పాండాలు చేరండి vs విలీనం

Pandalu Cerandi Vs Vilinam



'పాండాలు' అనేది పైథాన్ పర్యావరణం కోసం అధిక-పనితీరు సాధనం. ఇది డేటా విశ్లేషణ కోసం 'ఓపెన్' సోర్స్ కోడ్. రెండు డేటాఫ్రేమ్‌లను కలిపి ఒకే డేటాఫ్రేమ్‌లో కలపడానికి పాండాలు చేరడం మరియు పాండాలు విలీనం చేసే పద్ధతి ఉపయోగించబడుతుంది. పాండాల యొక్క రెండు పద్ధతులలో, తేడా ఏమిటంటే పాండాలు “చేరండి” ఫంక్షన్ సూచికను ఉపయోగించి డేటాఫ్రేమ్‌లో చేరుతుంది. పాండాలు “విలీనం” ఫంక్షన్ ఇండెక్స్ మరియు కాలమ్ పద్ధతిని ఉపయోగించి డేటాఫ్రేమ్‌లో కలుస్తుంది, దీనిలో మనం కోరుకున్న కాలమ్‌ను మనం ఎంచుకోవచ్చు. పాండాల చేరిక పద్ధతితో పోలిస్తే పాండాల విలీన పద్ధతి ఎక్కువగా ఉపయోగించబడుతుంది. అమలు కోసం మేము ఉపయోగిస్తున్న సాఫ్ట్‌వేర్ “స్పైడర్” సాఫ్ట్‌వేర్, ఇది పైథాన్ వాతావరణంలో ఉంది, ఇది పాండాలు జాయిన్ మెథడ్() మరియు పాండాస్ మెర్జ్() మెథడ్ ఫంక్షన్‌ల కోడ్ అమలు కోసం మాకు ప్రయోజనాలను అందిస్తుంది.

పాండాలు చేరిక() పద్ధతి యొక్క సింటాక్స్

'df1. చేరండి ( df2 )

పై సింటాక్స్‌లోని “df” అనేది “డేటాఫ్రేమ్” యొక్క సంక్షిప్త రూపం. సింటాక్స్‌లో “డాట్ జాయిన్” ఫంక్షన్‌తో రెండు డేటాఫ్రేమ్‌లు ఉన్నాయి, ఇది పద్ధతిని కాల్ చేయడానికి. ఇది రెండు డేటాఫ్రేమ్‌లను కలిపే పాండస్ పద్ధతి. ఇది డేటాఫ్రేమ్‌లను ఒకే ఒకదానిలో కలపడానికి సూచికను ఉపయోగించడం ద్వారా పని చేస్తుంది.







పాండాలు విలీనం() పద్ధతి యొక్క సింటాక్స్

'df1. విలీనం ( df2 , పై = 'నిలువు_పేరు' )

పాండాస్ విలీన పద్ధతి సింటాక్స్‌లో “df1” మరియు “df2” వంటి రెండు డేటాఫ్రేమ్‌లు ఉన్నాయి. 'డాట్ మెర్జ్' ఫంక్షన్ రెండు డేటాఫ్రేమ్‌లను విలోమ నిలువు రూపాన్ని కలిగి ఉండే పద్ధతిని పిలుస్తోంది.



పాండా విలీనం మరియు పాండాలు చేరడం యొక్క పద్ధతులను ఉపయోగించడానికి మేము రెండు డేటాఫ్రేమ్‌లను కలపడానికి క్రింది మార్గాలను కవర్ చేస్తాము:



  • పాండాలు జాయిన్ మెథడ్ అతివ్యాప్తి.
  • పాండాలు ఇండెక్స్ రీసెట్‌ని ఉపయోగించి పద్ధతిలో చేరతారు.
  • పాండాలు విలీన పద్ధతి (కాలమ్ 'ఎడమ మరియు కుడి').
  • పాండాలు విలీన పద్ధతి స్పష్టంగా ఉంది.

పాండాలు విలీనం మరియు పాండాలు చేరడం పద్ధతి యొక్క అమలు కోసం డేటాఫ్రేమ్‌లను సృష్టించడం

ముందుగా, మనం డేటా ఫ్రేమ్‌ని సృష్టించాలి. దాని కోసం, మేము 'స్పైడర్' సాధనాన్ని ఉపయోగిస్తాము. దాన్ని తెరిచిన తర్వాత, కోడ్ రాయడం ప్రారంభించండి. పాండాల లైబ్రరీ అసోసియేషన్ కోసం పాండాలను 'pd'గా దిగుమతి చేయండి. మేము డేటాఫ్రేమ్ వేరియబుల్‌లను “x”, “y”, “p”, మరియు “q తదనుగుణంగా మరియు “a” విలువలతో “1” మరియు “b” విలువలతో “2”గా కేటాయించాము.





అవుట్‌పుట్ అనేది కేటాయించిన విలువలతో సృష్టించబడిన “df”. డేటా ఎంత పెద్దదైతే అంత పెద్దది చేయగలం.



మరొక డేటాఫ్రేమ్‌ను సృష్టిస్తోంది

పాండాలు చేరడం మరియు పాండాలు విలీనమయ్యే పద్ధతులను స్పష్టంగా అర్థం చేసుకోవడానికి మనం మరొక డేటాఫ్రేమ్‌ని తయారు చేయాలి. ఇక్కడ, మేము పైన ఉన్న “df” వలె “df” సృష్టించాము, కేటాయించిన వేరియబుల్స్ మాత్రమే విలువలు భిన్నంగా ఉంటాయి. మనకు “h”, “j”, “s” మరియు “d” ఉన్నాయి, అయితే “b” విలువలను “8” విలువతో మరియు “Y” విలువ “3”తో కేటాయించండి.

అవుట్‌పుట్ సృష్టించబడిన సాధారణ “df”ని చూపుతుంది.

ఉదాహరణ # 01: పాండాలు చేరడం పద్ధతి (అతివ్యాప్తి చెందడం)

ఇప్పుడు, పాండాలు జాయిన్ మెథడ్‌తో రెండు డేటాఫ్రేమ్‌లను ఎలా జాయిన్ చేయాలో చూద్దాం. ఈ పద్ధతి కోసం, మేము డేటాఫ్రేమ్ నుండి పని చేయాలనుకుంటున్న మీ ఎంపిక కాలమ్‌ని ఎంచుకోవచ్చు. మేము 'df' నుండి అతివ్యాప్తి చెందుతున్న నిలువు వరుస 'ఎడమ'తో ఉదాహరణను తీసుకున్నాము, కాబట్టి మేము డేటా యొక్క అతివ్యాప్తిని అధిగమించడానికి 'ప్రత్యయం'తో దీన్ని పరిష్కరించవచ్చు. ఇక్కడ, ఉపయోగించిన వేరియబుల్స్ “x”, “z”, “v”, “d”. '3', '6', '7' మరియు '9'గా కేటాయించబడిన విలువలతో 'p', 'o', 'l' మరియు 'y'. కుడి 'df' ప్రత్యయంతో ఎడమ చేరడానికి సమలేఖనం సెట్ చేయబడి, “.join” పద్ధతిని పిలుస్తుంది. ”. కోడ్‌లో “ప్రత్యయం” ఉపయోగించబడింది ఎందుకంటే డేటాఫ్రేమ్‌లో, “కీ” అనే ఒకే పేరు ఉన్న రెండు నిలువు వరుసలు ఉన్నాయి మరియు అవి డేటాను అతివ్యాప్తి చేయవు.

అవుట్‌పుట్ పాండాస్ జాయిన్ పద్ధతిని ఉపయోగించి రెండు “df”ని చేర్చే పద్ధతితో అతివ్యాప్తి చెందిన డేటాను ప్రదర్శించదు.

ఉదాహరణ # 02: పాండాలు ఇండెక్స్ రీసెట్‌ని ఉపయోగించి చేరే పద్ధతి

ఈ ఉదాహరణలో, మేము రెండు డేటాఫ్రేమ్‌లలో చేరడంలో సహాయపడే మెథడ్ జాయిన్‌లో “కీ”గా ఉపయోగించడానికి “ఆన్” పరామితితో కాలమ్‌ను విడిగా పేర్కొంటాము. మిళిత విషయం ఈ పరామితితో చేయబడుతుంది. అలాగే, 'df' రెండింటిలో ఒకదాని సూచిక వాటిని చేరేలా ఉండాలి. ఒకే ప్రయోజనం కోసం ఉపయోగించిన ఒకే రకమైన డేటా లేదా డేటా ప్రాసెసింగ్ కోసం కలిసి ఉండవచ్చు. ఇది కుడి వైపు నుండి ఉపయోగించి ఇప్పటికీ సూచికను ఉపయోగిస్తుంది. వేరియబుల్స్ 's', 't', 'u', 'v', 'n', 'w', 'k' మరియు 'q'. కేటాయించిన విలువలు “3”, “6”, “7” మరియు “9”. 'రీసెట్ డాట్ ఇండెక్స్' అనేది 'df' యొక్క సూచికను రీసెట్ చేయడానికి పాండాల పద్ధతి. రీసెట్ ఇండెక్స్ మీ డేటాఫ్రేమ్ జాబితా యొక్క అన్ని పూర్ణాంకాలను 0 నుండి డేటాఫ్రేమ్ డేటా పొడిగించే వరకు సెట్ చేస్తుంది.

పాండాల యొక్క ఇండెక్స్ “కీ” చేరిక పద్ధతితో ప్రదర్శించబడే అవుట్‌పుట్ ఇక్కడ ఉంది.

ఉదాహరణ # 03: పాండాస్ మెర్జ్ మెథడ్ (కాలమ్ 'ఎడమ మరియు కుడి')

పాండాలు చేరడం పద్ధతి వలె విలీన పద్ధతి అదే విధమైన చర్యను చేస్తుంది. ఒకే విధమైన డేటాఫ్రేమ్‌లో డేటాను కలపడం కోసం రెండు పద్ధతులు ఉన్నాయి. విలీన పద్ధతి మరింత బహుముఖమైనది, దీనికి కీని పేర్కొనడం అవసరం. మేము మీ డేటాఫ్రేమ్ పనిని బట్టి ఎడమ మరియు కుడి నిలువు వరుసలపై కూడా పేర్కొనవచ్చు. కోడ్‌లోని వేరియబుల్స్ “s”, “d”, “g”, “f”, “k”, “j”, “b” మరియు “q”. కేటాయించిన విలువలు “9”, “5”, “6” మరియు “7”. పాండాస్ మెర్జ్ మెథడ్ ఫంక్షన్ యొక్క 'ఎలా' పరామితిని ఉపయోగించి 'df' రెండింటిలోనూ బాహ్య 'చేరడం' అమలు చేయబడుతుంది.

మనం చూసే అవుట్‌పుట్ రెండు డేటాఫ్రేమ్‌ల విలీన డేటాను చూపుతుంది. 'NaN' అనేది 'సంఖ్య కాదు'ని సూచిస్తుంది, అంటే డేటాలో సంఖ్య కేటాయించబడని చోట 'NaN' చూపుతుంది.

ఉదాహరణ # 04: విలీన పద్ధతి స్పష్టంగా

ఇక్కడ, ఈ ఉదాహరణలో, విలీన పద్ధతి అనేది ఇండెక్స్ నాశనం మరియు ఇండెక్స్ విలువ డేటాఫ్రేమ్‌లో ఊహించబడదు. మేము చేయవలసిన పనిని బట్టి ఈ పద్ధతిని చేస్తాము, ఇక్కడ స్పష్టంగా అనుసరించాల్సిన అవసరం ఉంది. ఇది పారామీటర్‌తో ఎడమ సూచిక లేదా కుడి సూచిక ఆధారంగా డేటాను విలీనం చేస్తుంది. ఈ డేటాఫ్రేమ్‌లోని వేరియబుల్స్ “t”, “r”, “I”, “u”, “h”, “o”, “e” మరియు “e”. కేటాయించిన విలువలు “2”, “4”, “6” మరియు “4”. పాండాలు విలీన పద్ధతి యొక్క పై ఉదాహరణ అవసరాన్ని బట్టి కాలమ్ ఎంపికతో రెండు డేటాఫ్రేమ్‌లను కలపడానికి అత్యంత ప్రదర్శించదగిన మరియు విలువైన పద్ధతి. డేటాసెట్‌లో విలీన కీ ప్రత్యేకంగా ఉందని కోడ్ లైన్ చివరిలో తనిఖీ చేస్తోంది.

దిగువ అవుట్‌పుట్‌లో సూచిక లేకుండా సూచిక చూపబడదు కానీ ఫంక్షన్ కుడి మరియు ఎడమ సూచిక ఆధారంగా నిర్వహించబడుతుంది.

ముగింపు

విలీనం() మరియు జాయిన్() పద్ధతులు రెండూ చాలా సౌకర్యవంతంగా మరియు ప్రభావవంతంగా ఉంటాయి. ఈ రెండు ఫంక్షన్‌లు ఒకే డేటాఫ్రేమ్‌లో రెండు వేర్వేరు డేటాఫ్రేమ్‌లో చేరడానికి ఉపయోగించబడతాయి, అయితే సందర్భాన్ని బట్టి వేర్వేరు ఉపయోగం ఉంటుంది. ఈ వ్యాసంలో, పాండాలు చేరడం మరియు విలీనం చేసే పద్ధతి మధ్య ఉన్న ముఖ్యమైన తేడాలను మేము నేర్చుకున్నాము. ఉదాహరణలను చేసి, పాండాలు జాయిన్ మెథడ్‌ని అర్థం చేసుకున్న తర్వాత, మరింత ఫ్లెక్సిబుల్ మరియు డేటాబేస్ స్టైల్ జాయినింగ్ కావాలంటే, పాండాస్ మెర్జ్ మెథడ్‌తో వెళ్లడం ఉత్తమం అనే జ్ఞానంతో మేము దానిని ముగించాము. మరోవైపు, మేము డేటాఫ్రేమ్‌ను ఇండెక్స్‌తో కలిపి విస్తృతంగా చేయాలనుకుంటే, మనం పాండస్ జాయిన్() మెథడ్ ఫంక్షన్‌తో వెళ్లవచ్చు.