'పాండాలు' అనేది పైథాన్ పర్యావరణం కోసం అధిక-పనితీరు సాధనం. ఇది డేటా విశ్లేషణ కోసం 'ఓపెన్' సోర్స్ కోడ్. రెండు డేటాఫ్రేమ్లను కలిపి ఒకే డేటాఫ్రేమ్లో కలపడానికి పాండాలు చేరడం మరియు పాండాలు విలీనం చేసే పద్ధతి ఉపయోగించబడుతుంది. పాండాల యొక్క రెండు పద్ధతులలో, తేడా ఏమిటంటే పాండాలు “చేరండి” ఫంక్షన్ సూచికను ఉపయోగించి డేటాఫ్రేమ్లో చేరుతుంది. పాండాలు “విలీనం” ఫంక్షన్ ఇండెక్స్ మరియు కాలమ్ పద్ధతిని ఉపయోగించి డేటాఫ్రేమ్లో కలుస్తుంది, దీనిలో మనం కోరుకున్న కాలమ్ను మనం ఎంచుకోవచ్చు. పాండాల చేరిక పద్ధతితో పోలిస్తే పాండాల విలీన పద్ధతి ఎక్కువగా ఉపయోగించబడుతుంది. అమలు కోసం మేము ఉపయోగిస్తున్న సాఫ్ట్వేర్ “స్పైడర్” సాఫ్ట్వేర్, ఇది పైథాన్ వాతావరణంలో ఉంది, ఇది పాండాలు జాయిన్ మెథడ్() మరియు పాండాస్ మెర్జ్() మెథడ్ ఫంక్షన్ల కోడ్ అమలు కోసం మాకు ప్రయోజనాలను అందిస్తుంది.
పాండాలు చేరిక() పద్ధతి యొక్క సింటాక్స్
'df1. చేరండి ( df2 ) ”పై సింటాక్స్లోని “df” అనేది “డేటాఫ్రేమ్” యొక్క సంక్షిప్త రూపం. సింటాక్స్లో “డాట్ జాయిన్” ఫంక్షన్తో రెండు డేటాఫ్రేమ్లు ఉన్నాయి, ఇది పద్ధతిని కాల్ చేయడానికి. ఇది రెండు డేటాఫ్రేమ్లను కలిపే పాండస్ పద్ధతి. ఇది డేటాఫ్రేమ్లను ఒకే ఒకదానిలో కలపడానికి సూచికను ఉపయోగించడం ద్వారా పని చేస్తుంది.
పాండాలు విలీనం() పద్ధతి యొక్క సింటాక్స్
'df1. విలీనం ( df2 , పై = 'నిలువు_పేరు' ) ”పాండాస్ విలీన పద్ధతి సింటాక్స్లో “df1” మరియు “df2” వంటి రెండు డేటాఫ్రేమ్లు ఉన్నాయి. 'డాట్ మెర్జ్' ఫంక్షన్ రెండు డేటాఫ్రేమ్లను విలోమ నిలువు రూపాన్ని కలిగి ఉండే పద్ధతిని పిలుస్తోంది.
పాండా విలీనం మరియు పాండాలు చేరడం యొక్క పద్ధతులను ఉపయోగించడానికి మేము రెండు డేటాఫ్రేమ్లను కలపడానికి క్రింది మార్గాలను కవర్ చేస్తాము:
- పాండాలు జాయిన్ మెథడ్ అతివ్యాప్తి.
- పాండాలు ఇండెక్స్ రీసెట్ని ఉపయోగించి పద్ధతిలో చేరతారు.
- పాండాలు విలీన పద్ధతి (కాలమ్ 'ఎడమ మరియు కుడి').
- పాండాలు విలీన పద్ధతి స్పష్టంగా ఉంది.
పాండాలు విలీనం మరియు పాండాలు చేరడం పద్ధతి యొక్క అమలు కోసం డేటాఫ్రేమ్లను సృష్టించడం
ముందుగా, మనం డేటా ఫ్రేమ్ని సృష్టించాలి. దాని కోసం, మేము 'స్పైడర్' సాధనాన్ని ఉపయోగిస్తాము. దాన్ని తెరిచిన తర్వాత, కోడ్ రాయడం ప్రారంభించండి. పాండాల లైబ్రరీ అసోసియేషన్ కోసం పాండాలను 'pd'గా దిగుమతి చేయండి. మేము డేటాఫ్రేమ్ వేరియబుల్లను “x”, “y”, “p”, మరియు “q తదనుగుణంగా మరియు “a” విలువలతో “1” మరియు “b” విలువలతో “2”గా కేటాయించాము.
అవుట్పుట్ అనేది కేటాయించిన విలువలతో సృష్టించబడిన “df”. డేటా ఎంత పెద్దదైతే అంత పెద్దది చేయగలం.
మరొక డేటాఫ్రేమ్ను సృష్టిస్తోంది
పాండాలు చేరడం మరియు పాండాలు విలీనమయ్యే పద్ధతులను స్పష్టంగా అర్థం చేసుకోవడానికి మనం మరొక డేటాఫ్రేమ్ని తయారు చేయాలి. ఇక్కడ, మేము పైన ఉన్న “df” వలె “df” సృష్టించాము, కేటాయించిన వేరియబుల్స్ మాత్రమే విలువలు భిన్నంగా ఉంటాయి. మనకు “h”, “j”, “s” మరియు “d” ఉన్నాయి, అయితే “b” విలువలను “8” విలువతో మరియు “Y” విలువ “3”తో కేటాయించండి.
అవుట్పుట్ సృష్టించబడిన సాధారణ “df”ని చూపుతుంది.
ఉదాహరణ # 01: పాండాలు చేరడం పద్ధతి (అతివ్యాప్తి చెందడం)
ఇప్పుడు, పాండాలు జాయిన్ మెథడ్తో రెండు డేటాఫ్రేమ్లను ఎలా జాయిన్ చేయాలో చూద్దాం. ఈ పద్ధతి కోసం, మేము డేటాఫ్రేమ్ నుండి పని చేయాలనుకుంటున్న మీ ఎంపిక కాలమ్ని ఎంచుకోవచ్చు. మేము 'df' నుండి అతివ్యాప్తి చెందుతున్న నిలువు వరుస 'ఎడమ'తో ఉదాహరణను తీసుకున్నాము, కాబట్టి మేము డేటా యొక్క అతివ్యాప్తిని అధిగమించడానికి 'ప్రత్యయం'తో దీన్ని పరిష్కరించవచ్చు. ఇక్కడ, ఉపయోగించిన వేరియబుల్స్ “x”, “z”, “v”, “d”. '3', '6', '7' మరియు '9'గా కేటాయించబడిన విలువలతో 'p', 'o', 'l' మరియు 'y'. కుడి 'df' ప్రత్యయంతో ఎడమ చేరడానికి సమలేఖనం సెట్ చేయబడి, “.join” పద్ధతిని పిలుస్తుంది. ”. కోడ్లో “ప్రత్యయం” ఉపయోగించబడింది ఎందుకంటే డేటాఫ్రేమ్లో, “కీ” అనే ఒకే పేరు ఉన్న రెండు నిలువు వరుసలు ఉన్నాయి మరియు అవి డేటాను అతివ్యాప్తి చేయవు.
అవుట్పుట్ పాండాస్ జాయిన్ పద్ధతిని ఉపయోగించి రెండు “df”ని చేర్చే పద్ధతితో అతివ్యాప్తి చెందిన డేటాను ప్రదర్శించదు.
ఉదాహరణ # 02: పాండాలు ఇండెక్స్ రీసెట్ని ఉపయోగించి చేరే పద్ధతి
ఈ ఉదాహరణలో, మేము రెండు డేటాఫ్రేమ్లలో చేరడంలో సహాయపడే మెథడ్ జాయిన్లో “కీ”గా ఉపయోగించడానికి “ఆన్” పరామితితో కాలమ్ను విడిగా పేర్కొంటాము. మిళిత విషయం ఈ పరామితితో చేయబడుతుంది. అలాగే, 'df' రెండింటిలో ఒకదాని సూచిక వాటిని చేరేలా ఉండాలి. ఒకే ప్రయోజనం కోసం ఉపయోగించిన ఒకే రకమైన డేటా లేదా డేటా ప్రాసెసింగ్ కోసం కలిసి ఉండవచ్చు. ఇది కుడి వైపు నుండి ఉపయోగించి ఇప్పటికీ సూచికను ఉపయోగిస్తుంది. వేరియబుల్స్ 's', 't', 'u', 'v', 'n', 'w', 'k' మరియు 'q'. కేటాయించిన విలువలు “3”, “6”, “7” మరియు “9”. 'రీసెట్ డాట్ ఇండెక్స్' అనేది 'df' యొక్క సూచికను రీసెట్ చేయడానికి పాండాల పద్ధతి. రీసెట్ ఇండెక్స్ మీ డేటాఫ్రేమ్ జాబితా యొక్క అన్ని పూర్ణాంకాలను 0 నుండి డేటాఫ్రేమ్ డేటా పొడిగించే వరకు సెట్ చేస్తుంది.
పాండాల యొక్క ఇండెక్స్ “కీ” చేరిక పద్ధతితో ప్రదర్శించబడే అవుట్పుట్ ఇక్కడ ఉంది.
ఉదాహరణ # 03: పాండాస్ మెర్జ్ మెథడ్ (కాలమ్ 'ఎడమ మరియు కుడి')
పాండాలు చేరడం పద్ధతి వలె విలీన పద్ధతి అదే విధమైన చర్యను చేస్తుంది. ఒకే విధమైన డేటాఫ్రేమ్లో డేటాను కలపడం కోసం రెండు పద్ధతులు ఉన్నాయి. విలీన పద్ధతి మరింత బహుముఖమైనది, దీనికి కీని పేర్కొనడం అవసరం. మేము మీ డేటాఫ్రేమ్ పనిని బట్టి ఎడమ మరియు కుడి నిలువు వరుసలపై కూడా పేర్కొనవచ్చు. కోడ్లోని వేరియబుల్స్ “s”, “d”, “g”, “f”, “k”, “j”, “b” మరియు “q”. కేటాయించిన విలువలు “9”, “5”, “6” మరియు “7”. పాండాస్ మెర్జ్ మెథడ్ ఫంక్షన్ యొక్క 'ఎలా' పరామితిని ఉపయోగించి 'df' రెండింటిలోనూ బాహ్య 'చేరడం' అమలు చేయబడుతుంది.
మనం చూసే అవుట్పుట్ రెండు డేటాఫ్రేమ్ల విలీన డేటాను చూపుతుంది. 'NaN' అనేది 'సంఖ్య కాదు'ని సూచిస్తుంది, అంటే డేటాలో సంఖ్య కేటాయించబడని చోట 'NaN' చూపుతుంది.
ఉదాహరణ # 04: విలీన పద్ధతి స్పష్టంగా
ఇక్కడ, ఈ ఉదాహరణలో, విలీన పద్ధతి అనేది ఇండెక్స్ నాశనం మరియు ఇండెక్స్ విలువ డేటాఫ్రేమ్లో ఊహించబడదు. మేము చేయవలసిన పనిని బట్టి ఈ పద్ధతిని చేస్తాము, ఇక్కడ స్పష్టంగా అనుసరించాల్సిన అవసరం ఉంది. ఇది పారామీటర్తో ఎడమ సూచిక లేదా కుడి సూచిక ఆధారంగా డేటాను విలీనం చేస్తుంది. ఈ డేటాఫ్రేమ్లోని వేరియబుల్స్ “t”, “r”, “I”, “u”, “h”, “o”, “e” మరియు “e”. కేటాయించిన విలువలు “2”, “4”, “6” మరియు “4”. పాండాలు విలీన పద్ధతి యొక్క పై ఉదాహరణ అవసరాన్ని బట్టి కాలమ్ ఎంపికతో రెండు డేటాఫ్రేమ్లను కలపడానికి అత్యంత ప్రదర్శించదగిన మరియు విలువైన పద్ధతి. డేటాసెట్లో విలీన కీ ప్రత్యేకంగా ఉందని కోడ్ లైన్ చివరిలో తనిఖీ చేస్తోంది.
దిగువ అవుట్పుట్లో సూచిక లేకుండా సూచిక చూపబడదు కానీ ఫంక్షన్ కుడి మరియు ఎడమ సూచిక ఆధారంగా నిర్వహించబడుతుంది.
ముగింపు
విలీనం() మరియు జాయిన్() పద్ధతులు రెండూ చాలా సౌకర్యవంతంగా మరియు ప్రభావవంతంగా ఉంటాయి. ఈ రెండు ఫంక్షన్లు ఒకే డేటాఫ్రేమ్లో రెండు వేర్వేరు డేటాఫ్రేమ్లో చేరడానికి ఉపయోగించబడతాయి, అయితే సందర్భాన్ని బట్టి వేర్వేరు ఉపయోగం ఉంటుంది. ఈ వ్యాసంలో, పాండాలు చేరడం మరియు విలీనం చేసే పద్ధతి మధ్య ఉన్న ముఖ్యమైన తేడాలను మేము నేర్చుకున్నాము. ఉదాహరణలను చేసి, పాండాలు జాయిన్ మెథడ్ని అర్థం చేసుకున్న తర్వాత, మరింత ఫ్లెక్సిబుల్ మరియు డేటాబేస్ స్టైల్ జాయినింగ్ కావాలంటే, పాండాస్ మెర్జ్ మెథడ్తో వెళ్లడం ఉత్తమం అనే జ్ఞానంతో మేము దానిని ముగించాము. మరోవైపు, మేము డేటాఫ్రేమ్ను ఇండెక్స్తో కలిపి విస్తృతంగా చేయాలనుకుంటే, మనం పాండస్ జాయిన్() మెథడ్ ఫంక్షన్తో వెళ్లవచ్చు.