పాండాలు NaN విలువలను పూరించండి
మీ డేటా ఫ్రేమ్లోని నిలువు వరుస NaN లేదా None విలువలను కలిగి ఉంటే, మీరు వాటిని సున్నా (0)తో పూరించడానికి “fillna()” లేదా “replace()” ఫంక్షన్లను ఉపయోగించవచ్చు.
పూరించండి ()
NA/NaN విలువలు “fillna()” ఫంక్షన్ని ఉపయోగించి అందించిన విధానంతో నింపబడతాయి. కింది వాక్యనిర్మాణాన్ని పరిగణనలోకి తీసుకోవడం ద్వారా దీనిని ఉపయోగించవచ్చు:
మీరు ఒకే నిలువు వరుస కోసం NaN విలువలను పూరించాలనుకుంటే, వాక్యనిర్మాణం క్రింది విధంగా ఉంటుంది:
మీరు పూర్తి డేటాఫ్రేమ్ కోసం NaN విలువలను పూరించవలసి వచ్చినప్పుడు, వాక్యనిర్మాణం అందించిన విధంగా ఉంటుంది:
భర్తీ()
NaN విలువల యొక్క ఒక నిలువు వరుసను భర్తీ చేయడానికి, అందించిన వాక్యనిర్మాణం క్రింది విధంగా ఉంటుంది:
అయితే, మొత్తం DataFrame యొక్క NaN విలువలను భర్తీ చేయడానికి, మేము ఈ క్రింది పేర్కొన్న సింటాక్స్ని ఉపయోగించాలి:
ఈ రచనలో, మేము ఇప్పుడు మా పాండాస్ డేటాఫ్రేమ్లో NaN విలువలను పూరించడానికి ఈ రెండు పద్ధతుల యొక్క ఆచరణాత్మక అమలును అన్వేషిస్తాము మరియు నేర్చుకుంటాము.
ఉదాహరణ 1: పాండాస్ “ఫిల్నా()” పద్ధతిని ఉపయోగించి NaN విలువలను పూరించండి
ఇచ్చిన డేటాఫ్రేమ్లోని NaN విలువలను 0తో పూరించడానికి పాండాస్ “DataFrame.fillna()” ఫంక్షన్ యొక్క అప్లికేషన్ను ఈ దృష్టాంతం ప్రదర్శిస్తుంది. మీరు తప్పిపోయిన విలువలను ఒకే కాలమ్లో పూరించవచ్చు లేదా మీరు వాటిని మొత్తం డేటాఫ్రేమ్లో పూరించవచ్చు. ఇక్కడ, మేము ఈ రెండు పద్ధతులను చూస్తాము.
ఈ వ్యూహాలను అమలులోకి తీసుకురావడానికి, మేము ప్రోగ్రామ్ యొక్క అమలు కోసం తగిన వేదికను పొందాలి. కాబట్టి, మేము 'స్పైడర్' సాధనాన్ని ఉపయోగించాలని నిర్ణయించుకున్నాము. మేము 'పాండాలు' టూల్కిట్ను ప్రోగ్రామ్లోకి దిగుమతి చేయడం ద్వారా మా పైథాన్ కోడ్ను ప్రారంభించాము ఎందుకంటే మేము డేటాఫ్రేమ్ను నిర్మించడానికి అలాగే ఆ డేటాఫ్రేమ్లో లేని విలువలను పూరించడానికి పాండాస్ ఫీచర్ను ఉపయోగించాలి. ప్రోగ్రామ్ అంతటా 'pd' 'పాండాలు' యొక్క మారుపేరుగా ఉపయోగించబడుతుంది.
ఇప్పుడు, మాకు పాండాస్ ఫీచర్లకు యాక్సెస్ ఉంది. మా డేటాఫ్రేమ్ని రూపొందించడానికి మేము మొదట దాని “pd.DataFrame()” ఫంక్షన్ని ఉపయోగిస్తాము. మేము ఈ పద్ధతిని ప్రారంభించాము మరియు దానిని మూడు నిలువు వరుసలతో ప్రారంభించాము. ఈ నిలువు వరుసల శీర్షికలు “M1”, “M2” మరియు “M3”. “M1” నిలువు వరుసలోని విలువలు “1”, “ఏదీ కాదు”, “5”, “9” మరియు “3”. “M2”లోని ఎంట్రీలు “ఏదీ కాదు”, “3”, “8”, “4” మరియు “6”. 'M3' డేటాను '1', '2', '3', '5' మరియు 'ఏదీ కాదు'గా నిల్వ చేస్తుంది. “pd.DataFrame()” పద్ధతిని పిలిచినప్పుడు మేము ఈ డేటాఫ్రేమ్ని నిల్వ చేయగల డేటాఫ్రేమ్ ఆబ్జెక్ట్ అవసరం. మేము “తప్పిపోయిన” డేటాఫ్రేమ్ ఆబ్జెక్ట్ను సృష్టించాము మరియు “pd.DataFrame()” ఫంక్షన్ నుండి మనకు లభించిన ఫలితం ద్వారా దానిని కేటాయించాము. అప్పుడు, మేము పైథాన్ కన్సోల్లో డేటాఫ్రేమ్ను ప్రదర్శించడానికి పైథాన్ యొక్క “ప్రింట్()” పద్ధతిని ఉపయోగించాము.
మేము ఈ కోడ్ భాగాన్ని అమలు చేసినప్పుడు, టెర్మినల్లో మూడు నిలువు వరుసలతో కూడిన డేటాఫ్రేమ్ని వీక్షించవచ్చు. ఇక్కడ, మూడు నిలువు వరుసలలో శూన్య విలువలు ఉన్నాయని మనం గమనించవచ్చు.
తప్పిపోయిన విలువలను 0తో పూరించడానికి Pandas “fillna()” ఫంక్షన్ని వర్తింపజేయడానికి మేము కొన్ని శూన్య విలువలతో DataFrameని సృష్టించాము. దానిని ఎలా చేయాలో తెలుసుకుందాం.
డేటాఫ్రేమ్ని ప్రదర్శించిన తర్వాత, మేము పాండాస్ “ఫిల్నా()” ఫంక్షన్ను ప్రారంభించాము. ఇక్కడ, తప్పిపోయిన విలువలను ఒకే నిలువు వరుసలో పూరించడం నేర్చుకుంటాము. దీని కోసం వాక్యనిర్మాణం ఇప్పటికే ట్యుటోరియల్ ప్రారంభంలో ప్రస్తావించబడింది. మేము డేటాఫ్రేమ్ పేరును అందించాము మరియు నిర్దిష్ట కాలమ్ శీర్షికను “.fillna()” ఫంక్షన్తో పేర్కొన్నాము. ఈ పద్ధతి యొక్క కుండలీకరణాల మధ్య, మేము శూన్య ప్రదేశాలలో ఉంచబడే విలువను అందించాము. డేటాఫ్రేమ్ పేరు “తప్పిపోయింది” మరియు మేము ఇక్కడ ఎంచుకున్న కాలమ్ “M2”. “fillna()” యొక్క కలుపుల మధ్య అందించిన విలువ “0”. చివరగా, నవీకరించబడిన డేటాఫ్రేమ్ను వీక్షించడానికి మేము “ప్రింట్()” ఫంక్షన్ని పిలిచాము.
ఇక్కడ, NaN విలువ 0తో నిండినందున డేటాఫ్రేమ్ యొక్క “M2” కాలమ్ ఇప్పుడు ఏ తప్పిపోయిన విలువలను కలిగి లేదని మీరు చూడవచ్చు.
అదే పద్ధతితో మొత్తం డేటాఫ్రేమ్ కోసం NaN విలువలను పూరించడానికి, మేము “fillna()” అని పిలుస్తాము. ఇది చాలా సులభం. మేము డేటాఫ్రేమ్ పేరును “fillna()” ఫంక్షన్తో అందించాము మరియు కుండలీకరణాల మధ్య ఫంక్షన్ విలువ “0”ని కేటాయించాము. చివరగా, “ప్రింట్()” ఫంక్షన్ మాకు నిండిన డేటాఫ్రేమ్ని చూపింది.
అన్ని విలువలు ఇప్పుడు 0తో రీఫిల్ చేయబడినందున ఇది NaN విలువలు లేని డేటాఫ్రేమ్ను పొందుతుంది.
ఉదాహరణ 2: పాండాలు “రిప్లేస్()” పద్ధతిని ఉపయోగించి NaN విలువలను పూరించండి
వ్యాసంలోని ఈ భాగం డేటాఫ్రేమ్లో NaN విలువలను పూరించడానికి మరొక పద్ధతిని ప్రదర్శిస్తుంది. మేము ఒకే కాలమ్లో మరియు పూర్తి డేటాఫ్రేమ్లో విలువలను పూరించడానికి పాండాస్ యొక్క “రీప్లేస్()” ఫంక్షన్ని ఉపయోగిస్తాము.
మేము 'స్పైడర్' సాధనంలో కోడ్ రాయడం ప్రారంభిస్తాము. మొదట, మేము అవసరమైన లైబ్రరీలను దిగుమతి చేసుకున్నాము. ఇక్కడ, పాండాస్ పద్ధతులను ఉపయోగించడానికి పైథాన్ ప్రోగ్రామ్ను ప్రారంభించడానికి మేము పాండాస్ లైబ్రరీని లోడ్ చేసాము. మేము లోడ్ చేసిన రెండవ లైబ్రరీ NumPy మరియు దానిని “np” అని మారుపేరు. NumPy తప్పిపోయిన డేటాను “replace()” పద్ధతితో నిర్వహిస్తుంది.
అప్పుడు, మేము మూడు నిలువు వరుసలను కలిగి ఉన్న డేటాఫ్రేమ్ను రూపొందించాము - 'స్క్రూ', 'నెయిల్' మరియు 'డ్రిల్'. ప్రతి నిలువు వరుసలోని విలువలు వరుసగా ఇవ్వబడ్డాయి. 'స్క్రూ' కాలమ్లో '112', '234', 'ఏమీ కాదు' మరియు '650' విలువలు ఉన్నాయి. 'నెయిల్' కాలమ్లో '123', '145', 'ఏమీ కాదు' మరియు '711' ఉన్నాయి. చివరగా, “డ్రిల్” కాలమ్లో “312”, “ఏమీ లేదు”, “500” మరియు “ఏదీ లేదు” విలువలు ఉన్నాయి. డేటాఫ్రేమ్ “టూల్” డేటాఫ్రేమ్ ఆబ్జెక్ట్లో నిల్వ చేయబడుతుంది మరియు “ప్రింట్()” పద్ధతిని ఉపయోగించి ప్రదర్శించబడుతుంది.
రికార్డ్లో నాలుగు NaN విలువలతో కూడిన డేటాఫ్రేమ్ క్రింది అవుట్పుట్ ఇమేజ్లో చూడవచ్చు:
ఇప్పుడు, డేటాఫ్రేమ్లోని ఒకే కాలమ్లో శూన్య విలువలను పూరించడానికి మేము పాండాస్ “రిప్లేస్()” పద్ధతిని ఉపయోగిస్తాము. టాస్క్ కోసం, మేము “రిప్లేస్()” ఫంక్షన్ను ప్రారంభించాము. మేము డేటాఫ్రేమ్ పేరు “టూల్” మరియు కాలమ్ “స్క్రూ”ని “.replace()” పద్ధతితో సరఫరా చేసాము. దాని జంట కలుపుల మధ్య, మేము డేటాఫ్రేమ్లోని “np.nan” ఎంట్రీల కోసం “0” విలువను సెట్ చేసాము. అవుట్పుట్ను ప్రదర్శించడానికి “ప్రింట్()” పద్ధతి ఉపయోగించబడుతుంది.
ఫలిత డేటాఫ్రేమ్ 'స్క్రూ' కాలమ్లో NaN ఎంట్రీలతో 0తో భర్తీ చేయబడిన మొదటి నిలువు వరుసను మాకు చూపుతుంది.
ఇప్పుడు, మేము మొత్తం డేటాఫ్రేమ్లో విలువలను పూరించడాన్ని నేర్చుకుంటాము. మేము డేటాఫ్రేమ్ పేరుతో “రీప్లేస్()” పద్ధతిని పిలిచాము మరియు మేము np.nan ఎంట్రీలతో భర్తీ చేయాలనుకుంటున్న విలువను అందించాము. చివరగా, మేము నవీకరించబడిన డేటాఫ్రేమ్ను “ప్రింట్()” ఫంక్షన్తో ముద్రించాము.
ఇది ఎటువంటి తప్పిపోయిన రికార్డులు లేకుండా ఫలిత డేటాఫ్రేమ్ను మాకు అందిస్తుంది.
ముగింపు
డేటాఫ్రేమ్లో తప్పిపోయిన ఎంట్రీలతో వ్యవహరించడం అనేది ప్రాథమికమైనది మరియు డేటా విశ్లేషణ ప్రక్రియలో సంక్లిష్టతను తగ్గించడానికి మరియు డేటాను ధిక్కరించడానికి అవసరమైన అవసరం. ఈ సమస్యను ఎదుర్కోవటానికి పాండాస్ మాకు కొన్ని ఎంపికలను అందిస్తుంది. మేము ఈ గైడ్లో రెండు సులభ వ్యూహాలను తీసుకువచ్చాము. మీకు విషయాలు కొంచెం అర్థమయ్యేలా మరియు సులభతరం చేయడానికి నమూనా కోడ్లను అమలు చేయడానికి మేము 'స్పైడర్' సాధనం సహాయంతో రెండు సాంకేతికతలను ఆచరణలో పెట్టాము. ఈ ఫంక్షన్ల గురించి జ్ఞానాన్ని పొందడం వలన మీ పాండాస్ నైపుణ్యాలు మరింత మెరుగుపడతాయి.