పాండాలు నాన్‌ని 0తో పూరించండి

Pandalu Nan Ni 0to Purincandi



డేటా సైన్స్ సాధారణంగా తప్పిపోయిన డేటాను కలిగి ఉంటుంది. మొత్తం అడ్డు వరుసను విస్మరించవచ్చు లేదా అడ్డు వరుస-నిలువు వరుస కలయికకు విలువను జోడించవచ్చు. అడ్డు వరుస/నిలువు వరుసను వదలడం అసంబద్ధం ఎందుకంటే ఇది ప్రతి అడ్డు వరుసకు నిర్దిష్ట మెట్రిక్‌ను తొలగిస్తుంది. NaN, ఇది 'సంఖ్య కాదు', డేటా సమితి నుండి తప్పిపోయిన విలువను చూపించే సాధారణ మార్గాలలో ఒకటి. ఉద్దేశించిన ఫలితాలను పొందడానికి, NaNని నిర్వహించడం చాలా ముఖ్యం. కాబట్టి, పాండాస్ డేటాఫ్రేమ్‌లోని వరుస లేదా నిలువు వరుసలోని NaN విలువలను 0కి ఎలా మార్చాలో తెలుసుకుందాం.

పాండాలు NaN విలువలను పూరించండి

మీ డేటా ఫ్రేమ్‌లోని నిలువు వరుస NaN లేదా None విలువలను కలిగి ఉంటే, మీరు వాటిని సున్నా (0)తో పూరించడానికి “fillna()” లేదా “replace()” ఫంక్షన్‌లను ఉపయోగించవచ్చు.

పూరించండి ()







NA/NaN విలువలు “fillna()” ఫంక్షన్‌ని ఉపయోగించి అందించిన విధానంతో నింపబడతాయి. కింది వాక్యనిర్మాణాన్ని పరిగణనలోకి తీసుకోవడం ద్వారా దీనిని ఉపయోగించవచ్చు:



మీరు ఒకే నిలువు వరుస కోసం NaN విలువలను పూరించాలనుకుంటే, వాక్యనిర్మాణం క్రింది విధంగా ఉంటుంది:




మీరు పూర్తి డేటాఫ్రేమ్ కోసం NaN విలువలను పూరించవలసి వచ్చినప్పుడు, వాక్యనిర్మాణం అందించిన విధంగా ఉంటుంది:






భర్తీ()

NaN విలువల యొక్క ఒక నిలువు వరుసను భర్తీ చేయడానికి, అందించిన వాక్యనిర్మాణం క్రింది విధంగా ఉంటుంది:




అయితే, మొత్తం DataFrame యొక్క NaN విలువలను భర్తీ చేయడానికి, మేము ఈ క్రింది పేర్కొన్న సింటాక్స్‌ని ఉపయోగించాలి:


ఈ రచనలో, మేము ఇప్పుడు మా పాండాస్ డేటాఫ్రేమ్‌లో NaN విలువలను పూరించడానికి ఈ రెండు పద్ధతుల యొక్క ఆచరణాత్మక అమలును అన్వేషిస్తాము మరియు నేర్చుకుంటాము.

ఉదాహరణ 1: పాండాస్ “ఫిల్నా()” పద్ధతిని ఉపయోగించి NaN విలువలను పూరించండి

ఇచ్చిన డేటాఫ్రేమ్‌లోని NaN విలువలను 0తో పూరించడానికి పాండాస్ “DataFrame.fillna()” ఫంక్షన్ యొక్క అప్లికేషన్‌ను ఈ దృష్టాంతం ప్రదర్శిస్తుంది. మీరు తప్పిపోయిన విలువలను ఒకే కాలమ్‌లో పూరించవచ్చు లేదా మీరు వాటిని మొత్తం డేటాఫ్రేమ్‌లో పూరించవచ్చు. ఇక్కడ, మేము ఈ రెండు పద్ధతులను చూస్తాము.

ఈ వ్యూహాలను అమలులోకి తీసుకురావడానికి, మేము ప్రోగ్రామ్ యొక్క అమలు కోసం తగిన వేదికను పొందాలి. కాబట్టి, మేము 'స్పైడర్' సాధనాన్ని ఉపయోగించాలని నిర్ణయించుకున్నాము. మేము 'పాండాలు' టూల్‌కిట్‌ను ప్రోగ్రామ్‌లోకి దిగుమతి చేయడం ద్వారా మా పైథాన్ కోడ్‌ను ప్రారంభించాము ఎందుకంటే మేము డేటాఫ్రేమ్‌ను నిర్మించడానికి అలాగే ఆ డేటాఫ్రేమ్‌లో లేని విలువలను పూరించడానికి పాండాస్ ఫీచర్‌ను ఉపయోగించాలి. ప్రోగ్రామ్ అంతటా 'pd' 'పాండాలు' యొక్క మారుపేరుగా ఉపయోగించబడుతుంది.

ఇప్పుడు, మాకు పాండాస్ ఫీచర్‌లకు యాక్సెస్ ఉంది. మా డేటాఫ్రేమ్‌ని రూపొందించడానికి మేము మొదట దాని “pd.DataFrame()” ఫంక్షన్‌ని ఉపయోగిస్తాము. మేము ఈ పద్ధతిని ప్రారంభించాము మరియు దానిని మూడు నిలువు వరుసలతో ప్రారంభించాము. ఈ నిలువు వరుసల శీర్షికలు “M1”, “M2” మరియు “M3”. “M1” నిలువు వరుసలోని విలువలు “1”, “ఏదీ కాదు”, “5”, “9” మరియు “3”. “M2”లోని ఎంట్రీలు “ఏదీ కాదు”, “3”, “8”, “4” మరియు “6”. 'M3' డేటాను '1', '2', '3', '5' మరియు 'ఏదీ కాదు'గా నిల్వ చేస్తుంది. “pd.DataFrame()” పద్ధతిని పిలిచినప్పుడు మేము ఈ డేటాఫ్రేమ్‌ని నిల్వ చేయగల డేటాఫ్రేమ్ ఆబ్జెక్ట్ అవసరం. మేము “తప్పిపోయిన” డేటాఫ్రేమ్ ఆబ్జెక్ట్‌ను సృష్టించాము మరియు “pd.DataFrame()” ఫంక్షన్ నుండి మనకు లభించిన ఫలితం ద్వారా దానిని కేటాయించాము. అప్పుడు, మేము పైథాన్ కన్సోల్‌లో డేటాఫ్రేమ్‌ను ప్రదర్శించడానికి పైథాన్ యొక్క “ప్రింట్()” పద్ధతిని ఉపయోగించాము.


మేము ఈ కోడ్ భాగాన్ని అమలు చేసినప్పుడు, టెర్మినల్‌లో మూడు నిలువు వరుసలతో కూడిన డేటాఫ్రేమ్‌ని వీక్షించవచ్చు. ఇక్కడ, మూడు నిలువు వరుసలలో శూన్య విలువలు ఉన్నాయని మనం గమనించవచ్చు.


తప్పిపోయిన విలువలను 0తో పూరించడానికి Pandas “fillna()” ఫంక్షన్‌ని వర్తింపజేయడానికి మేము కొన్ని శూన్య విలువలతో DataFrameని సృష్టించాము. దానిని ఎలా చేయాలో తెలుసుకుందాం.

డేటాఫ్రేమ్‌ని ప్రదర్శించిన తర్వాత, మేము పాండాస్ “ఫిల్నా()” ఫంక్షన్‌ను ప్రారంభించాము. ఇక్కడ, తప్పిపోయిన విలువలను ఒకే నిలువు వరుసలో పూరించడం నేర్చుకుంటాము. దీని కోసం వాక్యనిర్మాణం ఇప్పటికే ట్యుటోరియల్ ప్రారంభంలో ప్రస్తావించబడింది. మేము డేటాఫ్రేమ్ పేరును అందించాము మరియు నిర్దిష్ట కాలమ్ శీర్షికను “.fillna()” ఫంక్షన్‌తో పేర్కొన్నాము. ఈ పద్ధతి యొక్క కుండలీకరణాల మధ్య, మేము శూన్య ప్రదేశాలలో ఉంచబడే విలువను అందించాము. డేటాఫ్రేమ్ పేరు “తప్పిపోయింది” మరియు మేము ఇక్కడ ఎంచుకున్న కాలమ్ “M2”. “fillna()” యొక్క కలుపుల మధ్య అందించిన విలువ “0”. చివరగా, నవీకరించబడిన డేటాఫ్రేమ్‌ను వీక్షించడానికి మేము “ప్రింట్()” ఫంక్షన్‌ని పిలిచాము.


ఇక్కడ, NaN విలువ 0తో నిండినందున డేటాఫ్రేమ్ యొక్క “M2” కాలమ్ ఇప్పుడు ఏ తప్పిపోయిన విలువలను కలిగి లేదని మీరు చూడవచ్చు.


అదే పద్ధతితో మొత్తం డేటాఫ్రేమ్ కోసం NaN విలువలను పూరించడానికి, మేము “fillna()” అని పిలుస్తాము. ఇది చాలా సులభం. మేము డేటాఫ్రేమ్ పేరును “fillna()” ఫంక్షన్‌తో అందించాము మరియు కుండలీకరణాల మధ్య ఫంక్షన్ విలువ “0”ని కేటాయించాము. చివరగా, “ప్రింట్()” ఫంక్షన్ మాకు నిండిన డేటాఫ్రేమ్‌ని చూపింది.


అన్ని విలువలు ఇప్పుడు 0తో రీఫిల్ చేయబడినందున ఇది NaN విలువలు లేని డేటాఫ్రేమ్‌ను పొందుతుంది.

ఉదాహరణ 2: పాండాలు “రిప్లేస్()” పద్ధతిని ఉపయోగించి NaN విలువలను పూరించండి

వ్యాసంలోని ఈ భాగం డేటాఫ్రేమ్‌లో NaN విలువలను పూరించడానికి మరొక పద్ధతిని ప్రదర్శిస్తుంది. మేము ఒకే కాలమ్‌లో మరియు పూర్తి డేటాఫ్రేమ్‌లో విలువలను పూరించడానికి పాండాస్ యొక్క “రీప్లేస్()” ఫంక్షన్‌ని ఉపయోగిస్తాము.

మేము 'స్పైడర్' సాధనంలో కోడ్ రాయడం ప్రారంభిస్తాము. మొదట, మేము అవసరమైన లైబ్రరీలను దిగుమతి చేసుకున్నాము. ఇక్కడ, పాండాస్ పద్ధతులను ఉపయోగించడానికి పైథాన్ ప్రోగ్రామ్‌ను ప్రారంభించడానికి మేము పాండాస్ లైబ్రరీని లోడ్ చేసాము. మేము లోడ్ చేసిన రెండవ లైబ్రరీ NumPy మరియు దానిని “np” అని మారుపేరు. NumPy తప్పిపోయిన డేటాను “replace()” పద్ధతితో నిర్వహిస్తుంది.

అప్పుడు, మేము మూడు నిలువు వరుసలను కలిగి ఉన్న డేటాఫ్రేమ్‌ను రూపొందించాము - 'స్క్రూ', 'నెయిల్' మరియు 'డ్రిల్'. ప్రతి నిలువు వరుసలోని విలువలు వరుసగా ఇవ్వబడ్డాయి. 'స్క్రూ' కాలమ్‌లో '112', '234', 'ఏమీ కాదు' మరియు '650' విలువలు ఉన్నాయి. 'నెయిల్' కాలమ్‌లో '123', '145', 'ఏమీ కాదు' మరియు '711' ఉన్నాయి. చివరగా, “డ్రిల్” కాలమ్‌లో “312”, “ఏమీ లేదు”, “500” మరియు “ఏదీ లేదు” విలువలు ఉన్నాయి. డేటాఫ్రేమ్ “టూల్” డేటాఫ్రేమ్ ఆబ్జెక్ట్‌లో నిల్వ చేయబడుతుంది మరియు “ప్రింట్()” పద్ధతిని ఉపయోగించి ప్రదర్శించబడుతుంది.


రికార్డ్‌లో నాలుగు NaN విలువలతో కూడిన డేటాఫ్రేమ్ క్రింది అవుట్‌పుట్ ఇమేజ్‌లో చూడవచ్చు:


ఇప్పుడు, డేటాఫ్రేమ్‌లోని ఒకే కాలమ్‌లో శూన్య విలువలను పూరించడానికి మేము పాండాస్ “రిప్లేస్()” పద్ధతిని ఉపయోగిస్తాము. టాస్క్ కోసం, మేము “రిప్లేస్()” ఫంక్షన్‌ను ప్రారంభించాము. మేము డేటాఫ్రేమ్ పేరు “టూల్” మరియు కాలమ్ “స్క్రూ”ని “.replace()” పద్ధతితో సరఫరా చేసాము. దాని జంట కలుపుల మధ్య, మేము డేటాఫ్రేమ్‌లోని “np.nan” ఎంట్రీల కోసం “0” విలువను సెట్ చేసాము. అవుట్‌పుట్‌ను ప్రదర్శించడానికి “ప్రింట్()” పద్ధతి ఉపయోగించబడుతుంది.


ఫలిత డేటాఫ్రేమ్ 'స్క్రూ' కాలమ్‌లో NaN ఎంట్రీలతో 0తో భర్తీ చేయబడిన మొదటి నిలువు వరుసను మాకు చూపుతుంది.


ఇప్పుడు, మేము మొత్తం డేటాఫ్రేమ్‌లో విలువలను పూరించడాన్ని నేర్చుకుంటాము. మేము డేటాఫ్రేమ్ పేరుతో “రీప్లేస్()” పద్ధతిని పిలిచాము మరియు మేము np.nan ఎంట్రీలతో భర్తీ చేయాలనుకుంటున్న విలువను అందించాము. చివరగా, మేము నవీకరించబడిన డేటాఫ్రేమ్‌ను “ప్రింట్()” ఫంక్షన్‌తో ముద్రించాము.


ఇది ఎటువంటి తప్పిపోయిన రికార్డులు లేకుండా ఫలిత డేటాఫ్రేమ్‌ను మాకు అందిస్తుంది.

ముగింపు

డేటాఫ్రేమ్‌లో తప్పిపోయిన ఎంట్రీలతో వ్యవహరించడం అనేది ప్రాథమికమైనది మరియు డేటా విశ్లేషణ ప్రక్రియలో సంక్లిష్టతను తగ్గించడానికి మరియు డేటాను ధిక్కరించడానికి అవసరమైన అవసరం. ఈ సమస్యను ఎదుర్కోవటానికి పాండాస్ మాకు కొన్ని ఎంపికలను అందిస్తుంది. మేము ఈ గైడ్‌లో రెండు సులభ వ్యూహాలను తీసుకువచ్చాము. మీకు విషయాలు కొంచెం అర్థమయ్యేలా మరియు సులభతరం చేయడానికి నమూనా కోడ్‌లను అమలు చేయడానికి మేము 'స్పైడర్' సాధనం సహాయంతో రెండు సాంకేతికతలను ఆచరణలో పెట్టాము. ఈ ఫంక్షన్ల గురించి జ్ఞానాన్ని పొందడం వలన మీ పాండాస్ నైపుణ్యాలు మరింత మెరుగుపడతాయి.