పాండాస్ సమ్ కాలమ్

Pandas Sam Kalam



“పైథాన్‌ని ఉపయోగించి పాండాస్ డేటాఫ్రేమ్‌లోని అన్ని లేదా నిర్దిష్ట నిలువు వరుసలను ఎలా సంకలనం చేయాలో ఈ కథనం ప్రదర్శిస్తుంది. ఈ ట్యుటోరియల్ యొక్క అనేక ఉదాహరణలలో కొన్ని సహాయక పారామితులతో పాటు DataFrame.sum() ఫంక్షన్ ఉపయోగించబడుతుంది.

ఈ ట్యుటోరియల్ ముగిసినప్పుడు, మీరు ఎలా చేయాలో తెలుసుకోవచ్చు:







    • పాండాస్‌లో డేటాఫ్రేమ్ కాలమ్ మొత్తాన్ని కనుగొనండి.
    • డేటాఫ్రేమ్ నిలువు వరుసలను కలుపుతోంది
    • పేర్కొన్న షరతుకు అనుగుణంగా ఉండే పాండాస్ డేటాఫ్రేమ్‌కు నిలువు వరుసలను జోడించండి.
    • డేటాఫ్రేమ్ యొక్క డేటాను సమూహపరచిన తర్వాత మొత్తాన్ని నిర్ణయించండి.

డేటాఫ్రేమ్ నిలువు వరుసల మొత్తాన్ని ఎలా నిర్ణయించాలి?

పాండాస్‌లోని “dataframe.sum()” ఫంక్షన్ పేర్కొన్న అక్షం కోసం మొత్తం మొత్తాన్ని అందిస్తుంది. ఇన్‌పుట్ అనేది ఇండెక్స్ యొక్క అక్షం అయితే, ఫంక్షన్ ప్రతి నిలువు వరుస విలువలను ఒక్కొక్కటిగా జోడిస్తుంది, ఆపై ప్రతి నిలువు వరుసలో అదే విధంగా చేస్తుంది, ప్రతి నిలువు వరుసలోని డేటా/విలువల మొత్తాన్ని నిల్వ చేసే శ్రేణిని అందిస్తుంది. అదనంగా, ఇది తప్పిపోయిన విలువలను విస్మరించడం ద్వారా డేటాఫ్రేమ్ మొత్తాన్ని లెక్కించడానికి మద్దతు ఇస్తుంది.



సింటాక్స్: DataFrame.sum(అక్షం = ఏదీ కాదు, స్కిప్నా = ఏదీ కాదు, స్థాయి = ఏదీ కాదు, సంఖ్యా_మాత్రమే = ఏదీ కాదు, min_count = 0, **kwargs)



ఎక్కడ,





అక్షం: {నిలువు వరుసలు (1), సూచిక (0)}

ఆర్డర్: ఫలితాన్ని గణిస్తున్నప్పుడు NA/శూన్య విలువలను విస్మరించండి.



స్థాయి: పేర్కొన్న అక్షం క్రమానుగతంగా ఉంటే (బహుళ సూచిక), శ్రేణికి మార్చడానికి ముందు నిర్దిష్ట సూచిక స్థాయికి లెక్కించండి.

సంఖ్య_మాత్రమే: కేవలం ఫ్లోట్, పూర్ణాంక మరియు బూలియన్ నిలువు వరుసలు ఆమోదయోగ్యమైనవి. ఏదీ లేకుంటే, ప్రతిదీ ఉపయోగించడానికి ప్రయత్నించండి; కాకపోతే, సంఖ్యా డేటా మాత్రమే. సిరీస్ కోసం, అమలు చేయబడలేదు.

కనిష్ట_గణన: ఆపరేషన్‌ను పూర్తి చేయడానికి అవసరమైన సాధ్యం విలువల సంఖ్య. min_count కంటే తక్కువ నాన్-NA విలువలు ఉన్నట్లయితే ఫలితం NA అవుతుంది.

రిటర్న్స్: డేటాఫ్రేమ్ (స్థాయి పేర్కొన్నట్లయితే) లేదా సిరీస్.

ఉదాహరణ # 01: డేటాఫ్రేమ్ కాలమ్ మరియు అన్ని నిలువు వరుసల మొత్తాన్ని నిర్ణయించండి

మాకు మొదట చెల్లుబాటు అయ్యే డేటాటైప్‌లతో కూడిన డేటాఫ్రేమ్ అవసరం, అంటే, పూర్ణాంక, ఫ్లోట్, మొదలైనవి, కాలమ్ లేదా కాలమ్‌ల కోసం మేము డేటా మొత్తాన్ని కనుగొనగలము. pd.DataFrame() ఫంక్షన్‌ని ఉపయోగించడం ద్వారా డేటాఫ్రేమ్ సృష్టించబడుతుంది.


మేము pd.DataFrame() ఫంక్షన్‌లోని పైథాన్ నిఘంటువు నుండి అవసరమైన డేటాఫ్రేమ్‌ని సృష్టించాము. పైన సృష్టించబడిన డేటాఫ్రేమ్‌లో, 'పేరు', 'రోజు1', 'రోజు2' మరియు 'రోజు3' అనే నాలుగు నిలువు వరుసలు ఉన్నాయి. నాలుగు నిలువు వరుసలలో మూడు నిలువు వరుసలు అంటే “day1”, “day2” మరియు “day3” అనేవి డేటా విలువలతో కూడిన సంఖ్యా నిలువు వరుసలు (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2), మరియు (7, 4, 3, 5, 6, 2, 1, 4) వరుసగా. మేము ఈ మూడు నిలువు వరుసల మొత్తాన్ని మాత్రమే కనుగొనగలము. శ్రేణి (అనగా, నిలువు వరుస) మరియు మొత్తం డేటాఫ్రేమ్ రెండింటి కోసం మొత్తాన్ని మొత్తం () పద్ధతిని ఉపయోగించి నిర్ణయించవచ్చు. పాండాస్ కాలమ్‌లో మొత్తం డేటాను ఎలా సంకలనం చేయాలో నేర్పడం ద్వారా ప్రారంభిద్దాం.


మొత్తాన్ని నిర్ణయించడానికి, మేము “day2” నిలువు వరుసలో మొత్తం() పద్ధతిని ఉపయోగించాము. ఫంక్షన్ మొత్తం విలువ 28ని అందించింది. ఇదే విధంగా, మేము ప్రతి డేటాఫ్రేమ్ కాలమ్ మొత్తాన్ని గుర్తించవచ్చు. మొత్తం డేటాఫ్రేమ్‌లో మొత్తం () పద్ధతిని ఉపయోగించడం ద్వారా ఇది నెరవేరుతుంది.


ఇది చూడగలిగినట్లుగా, 'day1' కాలమ్ మొత్తం 31; “day2” కోసం, మొత్తం విలువ 28, అయితే, “day3” నిలువు వరుస కోసం, మొత్తం విలువ 32.

ఉదాహరణ # 02: డేటాఫ్రేమ్ కాలమ్ విలువలను కలిపి సంక్షిప్తం చేయడానికి సమ్() ఫంక్షన్‌ని ఉపయోగించడం

మునుపటి ఉదాహరణ యొక్క అవుట్‌పుట్ నుండి మీరు చూడగలిగినట్లుగా, ఫంక్షన్ మొత్తాన్ని రూపొందించిన వాస్తవ డేటా ఫ్రేమ్ కాలమ్ డేటాను అందించలేదు. అయితే, డేటాఫ్రేమ్ నిలువు వరుసకు “DataFrame.sum()” పద్ధతిని కేటాయించడం ద్వారా, మీరు మొత్తం కాలమ్‌తో సహా DataFrameలోని ప్రతి నిలువు వరుసను యాక్సెస్ చేయవచ్చు. మొదట, మేము ఈ ఉదాహరణ కోసం మరొక డేటాఫ్రేమ్‌ని సృష్టిస్తాము.


pd.DataFrame()ని ఉపయోగించి మా డేటాఫ్రేమ్ సృష్టించబడింది. మేము డేటాఫ్రేమ్‌ను మూడు నిలువు వరుసలతో సృష్టించాము: వస్తువు, ధర మరియు పన్ను. స్ట్రింగ్ విలువలు ('పెన్', 'మార్కర్', 'రూలర్', 'ఎరేజర్', 'పెన్సిల్', 'క్లిప్‌బోర్డ్', 'స్టెప్లర్', 'పిన్స్') కలిగి ఉన్న నిలువు వరుస అంశం, విలువలను నిల్వ చేసే నిలువు వరుస ధర (20, 15, 10, 3, 5, 30, 35, 10), మరియు 'పన్ను' కాలమ్ విలువలను కలిగి ఉంటుంది (8, 5, 3, 3, 4, 10, 5, 2). ఇప్పుడు ధర మరియు పన్ను కాలమ్ విలువలను జోడించి, ఒరిజినల్ డేటాఫ్రేమ్ నిలువు వరుసలను ఉంచడం ద్వారా ఫలితాలను కొత్త కాలమ్‌లో నిల్వ చేద్దాం.


కొత్త నిలువు వరుస 'మొత్తం'తో పాటు గమనించవచ్చు కాబట్టి, ఇచ్చిన డేటాఫ్రేమ్ యొక్క అసలు నిలువు వరుసలు కూడా ఫంక్షన్ ద్వారా అందించబడతాయి. 'మొత్తం' నిలువు వరుస 'ధర' మరియు 'పన్ను' నిలువు వరుసల విలువల మొత్తాన్ని ప్రతి 'అంశం' డేటాకు వ్యతిరేకంగా నిల్వ చేస్తుంది.

ఉదాహరణ # 03: పేర్కొన్న డేటాఫ్రేమ్ కాలమ్‌ల మొత్తాన్ని నిర్ణయించడానికి సమ్() ఫంక్షన్‌ని ఉపయోగించడం

డేటాఫ్రేమ్ యొక్క బహుళ నిలువు వరుసలను కలిపి, మేము నిలువు వరుసల లేబుల్‌లతో జాబితాను పేర్కొనవచ్చు, ఆపై మొత్తాన్ని కనుగొనడానికి జాబితాలో మొత్తం() పద్ధతిని వర్తింపజేయవచ్చు. మునుపటి ఉదాహరణల వలె, మేము మొదట డేటాఫ్రేమ్‌ను సృష్టిస్తాము.


“విద్యార్థులు”, “మార్కులు1”, “మార్కులు2” మరియు “మార్కులు3” అనే నాలుగు నిలువు వరుసలతో మేము మా డేటాఫ్రేమ్‌ని సృష్టించాము. “విద్యార్థులు” కాలమ్ డేటాను నిల్వ చేస్తుంది (“లారీ”, “జేమ్స్”, “రాబ్”, “ఆర్య”, “మాక్స్”, “బెన్”, “గ్వెన్”, “బిల్”), మరియు కాలమ్ “మార్క్స్1” నిల్వ చేస్తుంది విలువలు (8, 9, 6, 8, 10, 7, 9, 9), అయితే “మార్క్‌లు 2” మరియు “మార్క్స్ 3” నిలువు వరుసలు సంఖ్యా విలువలను (6, 6, 8, 6, 7, 9, 10, 9) నిల్వ చేస్తాయి ) మరియు (7, 6, 9, 7, 8, 7, 10, 10) వరుసగా.


ముందుగా, మేము 'విద్యార్థులు', 'మార్క్‌లు1' మరియు 'మార్క్‌లు3' కాలమ్ లేబుల్‌లతో జాబితా వస్తువును సృష్టించాము. అప్పుడు మొత్తం () పద్ధతి జాబితాకు వర్తించబడుతుంది. 'విద్యార్థులు' అనే నిలువు వరుస సంఖ్యా రహితంగా ఉన్నందున మాత్రమే ఫంక్షన్ marks1 మరియు marks3 నిలువు వరుసల విలువలను సంక్షిప్తీకరించింది, కాబట్టి Sum() ఫంక్షన్ కాలమ్ “విద్యార్థులు” విలువల మొత్తాన్ని కనుగొనలేదు. 'మార్క్స్1' మరియు 'మార్క్స్3' నిలువు వరుసల విలువల మొత్తాన్ని మేము 'మొత్తం' నిలువు వరుసలో నిల్వ చేసాము.

ఉదాహరణ # 04: నిర్దిష్ట పరిస్థితిని సంతృప్తిపరిచే పాండాస్ డేటాఫ్రేమ్ యొక్క నిలువు వరుసలను జోడించండి

ఈ ఉదాహరణలో, పేర్కొన్న నిలువు వరుసలు పేర్కొన్న షరతుకు అనుగుణంగా ఉంటే మేము వాటి విలువలను జోడిస్తాము.


కొత్తగా సృష్టించబడిన డేటాఫ్రేమ్‌లో 5 నిలువు వరుసలు ఉన్నాయి, అనగా “కంపెనీ”, “వారం1_సేల్స్”, “వారం2_సేల్స్”, “వారం3_సేల్స్” మరియు “బ్రాంచ్‌లు”. ఇప్పుడు, ఇవ్వబడిన డేటాఫ్రేమ్ అడ్డు వరుసల విలువల మొత్తాన్ని జోడిస్తున్నప్పుడు లేదా కనుగొన్నప్పుడు చివరి నిలువు వరుస విలువను జోడించకూడదనుకుందాం. మేము కాలమ్ విలువలను వాటి లేబుల్‌లలో 'వారం' అనే పదంతో జోడించాలనుకుంటున్నాము. 'వారం' అనే పదం కాలమ్ లేబుల్‌లో ఉందో లేదో తెలుసుకోవడానికి జాబితా గ్రహణశక్తిని సృష్టించవచ్చు.


ఇప్పుడు మేము వాటి లేబుల్‌లలో “వారం” అనే పదాన్ని కలిగి ఉన్న నిలువు వరుసలను పొందాము. మేము sum() ఫంక్షన్‌లోని axis=1 ఆర్గ్యుమెంట్‌ని ఉపయోగించి “వారం” అనే పదాన్ని కలిగి ఉన్న నిలువు వరుసలను సంగ్రహించవచ్చు.


ఈ పద్ధతిలో, మేము కోరుకోని నిలువు వరుసలను చేర్చకుండానే అడ్డు వరుసల వారీగా డేటాను సురక్షితంగా సంగ్రహించవచ్చు.

ఉదాహరణ # 5: డేటాఫ్రేమ్ యొక్క డేటాను సమూహపరచిన తర్వాత మొత్తాన్ని నిర్ణయించండి

మేము ఒకటి లేదా అంతకంటే ఎక్కువ నిలువు వరుసల డేటాను సమూహపరచిన తర్వాత డేటాఫ్రేమ్ నిలువు వరుసల మొత్తాన్ని కూడా కనుగొనవచ్చు. డేటాను కాలమ్‌లోని వర్గాలుగా వర్గీకరించడానికి groupby() పద్ధతి ఉపయోగించబడుతుంది. డేటాఫ్రేమ్‌ను క్రియేట్ చేద్దాం, తద్వారా దానిలోని ఒక నిలువు వరుసలోని డేటాను సమూహపరచవచ్చు.


ఇప్పుడు మేము “వయస్సు” కాలమ్‌లోని డేటాను సమూహపరుస్తాము మరియు సమూహంలోని ప్రతి వర్గానికి “స్కోర్1” మరియు “స్కోర్2” నిలువు వరుసల విలువలను సమూహపరుస్తాము.


మొదట డేటా విలువలను వయస్సు వారీగా సమూహపరచిన తర్వాత డేటాఫ్రేమ్‌లోని డేటాను సంగ్రహించడం వలన వయస్సు సమూహాలను బట్టి కాలమ్ వారీగా మొత్తం వస్తుంది.

ముగింపు

ఈ ట్యుటోరియల్‌లో, పాండాస్ సమ్ పద్ధతిని ఉపయోగించి డేటాఫ్రేమ్‌లలో మొత్తాన్ని ఎలా గణించాలో నేర్పడానికి మేము ప్రయత్నించాము. మేము ఈ పోస్ట్ యొక్క ఉదాహరణలలో విలువలను వరుస మరియు నిలువు వరుసల వారీగా జోడించడం గురించి చర్చించాము. అదనంగా, మీరు షరతులతో నిలువు వరుసలను ఎలా జోడించాలో మరియు డేటాఫ్రేమ్ యొక్క నిలువు వరుసను సమూహపరచిన తర్వాత విలువలను ఎలా సంకలనం చేయాలో నేర్చుకున్నారు. ఇప్పుడు మీరు డేటాఫ్రేమ్ యొక్క నిలువు వరుసలను కలిపి లేదా డేటాఫ్రేమ్ కాలమ్‌లోని విలువలను మీరే సంకలనం చేయవచ్చు.