R డేటాఫ్రేమ్‌లో నిలువు వరుసల సంఖ్యను పొందండి

R Detaphrem Lo Niluvu Varusala Sankhyanu Pondandi



R లో, నిలువు వరుసల సంఖ్యను పొందడం అనేది డేటాఫ్రేమ్‌లతో పనిచేసేటప్పుడు అనేక సందర్భాల్లో అవసరమైన ప్రాథమిక ఆపరేషన్. డేటాను సబ్‌సెట్టింగ్, విశ్లేషించడం, మానిప్యులేట్ చేయడం, ప్రచురించడం మరియు విజువలైజ్ చేసేటప్పుడు, నిలువు వరుసల సంఖ్య తెలుసుకోవలసిన కీలకమైన సమాచారం. అందువల్ల, పేర్కొన్న డేటాఫ్రేమ్ యొక్క మొత్తం నిలువు వరుసలను పొందడానికి R విభిన్న విధానాలను అందిస్తుంది. ఈ వ్యాసంలో, డేటాఫ్రేమ్ యొక్క నిలువు వరుసల గణనను పొందడానికి మాకు సహాయపడే కొన్ని విధానాలను మేము చర్చిస్తాము.

ఉదాహరణ 1: Ncol() ఫంక్షన్‌ని ఉపయోగించడం

డేటాఫ్రేమ్‌ల మొత్తం నిలువు వరుసలను పొందడానికి ncol() అనేది చాలా తరచుగా చేసే ఫంక్షన్.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('------డేటా ఫ్రేమ్‌లోని నిలువు వరుసల సంఖ్య :', n)

ఈ ఉదాహరణలో, R లోని data.frame() ఫంక్షన్‌ని ఉపయోగించి 'y1', 'y2' మరియు 'y3'గా లేబుల్ చేయబడిన మూడు నిలువు వరుసలతో మేము మొదట 'df' డేటాఫ్రేమ్‌ని సృష్టిస్తాము. ప్రతి నిలువు వరుసలోని మూలకాలు ఉపయోగించి పేర్కొనబడ్డాయి మూలకాల యొక్క వెక్టర్‌ను సృష్టించే c() ఫంక్షన్. అప్పుడు, “n” వేరియబుల్ ఉపయోగించి, “df” డేటాఫ్రేమ్‌లోని మొత్తం నిలువు వరుసలను నిర్ణయించడానికి ncol() ఫంక్షన్ ఉపయోగించబడుతుంది. చివరగా, వివరణాత్మక సందేశం మరియు “n” వేరియబుల్‌తో, అందించిన cat() ఫంక్షన్ కన్సోల్‌లో ఫలితాలను ముద్రిస్తుంది.



ఊహించిన విధంగా, తిరిగి పొందిన అవుట్‌పుట్ పేర్కొన్న డేటాఫ్రేమ్‌లో మూడు నిలువు వరుసలు ఉన్నాయని సూచిస్తుంది:







ఉదాహరణ 2: ఖాళీ డేటాఫ్రేమ్ కోసం మొత్తం నిలువు వరుసలను లెక్కించండి

తరువాత, మేము ncol() ఫంక్షన్‌ను ఖాళీ డేటాఫ్రేమ్‌కు వర్తింపజేస్తాము, ఇది మొత్తం నిలువు వరుసల విలువలను కూడా పొందుతుంది కానీ ఆ విలువ సున్నా.

ఖాళీ_df <- data.frame()

n <- ncol(ఖాళీ_df)

cat('---డేటా ఫ్రేమ్‌లోని నిలువు వరుసలు :', n)

ఈ ఉదాహరణలో, మేము కాలమ్‌లు లేదా అడ్డు వరుసలను పేర్కొనకుండా data.frame()కి కాల్ చేయడం ద్వారా ఖాళీ DataFrame, “empty_df”ని రూపొందిస్తాము. తరువాత, మేము డేటాఫ్రేమ్‌లోని నిలువు వరుసల సంఖ్యను కనుగొనడానికి ఉపయోగించే ncol() ఫంక్షన్‌ని ఉపయోగిస్తాము. ncol() ఫంక్షన్ మొత్తం నిలువు వరుసలను పొందడానికి ఇక్కడ “empty_df” డేటాఫ్రేమ్‌తో సెట్ చేయబడింది. “empty_df” డేటాఫ్రేమ్ ఖాళీగా ఉన్నందున, దానికి నిలువు వరుసలు లేవు. కాబట్టి, ncol(empty_df) అవుట్‌పుట్ 0. ఫలితాలు ఇక్కడ అమలు చేయబడిన cat() ఫంక్షన్ ద్వారా ప్రదర్శించబడతాయి.



డేటాఫ్రేమ్ ఖాళీగా ఉన్నందున అవుట్‌పుట్ ఊహించిన విధంగా “0” విలువను చూపుతుంది.

ఉదాహరణ 3: పొడవు() ఫంక్షన్‌తో Select_If() ఫంక్షన్‌ని ఉపయోగించడం

మేము ఏదైనా నిర్దిష్ట రకం నిలువు వరుసల సంఖ్యను తిరిగి పొందాలనుకుంటే, R యొక్క పొడవు() ఫంక్షన్‌తో కలిపి select_if() ఫంక్షన్‌ని ఉపయోగించాలి. ఈ ఫంక్షన్‌లు ప్రతి రకం నిలువు వరుసల మొత్తాన్ని పొందడానికి కలిపి ఉపయోగించబడతాయి. . ఈ ఫంక్షన్‌లను ఉపయోగించడానికి కోడ్ క్రింది వాటిలో అమలు చేయబడుతుంది:

లైబ్రరీ (dplyr)

x1<-అక్షరాలు[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-నమూనా(c('వేసవి','శీతాకాలం'),10,భర్తీ=నిజం)

df1<-data.frame(x1,x2,x3,x4)

df1

పొడవు(select_if(df1,is.numeric))

ఈ ఉదాహరణలో, మేము మొదట dplyr ప్యాకేజీని లోడ్ చేస్తాము, తద్వారా మనం select_if() ఫంక్షన్ మరియు పొడవు() ఫంక్షన్‌ని యాక్సెస్ చేయవచ్చు. అప్పుడు, మేము నాలుగు వేరియబుల్స్‌ను సృష్టిస్తాము - 'x1', 'x2', 'x3' మరియు 'x4', వరుసగా. ఇక్కడ, “x1” ఆంగ్ల వర్ణమాల యొక్క మొదటి 10 పెద్ద అక్షరాలను కలిగి ఉంది. “x2” మరియు “x3” వేరియబుల్స్ వరుసగా 2 మరియు 5 పారామీటర్‌లతో 10 యాదృచ్ఛిక సంఖ్యల రెండు వేర్వేరు వెక్టర్‌లను సృష్టించడానికి rpois() ఫంక్షన్‌ని ఉపయోగించి ఉత్పత్తి చేయబడతాయి. “x4” వేరియబుల్ అనేది వెక్టర్ c (“వేసవి”, “శీతాకాలం”) నుండి యాదృచ్ఛికంగా నమూనా చేయబడిన 10 మూలకాలతో కూడిన ఫ్యాక్టర్ వెక్టర్.

అప్పుడు, మేము 'df1' DataFrameని సృష్టించడానికి ప్రయత్నిస్తాము, ఇక్కడ అన్ని వేరియబుల్స్ data.frame() ఫంక్షన్‌లో పాస్ చేయబడతాయి. చివరగా, dplyr ప్యాకేజీ నుండి select_if() ఫంక్షన్‌ని ఉపయోగించి సృష్టించబడిన “df1” DataFrame యొక్క పొడవును నిర్ణయించడానికి మేము పొడవు() ఫంక్షన్‌ని అమలు చేస్తాము. select_if() ఫంక్షన్ “df1” DataFrame నుండి నిలువు వరుసలను ఆర్గ్యుమెంట్‌గా ఎంచుకుంటుంది మరియు is.numeric() ఫంక్షన్ సంఖ్యా విలువలను కలిగి ఉన్న నిలువు వరుసలను మాత్రమే ఎంపిక చేస్తుంది. అప్పుడు, పొడవు() ఫంక్షన్ మొత్తం కోడ్ యొక్క అవుట్‌పుట్ అయిన select_if() ద్వారా ఎంపిక చేయబడిన మొత్తం నిలువు వరుసలను పొందుతుంది.

కాలమ్ యొక్క పొడవు క్రింది అవుట్‌పుట్‌లో చూపబడింది, ఇది డేటాఫ్రేమ్ యొక్క మొత్తం నిలువు వరుసలను సూచిస్తుంది:

ఉదాహరణ 4: Sapply() ఫంక్షన్‌ని ఉపయోగించడం

దీనికి విరుద్ధంగా, మనం నిలువు వరుసల తప్పిపోయిన విలువలను మాత్రమే లెక్కించాలనుకుంటే, మనకు sapply() ఫంక్షన్ ఉంటుంది. sapply() ఫంక్షన్ ప్రత్యేకంగా పనిచేయడానికి డేటాఫ్రేమ్‌లోని ప్రతి నిలువు వరుసపై మళ్ళిస్తుంది. sapply() ఫంక్షన్ మొదట డేటాఫ్రేమ్‌తో ఆర్గ్యుమెంట్‌గా పాస్ చేయబడింది. అప్పుడు, ఆ డేటాఫ్రేమ్‌లో ఆపరేషన్ చేయవలసి ఉంటుంది. డేటాఫ్రేమ్ నిలువు వరుసలలో NA విలువల గణనను పొందడానికి sapply() ఫంక్షన్ యొక్క అమలు క్రింది విధంగా అందించబడింది:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(new_df, function(x) sum(is.na(x)))

ఈ ఉదాహరణలో, మేము 'c1', 'c2' మరియు 'c3' అనే మూడు నిలువు వరుసలతో 'new_df' డేటాఫ్రేమ్‌ను రూపొందిస్తాము. మొదటి నిలువు వరుసలు, “c1” మరియు “c3”, NA ద్వారా సూచించబడే కొన్ని తప్పిపోయిన విలువలతో సహా సంఖ్యా విలువలను కలిగి ఉంటాయి. రెండవ నిలువు వరుస, “c2”, కొన్ని తప్పిపోయిన విలువలతో సహా అక్షరాలను కలిగి ఉంది, అవి NA ద్వారా కూడా సూచించబడతాయి. అప్పుడు, మేము sapply() ఫంక్షన్‌ని “new_df” DataFrameకి వర్తింపజేస్తాము మరియు sapply() ఫంక్షన్‌లోని sum() వ్యక్తీకరణను ఉపయోగించి ప్రతి నిలువు వరుసలోని తప్పిపోయిన విలువల సంఖ్యను గణిస్తాము.

is.na() ఫంక్షన్ అనేది సమ్() ఫంక్షన్‌కి పేర్కొనబడిన వ్యక్తీకరణ, ఇది నిలువు వరుసలోని ప్రతి మూలకం తప్పిపోయిందో లేదో సూచించే లాజికల్ వెక్టార్‌ను అందిస్తుంది. సమ్() ఫంక్షన్ ప్రతి నిలువు వరుసలో తప్పిపోయిన విలువల సంఖ్యను లెక్కించడానికి TRUE విలువలను జోడిస్తుంది.

అందువల్ల, అవుట్‌పుట్ ప్రతి నిలువు వరుసలో మొత్తం NA విలువలను ప్రదర్శిస్తుంది:

ఉదాహరణ 5: డిమ్() ఫంక్షన్‌ని ఉపయోగించడం

అదనంగా, మేము డేటాఫ్రేమ్ యొక్క అడ్డు వరుసలతో పాటు మొత్తం నిలువు వరుసలను పొందాలనుకుంటున్నాము. అప్పుడు, dim() ఫంక్షన్ DataFrame యొక్క కొలతలను అందిస్తుంది. dim() ఫంక్షన్ ఆబ్జెక్ట్‌ను ఆర్గ్యుమెంట్‌గా తీసుకుంటుంది, దీని కొలతలు మనం తిరిగి పొందాలనుకుంటున్నాము. dim() ఫంక్షన్‌ని ఉపయోగించడానికి ఇక్కడ కోడ్ ఉంది:

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

పాయింట్లు=c(8, 10, 7, 4))

మసక (d1)

ఈ ఉదాహరణలో, రెండు నిలువు వరుసలు “జట్టు” మరియు “పాయింట్లు” సెట్ చేయబడిన data.frame() ఫంక్షన్‌ని ఉపయోగించి రూపొందించబడిన “d1” DataFrameని మేము మొదట నిర్వచించాము. ఆ తర్వాత, మేము “d1” డేటాఫ్రేమ్‌పై dim() ఫంక్షన్‌ని అమలు చేస్తాము. మసక() ఫంక్షన్ DataFrame వరుసలు మరియు నిలువు వరుసల సంఖ్యను అందిస్తుంది. కాబట్టి, మేము dim(d1)ని అమలు చేసినప్పుడు, అది రెండు మూలకాలతో వెక్టార్‌ను అందిస్తుంది - వీటిలో మొదటిది 'd1' డేటాఫ్రేమ్‌లోని అడ్డు వరుసల సంఖ్యను ప్రతిబింబిస్తుంది మరియు రెండవది నిలువు వరుసల సంఖ్యను సూచిస్తుంది.

అవుట్‌పుట్ డేటాఫ్రేమ్ యొక్క కొలతలను సూచిస్తుంది, ఇక్కడ “4” విలువ మొత్తం నిలువు వరుసలను సూచిస్తుంది మరియు “2” విలువ అడ్డు వరుసలను సూచిస్తుంది:

ముగింపు

R లో నిలువు వరుసల సంఖ్యను లెక్కించడం అనేది డేటాఫ్రేమ్‌లో నిర్వహించగల సులభమైన మరియు ముఖ్యమైన ఆపరేషన్ అని మేము ఇప్పుడు తెలుసుకున్నాము. అన్ని ఫంక్షన్లలో, ncol() ఫంక్షన్ అత్యంత అనుకూలమైన మార్గం. ఇప్పుడు, ఇచ్చిన డేటాఫ్రేమ్ నుండి నిలువు వరుసల సంఖ్యను పొందడానికి వివిధ మార్గాల గురించి మాకు తెలుసు.