R లో, నిలువు వరుసల సంఖ్యను పొందడం అనేది డేటాఫ్రేమ్లతో పనిచేసేటప్పుడు అనేక సందర్భాల్లో అవసరమైన ప్రాథమిక ఆపరేషన్. డేటాను సబ్సెట్టింగ్, విశ్లేషించడం, మానిప్యులేట్ చేయడం, ప్రచురించడం మరియు విజువలైజ్ చేసేటప్పుడు, నిలువు వరుసల సంఖ్య తెలుసుకోవలసిన కీలకమైన సమాచారం. అందువల్ల, పేర్కొన్న డేటాఫ్రేమ్ యొక్క మొత్తం నిలువు వరుసలను పొందడానికి R విభిన్న విధానాలను అందిస్తుంది. ఈ వ్యాసంలో, డేటాఫ్రేమ్ యొక్క నిలువు వరుసల గణనను పొందడానికి మాకు సహాయపడే కొన్ని విధానాలను మేము చర్చిస్తాము.
ఉదాహరణ 1: Ncol() ఫంక్షన్ని ఉపయోగించడం
డేటాఫ్రేమ్ల మొత్తం నిలువు వరుసలను పొందడానికి ncol() అనేది చాలా తరచుగా చేసే ఫంక్షన్.
df <- data.frame('y1' = c(10, 12, 14, 19),
'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))
n <- ncol(df)
cat('------డేటా ఫ్రేమ్లోని నిలువు వరుసల సంఖ్య :', n)
ఈ ఉదాహరణలో, R లోని data.frame() ఫంక్షన్ని ఉపయోగించి 'y1', 'y2' మరియు 'y3'గా లేబుల్ చేయబడిన మూడు నిలువు వరుసలతో మేము మొదట 'df' డేటాఫ్రేమ్ని సృష్టిస్తాము. ప్రతి నిలువు వరుసలోని మూలకాలు ఉపయోగించి పేర్కొనబడ్డాయి మూలకాల యొక్క వెక్టర్ను సృష్టించే c() ఫంక్షన్. అప్పుడు, “n” వేరియబుల్ ఉపయోగించి, “df” డేటాఫ్రేమ్లోని మొత్తం నిలువు వరుసలను నిర్ణయించడానికి ncol() ఫంక్షన్ ఉపయోగించబడుతుంది. చివరగా, వివరణాత్మక సందేశం మరియు “n” వేరియబుల్తో, అందించిన cat() ఫంక్షన్ కన్సోల్లో ఫలితాలను ముద్రిస్తుంది.
ఊహించిన విధంగా, తిరిగి పొందిన అవుట్పుట్ పేర్కొన్న డేటాఫ్రేమ్లో మూడు నిలువు వరుసలు ఉన్నాయని సూచిస్తుంది:
ఉదాహరణ 2: ఖాళీ డేటాఫ్రేమ్ కోసం మొత్తం నిలువు వరుసలను లెక్కించండి
తరువాత, మేము ncol() ఫంక్షన్ను ఖాళీ డేటాఫ్రేమ్కు వర్తింపజేస్తాము, ఇది మొత్తం నిలువు వరుసల విలువలను కూడా పొందుతుంది కానీ ఆ విలువ సున్నా.
ఖాళీ_df <- data.frame()n <- ncol(ఖాళీ_df)
cat('---డేటా ఫ్రేమ్లోని నిలువు వరుసలు :', n)
ఈ ఉదాహరణలో, మేము కాలమ్లు లేదా అడ్డు వరుసలను పేర్కొనకుండా data.frame()కి కాల్ చేయడం ద్వారా ఖాళీ DataFrame, “empty_df”ని రూపొందిస్తాము. తరువాత, మేము డేటాఫ్రేమ్లోని నిలువు వరుసల సంఖ్యను కనుగొనడానికి ఉపయోగించే ncol() ఫంక్షన్ని ఉపయోగిస్తాము. ncol() ఫంక్షన్ మొత్తం నిలువు వరుసలను పొందడానికి ఇక్కడ “empty_df” డేటాఫ్రేమ్తో సెట్ చేయబడింది. “empty_df” డేటాఫ్రేమ్ ఖాళీగా ఉన్నందున, దానికి నిలువు వరుసలు లేవు. కాబట్టి, ncol(empty_df) అవుట్పుట్ 0. ఫలితాలు ఇక్కడ అమలు చేయబడిన cat() ఫంక్షన్ ద్వారా ప్రదర్శించబడతాయి.
డేటాఫ్రేమ్ ఖాళీగా ఉన్నందున అవుట్పుట్ ఊహించిన విధంగా “0” విలువను చూపుతుంది.
ఉదాహరణ 3: పొడవు() ఫంక్షన్తో Select_If() ఫంక్షన్ని ఉపయోగించడం
మేము ఏదైనా నిర్దిష్ట రకం నిలువు వరుసల సంఖ్యను తిరిగి పొందాలనుకుంటే, R యొక్క పొడవు() ఫంక్షన్తో కలిపి select_if() ఫంక్షన్ని ఉపయోగించాలి. ఈ ఫంక్షన్లు ప్రతి రకం నిలువు వరుసల మొత్తాన్ని పొందడానికి కలిపి ఉపయోగించబడతాయి. . ఈ ఫంక్షన్లను ఉపయోగించడానికి కోడ్ క్రింది వాటిలో అమలు చేయబడుతుంది:
లైబ్రరీ (dplyr)x1<-అక్షరాలు[1:10]
x2<-rpois(10,2)
x3<-rpois(10,5)
x4<-నమూనా(c('వేసవి','శీతాకాలం'),10,భర్తీ=నిజం)
df1<-data.frame(x1,x2,x3,x4)
df1
పొడవు(select_if(df1,is.numeric))
ఈ ఉదాహరణలో, మేము మొదట dplyr ప్యాకేజీని లోడ్ చేస్తాము, తద్వారా మనం select_if() ఫంక్షన్ మరియు పొడవు() ఫంక్షన్ని యాక్సెస్ చేయవచ్చు. అప్పుడు, మేము నాలుగు వేరియబుల్స్ను సృష్టిస్తాము - 'x1', 'x2', 'x3' మరియు 'x4', వరుసగా. ఇక్కడ, “x1” ఆంగ్ల వర్ణమాల యొక్క మొదటి 10 పెద్ద అక్షరాలను కలిగి ఉంది. “x2” మరియు “x3” వేరియబుల్స్ వరుసగా 2 మరియు 5 పారామీటర్లతో 10 యాదృచ్ఛిక సంఖ్యల రెండు వేర్వేరు వెక్టర్లను సృష్టించడానికి rpois() ఫంక్షన్ని ఉపయోగించి ఉత్పత్తి చేయబడతాయి. “x4” వేరియబుల్ అనేది వెక్టర్ c (“వేసవి”, “శీతాకాలం”) నుండి యాదృచ్ఛికంగా నమూనా చేయబడిన 10 మూలకాలతో కూడిన ఫ్యాక్టర్ వెక్టర్.
అప్పుడు, మేము 'df1' DataFrameని సృష్టించడానికి ప్రయత్నిస్తాము, ఇక్కడ అన్ని వేరియబుల్స్ data.frame() ఫంక్షన్లో పాస్ చేయబడతాయి. చివరగా, dplyr ప్యాకేజీ నుండి select_if() ఫంక్షన్ని ఉపయోగించి సృష్టించబడిన “df1” DataFrame యొక్క పొడవును నిర్ణయించడానికి మేము పొడవు() ఫంక్షన్ని అమలు చేస్తాము. select_if() ఫంక్షన్ “df1” DataFrame నుండి నిలువు వరుసలను ఆర్గ్యుమెంట్గా ఎంచుకుంటుంది మరియు is.numeric() ఫంక్షన్ సంఖ్యా విలువలను కలిగి ఉన్న నిలువు వరుసలను మాత్రమే ఎంపిక చేస్తుంది. అప్పుడు, పొడవు() ఫంక్షన్ మొత్తం కోడ్ యొక్క అవుట్పుట్ అయిన select_if() ద్వారా ఎంపిక చేయబడిన మొత్తం నిలువు వరుసలను పొందుతుంది.
కాలమ్ యొక్క పొడవు క్రింది అవుట్పుట్లో చూపబడింది, ఇది డేటాఫ్రేమ్ యొక్క మొత్తం నిలువు వరుసలను సూచిస్తుంది:
ఉదాహరణ 4: Sapply() ఫంక్షన్ని ఉపయోగించడం
దీనికి విరుద్ధంగా, మనం నిలువు వరుసల తప్పిపోయిన విలువలను మాత్రమే లెక్కించాలనుకుంటే, మనకు sapply() ఫంక్షన్ ఉంటుంది. sapply() ఫంక్షన్ ప్రత్యేకంగా పనిచేయడానికి డేటాఫ్రేమ్లోని ప్రతి నిలువు వరుసపై మళ్ళిస్తుంది. sapply() ఫంక్షన్ మొదట డేటాఫ్రేమ్తో ఆర్గ్యుమెంట్గా పాస్ చేయబడింది. అప్పుడు, ఆ డేటాఫ్రేమ్లో ఆపరేషన్ చేయవలసి ఉంటుంది. డేటాఫ్రేమ్ నిలువు వరుసలలో NA విలువల గణనను పొందడానికి sapply() ఫంక్షన్ యొక్క అమలు క్రింది విధంగా అందించబడింది:
new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))
sapply(new_df, function(x) sum(is.na(x)))
ఈ ఉదాహరణలో, మేము 'c1', 'c2' మరియు 'c3' అనే మూడు నిలువు వరుసలతో 'new_df' డేటాఫ్రేమ్ను రూపొందిస్తాము. మొదటి నిలువు వరుసలు, “c1” మరియు “c3”, NA ద్వారా సూచించబడే కొన్ని తప్పిపోయిన విలువలతో సహా సంఖ్యా విలువలను కలిగి ఉంటాయి. రెండవ నిలువు వరుస, “c2”, కొన్ని తప్పిపోయిన విలువలతో సహా అక్షరాలను కలిగి ఉంది, అవి NA ద్వారా కూడా సూచించబడతాయి. అప్పుడు, మేము sapply() ఫంక్షన్ని “new_df” DataFrameకి వర్తింపజేస్తాము మరియు sapply() ఫంక్షన్లోని sum() వ్యక్తీకరణను ఉపయోగించి ప్రతి నిలువు వరుసలోని తప్పిపోయిన విలువల సంఖ్యను గణిస్తాము.
is.na() ఫంక్షన్ అనేది సమ్() ఫంక్షన్కి పేర్కొనబడిన వ్యక్తీకరణ, ఇది నిలువు వరుసలోని ప్రతి మూలకం తప్పిపోయిందో లేదో సూచించే లాజికల్ వెక్టార్ను అందిస్తుంది. సమ్() ఫంక్షన్ ప్రతి నిలువు వరుసలో తప్పిపోయిన విలువల సంఖ్యను లెక్కించడానికి TRUE విలువలను జోడిస్తుంది.
అందువల్ల, అవుట్పుట్ ప్రతి నిలువు వరుసలో మొత్తం NA విలువలను ప్రదర్శిస్తుంది:
ఉదాహరణ 5: డిమ్() ఫంక్షన్ని ఉపయోగించడం
అదనంగా, మేము డేటాఫ్రేమ్ యొక్క అడ్డు వరుసలతో పాటు మొత్తం నిలువు వరుసలను పొందాలనుకుంటున్నాము. అప్పుడు, dim() ఫంక్షన్ DataFrame యొక్క కొలతలను అందిస్తుంది. dim() ఫంక్షన్ ఆబ్జెక్ట్ను ఆర్గ్యుమెంట్గా తీసుకుంటుంది, దీని కొలతలు మనం తిరిగి పొందాలనుకుంటున్నాము. dim() ఫంక్షన్ని ఉపయోగించడానికి ఇక్కడ కోడ్ ఉంది:
d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),పాయింట్లు=c(8, 10, 7, 4))
మసక (d1)
ఈ ఉదాహరణలో, రెండు నిలువు వరుసలు “జట్టు” మరియు “పాయింట్లు” సెట్ చేయబడిన data.frame() ఫంక్షన్ని ఉపయోగించి రూపొందించబడిన “d1” DataFrameని మేము మొదట నిర్వచించాము. ఆ తర్వాత, మేము “d1” డేటాఫ్రేమ్పై dim() ఫంక్షన్ని అమలు చేస్తాము. మసక() ఫంక్షన్ DataFrame వరుసలు మరియు నిలువు వరుసల సంఖ్యను అందిస్తుంది. కాబట్టి, మేము dim(d1)ని అమలు చేసినప్పుడు, అది రెండు మూలకాలతో వెక్టార్ను అందిస్తుంది - వీటిలో మొదటిది 'd1' డేటాఫ్రేమ్లోని అడ్డు వరుసల సంఖ్యను ప్రతిబింబిస్తుంది మరియు రెండవది నిలువు వరుసల సంఖ్యను సూచిస్తుంది.
అవుట్పుట్ డేటాఫ్రేమ్ యొక్క కొలతలను సూచిస్తుంది, ఇక్కడ “4” విలువ మొత్తం నిలువు వరుసలను సూచిస్తుంది మరియు “2” విలువ అడ్డు వరుసలను సూచిస్తుంది:
ముగింపు
R లో నిలువు వరుసల సంఖ్యను లెక్కించడం అనేది డేటాఫ్రేమ్లో నిర్వహించగల సులభమైన మరియు ముఖ్యమైన ఆపరేషన్ అని మేము ఇప్పుడు తెలుసుకున్నాము. అన్ని ఫంక్షన్లలో, ncol() ఫంక్షన్ అత్యంత అనుకూలమైన మార్గం. ఇప్పుడు, ఇచ్చిన డేటాఫ్రేమ్ నుండి నిలువు వరుసల సంఖ్యను పొందడానికి వివిధ మార్గాల గురించి మాకు తెలుసు.