R లో నమూనా() ఫంక్షన్

R Lo Namuna Phanksan



R లో, మేము వెక్టర్ లేదా నమూనా() ఫంక్షన్‌ని ఉపయోగించి జాబితా నుండి యాదృచ్ఛికంగా నమూనా విలువలను పొందుతాము. అనేక గణాంక అనువర్తనాల్లో ఉపయోగకరమైన డేటా యొక్క ఉపసమితిని యాదృచ్ఛికంగా ఎంచుకోవడానికి ఇది మాకు వీలు కల్పిస్తుంది. నమూనా() ఫంక్షన్‌లో ఇన్‌పుట్ జాబితా అయితే, అవుట్‌పుట్ కూడా అదే సంఖ్యలో మూలకాలతో జాబితాగా ఉంటుంది, కానీ ఎంచుకున్న మూలకాలతో ఉంటుంది. ఈ కథనం వివిధ వాదనలను సెట్ చేసే అమలుతో R యొక్క నమూనా() ఫంక్షన్‌ను ప్రదర్శిస్తుంది.

ఉదాహరణ 1: డేటా ఆర్గ్యుమెంట్‌తో నమూనా() ఫంక్షన్‌ని ఉపయోగించడం

యాదృచ్ఛికంగా సంఖ్యను రూపొందించడానికి R యొక్క నమూనా() ఫంక్షన్ తప్పనిసరిగా నమూనా డేటాతో అందించబడాలి. నమూనా డేటా అనేది నమూనా() ఫంక్షన్‌కి అవసరమైన ఆర్గ్యుమెంట్, దీని కోడ్ క్రింది వాటిలో ఇవ్వబడింది:

డేటాX < - సి ( 10 , ఇరవై , 30 , 40 , యాభై , 60 , 70 , 80 , 90 , 100 )

నమూనా ( డేటాX , 3 )

నమూనా ( డేటాX , 3 )

ఇక్కడ, మేము మొదట “డేటాఎక్స్” వేరియబుల్‌లో పూర్ణాంక మూలకాల యొక్క వెక్టర్‌లను ఉత్పత్తి చేస్తాము. తరువాత, మేము కోడ్‌లో నమూనా() ఫంక్షన్‌ని రెండుసార్లు పిలుస్తాము మరియు దానికి ఆర్గ్యుమెంట్‌గా మేము గతంలో రూపొందించిన “డేటాఎక్స్” వెక్టర్‌ను పాస్ చేస్తాము. నమూనా (డేటాఎక్స్, 3) యొక్క మొదటి ఉపయోగం 'డేటాఎక్స్' వెక్టర్ నుండి మూడు మూలకాల యొక్క యాదృచ్ఛిక నమూనాను తీసుకుంటుంది. ఫలితాలు 'dataX' నుండి మూడు మూలకాల యొక్క యాదృచ్ఛిక ప్రస్తారణ. ఆ తర్వాత, మేము మళ్ళీ నమూనా(a, 5)ని ఉపయోగిస్తాము, ఇది 'dataX' వెక్టర్ నుండి మూడు మూలకాల యొక్క మరొక స్వతంత్ర యాదృచ్ఛిక నమూనాను తీసుకుంటుంది. ఈసారి, గత ఫలితాల కంటే పూర్తిగా భిన్నమైన ఫలితం ఉంది.







అవుట్‌పుట్ నమూనా() ఫంక్షన్‌ని రెండుసార్లు కాల్ చేయడంలో విభిన్న అంశాలను చూపుతుంది. మేము యాదృచ్ఛికంగా నమూనాను సృష్టించిన ప్రతిసారీ, వెక్టర్స్ నుండి విభిన్న మూలకాలు పొందబడతాయి:





ఉదాహరణ 2: రీప్లేస్ ఆర్గ్యుమెంట్‌తో నమూనా() ఫంక్షన్‌ని ఉపయోగించడం

ఇంకా, మేము లాజికల్ విలువలను తీసుకునే నమూనా() ఫంక్షన్ యొక్క 'భర్తీ' వాదనను కలిగి ఉన్నాము. రీప్లేస్‌మెంట్ ఆప్షన్, TRUEతో ఎలిమెంట్‌ని శాంపిల్ చేస్తే సారూప్య మూలకం ఒకటి కంటే ఎక్కువసార్లు ఎంచుకోవచ్చు. అయినప్పటికీ, విలువ తప్పుకు సెట్ చేయబడితే, ప్రతి మూలకం యొక్క ఒక ఎంపిక మాత్రమే ఉంటుంది, దీని వలన మూలకాలు భర్తీ చేయకుండా నమూనా చేయబడతాయి.





యాదృచ్ఛిక_సంఖ్యలు = సి ( పదకొండు , 25 , 12 , 89 , నాలుగు ఐదు , 16 , 67 , 38 , 96 , 55 , 73 )

నమూనా ( యాదృచ్ఛిక_సంఖ్యలు , 4 , భర్తీ చేయండి = నిజం )

నమూనా ( యాదృచ్ఛిక_సంఖ్యలు , 5 , భర్తీ చేయండి = నిజం )

ఇక్కడ, మేము మొదట వెక్టార్‌ను “random_numbers” వేరియబుల్‌లో కొన్ని సంఖ్యా విలువలతో నిర్వచించాము. ఆ తర్వాత, మేము నమూనా() ఫంక్షన్‌ని అమలు చేస్తాము, ఇక్కడ “random_numbers” ఆర్గ్యుమెంట్‌గా పంపబడుతుంది. “4” విలువ నమూనా() ఫంక్షన్‌కు పేర్కొనబడింది, ఇది “random_numbers”లోని వెక్టర్స్ నుండి నాలుగు యాదృచ్ఛిక విలువలను మాత్రమే ఎంపిక చేస్తుందని సూచిస్తుంది.

తరువాత, నమూనా() ఫంక్షన్‌లోని భర్తీ=TRUE ప్రతి విలువను ఒకటి కంటే ఎక్కువసార్లు ఎంచుకోవచ్చని నిర్దేశిస్తుంది. అప్పుడు, మేము ఈసారి వెక్టర్స్ నుండి “5” యాదృచ్ఛిక విలువలను ఎంచుకునే నమూనా() ఫంక్షన్‌ను మళ్లీ అమలు చేస్తాము. అదేవిధంగా, మేము ప్రతి విలువకు బహుళ ఎంపిక ఎంపికల కోసం భర్తీ వాదనను 'TRUE'తో మునుపటిలా సెట్ చేస్తాము.



మనం చూడగలిగినట్లుగా, మొదటి అవుట్‌పుట్ “random_numbers” వెక్టార్ నుండి యాదృచ్ఛికంగా ఎంచుకున్న 4 మూలకాల యొక్క వెక్టర్‌ను ప్రదర్శిస్తుంది. అయితే, తదుపరి అవుట్‌పుట్, యాదృచ్ఛికంగా ఎంచుకున్న మూలకాల '5' యొక్క వెక్టర్‌ను ప్రదర్శిస్తుంది:

ఉదాహరణ 3: సైజు ఆర్గ్యుమెంట్‌తో నమూనా() ఫంక్షన్‌ని ఉపయోగించడం

నమూనా() ఫంక్షన్ పాస్ అయ్యే తదుపరి వాదన “పరిమాణం”. 'పరిమాణం' అనేది డ్రా చేయవలసిన నమూనాల విలువను సూచించే ఐచ్ఛిక పరామితి. 'పరిమాణం' పరామితితో నమూనా() ఫంక్షన్ యొక్క కోడ్ క్రింది వాటిలో ఇవ్వబడింది:

వెక్టర్స్ < - 1 : 10

నమూనా ( వెక్టర్స్ , పరిమాణం = 5 )

ఇక్కడ, సంఖ్యా వెక్టార్ 'వెక్టర్స్' వేరియబుల్‌లో 1 నుండి 10 వరకు పూర్ణాంకాల క్రమం అని నిర్వచించబడింది. నమూనా() ఫంక్షన్ వెక్టర్ నుండి యాదృచ్ఛిక మూలకాల ఎంపికకు ఉపయోగించబడుతుంది. మనం చూడగలిగినట్లుగా, నమూనా () ఫంక్షన్ రెండు వాదనలను తీసుకుంటుంది. మొదటి వాదన మేము నమూనాను పొందే వెక్టర్స్. తదుపరి ఆర్గ్యుమెంట్ '5' విలువతో పేర్కొనబడిన పరిమాణం, ఇది వెక్టర్ నుండి ఎంచుకోవడానికి ఐదు మూలకాలు మాత్రమే ఉన్నాయని సూచిస్తుంది.

అందువల్ల, ఎంచుకున్న మూలకాలు క్రింది అవుట్‌పుట్‌లో కొత్త వెక్టర్‌గా యాదృచ్ఛిక క్రమంలో తిరిగి ఇవ్వబడతాయి:

ఉదాహరణ 4: R జాబితా కోసం నమూనా() ఫంక్షన్‌ని ఉపయోగించడం

అంతేకాకుండా, నమూనా() ఫంక్షన్‌ని Rలోని జాబితా కోసం ఉపయోగించవచ్చు. ఉదాహరణలోని ఈ విభాగం జాబితా నుండి యాదృచ్ఛిక విలువలను పొందుతుంది.

R_జాబితా < - జాబితా ( 1 : 4 ,

913 ,

సి ( 'X' , 'YYY' , 'మంచిది' ) ,

'ZZZ' ,

5 )

ఫలితం < - R_జాబితా [ నమూనా ( 1 : పొడవు ( R_జాబితా ) , పరిమాణం = 4 ) ]

ఫలితం

ఇక్కడ, 'R_list' జాబితా సంఖ్యల వెక్టర్, ఒకే సంఖ్య, అక్షర వెక్టర్, స్ట్రింగ్ మరియు మరొక సంఖ్యతో సహా వివిధ రకాల మూలకాలతో నిర్వచించబడింది. ఆ తరువాత, మేము నమూనా() ఫంక్షన్ ప్రారంభించబడిన 'ఫలితం' వేరియబుల్‌ను సృష్టిస్తాము.

నమూనా() ఫంక్షన్ లోపల, మేము '1:length(R_list)' ఎక్స్‌ప్రెషన్‌ను సెట్ చేసాము, ఇది నమూనా ద్వారా సూచికల వెక్టర్‌లను సూచిస్తుంది. తరువాత, నమూనా చేయవలసిన మూలకాల సంఖ్యను పేర్కొనడానికి మనకు “పరిమాణం” ఆర్గ్యుమెంట్ ఉంది, అది “4”. కాబట్టి, “R_list” అనేది “R_list” జాబితా నుండి యాదృచ్ఛికంగా ఎంచుకున్న మూడు మూలకాలను ఉత్పత్తి చేస్తుంది. 'R_list' జాబితాలోని మూలకాలు వివిధ రకాలుగా ఉన్నందున, 'ఫలితం'లోని మూలకాలు కూడా వివిధ రకాలుగా ఉండవచ్చు.

అవుట్‌పుట్ అసలు జాబితా యొక్క యాదృచ్ఛిక ఉపసమితిని కలిగి ఉన్న కొత్త జాబితాను సూచిస్తుంది:

ఉదాహరణ 5: ప్రోబ్ ఆర్గ్యుమెంట్‌తో నమూనా() ఫంక్షన్‌ని ఉపయోగించడం

అదనంగా, మేము నమూనా() ఫంక్షన్ యొక్క “ప్రాబ్” పరామితిని కలిగి ఉన్నాము. 'ప్రాబ్' ఆర్గ్యుమెంట్ వెక్టర్‌లో ఎంచుకున్న మూలకం యొక్క సంభావ్యతను ఇస్తుంది. 'ప్రాబ్' ఆర్గ్యుమెంట్ ఉపయోగించనప్పుడు అన్ని మూలకాలు సమాన సంభావ్యతను కలిగి ఉన్నాయని గమనించండి.

నా_డేటా = సి ( 31 , 99 , 5 , 24 , 72 )

నమూనా ( నా_డేటా , పరిమాణం = 10 , భర్తీ చేయండి = నిజం ,

సమస్య = సి ( 0.5 , ప్రతినిధి ( 0.1 , 4 ) ) )

ఇక్కడ, సంఖ్యా వెక్టర్స్ యొక్క మూలకాలు 'my_data'కు సూచించబడతాయి. తదుపరి దశలో, 'my_data' దాని నుండి యాదృచ్ఛికంగా ఎంచుకున్న 10 మూలకాలకు పంపబడిన నమూనా() ఫంక్షన్‌ని మేము పిలుస్తాము. అప్పుడు, 'పరిమాణం' ఆర్గ్యుమెంట్ నిర్వచించబడింది, ఇది యాదృచ్ఛికంగా ఎంచుకోవలసిన విలువ '10' పరిమాణంలో ఉండాలని నిర్దేశిస్తుంది. ఆ తర్వాత, మేము 'భర్తీ' ఆర్గ్యుమెంట్‌కు 'TRUE'ని కేటాయిస్తాము అంటే ఎంచుకున్న ప్రతి మూలకం తదుపరిదాన్ని ఎంచుకునే ముందు వెక్టర్‌లోకి భర్తీ చేయబడుతుంది. నమూనా() ఫంక్షన్‌లో నిర్వచించబడిన మూడవ ఆర్గ్యుమెంట్ “ప్రాబ్”, ఇది ఎంచుకోవలసిన “my_data” వెక్టర్‌లోని ప్రతి మూలకం యొక్క సంభావ్యతను నిర్వచిస్తుంది. మొదటి మూలకం యొక్క సంభావ్యత '0.5'కి సెట్ చేయబడింది. మిగిలిన నాలుగు వెక్టార్ మూలకాల కోసం, సంభావ్యత '0.1'.

కింది అవుట్‌పుట్ ఆశించిన విధంగా వెక్టర్స్‌లోని మొదటి మూలకం యొక్క అత్యధిక సంభావ్యతతో తిరిగి పొందబడింది:

ఉదాహరణ 6: బార్‌ప్లాట్‌ను రెండర్ చేయడానికి నమూనా() ఫంక్షన్‌ని ఉపయోగించడం

చివరగా, ఇచ్చిన సంభావ్యత పంపిణీతో వర్గీకరణ వేరియబుల్ యొక్క పంపిణీని దృశ్యమానం చేయడానికి R లో బార్‌ప్లాట్‌ను నిర్మించడానికి నమూనా() ఫంక్షన్ ఉపయోగించబడుతుంది.

నమూనా_డేటా = సి ( 1 , 2 , 3 )

బార్‌ప్లాట్ ( పట్టిక ( నమూనా ( నమూనా_డేటా , పరిమాణం = 500 , భర్తీ చేయండి = నిజం , సమస్య = సి ( .30 , .60 , .10 ) ) ) )

ఇక్కడ, పూర్ణాంక విలువ యొక్క వెక్టార్‌తో “నమూనా_డేటా”ను నిర్వచించిన తర్వాత, మేము నమూనా() ఫంక్షన్‌ని అమలు చేయడం ద్వారా బార్‌ప్లాట్‌ను రూపొందిస్తాము. ముందుగా, ఫలిత నమూనా యొక్క ఫ్రీక్వెన్సీ పట్టికను రూపొందించడానికి టేబుల్() ఫంక్షన్‌ను ప్రారంభించే బార్‌ప్లాట్‌ని మేము పిలుస్తాము. అప్పుడు, మేము టేబుల్() ఫంక్షన్‌లోని నమూనా() ఫంక్షన్‌ను పేర్కొంటాము, ఇక్కడ పూర్ణాంకాల 1 నుండి 3 వరకు ఉన్న వెక్టర్ నుండి 1000 పరిమాణం యొక్క యాదృచ్ఛిక నమూనా డ్రా చేయబడుతుంది. ఆపై, ప్రతి పూర్ణాంకాన్ని ఎంచుకునే సంభావ్యతను పేర్కొనడానికి “ప్రాబ్” ఆర్గ్యుమెంట్ ఉపయోగించబడుతుంది. .

మనం ఇప్పుడు చూడగలిగినట్లుగా, బార్‌ప్లాట్ కింది వాటిలో మూడు బార్‌లతో రెండర్ చేయబడింది, ప్రతి పూర్ణాంకానికి ఒకటి, మరియు బార్‌ల ఎత్తు నమూనాలో సంభవించే పూర్ణాంకానికి సంబంధించినది:

ముగింపు

వివిధ ఉదాహరణలతో నమూనా() ఫంక్షన్ ఎలా పనిచేస్తుందో మనం చూశాము. నమూనా() ఫంక్షన్ నమూనా డేటా అవసరమయ్యే వివిధ ఆర్గ్యుమెంట్‌లతో ఉపయోగించబడుతుంది మరియు అన్ని ఇతర ఆర్గ్యుమెంట్‌లు ఐచ్ఛికం మరియు నిర్దిష్ట సందర్భాలలో పిలవబడతాయి. అయినప్పటికీ, నమూనా() ఫంక్షన్ గణాంక విశ్లేషణలో లేదా పెద్ద డేటాసెట్‌లతో పని చేస్తున్నప్పుడు ఉపయోగకరంగా ఉంటుంది.