పైథాన్ ఎంటిటీ ఫ్రేమ్వర్క్లను ప్రీ-ప్రాసెస్ చేయడానికి పికిల్ను ఉపయోగించవచ్చు, ఇది ఒక వస్తువును మెమరీ నుండి బైట్ స్ట్రీమ్గా మార్చే ప్రక్రియ, ఇది బైనరీ ఫార్మాట్గా డిస్క్కు సేవ్ చేయబడుతుంది. ఈ విధానాన్ని సీరియలైజేషన్ అంటారు. దీన్ని సాధించడానికి, పికిల్ డంప్() పద్ధతిని ఉపయోగించండి. ఈ బైనరీ రికార్డ్ని మళ్లీ పైథాన్ ప్రోగ్రామ్లోకి లోడ్ చేసినప్పుడు, దాన్ని డి-సీరియల్గా మార్చవచ్చు మరియు పికిల్ లోడ్() పద్ధతిని ఉపయోగించి తిరిగి పైథాన్ ఆబ్జెక్ట్గా మార్చవచ్చు.
పైథాన్ పికిల్ మాడ్యూల్ని ఉపయోగించి డేటాను, మరింత ప్రత్యేకంగా నిఘంటువుని ఎలా నిల్వ చేయాలో ఈ కథనం మీకు నేర్పుతుంది. ప్రారంభించడానికి, మేము ఊరగాయ మాడ్యూల్ను సేకరించాలి. పికిల్ డంప్() మూడు పారామితులను అంగీకరిస్తుంది. మొదటి ఇన్పుట్ సేవ్ చేయాల్సిన డేటాను నిర్దేశిస్తుంది. రెండవ పరామితి ఫైల్ ఆబ్జెక్ట్, ఇది ఫైల్ రైట్-బైనరీ (wb) మోడ్లో తెరవబడినప్పుడు తిరిగి వస్తుంది. కీ-విలువ వాదన మూడవ పరామితి. ప్రోటోకాల్ ఈ పరామితి ద్వారా నిర్వచించబడింది. ఊరగాయ రెండు రకాలుగా వర్గీకరించబడింది: అత్యధిక ప్రోటోకాల్ అలాగే ఊరగాయ డిఫాల్ట్ ప్రోటోకాల్. డేటాను తిరిగి పొందడానికి లేదా డీరియలైజ్ చేయడానికి, పికిల్ లోడ్() పద్ధతి ఉపయోగించబడుతుంది, దీని ద్వారా ఫైల్ ఆబ్జెక్ట్ను రీడ్-బైనరీ (rb) మోడ్లో తెరవడం ద్వారా పొందబడుతుంది.
ఉదాహరణ 1: పికిల్ డంప్ మరియు లోడ్ ఫంక్షన్ని ఉపయోగించి పికిల్ ఫైల్లోని డేటా యొక్క సీరియలైజేషన్ మరియు డీసీరియలైజేషన్
ఈ ఉదాహరణలో, మేము చాలా సులభమైన కోడ్తో డేటాను నిఘంటువుగా ఎలా సీరియలైజ్ చేయాలో మరియు డీరియలైజ్ చేయాలో నేర్చుకుంటాము.
మునుపటి ఉదాహరణలో అందించిన కోడ్లో, పైథాన్ లైబ్రరీ నుండి మొదటి పికిల్ మాడ్యూల్ దిగుమతి చేయబడింది, తద్వారా దాని పద్ధతులు ఉపయోగించబడతాయి. అప్పుడు, 2 కీలు మరియు విలువలతో కూడిన డేటా నిఘంటువు 'ఆకారం' అనే వేరియబుల్లో ప్రారంభించబడింది మరియు నిల్వ చేయబడుతుంది. తదుపరి లైన్లో, రైట్-బైనరీ (wb) మోడ్లో “info.p” పేరుతో కొత్త ఫైల్ను తెరవడానికి పికిల్ డంప్() పద్ధతి ఉపయోగించబడుతుంది మరియు “ఆకారం” డేటా ఈ ఫైల్లో నిల్వ చేయబడుతుంది. తదుపరి పంక్తిలో, మేము డేటాను rb మోడ్లో డంప్ చేసిన అదే ఫైల్ కోసం పికిల్ లోడ్() పద్ధతిని ఉపయోగించారు. ఇది మా నిఘంటువు డేటాను అందిస్తుంది మరియు 'a' అనే వేరియబుల్లో నిల్వ చేయబడుతుంది. చివరగా, ఈ రిటర్న్ చేయబడిన వస్తువు క్రింది స్క్రీన్షాట్లో చూపిన విధంగా ప్రింట్ ఆదేశాన్ని ఉపయోగించి అవుట్పుట్ టెర్మినల్లో ప్రదర్శించబడుతుంది.
డంప్ పద్ధతిని ఉపయోగించి డేటా మొదట 'info.p' ఫైల్లో నిల్వ చేయబడిందని మనం చూడవచ్చు. అప్పుడు, మేము అదే ఫైల్కు లోడ్() పద్ధతిని ఉపయోగించినప్పుడు, మేము మా డేటాను తిరిగి పొందాము.
ఉదాహరణ 2: పైథాన్లోని డేటాను సీరియలైజ్ చేయడానికి అదనపు ప్రోటోకాల్తో పికిల్ డంప్ ఫంక్షన్ను ఉపయోగించడం
మేము తాజా ప్రోటోకాల్ అయిన పికిల్ యొక్క 'HIGHEST_PROTOCOL' అనే అదనపు ప్రోటోకాల్ని ఉపయోగించే ఇదే ఉదాహరణ. ఈ ప్రోటోకాల్ మేము ఉపయోగించడానికి మరియు ఆప్టిమైజేషన్లను చేర్చగల కొత్త భాషా లక్షణాలను అనుమతిస్తుంది.
మునుపటి ఉదాహరణలో అందించిన కోడ్లో, మొదటి ఊరగాయ మాడ్యూల్ దిగుమతి చేయబడింది. అప్పుడు, కీ మరియు విలువతో ఒక అంశం యొక్క నిఘంటువు ప్రారంభించబడుతుంది మరియు 'a' వేరియబుల్లో నిల్వ చేయబడుతుంది. తదుపరి లైన్లో, “info.p” అనే కొత్త ఫైల్ wb మోడ్లో హ్యాండిల్గా తెరవబడుతుంది. ఇప్పుడు, ఫైల్ 'హ్యాండిల్' అనే వస్తువులో ఉంది. అప్పుడు, 'HIGHEST_PROTOCOL'ని ఉపయోగించి 'a' నిఘంటువుతో ''హ్యాండిల్' చేయడానికి డంప్() ఫంక్షన్ ఉపయోగించబడుతుంది. ఇది “a”లోని నిఘంటువుని కంప్యూటర్ డిస్క్లోని “info.p” ఫైల్లో సేవ్ చేయడానికి అనుమతిస్తుంది. ఫైల్ నుండి సమాచారాన్ని సంగ్రహించడానికి, ఫైల్ ముందుగా “rb” మోడ్లో తెరవబడుతుంది. అప్పుడు, ఈ ఫైల్ కోసం పికిల్ లోడ్() పద్ధతిని ఉపయోగించారు. తిరిగి వచ్చిన డేటా 'b' లక్షణంలో సేవ్ చేయబడుతుంది. చివరగా, ప్రింట్ ఆదేశాన్ని ఉపయోగించి, ఈ సమాచారం క్రింది స్క్రీన్ క్యాప్చర్లో కనిపించే విధంగా అవుట్పుట్ నోడ్ వద్ద ప్రదర్శించబడుతుంది:
ఉదాహరణ 3: పికిల్ డంప్ మరియు లోడ్ ఫంక్షన్ని ఉపయోగించి పికిల్ ఫైల్లోని డేటా జాబితా యొక్క సీరియలైజేషన్ మరియు డీసీరియలైజేషన్
ఈ ఉదాహరణలో, పికిల్ మాడ్యూల్ మొదట దిగుమతి చేయబడుతుంది. ఆ తర్వాత, కొంత డేటా డిక్షనరీలోకి జాబితా ఆకృతిలో చొప్పించబడుతుంది మరియు 'shape_colors' వేరియబుల్లో నిల్వ చేయబడుతుంది. తదుపరి లైన్లో, ఈ డేటాతో నేరుగా పికిల్ డంప్() పద్ధతిని ఉపయోగించారు. దాని పరామితిలో ఫైల్ స్థానంలో, 'info.p' ఫైల్ wb మోడ్లో తెరవబడుతుంది. ఫలితంగా, కంప్యూటర్ యొక్క డిస్క్లో నిల్వ చేయబడిన ఈ ఫైల్లో నిఘంటువు డేటా ఇప్పుడు డంప్ చేయబడింది. అప్పుడు, ఫైల్ నుండి డేటాను చదవడానికి, అదే ఫైల్లో పికిల్ లోడ్() పద్ధతిని అమలు చేస్తారు. తిరిగి వచ్చిన డేటా వేరియబుల్ “a”లో సేవ్ చేయబడుతుంది. చివరగా, ప్రింట్ ఆదేశాన్ని ఉపయోగించి, ఈ సమాచారం క్రింది స్నాప్షాట్లో చిత్రీకరించినట్లుగా ద్వితీయ టెర్మినల్స్లో ప్రదర్శించబడుతుంది:
ఉదాహరణ 4: పికిల్ డంప్ మరియు లోడ్ ఫంక్షన్లను ఉపయోగించి పికిల్ ఫైల్లో సమాచారాన్ని నిల్వ చేయడం వివిధ పారామితులతో
అందించిన కోడ్లో, మొదటి ఊరగాయ మాడ్యూల్ దిగుమతి చేయబడింది. అప్పుడు, జీతాల నిఘంటువు ప్రారంభించబడింది మరియు 'జీతాలు' వేరియబుల్లో నిల్వ చేయబడుతుంది. తదుపరి లైన్లో, కొత్త ఫైల్ “salary.p” wb మోడ్లో హ్యాండిల్గా తెరవబడుతుంది. ఇప్పుడు, ఫైల్ 'హ్యాండిల్' అనే వస్తువులో ఉంది. అప్పుడు, 'HIGHEST_PROTOCOL'ని ఉపయోగించి 'జీతాలు' నిఘంటువుతో 'హ్యాండిల్' చేయడానికి పికిల్ డంప్() ఫంక్షన్ ఉపయోగించబడుతుంది. ఇది 'జీతాలు'లోని నిఘంటువుని 'salary.p' ఫైల్లో కంప్యూటర్ డిస్క్లో సేవ్ చేయడానికి అనుమతిస్తుంది. ఇప్పుడు, ఫైల్ నుండి డేటాను తిరిగి పొందడానికి, ఫైల్ మొదట 'rb' మోడ్లో తెరవబడుతుంది. అప్పుడు, ఈ ఫైల్ కోసం పికిల్ లోడ్() పద్ధతిని ఉపయోగించారు. రివర్ట్ చేయబడిన సమాచారం వేరియబుల్ “a”లో సేవ్ చేయబడుతుంది. అంతిమంగా, ప్రింట్ కమాండ్ని ఉపయోగించడం ద్వారా, ఈ డేటా క్రింది స్నాప్షాట్లో చూపిన విధంగా అవుట్పుట్ ముగింపులో ప్రదర్శించబడుతుంది:
ఉదాహరణ 5: పికిల్ డంప్ మరియు లోడ్ ఫంక్షన్ని ఉపయోగించి పికిల్ ఫైల్లో బహుళ పరిమాణాలలో డేటా యొక్క సీరియలైజేషన్ మరియు డీసీరియలైజేషన్
పైథాన్లో డేటాఫ్రేమ్లను (మల్టీ-డైమెన్షనల్ టేబుల్స్) సృష్టించడం అనేది పైథాన్ యొక్క పాండా మాడ్యూల్లో కనుగొనబడిన కొత్త పద్ధతులు మరియు ఫంక్షన్లను పరీక్షించడానికి ఉపయోగపడుతుంది. మొదటి నుండి డేటాఫ్రేమ్ను రూపొందించడానికి వివిధ పద్ధతులు ఉన్నాయి, అయితే ప్రాథమిక నిఘంటువును ఉపయోగించడం సులభతరమైనది.
మునుపటి ఉదాహరణలో అందించిన కోడ్లో, మొదటి ఊరగాయ మరియు పాండాలు మాడ్యూల్లు దిగుమతి చేయబడ్డాయి. అప్పుడు, pd.DataFrame() పద్ధతిని ఉపయోగించి బహుళ డైమెన్షనల్ పట్టిక సృష్టించబడుతుంది. వ్యూహం యొక్క తదుపరి లక్షణం నాలుగు జాబితాల జాబితా. ప్రతి జాబితా పట్టిక వరుసకు అనుగుణంగా ఉంటుంది. రెండవ పరామితి 'నిలువు వరుసలు', ఇది పట్టికలోని ప్రతి నిలువు వరుస యొక్క శీర్షికను నిర్వచిస్తుంది. ఈ డేటాఫ్రేమ్ 'ప్రీ'లో నిల్వ చేయబడుతుంది. అప్పుడు, “attendance.p” అనే కొత్త ఫైల్ wb మోడ్లో తెరవబడుతుంది మరియు డేటాఫ్రేమ్తో ఈ ఫైల్లో పికిల్ డంప్() పద్ధతిని ఉపయోగించారు. ఇప్పుడు, మా పేర్కొన్న డేటా కంప్యూటర్ యొక్క హార్డ్ డిస్క్లోని “attendance.p” ఫైల్లో నిల్వ చేయబడుతుంది.
ఫైల్ నుండి డేటాను తిరిగి పొందడానికి, మేము ఫైల్ను చదవడానికి అనుమతించే rb మోడ్లో ఫైల్ను తెరుస్తాము. అప్పుడు, 'attendance.p' ఫైల్లో పికిల్ లోడ్() పద్ధతిని ఉపయోగించారు. చివరగా, ఫైల్లోని డేటా అవుట్పుట్ టెర్మినల్లో ప్రదర్శించబడుతుంది. మనం చూడగలిగినట్లుగా, మొత్తం DataFrame 'attendance.p' ఫైల్లో నిల్వ చేయబడిన అవుట్పుట్ టెర్మినల్లో ప్రదర్శించబడుతుంది.
ముగింపు
పికిల్ ఫైల్స్తో పని చేసేటప్పుడు అదనపు జాగ్రత్తలు తీసుకోండి. ఊరగాయ మాడ్యూల్కు భద్రత లేదు. మీరు నమ్మకంగా ఉన్న డేటాను మాత్రమే అన్పిల్ చేయండి. అన్పిక్లింగ్ ప్రక్రియలో ఏకపక్ష కోడ్ని అమలు చేసే హానికరమైన పికిల్ డేటాను సృష్టించడం సాధ్యమవుతుంది. అయినప్పటికీ, పైథాన్లో నిఘంటువులు, జాబితాలు మరియు పట్టికలను నిల్వ చేయడానికి ఇది సమర్థవంతమైన పద్ధతి. మీరు ప్రీ-ప్రాసెసింగ్ వంటి డేటాపై సాధారణ కార్యకలాపాలను అమలు చేస్తున్నప్పుడు డేటా విశ్లేషణలో పిక్లింగ్ చాలా ఉపయోగకరంగా ఉంటుంది. పైథాన్ యొక్క పికిల్ మాడ్యూల్ యొక్క వివిధ పద్ధతుల గురించి మరియు దానిని నిఘంటువులతో ఎలా ఉపయోగించాలో తెలుసుకోవడానికి ఈ వ్యాసం మీకు సహాయపడిందని నేను ఆశిస్తున్నాను.