Linuxలో iconv కమాండ్

Linuxlo Iconv Kamand



ఈ కథనాన్ని అమలు చేయడానికి లోతుగా వెళ్లే ముందు మీ Linux మెషీన్‌ను అప్‌డేట్ చేయాలని నిర్ధారించుకోండి. నవీకరణ కోసం, “నవీకరణ” కీవర్డ్‌తో Linux యొక్క “apt” యుటిలిటీని ఉపయోగించండి మరియు “sudo” అధికారాలను ఉపయోగించి ఈ సూచనను అమలు చేయండి. మేము ఇప్పుడు అమలులోకి వెళ్లగలిగినప్పటికీ, మేము ఈ సిస్టమ్‌ను కూడా అప్‌గ్రేడ్ చేయడానికి ఇష్టపడతాము, అనగా, అప్‌గ్రేడ్ చేయడం వలన లోపాలు సంభవించే అవకాశం తగ్గుతుంది మరియు సిస్టమ్ సమస్యలను మరింత ఖచ్చితంగా పరిష్కరించగలదు. కాబట్టి, “అప్‌గ్రేడ్” సూచనలో “apt” యుటిలిటీని ఉపయోగించండి.

ఇప్పుడు దాని టెర్మినల్ కన్సోల్‌లో Linux యొక్క iconv యుటిలిటీని చూద్దాం. కాబట్టి, మేము మా టెర్మినల్ స్క్రీన్‌పై తెలిసిన మరియు ఎక్కువగా ఉపయోగించే అన్ని కోడెడ్ క్యారెక్టర్ సెట్‌లను ప్రదర్శించడానికి “-l” ఫ్లాగ్‌తో “iconv” సూచనను అమలు చేస్తున్నాము. ఇది కోడెడ్ క్యారెక్టర్ సెట్‌లను వాటి మారుపేర్లతో పాటు ప్రదర్శిస్తుంది. మీరు కొంచెం క్రిందికి స్క్రోల్ చేసిన తర్వాత కోడెడ్ క్యారెక్టర్ సెట్‌ల సుదీర్ఘ జాబితాను చూడవచ్చు.







ఇప్పుడు, Linuxలో iconv కమాండ్ అమలుతో ప్రారంభించడానికి ఇది సమయం. మొదట, ఒక రకమైన ఫైల్‌ను మరొక రకానికి మార్చడానికి మన సిస్టమ్‌లో వివిధ రకాల ఫైల్‌లు అవసరం. అందువల్ల, మేము మూడు వేర్వేరు ఫైల్‌లను సృష్టించడానికి కన్సోల్ టెర్మినల్‌లో “టచ్” ప్రశ్నను ఉపయోగిస్తాము, అనగా జావా రకం, సి రకం మరియు టెక్స్ట్ రకం. ప్రస్తుత డైరెక్టరీ కంటెంట్‌లను జాబితా చేస్తే, మీరు అందులో కొత్తగా రూపొందించిన ఫైల్‌లను కనుగొంటారు.



దీని తరువాత, ప్రతి ఫైల్ పేరుతో పాటు “ఫైల్” ప్రశ్నను ఉపయోగించి మేము ప్రతి ఫైల్ రకాన్ని విడిగా పరిశీలిస్తాము. ప్రతి ఫైల్‌కి విడిగా సెట్ చేయబడిన కోడింగ్ క్యారెక్టర్ రకాన్ని ప్రదర్శించడానికి ఈ ప్రశ్నకు “-I” ఎంపిక అవసరం. మీరు “-I” ఎంపికను ఉపయోగించడం మరచిపోయినట్లయితే, బదులుగా “—mime” ఫ్లాగ్‌ని ఉపయోగించండి. “-I” మరియు “—mime” ఫ్లాగ్‌లు రెండూ ఒకే విధంగా పనిచేస్తాయి.



ఇప్పుడు, “txt” టైప్ ఫైల్ కోసం “ఫైల్” సూచనను అమలు చేసిన తర్వాత, మనకు “US-ASCII” క్యారెక్టర్ టైప్ ఎన్‌కోడింగ్ వచ్చింది. జావా మరియు సి ఫైల్‌ల కోసం ఒకే సూచనను ఉపయోగిస్తున్నప్పుడు, రెండు ఫైల్‌లు “బైనరీ” క్యారెక్టర్ టైప్ ఎన్‌కోడింగ్‌ని కలిగి ఉన్నాయని చూపిస్తుంది. దానితో పాటు, ఈ మూడు ఫైల్‌లు ఖాళీగా ఉన్నాయని ఈ సూచన చూపిస్తుంది.





ఇప్పుడు, నిర్దిష్ట క్యారెక్టర్ సెట్ ఎన్‌కోడింగ్ ఫైల్‌ను మరొక క్యారెక్టర్ సెట్ ఎన్‌కోడింగ్‌గా మార్చడానికి కన్సోల్‌లో ఐకాన్వి ఇన్‌స్ట్రక్షన్ వినియోగాన్ని మేము వివరిస్తాము. దానికి ముందు, మన ఫైల్‌లకు కొంత కోడ్ లేదా డేటాను తప్పనిసరిగా జోడించాలి. కాబట్టి, మేము “text.java” ఫైల్‌లో జావా కోడ్‌ని, “text.c” ఫైల్‌లో C కోడ్‌ని మరియు “test.txt” ఫైల్‌లో టెక్స్ట్ డేటాను జోడించాము. దిగువ అందించిన విధంగా మూడు ఫైల్‌ల కంటెంట్‌లను ప్రదర్శించడానికి పిల్లి ప్రశ్న ఇక్కడ ఉపయోగించబడింది:



ఇప్పుడు మేము డేటాను విజయవంతంగా జోడించాము, ఈ ఫైల్‌ల అక్షర సమితి ఎన్‌కోడింగ్‌ను మరోసారి చూస్తాము. కాబట్టి, మేము '-I' ఫ్లాగ్ మరియు ఫైల్ పేర్లతో షెల్‌లో అదే ఫైల్ సూచనలను ప్రయత్నించాము, అనగా test.txt, test.java మరియు test.c. మూడు ఫైల్‌ల కోసం ఈ మూడు సూచనలను విడివిడిగా అమలు చేయడం వలన జావా మరియు C ఫైల్‌ల కోసం అక్షర సమితి ఎన్‌కోడింగ్ నవీకరించబడిందని చూపిస్తుంది, అయితే టెక్స్ట్ ఫైల్‌కు అదే విధంగా ఉంటుంది, అంటే US-ASCII. జావా మరియు సి ఫైల్‌ల ఎన్‌కోడింగ్ గతంలో “బైనరీ”; ఇప్పుడు, అది 'US-ASCII'. అలాగే, టెక్స్ట్ ఫైల్ సాదా టెక్స్ట్ డేటాను కలిగి ఉందని, మిగిలిన రెండు కోడ్ ఫైల్‌లు స్క్రిప్ట్‌లను కంటెంట్‌గా కలిగి ఉన్నాయని చూపిస్తుంది.

ఈ కథనానికి అవసరమైన వాస్తవ విధిని నిర్వహించడానికి ఇది సమయం, అంటే, షెల్‌లోని iconv ఆదేశాన్ని ఉపయోగించి ఒక ఎన్‌కోడింగ్‌ను మరొకదానికి మార్చండి. అందువలన, మేము 'sudo' అధికారాలతో షెల్ టెర్మినల్‌లో 'iconv' సూచనను ఉపయోగిస్తున్నాము. ఈ ఆదేశం “-f” ఎంపికను “నుండి” అని సూచిస్తుంది మరియు “-t” ఎంపిక అంటే “to”, అంటే ఒక ఎన్‌కోడింగ్ నుండి మరొకదానికి.

“-f” ఎంపిక తర్వాత, మీరు మీ ఫైల్‌లో ఇప్పటికే ఉన్న ఎన్‌కోడింగ్‌ను పేర్కొనాలి, అంటే US-ASCII. “-t” ఎంపిక తర్వాత, మీరు పాత ఎన్‌కోడింగ్‌తో భర్తీ చేయాలనుకుంటున్న ఎన్‌కోడింగ్‌ను పేర్కొనాలి, అనగా UNICODE. మీరు దాని ఆబ్జెక్ట్ ఇమేజ్‌ని సృష్టించడానికి –o ఎంపికతో మూలంగా ఉపయోగించిన ఫైల్ పేరును పేర్కొనాలి. ఆబ్జెక్ట్ ఇమేజ్ అదే రకమైన మరొక ఫైల్, అంటే “new.c”, కానీ కొత్త ఎన్‌కోడింగ్ మరియు అదే డేటాతో ఉంటుంది.

కింది సూచనలను అమలు చేసిన తర్వాత, మీరు అదే డైరెక్టరీలో కొత్త ఫైల్‌ను పొందుతారు, అంటే, “ls” ప్రశ్న ప్రకారం. ఇప్పుడు, మేము iconv సూచనను ఉపయోగించి రూపొందించబడిన కొత్త ఫైల్ యొక్క అక్షర సమితి ఎన్‌కోడింగ్ కోసం తనిఖీ చేస్తాము. మేము '-I' ఎంపిక మరియు కొత్త ఫైల్ పేరు, అనగా new.cతో 'ఫైల్' సూచనను మళ్లీ ఉపయోగిస్తాము.

మీరు ఈ కొత్త ఫైల్ కోసం క్యారెక్టర్ సెట్ పాత ఫైల్ యొక్క క్యారెక్టర్ సెట్‌కి భిన్నంగా ఉన్నట్లు చూస్తారు, అంటే UTF-16LE క్యారెక్టర్ సెట్. ఎందుకంటే మేము మా new.c ఫైల్ కోసం iconv సూచనను ఉపయోగించి US-ASCII ఎన్‌కోడింగ్‌ను UNICODE ఎన్‌కోడింగ్‌కి అనువదించాము. “పిల్లి” ప్రశ్న ఫైల్‌లో అదే C కోడ్‌ని ప్రదర్శిస్తుంది కానీ ఇప్పటికే అందించిన విధంగా కొన్ని యూనికోడ్ అక్షరాలతో ప్రారంభించబడింది.

ఇదే విధంగా, మేము test.txt టెక్స్ట్ ఫైల్ ఎన్‌కోడింగ్‌ను మారుస్తాము. ఫైల్ సూచన ఇది US-ASCII క్యారెక్టర్ సెట్ ఎన్‌కోడింగ్‌ను కలిగి ఉందని చూపిస్తుంది. US-ASCII నుండి TURKISH8కి test.txt ఫైల్ ఎన్‌కోడింగ్‌ని మార్చడానికి iconv కమాండ్ అదే ఫార్మాట్‌తో ఉపయోగించబడింది. ఇది US-ASCIIని టర్కిష్‌కి మార్చదని మీరు చూస్తారు.

దీని తర్వాత, అదే ఫైల్ కోసం US-ASCII నుండి UTF-32 క్యారెక్టర్ సెట్ ఎన్‌కోడింగ్‌ను కవర్ చేయడానికి మేము అదే ఆదేశాన్ని ఉపయోగించాము. ఈసారి, అది పనిచేస్తుంది. ఎందుకంటే కొన్నిసార్లు ఒక ఎన్‌కోడింగ్ సెట్‌ను మరొకదానికి మార్చడంలో సమస్య ఉండవచ్చు లేదా ఇతర ఎన్‌కోడింగ్ దీనికి మద్దతు ఇవ్వకపోవచ్చు.

ముగింపు

ఈ కథనం iconv Linux సూచనలను ఉపయోగించి ఒక ఎన్‌కోడింగ్ క్యారెక్టర్ సెట్‌ను వాటి మారుపేర్లను ఉపయోగించి మరొకదానికి మార్చడానికి ఎలా ఉపయోగించాలో చర్చించింది. ఈ పద్ధతిలో, మేము వివిధ రకాలైన కొన్ని ఫైల్‌లను సృష్టించవలసి ఉంటుంది.