ట్రాన్స్‌ఫార్మర్‌లలో టెక్స్ట్ జనరేషన్‌ను ఎలా అనుకూలీకరించాలి

Trans Pharmar Lalo Tekst Janaresan Nu Ela Anukulikarincali



లోతైన అభ్యాసంలో, టెక్స్ట్ జనరేషన్ సహాయంతో సహజ భాషలో వచనాన్ని స్వయంచాలకంగా అనుకూలీకరించే ప్రక్రియను సూచిస్తుంది ఆర్టిఫిషియల్ న్యూరల్ నెట్‌వర్క్‌లు(ANN) . అంతేకాకుండా, మునుపటి పదం ఆధారంగా ఒక క్రమంలో రాబోయే పదాన్ని అంచనా వేయడానికి పెద్ద డేటాసెట్‌లపై ముందస్తు శిక్షణ పొందిన నిర్దిష్ట ప్రయోజనం కోసం వివిధ భాషా నమూనాలు ఉపయోగించబడతాయి. అదనంగా, భాషా అనువాదం, కంటెంట్‌ను రూపొందించడం, చాట్‌బాట్‌లు మరియు మరెన్నో సహా బహుళ అనువర్తనాల కోసం అనుకూలీకరించిన వచనాన్ని ఉపయోగించవచ్చు.

ఈ బ్లాగ్‌లో, మేము దిగువ అందించిన కంటెంట్‌ను కవర్ చేస్తాము:

ట్రాన్స్‌ఫార్మర్ల నుండి 'పైప్‌లైన్' ఫంక్షన్‌తో మోడల్‌ను లోడ్ చేయడం ద్వారా టెక్స్ట్ జనరేషన్‌ను ఎలా అనుకూలీకరించాలి?

ది ' పైప్లైన్ ”ఫంక్షన్ వినియోగదారు అవసరాలకు అనుగుణంగా ముందుగా శిక్షణ పొందిన AI మోడల్‌ని స్వయంచాలకంగా డౌన్‌లోడ్ చేయడానికి ఉపయోగించబడుతుంది. ఈ నిర్దిష్ట ఫంక్షన్‌ను ఉపయోగించడానికి, వినియోగదారులు “ని ఇన్‌స్టాల్ చేయాలి ట్రాన్స్ఫార్మర్లు ” ప్యాకేజీలు. ఈ ప్యాకేజీ అత్యాధునికమైన ట్రాన్స్‌ఫార్మర్-ఆధారిత మోడళ్లకు యాక్సెస్‌ను అందిస్తుంది, ఇవి సెంటిమెంట్ విశ్లేషణను అలాగే అనేక ఇతర వాటిని చేయగలవు. సహజ భాషా ప్రాసెసింగ్ (NLP) పనులు.







పైన వివరించిన దృశ్యం యొక్క ఆచరణాత్మక ప్రదర్శనను తనిఖీ చేయడానికి, దిగువ-ఇచ్చిన దశలకు వెళ్లండి!



దశ 1: 'ట్రాన్స్‌ఫార్మర్స్' ప్యాకేజీలను ఇన్‌స్టాల్ చేయండి

ప్రారంభంలో, “! పిప్' ట్రాన్స్‌ఫార్మర్ ప్యాకేజీలను ఇన్‌స్టాల్ చేయమని ఆదేశం:



! పిప్ ట్రాన్స్‌ఫార్మర్‌లను ఇన్‌స్టాల్ చేయండి

మీరు గమనిస్తే, పేర్కొన్న ప్యాకేజీ విజయవంతంగా ఇన్‌స్టాల్ చేయబడింది:





దశ 2: ట్రాన్స్‌ఫార్మర్ ఆధారిత మోడల్‌ను దిగుమతి చేయండి

తర్వాత, అవసరమైన ట్రాన్స్‌ఫార్మర్ ఆధారిత మోడల్‌ను దిగుమతి చేయండి. అలా చేయడానికి, ముందుగా, 'ని దిగుమతి చేయండి పైప్లైన్ 'ఫంక్షన్' నుండి ట్రాన్స్ఫార్మర్లు ”. తరువాత, దిగుమతి చేసుకున్న ఫంక్షన్‌ని ఉపయోగించండి మరియు పాస్ చేయండి ' టెక్స్ట్-తరం అవసరమైన మోడల్ పేరుతో పాటు దానికి వాదనగా ' gpt2 ”. తరువాత, వాటిని 'కి పంపండి ఉత్పత్తి ”వేరియబుల్:



నుండి ట్రాన్స్ఫార్మర్లు దిగుమతి పైప్లైన్

ఉత్పత్తి = పైప్లైన్ ( 'టెక్స్ట్-జనరేషన్' , మోడల్ = 'gpt2' )

దశ 3: వచనాన్ని అనుకూలీకరించండి

ఇప్పుడు, కావలసిన వచనాన్ని ఆర్గ్యుమెంట్‌గా పంపండి ఉత్పత్తి ”. క్రింద చూపిన విధంగా:

ఉత్పత్తి ( 'ట్రాన్స్‌ఫార్మర్‌లలో టెక్స్ట్‌ని రూపొందించడానికి gpt2 మోడల్‌ని ఉపయోగించడం ద్వారా' )

అందించిన అవుట్‌పుట్ ప్రకారం, డౌన్‌లోడ్ చేయబడిన ప్రీ-ట్రైన్డ్ “ gpt3 ” మోడల్ టెక్స్ట్ విజయవంతంగా రూపొందించబడింది:

మీరు ఇతర వాదనలను కూడా ఉపయోగించవచ్చు, ఉదాహరణకు:

ప్రాంప్ట్ = 'ట్రాన్స్‌ఫార్మర్‌లలో టెక్స్ట్‌ని రూపొందించడానికి gpt2 మోడల్‌ని ఉపయోగించడం ద్వారా'

ముద్రణ ( జన్యువు ( ప్రాంప్ట్ , num_return_sequences = 5 , గరిష్ట_పొడవు = ఇరవై ) )

ఇక్కడ:

  • ' ప్రాంప్ట్ ” అనేది ఇన్‌పుట్‌ని కలిగి ఉండే ఆర్గ్యుమెంట్‌గా ఉపయోగించబడుతుంది.
  • ' సంఖ్య_రిటర్న్_సీక్వెన్స్ ” ఆర్గ్యుమెంట్ అందించిన టెక్స్ట్ యొక్క సీక్వెన్స్‌ల సంఖ్యను రూపొందించడానికి ఉపయోగించబడుతుంది.
  • ' గరిష్ట_పొడవు ” ఆర్గ్యుమెంట్ ఉత్పత్తి చేయబడిన టెక్స్ట్ యొక్క పొడవును పేర్కొనడానికి ఉపయోగించబడుతుంది. మా విషయంలో, ఇది పరిమితం చేయబడింది ' 30 ”టోకెన్లు(పదాలు లేదా విరామచిహ్నాలు):

గమనిక: అనుకూలీకరించిన టెక్స్ట్ మోడల్ శిక్షణ డేటా ఆధారంగా పేర్కొన్న ప్రాంప్ట్ యొక్క కొనసాగింపుగా ఉంటుంది.

PyTorchలో టెక్స్ట్‌ని రూపొందించడానికి ట్రాన్స్‌ఫార్మర్ ఆధారిత మోడల్‌ని ఎలా ఉపయోగించాలి?

వినియోగదారులు వచనాన్ని కూడా అనుకూలీకరించవచ్చు “ పైటార్చ్ ' ఏది ' టార్చ్ ”ఆధారిత మెషిన్ లెర్నింగ్ ఫ్రేమ్‌వర్క్. ఇది NLP మరియు కంప్యూటర్ విజన్ వంటి విభిన్న అప్లికేషన్‌ల కోసం ఉపయోగించబడుతుంది. PyTorchలో వచనాన్ని అనుకూలీకరించడానికి ట్రాన్స్‌ఫార్మర్-ఆధారిత మోడల్‌ను ఉపయోగించడానికి, ముందుగా, “ని దిగుమతి చేయండి GPT2టోకనైజర్ 'మరియు' GPT2 మోడల్ '' నుండి విధులు ట్రాన్స్ఫార్మర్లు ”:

నుండి ట్రాన్స్ఫార్మర్లు దిగుమతి GPT2టోకనైజర్ , GPT2 మోడల్

అప్పుడు, 'ని ఉపయోగించండి GPT2టోకనైజర్ 'మేము కోరుకున్న ప్రీ-ట్రైన్డ్ మోడల్ ప్రకారం టోకెనైజర్' gpt2 ”:

టోకెనైజర్ = GPT2టోకనైజర్. నుండి_ముందుగా శిక్షణ పొందిన ( 'gpt2' )

తర్వాత, ముందుగా శిక్షణ పొందిన మోడల్ నుండి బరువులను ఇన్‌స్టాంటియేట్ చేయడం:

మోడల్ = GPT2 మోడల్. నుండి_ముందుగా శిక్షణ పొందిన ( 'gpt2' )

తరువాత, '' ప్రకటించండి gen_text ” మనం అనుకూలీకరించదలిచిన వచనాన్ని కలిగి ఉన్న వేరియబుల్:

gen_text = 'ట్రాన్స్‌ఫార్మర్‌లలో టెక్స్ట్‌ని రూపొందించడానికి gpt2 మోడల్‌ని ఉపయోగించడం ద్వారా'

ఇప్పుడు, 'ని పాస్ చేయండి gen_text 'మరియు' return_tensors=‘pt’ 'పైటోర్చ్‌లో టెక్స్ట్‌ని ఉత్పత్తి చేస్తుంది మరియు ఉత్పత్తి చేయబడిన విలువను నిల్వ చేస్తుంది' ఎన్కోడ్_ఇన్‌పుట్ ”వేరియబుల్:

ఎన్కోడ్_ఇన్‌పుట్ = టోకెనైజర్ ( gen_text , రిటర్న్_టెన్సర్‌లు = 'pt' )

చివరగా, పాస్ చేయండి ' ఎన్కోడ్_ఇన్‌పుట్ ''కి అనుకూలీకరించిన వచనాన్ని కలిగి ఉన్న వేరియబుల్ మోడల్ 'పరామితిగా మరియు ఫలిత అవుట్‌పుట్‌ను 'ని ఉపయోగించి పొందండి గరిష్ట_పొడవు 'వాదం' అని సెట్ చేయబడింది ఇరవై 'ఇది అందించిన టోకెన్‌లకు మాత్రమే ఉత్పత్తి చేయబడిన వచనం పరిమితం చేయబడుతుందని సూచిస్తుంది, ' num_return_sequences 'అది సెట్ చేయబడింది' 5 ” ఉత్పత్తి చేయబడిన టెక్స్ట్ టెక్స్ట్ యొక్క 5 సీక్వెన్స్‌లపై ఆధారపడి ఉంటుందని చూపిస్తుంది:

అవుట్పుట్ = మోడల్ ( ** ఎన్‌కోడ్_ఇన్‌పుట్ )

జనరేటర్ ( gen_text , గరిష్ట_పొడవు = ఇరవై , num_return_sequences = 5 )

అవుట్‌పుట్

TensorFlowలో టెక్స్ట్‌ని రూపొందించడానికి ట్రాన్స్‌ఫార్మర్ ఆధారిత మోడల్‌ని ఎలా ఉపయోగించాలి?

ట్రాన్స్‌ఫార్మర్‌లలో వచనాన్ని రూపొందించడానికి, ' టెన్సర్ ఫ్లో ”ఆధారిత మెషీన్ లెర్నింగ్ ఫ్రేమ్‌వర్క్‌లు కూడా ఉపయోగించబడతాయి. అలా చేయడానికి, ముందుగా, '' వంటి అవసరమైన ఫంక్షన్లను దిగుమతి చేయండి GPT2టోకనైజర్ 'మరియు' TFGPT2 మోడల్ ' నుండి ' ట్రాన్స్ఫార్మర్లు ”. మిగిలిన కోడ్ పైన పేర్కొన్న విధంగానే ఉంటుంది, మేము కేవలం ' TFGPT2 మోడల్ 'ఫంక్షన్' బదులుగా GPT2 మోడల్ ” ఫంక్షన్. క్రింది విధంగా:

నుండి ట్రాన్స్ఫార్మర్లు దిగుమతి GPT2టోకనైజర్ , TFGPT2 మోడల్

టోకెనైజర్ = GPT2టోకనైజర్. నుండి_ముందుగా శిక్షణ పొందిన ( 'gpt2' )

మోడల్ = TFGPT2 మోడల్. నుండి_ముందుగా శిక్షణ పొందిన ( 'gpt2' )

వచనం = 'ట్రాన్స్‌ఫార్మర్‌లలో టెక్స్ట్‌ని రూపొందించడానికి gpt2 మోడల్‌ని ఉపయోగించడం ద్వారా'

ఎన్కోడ్_ఇన్‌పుట్ = టోకెనైజర్ ( వచనం , రిటర్న్_టెన్సర్‌లు = 'tf' )

అవుట్పుట్ = మోడల్ ( ఎన్కోడ్_ఇన్‌పుట్ )

జనరేటర్ ( gen_text , గరిష్ట_పొడవు = ఇరవై , num_return_sequences = 5 )

మీరు చూడగలిగినట్లుగా, అనుకూలీకరించిన వచనం విజయవంతంగా రూపొందించబడింది:

అంతే! మేము ట్రాన్స్‌ఫార్మర్‌లలో వచన ఉత్పత్తిని అనుకూలీకరించడం గురించి వివరించాము.

ముగింపు

ట్రాన్స్‌ఫార్మర్‌లలో టెక్స్ట్ జనరేషన్‌ని అనుకూలీకరించడానికి, పైప్‌లైన్ ఫంక్షన్‌తో మోడల్‌ను లోడ్ చేయడం, ట్రాన్స్‌ఫార్మర్ ఆధారిత మోడల్‌ని ఉపయోగించడం వంటి విభిన్న మార్గాలు ఉన్నాయి “ పైటార్చ్ 'మరియు' టెన్సర్ ఫ్లో ” ఇవి మెషీన్ లెర్నింగ్ ఫ్రేమ్‌వర్క్‌లపై ఆధారపడి ఉంటాయి. ఈ గైడ్‌లో, మేము ట్రాన్స్‌ఫార్మర్‌లలో టెక్స్ట్ జనరేషన్‌ని అనుకూలీకరించే ఆచరణాత్మక ప్రదర్శనతో పాటు సంక్షిప్త సమాచారాన్ని అందించాము.