VisualGPT అంటే ఏమిటి - మీరు తెలుసుకోవలసిన ప్రతిదీ

Visualgpt Ante Emiti Miru Telusukovalasina Pratidi



మైక్రోసాఫ్ట్ యొక్క VisualGPT కొత్త సాంకేతికతను విడుదల చేసింది ' విజువల్ GPT ” ఇది AI యొక్క పురోగతి మరియు విజువల్స్ మరియు భాష మధ్య అంతరాన్ని తగ్గించడం ద్వారా మరింత ఆకర్షణీయమైన మరియు ఇంటరాక్టివ్ AI అనుభవాల కోసం అవకాశాలను అన్‌లాక్ చేస్తుంది.

VisualGPT అంటే ఏమిటి?

VisualGPT అనేది NLP (నేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్) మోడల్స్‌పై ఆధారపడిన ChatGPT యొక్క పొడిగించిన సంస్కరణ, కానీ VisualGPTలో, VFMS ఉపయోగించబడుతుంది, ఇది టెక్స్ట్ ప్రశ్నలను ఇమేజ్ రూపంలోకి మార్చగలదు. ఇది టెక్స్ట్ మరియు ఇమేజ్ క్వెరీల కలయిక/సమాకలనం.







విజువల్ GPT యొక్క ఉద్దేశ్యం

చాట్‌జిపిటిని మార్కెట్లోకి విడుదల చేసిన తర్వాత, టెక్స్ట్‌వల్ ఫార్మాట్‌లో మాత్రమే పని చేస్తూ, తదుపరి స్థాయి పురోగతిని సాధించడానికి, ఈ కారణాలన్నింటినీ అనుసరించి, AI కోసం రేసులో టెక్స్ట్‌వల్ నుండి గ్రాఫికల్ ఫార్మాట్‌లో పని చేసే సరైన సాధనం ఉంది. పురోగతి Microsoft VisualGPTని విడుదల చేస్తుంది VisualGPT యొక్క ముఖ్య ఉద్దేశ్యం వినియోగదారు డిమాండ్‌పై AI చిత్రాలను రూపొందించడం లేదా చిత్రాన్ని విశ్లేషించడం.



విజువల్ GPT యొక్క ఆర్కిటెక్చర్

VisualGPTలో వినియోగదారు ప్రశ్న, ప్రాంప్ట్ మేనేజర్, విజువల్ ఫౌండేషన్ మోడల్స్ (VFMలు), సిస్టమ్ ప్రిన్సిపల్, డైలాగ్ చరిత్ర, రీజనింగ్ చరిత్ర మరియు ఇంటర్మీడియట్ ఆన్సర్ ఉన్నాయి.



మేము దాని నమూనా గురించి ప్రత్యేకంగా మాట్లాడినట్లయితే, అంటే, ' VFMలు (విజువల్ ఫౌండేషన్ మోడల్స్) ”, BLIP (బూట్‌స్ట్రాపింగ్ లాంగ్వేజ్-ఇమేజ్ ప్రీ-ట్రైనింగ్) మరియు స్టేబుల్ డిఫ్యూజన్ వంటి దాదాపు 22 VFMలు ఉపయోగించబడ్డాయి.





విజువల్ చాట్‌జిపిటిని ఎలా రన్ చేయాలి?

విజువల్ చాట్‌జిపిటిని అమలు చేయడానికి, ఈ క్రింది దశలను పరిగణించండి:

దశ 1: పర్యావరణాన్ని సృష్టించండి

ముందుగా, మీరు పైథాన్ వెర్షన్ 3.8 యొక్క వాతావరణాన్ని సృష్టించాలి:



దిగుమతి sys

sys.path.append ( '/usr/local/lib/python3.8/site-packages' )

దశ 2: విజువల్ చాట్‌జిపిటి ఫైల్‌ను క్లోన్ చేయండి

ఇప్పుడు, కింది ఆదేశాన్ని ఉపయోగించి GitHub నుండి దృశ్య ChatGPT ఫైల్‌ను క్లోన్ చేయండి:

! git క్లోన్ https: // github.com / దీపాంశు88 / దృశ్య-chatgpt.git

దశ 3: కొత్త డైరెక్టరీని సెటప్ చేయండి

ఆ తర్వాత, దిగువ పేర్కొన్న ఆదేశం ద్వారా కొత్త డైరెక్టరీని సెటప్ చేయండి:

% cd దృశ్య-chatgpt

దశ 4: అవసరమైన ప్యాకేజీలను ఇన్‌స్టాల్ చేయండి

ఇప్పుడు, “ని ఉపయోగించి అవసరమైన ప్యాకేజీలను ఇన్‌స్టాల్ చేయండి పిప్ ” cmdlet:

! కర్ల్ https: // bootstrap.pypa.io / get-pip.py -ఓ get-pip.py

! python3.8 get-pip.py

! పైథాన్ 3.8 -మీ పిప్ ఇన్స్టాల్ -ఆర్ అవసరాలు.txt

దశ 5: OpenAI APIని యాక్సెస్ చేయండి

ప్రారంభ ప్యాకేజీలను ఇన్‌స్టాల్ చేసిన తర్వాత, “platform.openai.com” నుండి API కీని పొందడం ద్వారా మరియు ప్రామాణీకరించబడిన API కాల్‌లు చేయడం ద్వారా OpenAI APIని యాక్సెస్ చేయండి:

% env OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

దశ 6: మోడల్‌ని ఎంచుకోండి

చివరగా, Openaiని యాక్సెస్ చేసిన తర్వాత మోడల్‌ని ఎంచుకోండి, విజువల్ GPTలో ఉపయోగించిన 20 కంటే ఎక్కువ మోడల్‌లు ఉన్నాయి, మీరు మీ అవసరానికి అనుగుణంగా ఎంచుకోవచ్చు:

! పైథాన్ 3.8 / visual_chatgpt.py --లోడ్ Text2Image_cuda: 0

పై ఆదేశంలో, ' Text2Image ” ఉపయోగించాల్సిన మోడల్‌కు అనుగుణంగా ఉంటుంది. మరిన్ని వివరాల కోసం ఈ Google Colabని తనిఖీ చేయండి నోట్బుక్ .

ముగింపు

ఏదైనా ప్రశ్నకు సంబంధించి నిర్దిష్ట సమాధానాలను పొందడానికి ChatGPT పరిచయం చేయబడింది మరియు ఇప్పుడు Microsoft VisualGPTని ప్రారంభించింది, ఇది పాఠ్య మరియు చిత్ర డేటాతో వ్యవహరించగలదు. వినియోగదారు తన అవసరాలను వచన రూపంలో జోడించవచ్చు మరియు దాని గ్రాఫికల్ అవుట్‌పుట్‌ను పొందవచ్చు.