మైక్రోసాఫ్ట్ యొక్క VisualGPT కొత్త సాంకేతికతను విడుదల చేసింది ' విజువల్ GPT ” ఇది AI యొక్క పురోగతి మరియు విజువల్స్ మరియు భాష మధ్య అంతరాన్ని తగ్గించడం ద్వారా మరింత ఆకర్షణీయమైన మరియు ఇంటరాక్టివ్ AI అనుభవాల కోసం అవకాశాలను అన్లాక్ చేస్తుంది.
VisualGPT అంటే ఏమిటి?
VisualGPT అనేది NLP (నేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్) మోడల్స్పై ఆధారపడిన ChatGPT యొక్క పొడిగించిన సంస్కరణ, కానీ VisualGPTలో, VFMS ఉపయోగించబడుతుంది, ఇది టెక్స్ట్ ప్రశ్నలను ఇమేజ్ రూపంలోకి మార్చగలదు. ఇది టెక్స్ట్ మరియు ఇమేజ్ క్వెరీల కలయిక/సమాకలనం.
విజువల్ GPT యొక్క ఉద్దేశ్యం
చాట్జిపిటిని మార్కెట్లోకి విడుదల చేసిన తర్వాత, టెక్స్ట్వల్ ఫార్మాట్లో మాత్రమే పని చేస్తూ, తదుపరి స్థాయి పురోగతిని సాధించడానికి, ఈ కారణాలన్నింటినీ అనుసరించి, AI కోసం రేసులో టెక్స్ట్వల్ నుండి గ్రాఫికల్ ఫార్మాట్లో పని చేసే సరైన సాధనం ఉంది. పురోగతి Microsoft VisualGPTని విడుదల చేస్తుంది VisualGPT యొక్క ముఖ్య ఉద్దేశ్యం వినియోగదారు డిమాండ్పై AI చిత్రాలను రూపొందించడం లేదా చిత్రాన్ని విశ్లేషించడం.
విజువల్ GPT యొక్క ఆర్కిటెక్చర్
VisualGPTలో వినియోగదారు ప్రశ్న, ప్రాంప్ట్ మేనేజర్, విజువల్ ఫౌండేషన్ మోడల్స్ (VFMలు), సిస్టమ్ ప్రిన్సిపల్, డైలాగ్ చరిత్ర, రీజనింగ్ చరిత్ర మరియు ఇంటర్మీడియట్ ఆన్సర్ ఉన్నాయి.
మేము దాని నమూనా గురించి ప్రత్యేకంగా మాట్లాడినట్లయితే, అంటే, ' VFMలు (విజువల్ ఫౌండేషన్ మోడల్స్) ”, BLIP (బూట్స్ట్రాపింగ్ లాంగ్వేజ్-ఇమేజ్ ప్రీ-ట్రైనింగ్) మరియు స్టేబుల్ డిఫ్యూజన్ వంటి దాదాపు 22 VFMలు ఉపయోగించబడ్డాయి.
విజువల్ చాట్జిపిటిని ఎలా రన్ చేయాలి?
విజువల్ చాట్జిపిటిని అమలు చేయడానికి, ఈ క్రింది దశలను పరిగణించండి:
దశ 1: పర్యావరణాన్ని సృష్టించండి
ముందుగా, మీరు పైథాన్ వెర్షన్ 3.8 యొక్క వాతావరణాన్ని సృష్టించాలి:
దిగుమతి sys
sys.path.append ( '/usr/local/lib/python3.8/site-packages' )
దశ 2: విజువల్ చాట్జిపిటి ఫైల్ను క్లోన్ చేయండి
ఇప్పుడు, కింది ఆదేశాన్ని ఉపయోగించి GitHub నుండి దృశ్య ChatGPT ఫైల్ను క్లోన్ చేయండి:
! git క్లోన్ https: // github.com / దీపాంశు88 / దృశ్య-chatgpt.git
దశ 3: కొత్త డైరెక్టరీని సెటప్ చేయండి
ఆ తర్వాత, దిగువ పేర్కొన్న ఆదేశం ద్వారా కొత్త డైరెక్టరీని సెటప్ చేయండి:
% cd దృశ్య-chatgptదశ 4: అవసరమైన ప్యాకేజీలను ఇన్స్టాల్ చేయండి
ఇప్పుడు, “ని ఉపయోగించి అవసరమైన ప్యాకేజీలను ఇన్స్టాల్ చేయండి పిప్ ” cmdlet:
! కర్ల్ https: // bootstrap.pypa.io / get-pip.py -ఓ get-pip.py! python3.8 get-pip.py
! పైథాన్ 3.8 -మీ పిప్ ఇన్స్టాల్ -ఆర్ అవసరాలు.txt
దశ 5: OpenAI APIని యాక్సెస్ చేయండి
ప్రారంభ ప్యాకేజీలను ఇన్స్టాల్ చేసిన తర్వాత, “platform.openai.com” నుండి API కీని పొందడం ద్వారా మరియు ప్రామాణీకరించబడిన API కాల్లు చేయడం ద్వారా OpenAI APIని యాక్సెస్ చేయండి:
% env OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxదశ 6: మోడల్ని ఎంచుకోండి
చివరగా, Openaiని యాక్సెస్ చేసిన తర్వాత మోడల్ని ఎంచుకోండి, విజువల్ GPTలో ఉపయోగించిన 20 కంటే ఎక్కువ మోడల్లు ఉన్నాయి, మీరు మీ అవసరానికి అనుగుణంగా ఎంచుకోవచ్చు:
! పైథాన్ 3.8 / visual_chatgpt.py --లోడ్ Text2Image_cuda: 0పై ఆదేశంలో, ' Text2Image ” ఉపయోగించాల్సిన మోడల్కు అనుగుణంగా ఉంటుంది. మరిన్ని వివరాల కోసం ఈ Google Colabని తనిఖీ చేయండి నోట్బుక్ .
ముగింపు
ఏదైనా ప్రశ్నకు సంబంధించి నిర్దిష్ట సమాధానాలను పొందడానికి ChatGPT పరిచయం చేయబడింది మరియు ఇప్పుడు Microsoft VisualGPTని ప్రారంభించింది, ఇది పాఠ్య మరియు చిత్ర డేటాతో వ్యవహరించగలదు. వినియోగదారు తన అవసరాలను వచన రూపంలో జోడించవచ్చు మరియు దాని గ్రాఫికల్ అవుట్పుట్ను పొందవచ్చు.