ఈ గైడ్ AWSలో జాబితా క్రాలర్లను వివరిస్తుంది.
AWSలో జాబితా-క్రాలర్లు అంటే ఏమిటి?
క్రాలర్ అనేది AWS జిగురులో ఒక భాగం, ఇది డేటా లొకేషన్పై క్రాల్ చేయడానికి ఉపయోగించబడుతుంది మరియు ఆ సమాచారాన్ని తిరిగి కేటలాగ్కు ఊహించింది. క్రాలర్ సేకరించే సమాచారం డేటా రకాలు, స్కీమా నిర్మాణం లేదా ఇతర మాటలలో, అది మెటాడేటాను సేకరిస్తుంది. క్రాలర్ను డేటా కేటలాగ్తో కూడా ఉపయోగించవచ్చు, ఇది ETL జాబ్లు మొదలైన వాటిని ఉపయోగిస్తున్నప్పుడు గ్లూ ఎకోసిస్టమ్లో డేటాను తరలించినప్పుడు ఉపయోగించబడుతుంది.
అమెజాన్ గ్లూ సర్వీస్ అంటే ఏమిటి?
AWS గ్లూ అనేది అమెజాన్ ఎక్స్ట్రాక్ట్ ట్రాన్స్ఫార్మ్ మరియు లోడ్ సేవ, ఇది మొత్తం డేటాను నిర్వహించడానికి, గుర్తించడానికి, తరలించడానికి మరియు మార్చడానికి వినియోగదారుని అనుమతిస్తుంది. వినియోగదారుకు సర్వర్లను అందించడం మరియు కాన్ఫిగర్ చేయడం లేదా జీవిత చక్రాలను నిర్వహించడం అవసరం లేనందున AWS గ్లూ సర్వర్లెస్గా ఉంటుంది. డేటా కేటలాగ్ మరియు క్రాలర్లు AWS గ్లూ యొక్క భాగాలు, ఇది నిరంతర మెటాడేటా రిపోజిటరీగా పనిచేస్తుంది:
AWSలో క్రాలర్ను ఎలా సృష్టించాలి?
AWSలో క్రాలర్ని సృష్టించడానికి, AWS మేనేజ్మెంట్ కన్సోల్ నుండి AWS గ్లూ సేవను సందర్శించండి:
'లోకి వెళ్ళండి క్రాలర్లు ఎడమ పానెల్ నుండి దాని పేరుపై క్లిక్ చేయడం ద్వారా పేజీ:
'పై క్లిక్ చేయండి క్రాలర్ని సృష్టించండి ”బటన్:
క్రాలర్ పేరును టైప్ చేసి, 'పై క్లిక్ చేయండి తరువాత ”బటన్:
జిగురు పట్టికల కోసం మ్యాపింగ్ ఎంపికను ఎంచుకుని, “పై క్లిక్ చేయండి మూలాన్ని జోడించండి ” నుండి డేటాను పొందడానికి బటన్:
S3 సేవను ఎంచుకుని, 'పై క్లిక్ చేయండి S3ని బ్రౌజ్ చేయండి మూలం యొక్క స్థానాన్ని పొందడానికి ” బటన్:
S3 ఫోల్డర్ని ఎంచుకుని, 'పై క్లిక్ చేయండి ఎంచుకోండి ”బటన్:
స్థానం మూలానికి జోడించబడిన తర్వాత, 'పై క్లిక్ చేయండి S3 డేటా మూలాన్ని జోడించండి ”బటన్:
'పై క్లిక్ చేయండి తరువాత ”బటన్:
'పై క్లిక్ చేయండి కొత్త IAM పాత్రను సృష్టించండి '' నుండి బటన్ భద్రతా సెట్టింగ్లను కాన్ఫిగర్ చేయండి 'విభాగం:
పాత్ర పేరును నమోదు చేసి, 'పై క్లిక్ చేయండి సృష్టించు ”బటన్:
ఆ తర్వాత, కేవలం 'పై క్లిక్ చేయండి తరువాత ”బటన్:
లక్ష్య డేటాబేస్ను ఎంచుకుని, పట్టిక కోసం ఉపయోగించబడే పేరును టైప్ చేయండి:
దీని కోసం క్రాలర్ని షెడ్యూల్ చేయండి కోరిక మేరకు 'మరియు' పై క్లిక్ చేయండి తరువాత ”బటన్:
కాన్ఫిగరేషన్ని సమీక్షించి, 'పై క్లిక్ చేయండి క్రాలర్ని సృష్టించండి ”బటన్:
క్రాలర్ విజయవంతంగా సృష్టించబడింది మరియు దాన్ని క్లిక్ చేయడం ద్వారా మూలం నుండి డేటాను పొందేందుకు ఉపయోగించవచ్చు పరుగు ”బటన్:
AWSలోని లిస్ట్ క్రాలర్ల గురించి అంతే.
ముగింపు
ListCrawler అనేది AWS జిగురు సేవ యొక్క భాగం, ఇది మూలాధారాల నుండి సమాచారాన్ని క్రాల్ చేయడానికి మరియు కేటలాగ్కి తిరిగి రావడానికి ఉపయోగించబడుతుంది. డేటా కేటలాగ్లు మరియు క్రాలర్లు మెటాడేటా అని పిలువబడే డేటా గురించి సమాచారాన్ని పొందడానికి డేటాను సేకరించడానికి ఉపయోగించవచ్చు. S3 సేవ లేదా ఇతర మూలాధారాల నుండి డేటాను పొందడానికి మరియు డేటాబేస్లో క్రియేట్ టేబుల్లను ఉంచడానికి వినియోగదారు AWS గ్లూ నుండి క్రాలర్ను కూడా సృష్టించవచ్చు. ఈ గైడ్ AWSలోని ListCrawlers మరియు వాటిని ఎలా సృష్టించాలో వివరించింది.