AWSలో జాబితా-క్రాలర్లు అంటే ఏమిటి?

Awslo Jabita Kralarlu Ante Emiti



కంపెనీల వృద్ధిపై డేటా భారీ ప్రభావాన్ని చూపింది, ఎందుకంటే వాటిలో చాలా మంది దాని ద్వారా అంతర్దృష్టులను పొందడానికి దానిపై ఎక్కువగా ఆధారపడతారు. మెటాడేటా అనేది డేటాను వివరించే డేటాకు సంబంధించిన డేటా కాబట్టి దాని నుండి గరిష్ట సమాచారాన్ని పొందడానికి డేటాను ఉపయోగించవచ్చు. మెటాడేటా డేటా స్థానం, స్కీమా నిర్మాణం, డేటా రకం లేదా డేటా యజమాని వంటి వాటి వంటి సమాచారాన్ని కలిగి ఉంటుంది.

ఈ గైడ్ AWSలో జాబితా క్రాలర్‌లను వివరిస్తుంది.

AWSలో జాబితా-క్రాలర్లు అంటే ఏమిటి?

క్రాలర్ అనేది AWS జిగురులో ఒక భాగం, ఇది డేటా లొకేషన్‌పై క్రాల్ చేయడానికి ఉపయోగించబడుతుంది మరియు ఆ సమాచారాన్ని తిరిగి కేటలాగ్‌కు ఊహించింది. క్రాలర్ సేకరించే సమాచారం డేటా రకాలు, స్కీమా నిర్మాణం లేదా ఇతర మాటలలో, అది మెటాడేటాను సేకరిస్తుంది. క్రాలర్‌ను డేటా కేటలాగ్‌తో కూడా ఉపయోగించవచ్చు, ఇది ETL జాబ్‌లు మొదలైన వాటిని ఉపయోగిస్తున్నప్పుడు గ్లూ ఎకోసిస్టమ్‌లో డేటాను తరలించినప్పుడు ఉపయోగించబడుతుంది.









అమెజాన్ గ్లూ సర్వీస్ అంటే ఏమిటి?

AWS గ్లూ అనేది అమెజాన్ ఎక్స్‌ట్రాక్ట్ ట్రాన్స్‌ఫార్మ్ మరియు లోడ్ సేవ, ఇది మొత్తం డేటాను నిర్వహించడానికి, గుర్తించడానికి, తరలించడానికి మరియు మార్చడానికి వినియోగదారుని అనుమతిస్తుంది. వినియోగదారుకు సర్వర్‌లను అందించడం మరియు కాన్ఫిగర్ చేయడం లేదా జీవిత చక్రాలను నిర్వహించడం అవసరం లేనందున AWS గ్లూ సర్వర్‌లెస్‌గా ఉంటుంది. డేటా కేటలాగ్ మరియు క్రాలర్‌లు AWS గ్లూ యొక్క భాగాలు, ఇది నిరంతర మెటాడేటా రిపోజిటరీగా పనిచేస్తుంది:







AWSలో క్రాలర్‌ను ఎలా సృష్టించాలి?

AWSలో క్రాలర్‌ని సృష్టించడానికి, AWS మేనేజ్‌మెంట్ కన్సోల్ నుండి AWS గ్లూ సేవను సందర్శించండి:



'లోకి వెళ్ళండి క్రాలర్లు ఎడమ పానెల్ నుండి దాని పేరుపై క్లిక్ చేయడం ద్వారా పేజీ:

'పై క్లిక్ చేయండి క్రాలర్‌ని సృష్టించండి ”బటన్:

క్రాలర్ పేరును టైప్ చేసి, 'పై క్లిక్ చేయండి తరువాత ”బటన్:

జిగురు పట్టికల కోసం మ్యాపింగ్ ఎంపికను ఎంచుకుని, “పై క్లిక్ చేయండి మూలాన్ని జోడించండి ” నుండి డేటాను పొందడానికి బటన్:

S3 సేవను ఎంచుకుని, 'పై క్లిక్ చేయండి S3ని బ్రౌజ్ చేయండి మూలం యొక్క స్థానాన్ని పొందడానికి ” బటన్:

S3 ఫోల్డర్‌ని ఎంచుకుని, 'పై క్లిక్ చేయండి ఎంచుకోండి ”బటన్:

స్థానం మూలానికి జోడించబడిన తర్వాత, 'పై క్లిక్ చేయండి S3 డేటా మూలాన్ని జోడించండి ”బటన్:

'పై క్లిక్ చేయండి తరువాత ”బటన్:

'పై క్లిక్ చేయండి కొత్త IAM పాత్రను సృష్టించండి '' నుండి బటన్ భద్రతా సెట్టింగ్‌లను కాన్ఫిగర్ చేయండి 'విభాగం:

పాత్ర పేరును నమోదు చేసి, 'పై క్లిక్ చేయండి సృష్టించు ”బటన్:

ఆ తర్వాత, కేవలం 'పై క్లిక్ చేయండి తరువాత ”బటన్:

లక్ష్య డేటాబేస్ను ఎంచుకుని, పట్టిక కోసం ఉపయోగించబడే పేరును టైప్ చేయండి:

దీని కోసం క్రాలర్‌ని షెడ్యూల్ చేయండి కోరిక మేరకు 'మరియు' పై క్లిక్ చేయండి తరువాత ”బటన్:

కాన్ఫిగరేషన్‌ని సమీక్షించి, 'పై క్లిక్ చేయండి క్రాలర్‌ని సృష్టించండి ”బటన్:

క్రాలర్ విజయవంతంగా సృష్టించబడింది మరియు దాన్ని క్లిక్ చేయడం ద్వారా మూలం నుండి డేటాను పొందేందుకు ఉపయోగించవచ్చు పరుగు ”బటన్:

AWSలోని లిస్ట్ క్రాలర్‌ల గురించి అంతే.

ముగింపు

ListCrawler అనేది AWS జిగురు సేవ యొక్క భాగం, ఇది మూలాధారాల నుండి సమాచారాన్ని క్రాల్ చేయడానికి మరియు కేటలాగ్‌కి తిరిగి రావడానికి ఉపయోగించబడుతుంది. డేటా కేటలాగ్‌లు మరియు క్రాలర్‌లు మెటాడేటా అని పిలువబడే డేటా గురించి సమాచారాన్ని పొందడానికి డేటాను సేకరించడానికి ఉపయోగించవచ్చు. S3 సేవ లేదా ఇతర మూలాధారాల నుండి డేటాను పొందడానికి మరియు డేటాబేస్‌లో క్రియేట్ టేబుల్‌లను ఉంచడానికి వినియోగదారు AWS గ్లూ నుండి క్రాలర్‌ను కూడా సృష్టించవచ్చు. ఈ గైడ్ AWSలోని ListCrawlers మరియు వాటిని ఎలా సృష్టించాలో వివరించింది.