అమెజాన్ రెడ్‌షిఫ్ట్ డేటాటైప్‌లు అంటే ఏమిటి?

Amejan Red Sipht Detataip Lu Ante Emiti



Amazon Redshift అనేది AWS అందించే క్లౌడ్ సొల్యూషన్, ఇది డేటా వేర్‌హౌస్ యొక్క ప్రయోజనాన్ని పూర్తి చేస్తుంది. డేటా వేర్‌హౌస్ అనేది క్లౌడ్‌లో అపారమైన డేటాను నిల్వ చేసే పెద్ద స్థలం. డేటా గిడ్డంగి మరియు డేటాబేస్ మధ్య వ్యత్యాసం ఏమిటంటే, మునుపటిది ప్రస్తుత డేటాను మాత్రమే కాకుండా డేటా యొక్క పూర్తి చరిత్రను కూడా నిల్వ చేస్తుంది.

ఈ కథనం AWS ద్వారా Amazon Redshift గురించి మరియు ఈ సేవకు మద్దతిచ్చే డేటా రకాల గురించి నేర్చుకుంటుంది.







అమెజాన్ రెడ్‌షిఫ్ట్ అంటే ఏమిటి?

ఇది ఆధారంగా డేటా గిడ్డంగికి క్లౌడ్ పరిష్కారం 'PostgreSQL' . అనే సాంకేతికతను ఇందులో ఉపయోగిస్తున్నారు 'మాసివ్లీ ప్యారలల్ ప్రాసెసింగ్ (MPP)' మెరుపు వేగంతో పెటాబైట్‌ల డేటాను ప్రాసెస్ చేయడానికి. ఇది హిస్టారికల్ డేటా మరియు స్ట్రీమింగ్ సొల్యూషన్స్ ఆధారంగా రియల్ టైమ్ ప్రిడిక్షన్ కోసం సులభమైన పరిష్కారాన్ని అందిస్తుంది.



కింది బొమ్మ Amazon Redshift యొక్క పని విధానాన్ని చూపుతుంది:







Amazon Redshift ఎలా పని చేస్తుందో ఈ గ్రాఫికల్ వివరణ చాలా సులభం మరియు స్పష్టంగా ఉంది. అవుట్‌పుట్‌లను రూపొందించడానికి మరియు డేటా ఆధారిత అప్లికేషన్‌లను రూపొందించడానికి డేటా ఎలా తిరిగి పొందబడుతుంది మరియు మరింత ప్రాసెస్ చేయబడుతుంది అనే దాని గురించి ఇది మాకు సమాచారాన్ని అందిస్తుంది.

అమెజాన్ రెడ్‌షిఫ్ట్ యొక్క డేటా వేర్‌హౌస్ ఆర్కిటెక్చర్ క్రింద ఇవ్వబడిన చిత్రంలో కూడా చూడవచ్చు:



ఇప్పుడు, మేము ఈ సేవ యొక్క ఉపయోగాలు మరియు లక్షణాలకు వెళ్తాము.

లక్షణాలు

ఇప్పటికే చెప్పినట్లుగా, Amazon Redshift PostgreSQLపై ఆధారపడింది మరియు భారీ సమాంతర ప్రాసెసింగ్ అనే సాంకేతికతను ఉపయోగిస్తుంది, అది ఏ సమయంలోనైనా పెటాబైట్‌ల డేటాను ప్రాసెస్ చేయడానికి వీలు కల్పిస్తుంది. అందువల్ల, రెడ్‌షిఫ్ట్ మంచి సంఖ్యలో ఫీచర్లు మరియు ఉపయోగాలను అందిస్తుంది. ఈ లక్షణాలలో కొన్ని క్రింద ఉన్నాయి:

  • డేటా భద్రత మరియు ఎన్క్రిప్షన్.
  • వ్యాపార విశ్లేషణలు.
  • డేటా ఆధారిత అప్లికేషన్ మద్దతు.
  • ప్రిడిక్టివ్ విశ్లేషణ.
  • స్వయంచాలక పని పునరావృతం.
  • ఏకకాల డేటా స్కేలింగ్.
  • డేటా వేర్‌హౌసింగ్.

ఈ సేవ యొక్క కొన్ని అదనపు ఫీచర్లను క్రింద ఇవ్వబడిన చిత్రంలో చూడవచ్చు:

ఇవి రెడ్‌షిఫ్ట్ అందించే చాలా ఫీచర్లు మరియు ఇప్పుడు మేము ఈ సేవ ద్వారా మద్దతు ఇచ్చే డేటా రకాలకు వెళ్తాము.

డేటా రకాలు

Amazon Redshift అనేది అనేక ఫీచర్లతో కూడిన డేటా వేర్‌హౌసింగ్ సొల్యూషన్. ఇది నిర్మాణాత్మక మరియు నిర్మాణాత్మక డేటా రకాలకు మద్దతు ఇస్తుంది. ఇది PostgreSQLపై ఆధారపడినందున, సాధారణ SQL ప్రశ్నల ద్వారా డేటాను మార్చవచ్చు.

ఇప్పుడు, మరొక ప్రశ్న తలెత్తుతుంది, అంటే, ఈ డేటా ఫార్మాట్‌లు ఒకదానికొకటి ఎలా భిన్నంగా ఉంటాయి? ఈ రెండు డేటా ఫార్మాట్‌లను చర్చిద్దాం.

నిర్మాణాత్మక డేటా

మెషిన్ లెర్నింగ్ అల్గారిథమ్‌ల ద్వారా సులభంగా అనువదించబడే అత్యంత ఫార్మాట్ చేయబడిన డేటా రకాన్ని నిర్మాణాత్మక డేటా అంటారు. ఒక SQL డేటాబేస్ నిర్మాణాత్మక డేటాతో పని చేస్తుంది. సంబంధిత డేటాబేస్‌లు ఉపయోగించే డేటా వంటి నిర్మాణాత్మక డేటా పట్టిక రూపంలో ఉంటుంది

విస్తృతంగా ఉపయోగించే SQL డేటాబేస్ మేనేజ్‌మెంట్ సిస్టమ్‌లలో ఒకటి MYSQL. దీని నిర్మాణాన్ని క్రింద ఇవ్వబడిన చిత్రంలో చూడవచ్చు:

నిర్మాణాత్మక డేటా

నిర్మాణాత్మక డేటా తక్కువగా ఉంటుంది మరియు నాన్-రిలేషనల్ డేటాబేస్‌లలో ఉపయోగించే డేటా వంటి తక్కువ డేటాను ఫార్మాట్ చేస్తుంది. MongoDB ఒక ప్రసిద్ధ నాన్-రిలేషనల్ డేటాబేస్. SQL ప్రశ్నలు నాన్-రిలేషనల్ డేటాబేస్‌లలో పని చేయవు, కాబట్టి ఈ డేటాబేస్‌లను NoSQL డేటాబేస్‌లు అని కూడా అంటారు.

ఇప్పటికే చెప్పినట్లుగా, మొంగోడిబి అనేది నాన్-స్ట్రక్చర్డ్ డేటాబేస్ మేనేజ్‌మెంట్ సిస్టమ్ మరియు దాని నిర్మాణాన్ని ఇచ్చిన చిత్రంలో క్రింద చూడవచ్చు:

మేము డేటాబేస్‌లలో ఉపయోగించే రెండు ప్రాథమిక డేటా రకాలను పరిశీలించాము మరియు మేము ఇప్పుడు Amazon Redshift ద్వారా మద్దతు ఇచ్చే వాస్తవ డేటా రకాలకు వెళ్తాము. ఈ డేటా రకాలు:

  • సంఖ్యా డేటా
  • అక్షర డేటా
  • తేదీ సమయ డేటా
  • బూలియన్ డేటా
  • HLLSKETCH డేటా
  • సూపర్ డేటా
  • రీప్లేస్‌మెంట్ డేటా

ఈ డేటా రకాలను చర్చిద్దాం:

సంఖ్యా డేటా

ఈ డేటా రకం స్వీయ వివరణాత్మకమైనది. ఇది పూర్ణాంకాలు, దశాంశాలు, ఫ్లోటింగ్ పాయింట్ మరియు ఇతర సంఖ్యా డేటా రకాల రూపంలో ఉన్న డేటాకు మద్దతు ఇస్తుంది.

పూర్ణాంక డేటా రకం యొక్క లక్షణాలు క్రింది చిత్రంలో చూడవచ్చు:

దశాంశ డేటా రకం వినియోగదారు నుండి ఖచ్చితత్వం ఆధారంగా డేటాను నిల్వ చేస్తుంది. దీని లక్షణాలు క్రింది విధంగా ఉన్నాయి:

అక్షర డేటా

CHAR మరియు VARCHAR డేటా రకాలు అక్షర-ఆధారిత డేటా రకాల వర్గం కిందకు వస్తాయి. NCHAR మరియు NVARCHAR కూడా అక్షర రకం డేటా రకాలు. CHAR మరియు VARCHAR కాకుండా, ఈ రెండు డేటా రకాలు స్థిర పొడవు, యూనికోడ్ అక్షరాలను నిల్వ చేస్తాయి. ఈ డేటా రకాల లక్షణాలను చూద్దాం, అవి:

  • CHAR, CHARACTER, NCHAR 4KB పరిధిని కలిగి ఉంటాయి.
  • VARCHAR, NVARCHAR 64KB పరిధిని కలిగి ఉంది.
  • BPCHAR 256 బైట్‌ల పరిధిని కలిగి ఉంది.
  • TEXT 260 బైట్‌ల పరిధిని కలిగి ఉంది.

తేదీ సమయ డేటా

తేదీ సమయ డేటా రకాలు DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ. ఈ డేటా రకాల ఫంక్షనల్ సామర్థ్యాలు క్రింది విధంగా ఉన్నాయి:

  • DATE కేవలం క్యాలెండర్ తేదీలను నిల్వ చేస్తుంది.
  • TIME ఏ టైమ్ జోన్‌ను సూచించకుండా సమయాన్ని నిల్వ చేస్తుంది. ఇది డిఫాల్ట్‌గా UTC.
  • TIMETZ టైమ్ జోన్‌కు సూచనగా సమయాన్ని నిల్వ చేస్తుంది. ఇది డిఫాల్ట్‌గా వినియోగదారు పట్టికలు మరియు సిస్టమ్ పట్టికలు రెండింటిలోనూ UTC.
  • TIMESTAMP సమయం మాత్రమే కాకుండా తేదీలను కూడా కలిగి ఉంటుంది. ఇది డిఫాల్ట్‌గా వినియోగదారు పట్టికలు మరియు సిస్టమ్ పట్టికలు రెండింటిలోనూ UTC.
  • TIMESTAMPTZ సమయం మాత్రమే కాకుండా తేదీలను కూడా కలిగి ఉంటుంది. ఇది డిఫాల్ట్‌గా వినియోగదారు పట్టికలలో మాత్రమే UTC.

బూలియన్ డేటా

బూలియన్ డేటా రకం బైనరీ డేటా రకం, అంటే రెండు విలువలు మాత్రమే ఉన్నాయి. బూలియన్ డేటా రకం కోసం లక్షణాల పట్టిక చిత్రంలో క్రింద ఇవ్వబడింది:

HLLSKETCH డేటా

ఈ డేటా రకం స్కెచ్‌లను నిల్వ చేయడానికి ఉపయోగించబడుతుంది. రెడ్‌షిఫ్ట్ స్కెచ్‌లను చిన్న లేదా దట్టమైన రూపంలో సూచిస్తుంది. లింక్‌ను అనుసరించడం ద్వారా దట్టమైన ఆకృతి మరింత సామర్థ్యాన్ని అందించినప్పుడు స్కెచ్‌లు చాలా తక్కువగా ప్రారంభమవుతాయి మరియు క్రమంగా దట్టంగా మారుతాయి.

సూపర్ డేటా

ఈ డేటా రకం శ్రేణులు, సమూహ నిర్మాణాలు లేదా JSON రూపంలో ఉండే నిర్మాణాత్మక డేటాతో వ్యవహరిస్తుంది. డేటా యొక్క మోడల్ లేదా ఫార్మాట్ లేదు. వినియోగదారులు లింక్‌ను నావిగేట్ చేయడం ద్వారా మరింత సమాచారాన్ని అన్వేషించవచ్చు.

రీప్లేస్‌మెంట్ డేటా

ఈ డేటా రకం అక్షరాలను కూడా నిల్వ చేస్తుంది. అయితే, పొడవు పరిమితం. Amazon Redshift VARBYTE డేటాను ఏదైనా పూర్ణాంకం రకం లేదా అక్షర రకం డేటాలో ప్రసారం చేయడానికి అనుమతిస్తుంది. ఈ డేటాటైప్ గురించి మరింత సమాచారం పొందడానికి, క్రింది లింక్‌ని అనుసరించండి.

ఇది అమెజాన్ రెడ్‌షిఫ్ట్ మరియు అది సపోర్ట్ చేసే డేటా రకాలకు సంబంధించినది.

ముగింపు

Amazon Redshift అనేది AWS సేవ, ఇది దాని ప్రాథమిక రూపంలో డేటా గిడ్డంగి యొక్క ప్రయోజనాన్ని అందిస్తుంది, అయితే ఇది విశ్లేషణలు మరియు అంచనాల కోసం చాలా శక్తివంతమైన మరియు విశేషమైన పరిష్కారం. ఈ వ్యాసం Redshift మరియు అది మద్దతిచ్చే డేటా రకాలను చర్చించింది. ఈ డేటా రకాలు వాటి లక్షణాలతో పాటు క్లుప్తంగా వివరించబడ్డాయి.