Amazon Redshift అనేది AWS అందించే క్లౌడ్ సొల్యూషన్, ఇది డేటా వేర్హౌస్ యొక్క ప్రయోజనాన్ని పూర్తి చేస్తుంది. డేటా వేర్హౌస్ అనేది క్లౌడ్లో అపారమైన డేటాను నిల్వ చేసే పెద్ద స్థలం. డేటా గిడ్డంగి మరియు డేటాబేస్ మధ్య వ్యత్యాసం ఏమిటంటే, మునుపటిది ప్రస్తుత డేటాను మాత్రమే కాకుండా డేటా యొక్క పూర్తి చరిత్రను కూడా నిల్వ చేస్తుంది.
ఈ కథనం AWS ద్వారా Amazon Redshift గురించి మరియు ఈ సేవకు మద్దతిచ్చే డేటా రకాల గురించి నేర్చుకుంటుంది.
అమెజాన్ రెడ్షిఫ్ట్ అంటే ఏమిటి?
ఇది ఆధారంగా డేటా గిడ్డంగికి క్లౌడ్ పరిష్కారం 'PostgreSQL' . అనే సాంకేతికతను ఇందులో ఉపయోగిస్తున్నారు 'మాసివ్లీ ప్యారలల్ ప్రాసెసింగ్ (MPP)' మెరుపు వేగంతో పెటాబైట్ల డేటాను ప్రాసెస్ చేయడానికి. ఇది హిస్టారికల్ డేటా మరియు స్ట్రీమింగ్ సొల్యూషన్స్ ఆధారంగా రియల్ టైమ్ ప్రిడిక్షన్ కోసం సులభమైన పరిష్కారాన్ని అందిస్తుంది.
కింది బొమ్మ Amazon Redshift యొక్క పని విధానాన్ని చూపుతుంది:
Amazon Redshift ఎలా పని చేస్తుందో ఈ గ్రాఫికల్ వివరణ చాలా సులభం మరియు స్పష్టంగా ఉంది. అవుట్పుట్లను రూపొందించడానికి మరియు డేటా ఆధారిత అప్లికేషన్లను రూపొందించడానికి డేటా ఎలా తిరిగి పొందబడుతుంది మరియు మరింత ప్రాసెస్ చేయబడుతుంది అనే దాని గురించి ఇది మాకు సమాచారాన్ని అందిస్తుంది.
అమెజాన్ రెడ్షిఫ్ట్ యొక్క డేటా వేర్హౌస్ ఆర్కిటెక్చర్ క్రింద ఇవ్వబడిన చిత్రంలో కూడా చూడవచ్చు:
ఇప్పుడు, మేము ఈ సేవ యొక్క ఉపయోగాలు మరియు లక్షణాలకు వెళ్తాము.
లక్షణాలు
ఇప్పటికే చెప్పినట్లుగా, Amazon Redshift PostgreSQLపై ఆధారపడింది మరియు భారీ సమాంతర ప్రాసెసింగ్ అనే సాంకేతికతను ఉపయోగిస్తుంది, అది ఏ సమయంలోనైనా పెటాబైట్ల డేటాను ప్రాసెస్ చేయడానికి వీలు కల్పిస్తుంది. అందువల్ల, రెడ్షిఫ్ట్ మంచి సంఖ్యలో ఫీచర్లు మరియు ఉపయోగాలను అందిస్తుంది. ఈ లక్షణాలలో కొన్ని క్రింద ఉన్నాయి:
- డేటా భద్రత మరియు ఎన్క్రిప్షన్.
- వ్యాపార విశ్లేషణలు.
- డేటా ఆధారిత అప్లికేషన్ మద్దతు.
- ప్రిడిక్టివ్ విశ్లేషణ.
- స్వయంచాలక పని పునరావృతం.
- ఏకకాల డేటా స్కేలింగ్.
- డేటా వేర్హౌసింగ్.
ఈ సేవ యొక్క కొన్ని అదనపు ఫీచర్లను క్రింద ఇవ్వబడిన చిత్రంలో చూడవచ్చు:
ఇవి రెడ్షిఫ్ట్ అందించే చాలా ఫీచర్లు మరియు ఇప్పుడు మేము ఈ సేవ ద్వారా మద్దతు ఇచ్చే డేటా రకాలకు వెళ్తాము.
డేటా రకాలు
Amazon Redshift అనేది అనేక ఫీచర్లతో కూడిన డేటా వేర్హౌసింగ్ సొల్యూషన్. ఇది నిర్మాణాత్మక మరియు నిర్మాణాత్మక డేటా రకాలకు మద్దతు ఇస్తుంది. ఇది PostgreSQLపై ఆధారపడినందున, సాధారణ SQL ప్రశ్నల ద్వారా డేటాను మార్చవచ్చు.
ఇప్పుడు, మరొక ప్రశ్న తలెత్తుతుంది, అంటే, ఈ డేటా ఫార్మాట్లు ఒకదానికొకటి ఎలా భిన్నంగా ఉంటాయి? ఈ రెండు డేటా ఫార్మాట్లను చర్చిద్దాం.
నిర్మాణాత్మక డేటా
మెషిన్ లెర్నింగ్ అల్గారిథమ్ల ద్వారా సులభంగా అనువదించబడే అత్యంత ఫార్మాట్ చేయబడిన డేటా రకాన్ని నిర్మాణాత్మక డేటా అంటారు. ఒక SQL డేటాబేస్ నిర్మాణాత్మక డేటాతో పని చేస్తుంది. సంబంధిత డేటాబేస్లు ఉపయోగించే డేటా వంటి నిర్మాణాత్మక డేటా పట్టిక రూపంలో ఉంటుంది
విస్తృతంగా ఉపయోగించే SQL డేటాబేస్ మేనేజ్మెంట్ సిస్టమ్లలో ఒకటి MYSQL. దీని నిర్మాణాన్ని క్రింద ఇవ్వబడిన చిత్రంలో చూడవచ్చు:
నిర్మాణాత్మక డేటా
నిర్మాణాత్మక డేటా తక్కువగా ఉంటుంది మరియు నాన్-రిలేషనల్ డేటాబేస్లలో ఉపయోగించే డేటా వంటి తక్కువ డేటాను ఫార్మాట్ చేస్తుంది. MongoDB ఒక ప్రసిద్ధ నాన్-రిలేషనల్ డేటాబేస్. SQL ప్రశ్నలు నాన్-రిలేషనల్ డేటాబేస్లలో పని చేయవు, కాబట్టి ఈ డేటాబేస్లను NoSQL డేటాబేస్లు అని కూడా అంటారు.
ఇప్పటికే చెప్పినట్లుగా, మొంగోడిబి అనేది నాన్-స్ట్రక్చర్డ్ డేటాబేస్ మేనేజ్మెంట్ సిస్టమ్ మరియు దాని నిర్మాణాన్ని ఇచ్చిన చిత్రంలో క్రింద చూడవచ్చు:
మేము డేటాబేస్లలో ఉపయోగించే రెండు ప్రాథమిక డేటా రకాలను పరిశీలించాము మరియు మేము ఇప్పుడు Amazon Redshift ద్వారా మద్దతు ఇచ్చే వాస్తవ డేటా రకాలకు వెళ్తాము. ఈ డేటా రకాలు:
- సంఖ్యా డేటా
- అక్షర డేటా
- తేదీ సమయ డేటా
- బూలియన్ డేటా
- HLLSKETCH డేటా
- సూపర్ డేటా
- రీప్లేస్మెంట్ డేటా
ఈ డేటా రకాలను చర్చిద్దాం:
సంఖ్యా డేటా
ఈ డేటా రకం స్వీయ వివరణాత్మకమైనది. ఇది పూర్ణాంకాలు, దశాంశాలు, ఫ్లోటింగ్ పాయింట్ మరియు ఇతర సంఖ్యా డేటా రకాల రూపంలో ఉన్న డేటాకు మద్దతు ఇస్తుంది.
పూర్ణాంక డేటా రకం యొక్క లక్షణాలు క్రింది చిత్రంలో చూడవచ్చు:
దశాంశ డేటా రకం వినియోగదారు నుండి ఖచ్చితత్వం ఆధారంగా డేటాను నిల్వ చేస్తుంది. దీని లక్షణాలు క్రింది విధంగా ఉన్నాయి:
అక్షర డేటా
CHAR మరియు VARCHAR డేటా రకాలు అక్షర-ఆధారిత డేటా రకాల వర్గం కిందకు వస్తాయి. NCHAR మరియు NVARCHAR కూడా అక్షర రకం డేటా రకాలు. CHAR మరియు VARCHAR కాకుండా, ఈ రెండు డేటా రకాలు స్థిర పొడవు, యూనికోడ్ అక్షరాలను నిల్వ చేస్తాయి. ఈ డేటా రకాల లక్షణాలను చూద్దాం, అవి:
- CHAR, CHARACTER, NCHAR 4KB పరిధిని కలిగి ఉంటాయి.
- VARCHAR, NVARCHAR 64KB పరిధిని కలిగి ఉంది.
- BPCHAR 256 బైట్ల పరిధిని కలిగి ఉంది.
- TEXT 260 బైట్ల పరిధిని కలిగి ఉంది.
తేదీ సమయ డేటా
తేదీ సమయ డేటా రకాలు DATE, TIME, TIMETZ, TIMESTAMP, TIMESTAMPTZ. ఈ డేటా రకాల ఫంక్షనల్ సామర్థ్యాలు క్రింది విధంగా ఉన్నాయి:
- DATE కేవలం క్యాలెండర్ తేదీలను నిల్వ చేస్తుంది.
- TIME ఏ టైమ్ జోన్ను సూచించకుండా సమయాన్ని నిల్వ చేస్తుంది. ఇది డిఫాల్ట్గా UTC.
- TIMETZ టైమ్ జోన్కు సూచనగా సమయాన్ని నిల్వ చేస్తుంది. ఇది డిఫాల్ట్గా వినియోగదారు పట్టికలు మరియు సిస్టమ్ పట్టికలు రెండింటిలోనూ UTC.
- TIMESTAMP సమయం మాత్రమే కాకుండా తేదీలను కూడా కలిగి ఉంటుంది. ఇది డిఫాల్ట్గా వినియోగదారు పట్టికలు మరియు సిస్టమ్ పట్టికలు రెండింటిలోనూ UTC.
- TIMESTAMPTZ సమయం మాత్రమే కాకుండా తేదీలను కూడా కలిగి ఉంటుంది. ఇది డిఫాల్ట్గా వినియోగదారు పట్టికలలో మాత్రమే UTC.
బూలియన్ డేటా
బూలియన్ డేటా రకం బైనరీ డేటా రకం, అంటే రెండు విలువలు మాత్రమే ఉన్నాయి. బూలియన్ డేటా రకం కోసం లక్షణాల పట్టిక చిత్రంలో క్రింద ఇవ్వబడింది:
HLLSKETCH డేటా
ఈ డేటా రకం స్కెచ్లను నిల్వ చేయడానికి ఉపయోగించబడుతుంది. రెడ్షిఫ్ట్ స్కెచ్లను చిన్న లేదా దట్టమైన రూపంలో సూచిస్తుంది. లింక్ను అనుసరించడం ద్వారా దట్టమైన ఆకృతి మరింత సామర్థ్యాన్ని అందించినప్పుడు స్కెచ్లు చాలా తక్కువగా ప్రారంభమవుతాయి మరియు క్రమంగా దట్టంగా మారుతాయి.
సూపర్ డేటా
ఈ డేటా రకం శ్రేణులు, సమూహ నిర్మాణాలు లేదా JSON రూపంలో ఉండే నిర్మాణాత్మక డేటాతో వ్యవహరిస్తుంది. డేటా యొక్క మోడల్ లేదా ఫార్మాట్ లేదు. వినియోగదారులు లింక్ను నావిగేట్ చేయడం ద్వారా మరింత సమాచారాన్ని అన్వేషించవచ్చు.
రీప్లేస్మెంట్ డేటా
ఈ డేటా రకం అక్షరాలను కూడా నిల్వ చేస్తుంది. అయితే, పొడవు పరిమితం. Amazon Redshift VARBYTE డేటాను ఏదైనా పూర్ణాంకం రకం లేదా అక్షర రకం డేటాలో ప్రసారం చేయడానికి అనుమతిస్తుంది. ఈ డేటాటైప్ గురించి మరింత సమాచారం పొందడానికి, క్రింది లింక్ని అనుసరించండి.
ఇది అమెజాన్ రెడ్షిఫ్ట్ మరియు అది సపోర్ట్ చేసే డేటా రకాలకు సంబంధించినది.
ముగింపు
Amazon Redshift అనేది AWS సేవ, ఇది దాని ప్రాథమిక రూపంలో డేటా గిడ్డంగి యొక్క ప్రయోజనాన్ని అందిస్తుంది, అయితే ఇది విశ్లేషణలు మరియు అంచనాల కోసం చాలా శక్తివంతమైన మరియు విశేషమైన పరిష్కారం. ఈ వ్యాసం Redshift మరియు అది మద్దతిచ్చే డేటా రకాలను చర్చించింది. ఈ డేటా రకాలు వాటి లక్షణాలతో పాటు క్లుప్తంగా వివరించబడ్డాయి.