ఇమేజ్ ప్రాసెసింగ్ OpenCV

మేము ఈ వ్యాసంలో ఇమేజ్-ప్రాసెసింగ్ పద్ధతులను అధ్యయనం చేయబోతున్నాము. మేము కంప్యూటర్ విజన్ మరియు మెషిన్ లెర్నింగ్‌లో కొన్ని ప్రాథమికమైన కానీ క్లిష్టమైన అంశాలను పరిశీలిస్తాము. ఈ ప్రాథమిక ఇమేజ్ ప్రాసెసింగ్ పద్ధతులు డేటాసెట్‌ల వంటి సంక్లిష్ట సమస్యలను పరిష్కరించగలవు. ఫలితంగా, ఇమేజ్ ప్రాసెసింగ్‌లో ఆరు ప్రాథమిక దశలు ఉన్నాయి, అవి క్రింద ఇవ్వబడ్డాయి:

చిత్ర అనువాదం
చిత్రం భ్రమణం
చిత్రం అంకగణితం
చిత్రం ఫ్లిప్పింగ్
చిత్రం కత్తిరించడం
చిత్రం పరిమాణం మార్చడం

ఇప్పుడు, మేము పైన పేర్కొన్న అన్ని ఇమేజ్ ప్రాసెసింగ్ అంశాలను వివరంగా వివరిస్తాము.

1. చిత్ర అనువాదం

ఇమేజ్ ట్రాన్స్‌లేషన్ అనేది ఇమేజ్ ప్రాసెసింగ్ పద్ధతి, ఇది చిత్రాన్ని x మరియు y-అక్షాల వెంట తరలించడానికి మాకు సహాయపడుతుంది. మేము చిత్రాన్ని పైకి, క్రిందికి, కుడి, ఎడమ లేదా ఏదైనా కలయికను తరలించవచ్చు.

మేము అనువాద మాతృకను M గుర్తుతో నిర్వచించవచ్చు మరియు క్రింద చూపిన విధంగా మేము దానిని గణిత రూపంలో సూచించవచ్చు:

ఈ ప్రోగ్రామ్ ద్వారా అనువాద చిత్రం యొక్క భావనను మనం అర్థం చేసుకోవచ్చు.

పైథాన్ కోడ్: మేము ఈ క్రింది ప్రోగ్రామ్ పేరును అలాగే ఉంచుతాము translate.py .

# అవసరమైన ప్యాకేజీలను దిగుమతి చేయండి

దిగుమతి మొద్దుబారిన వంటి ఉదా

దిగుమతి argparse

దిగుమతి ఇముటిల్

దిగుమతి cv2

# మేము ఆర్గ్యుమెంట్ పార్సర్‌ని అమలు చేస్తాము

ap_obj = argparse. ఆర్గ్యుమెంట్ పార్సర్ ( )

ap_obj. add_argument ( '-k' , '--చిత్రం' , అవసరం = నిజమే ,

సహాయం = 'చిత్రం ఫైల్ యొక్క స్థానం' )

ఆర్గ్స్ = ఎవరిది ( ap_obj. పార్స్_ఆర్గ్స్ ( ) )

# చిత్రాన్ని లోడ్ చేసి, స్క్రీన్‌పై చూపించండి

చిత్రం = cv2. imread ( ఆర్గ్స్ [ 'చిత్రం' ] )

cv2. చూపించు ( 'Original_image' , చిత్రం )

# చిత్రం యొక్క అనువాదం NumPy మాతృక, ఇది క్రింద ఇవ్వబడింది:

# [[1, 0, shiftX], [0, 1, shiftY]]

# మేము చిత్రాలను వెంట మార్చడానికి పై NumPy మ్యాట్రిక్స్‌ని ఉపయోగించబోతున్నాము

# x-axis మరియు y-axis దిశలు. దీని కోసం, మనం కేవలం పిక్సెల్ విలువలను పాస్ చేయాలి.

# ఈ ప్రోగ్రామ్‌లో, మేము చిత్రాన్ని 30 పిక్సెల్‌లను కుడి వైపుకు తరలిస్తాము

# మరియు దిగువన 70 పిక్సెల్‌లు.

అనువాదం_మాట = ఉదా ఫ్లోట్32 ( [ [ 1 , 0 , 30 ] , [ 0 , 1 , 70 ] ] )

చిత్రం_అనువాదం = cv2. warpAffine ( చిత్రం , అనువాదం_మాట ,

( చిత్రం. ఆకారం [ 1 ] , చిత్రం. ఆకారం [ 0 ] ) )

cv2. చూపించు ( 'చిత్ర అనువాదం క్రిందికి మరియు కుడికి' , చిత్రం_అనువాదం )

# ఇప్పుడు, మేము చిత్రాలను వెంట మార్చడానికి పై NumPy మాతృకను ఉపయోగించబోతున్నాము

# x-axis (ఎడమ) మరియు y-axis (పైకి) దిశలు.

# ఇక్కడ, మేము 50 పిక్సెల్‌ల చిత్రాలను ఎడమవైపుకు తరలించబోతున్నాము

# మరియు పైకి 90 పిక్సెల్‌లు.

అనువాదం_మాట = ఉదా ఫ్లోట్32 ( [ [ 1 , 0 , - యాభై ] , [ 0 , 1 , - 90 ] ] )

చిత్రం_అనువాదం = cv2. warpAffine ( చిత్రం , అనువాదం_మాట ,

( చిత్రం. ఆకారం [ 1 ] , చిత్రం. ఆకారం [ 0 ] ) )

cv2. చూపించు ( 'చిత్ర అనువాదం పైకి మరియు ఎడమ' , చిత్రం_అనువాదం )

cv2. వేచి ఉండండి ( 0 )

లైన్లు 1 నుండి 5: మేము ఈ ప్రోగ్రామ్ కోసం OpenCV, argparser మరియు NumPy వంటి అన్ని అవసరమైన ప్యాకేజీలను దిగుమతి చేస్తున్నాము. ఇమ్యుటిల్స్ అనే మరో లైబ్రరీ ఉందని దయచేసి గమనించండి. ఇది OpenCV యొక్క ప్యాకేజీ కాదు. ఇది లైబ్రరీ మాత్రమే, అదే ఇమేజ్ ప్రాసెసింగ్‌ను సులభంగా చూపుతుంది.

మేము OpenCVని ఇన్‌స్టాల్ చేసినప్పుడు లైబ్రరీ ఇమ్యుటిల్స్ స్వయంచాలకంగా చేర్చబడవు. కాబట్టి ఇమ్యుటిల్స్‌ను ఇన్‌స్టాల్ చేయడానికి, మేము ఈ క్రింది పద్ధతిని ఉపయోగించాలి:

పిప్ ఇన్‌స్టాల్ ఇమ్యుటిల్స్

పంక్తులు 8 నుండి 15: మేము మా అగ్రపార్సర్‌ని సృష్టించాము మరియు మా చిత్రాన్ని లోడ్ చేసాము.

లైన్లు 24 నుండి 25: ఈ ప్రోగ్రామ్ విభాగంలో అనువాదం జరుగుతుంది. అనువాద మాతృక చిత్రం ఎన్ని పిక్సెల్‌లు పైకి లేదా క్రిందికి లేదా ఎడమ లేదా కుడికి తరలించబడుతుందో తెలియజేస్తుంది. OpenCVకి మ్యాట్రిక్స్ విలువ ఫ్లోటింగ్ పాయింట్ శ్రేణిలో ఉండటం అవసరం కాబట్టి, ట్రాన్స్‌లేషన్ మ్యాట్రిక్స్ ఫ్లోటింగ్ పాయింట్ శ్రేణుల్లో విలువలను తీసుకుంటుంది.

అనువాద మాతృక యొక్క మొదటి వరుస ఇలా కనిపిస్తుంది:

మాతృక యొక్క ఈ వరుస x-అక్షం కోసం. T యొక్క విలువ_x చిత్రం ఎడమ లేదా కుడి వైపుకు మార్చబడుతుందో లేదో నిర్ణయిస్తుంది. మనం ప్రతికూల విలువను పాస్ చేస్తే, చిత్రం ఎడమ వైపుకు మార్చబడుతుంది మరియు సానుకూల విలువ ఉంటే, చిత్రం కుడి వైపుకు మార్చబడుతుంది.

మేము ఇప్పుడు మాతృక యొక్క రెండవ వరుసను ఈ క్రింది విధంగా నిర్వచించాము:

మాతృక యొక్క ఈ వరుస y-అక్షం కోసం. T యొక్క విలువ_వై చిత్రాన్ని పైకి లేదా క్రిందికి మార్చాలా అనేది నిర్ణయిస్తుంది. మేము ప్రతికూల విలువను పాస్ చేస్తే, చిత్రం పైకి మారుతుందని అర్థం, మరియు విలువ సానుకూలంగా ఉంటే, అప్పుడు చిత్రం క్రిందికి మార్చబడుతుంది.

లైన్ 24 వద్ద మునుపటి ప్రోగ్రామ్‌లో, మేము tని నిర్వచించాము_x = 30 మరియు టి_వై = 70. కాబట్టి మేము చిత్రాన్ని 30 పిక్సెల్‌లను కుడి వైపుకు మరియు 70 పిక్సెల్‌లను క్రిందికి తరలిస్తున్నాము.

కానీ ప్రధాన చిత్ర అనువాద ప్రక్రియ లైన్ 25 వద్ద జరుగుతుంది, ఇక్కడ మేము అనువాద మాతృకను నిర్వచించాము cv2.warpAffine . ఈ ఫంక్షన్‌లో, మేము మూడు పారామితులను పాస్ చేస్తున్నాము: మొదటి పరామితి చిత్రం, రెండవ పరామితి అనువాద మాతృక మరియు మూడవ పరామితి చిత్రం పరిమాణం.

పంక్తి 27: లైన్ 27 ఫలితాన్ని అవుట్‌పుట్‌లో ప్రదర్శిస్తుంది.

ఇప్పుడు, మేము ఎడమ మరియు పైకి మరొక అనువాద మాతృకను అమలు చేస్తాము. దీని కోసం, మేము ప్రతికూల విలువలను నిర్వచించాలి.

లైన్ 33 నుండి 34: లైన్ 33 వద్ద మునుపటి ప్రోగ్రామ్‌లో, మేము tని నిర్వచించాము_x = -50 మరియు టి_వై = -90. కాబట్టి మేము చిత్రాన్ని 50 పిక్సెల్స్ ఎడమ వైపుకు మరియు 90 పిక్సెల్స్ పైకి తరలిస్తున్నాము. కానీ ప్రధాన చిత్ర అనువాద ప్రక్రియ లైన్ 34 వద్ద జరుగుతుంది, ఇక్కడ మేము అనువాద మాతృకను నిర్వచించాము cv2.warpAffine .

లైన్ 36 : లైన్ 36 అవుట్‌పుట్‌లో చూపిన విధంగా ఫలితాన్ని ప్రదర్శిస్తుంది.

మునుపటి కోడ్‌ను అమలు చేయడానికి, మేము క్రింద ఇచ్చిన విధంగా చిత్రం యొక్క పాత్‌ను ఇవ్వాలి.

అవుట్‌పుట్: python translate.py –image squirrel.jpg

ఇప్పుడు, మేము ఉపయోగించి అదే చిత్ర అనువాద ప్రోగ్రామ్‌ను అమలు చేస్తాము ఇముటిల్ గ్రంధాలయం. ఇమేజ్ ప్రాసెసింగ్ కోసం ఈ లైబ్రరీని ఉపయోగించడం చాలా సులభం. ఈ లైబ్రరీలో, మనం దాని గురించి ఆలోచించాల్సిన అవసరం లేదు cv2.warpAffine ఎందుకంటే ఈ లైబ్రరీ దీన్ని చూసుకుంటుంది. కాబట్టి imutils లైబ్రరీని ఉపయోగించి ఈ చిత్ర అనువాద ప్రోగ్రామ్‌ను అమలు చేద్దాం.

పైథాన్ కోడ్: మేము ఈ క్రింది ప్రోగ్రామ్ పేరును అలాగే ఉంచుతాము translate_imutils.py .

# అవసరమైన ప్యాకేజీలను దిగుమతి చేయండి

దిగుమతి మొద్దుబారిన వంటి ఉదా

దిగుమతి argparse

దిగుమతి ఇముటిల్

దిగుమతి cv2

# ఈ ఫంక్షన్ చిత్ర అనువాదాన్ని అమలు చేస్తుంది మరియు

# అనువదించబడిన చిత్రాన్ని కాలింగ్ ఫంక్షన్‌కి అందిస్తుంది.

డెఫ్ అనువదించు ( చిత్రం , x , వై ) :

అనువాదం_మాతృక = ఉదా ఫ్లోట్32 ( [ [ 1 , 0 , x ] , [ 0 , 1 , వై ] ] )

చిత్రం_అనువాదం = cv2. warpAffine ( చిత్రం , అనువాదం_మాతృక ,

( చిత్రం. ఆకారం [ 1 ] , చిత్రం. ఆకారం [ 0 ] ) )

తిరిగి చిత్రం_అనువాదం

# ఆర్గ్యుమెంట్ పార్సర్‌ను నిర్మించండి మరియు ఆర్గ్యుమెంట్‌లను అన్వయించండి

ap = argparse. ఆర్గ్యుమెంట్ పార్సర్ ( )

ap. add_argument ( '-నేను' , '--చిత్రం' , అవసరం = నిజమే , సహాయం = 'చిత్రానికి మార్గం' )

ఆర్గ్స్ = ఎవరిది ( ap. పార్స్_ఆర్గ్స్ ( ) )

# చిత్రాన్ని లోడ్ చేసి, స్క్రీన్‌పై ప్రదర్శించండి

చిత్రం = cv2. imread ( ఆర్గ్స్ [ 'చిత్రం' ] )

cv2. చూపించు ( 'Original_image' , చిత్రం )

చిత్రం_అనువాదం = ఇముటిల్. అనువదించు ( చిత్రం , 10 , 70 )

cv2. చూపించు ( 'చిత్ర అనువాదం కుడివైపు మరియు దిగువ వైపు' ,

చిత్రం_అనువాదం )

cv2. వేచి ఉండండి ( 0 )

లైన్లు 9 నుండి 13: ప్రోగ్రామ్ యొక్క ఈ విభాగంలో అనువాదం జరుగుతుంది. అనువాద మాతృక చిత్రం ఎన్ని పిక్సెల్‌ల ద్వారా పైకి లేదా క్రిందికి లేదా ఎడమ లేదా కుడికి తరలించబడుతుందో తెలియజేస్తుంది.

ఈ పంక్తులు ఇప్పటికే వివరించబడ్డాయి, కానీ ఇప్పుడు మేము అనువదించు () అనే ఫంక్షన్‌ని నిర్మించబోతున్నాము మరియు దానిలో మూడు విభిన్న పారామితులను పంపుతాము. చిత్రం మొదటి పరామితిగా పనిచేస్తుంది. అనువాద మాతృక యొక్క x మరియు y విలువలు రెండవ మరియు మూడవ పారామితులకు అనుగుణంగా ఉంటాయి.

గమనిక : ఇది ఇప్పటికే imutils లైబ్రరీ ప్యాకేజీలో చేర్చబడినందున ప్రోగ్రామ్ లోపల ఈ అనువాద ఫంక్షన్‌ని నిర్వచించాల్సిన అవసరం లేదు. నేను సూటిగా వివరణ కోసం ప్రోగ్రామ్‌లో ఉపయోగించాను. పంక్తి 24లో చూపిన విధంగా మనం ఈ ఫంక్షన్‌ని నేరుగా ఇమ్యుటిల్స్‌తో కాల్ చేయవచ్చు.

పంక్తి 24: మునుపటి ప్రోగ్రామ్ లైన్ 24 వద్ద, మేము tx = 10 మరియు ty = 70 నిర్వచించమని చూపుతుంది. కాబట్టి మేము చిత్రాన్ని 10 పిక్సెల్‌లను కుడి వైపుకు మరియు 70 పిక్సెల్‌లను క్రిందికి తరలిస్తున్నాము.

ఈ ప్రోగ్రామ్‌లో, మేము ఏ cv2.warpAffine ఫంక్షన్‌ల గురించి పట్టించుకోము ఎందుకంటే అవి ఇప్పటికే imutils లైబ్రరీ ప్యాకేజీలో ఉన్నాయి.

మునుపటి కోడ్‌ని అమలు చేయడానికి, క్రింద ఇచ్చిన విధంగా మనం చిత్రం యొక్క మార్గాన్ని ఇవ్వాలి:

అవుట్‌పుట్:

పైథాన్ ఇమ్యుటిల్స్. py --చిత్రం ఉడుత. jpg

2. ఇమేజ్ రొటేషన్

మునుపటి పాఠంలో (లేదా ఏదైనా కలయిక) చిత్రాన్ని పైకి, క్రిందికి, ఎడమ మరియు కుడికి ఎలా అనువదించాలో (అంటే, షిఫ్ట్) మేము పరిశీలించాము. తరువాత, ఇమేజ్ ప్రాసెసింగ్‌కు సంబంధించి మేము భ్రమణాన్ని చర్చిస్తాము.

భ్రమణం అని పిలువబడే ప్రక్రియలో ఒక చిత్రం తీటా అనే కోణం ద్వారా తిప్పబడుతుంది. మనం చిత్రాన్ని తిప్పుతున్న కోణం తీటా ద్వారా సూచించబడుతుంది. అదనంగా, నేను తిరిగే చిత్రాలను సులభతరం చేయడానికి రొటేట్ సౌలభ్యం ఫంక్షన్‌ను తదనంతరం అందిస్తాను.

అనువాదం వలె, మరియు బహుశా ఆశ్చర్యం లేదు, కోణం ద్వారా భ్రమణం, తీటా క్రింది ఆకృతిలో మాతృక Mని నిర్మించడం ద్వారా నిర్ణయించబడుతుంది:

ఈ మాత్రిక వెక్టార్ తీటా డిగ్రీలు (ఎక్స్, y)-కార్టీసియన్ ప్లేన్ ఇచ్చిన మూలం చుట్టూ తిప్పవచ్చు. సాధారణంగా, ఈ దృష్టాంతంలో, మూలం చిత్రం యొక్క కేంద్రంగా ఉంటుంది, కానీ వాస్తవానికి, మనం ఏదైనా యాదృచ్ఛిక (x, y) పాయింట్‌ని మా భ్రమణ కేంద్రంగా పేర్కొనవచ్చు.

తిప్పబడిన చిత్రం R అప్పుడు నేను నేరుగా మాతృక గుణకారాన్ని ఉపయోగించి అసలు చిత్రం నుండి సృష్టించబడుతుంది: R = IM

మరోవైపు, OpenCV, ఒక ఇమేజ్‌ని (1) స్కేల్ (అంటే, పునఃపరిమాణం) చేసే సామర్థ్యాన్ని అదనంగా అందిస్తుంది మరియు (2) చుట్టూ భ్రమణాన్ని నిర్వహించడానికి ఏకపక్ష భ్రమణ కేంద్రాన్ని అందిస్తుంది.

మా సవరించిన భ్రమణ మాతృక M క్రింద చూపబడింది:

అనే కొత్త ఫైల్‌ని తెరిచి, రూపొందించడం ద్వారా ప్రారంభిద్దాం తిప్పండి.py :

# అవసరమైన ప్యాకేజీలను దిగుమతి చేస్తోంది

దిగుమతి మొద్దుబారిన వంటి ఉదా

దిగుమతి argparse

దిగుమతి ఇముటిల్

దిగుమతి cv2

# ఆర్గ్యుమెంట్‌పార్సర్ ఆబ్జెక్ట్‌ని సృష్టించడం మరియు ఆర్గ్యుమెంట్‌ను పార్సింగ్ చేయడం

apobj = argparse. ఆర్గ్యుమెంట్ పార్సర్ ( )

apobj. add_argument ( '-k' , '--చిత్రం' , అవసరం = నిజమే , సహాయం = 'చిత్ర మార్గం' )

వాదనలు = ఎవరిది ( apobj. పార్స్_ఆర్గ్స్ ( ) )

చిత్రం = cv2. imread ( వాదనలు [ 'చిత్రం' ] )

cv2. చూపించు ( 'Original_image' , చిత్రం )

# చిత్రం యొక్క కొలతలు ఉపయోగించి చిత్రం యొక్క మధ్యభాగాన్ని లెక్కించండి.

( ఎత్తు , వెడల్పు ) = చిత్రం. ఆకారం [ : 2 ]

( సెంటర్ఎక్స్ , కేంద్రంY ) = ( వెడల్పు / 2 , ఎత్తు / 2 )

# ఇప్పుడు, cv2ని ఉపయోగించి, మేము చిత్రాన్ని 55 డిగ్రీల వరకు తిప్పుతాము

# getRotationMatrix2D()ని ఉపయోగించి భ్రమణ మాతృకను నిర్ణయించండి

భ్రమణ మాతృక = cv2. getRotationMatrix2D ( ( సెంటర్ఎక్స్ , కేంద్రంY ) , 55 , 1.0 )

తిప్పబడిన చిత్రం = cv2. warpAffine ( చిత్రం , భ్రమణ మాతృక , ( వెడల్పు , ఎత్తు ) )

cv2. చూపించు ( 'చిత్రాన్ని 55 డిగ్రీలు తిప్పారు' , తిప్పబడిన చిత్రం )

cv2. వేచి ఉండండి ( 0 )

# చిత్రం ఇప్పుడు -85 డిగ్రీలతో తిప్పబడుతుంది.

భ్రమణ మాతృక = cv2. getRotationMatrix2D ( ( సెంటర్ఎక్స్ , కేంద్రంY ) , - 85 , 1.0 )

తిప్పబడిన చిత్రం = cv2. warpAffine ( చిత్రం , భ్రమణ మాతృక , ( వెడల్పు , ఎత్తు ) )

cv2. చూపించు ( 'చిత్రాన్ని -85 డిగ్రీలు తిప్పారు' , తిప్పబడిన చిత్రం )

cv2. వేచి ఉండండి ( 0 )

మేము OpenCVని ఇన్‌స్టాల్ చేసినప్పుడు లైబ్రరీ ఇమ్యుటిల్స్ స్వయంచాలకంగా చేర్చబడవు. OpenCV ఇమ్యుటిల్స్‌ను ఇన్‌స్టాల్ చేస్తుంది. మేము ఈ క్రింది పద్ధతిని ఉపయోగించాలి:

పిప్ ఇన్‌స్టాల్ ఇమ్యుటిల్స్

పంక్తులు 8 నుండి 14: మేము మా అగ్రపార్సర్‌ని సృష్టించాము మరియు మా చిత్రాన్ని లోడ్ చేసాము. ఈ ఆర్గ్‌పార్సర్‌లో, మేము ఒక ఇమేజ్ ఆర్గ్యుమెంట్‌ను మాత్రమే ఉపయోగిస్తాము, ఇది భ్రమణాన్ని ప్రదర్శించడానికి ఈ ప్రోగ్రామ్‌లో మనం ఉపయోగించే చిత్రం యొక్క మార్గాన్ని తెలియజేస్తుంది.

చిత్రాన్ని తిప్పేటప్పుడు, మనం తప్పనిసరిగా భ్రమణ పివోట్ పాయింట్‌ని నిర్వచించాలి. ఎక్కువ సమయం, మీరు చిత్రాన్ని దాని మధ్యలో తిప్పాలనుకుంటున్నారు, కానీ OpenCV బదులుగా ఏదైనా యాదృచ్ఛిక పాయింట్‌ని ఎంచుకోవడానికి మిమ్మల్ని అనుమతిస్తుంది. చిత్రాన్ని దాని మధ్యలో తిప్పండి.

లైన్లు 17 నుండి 18 చిత్రం యొక్క వెడల్పు మరియు ఎత్తును వరుసగా తీసుకుని, ఆపై ప్రతి పరిమాణాన్ని రెండుగా విభజించి చిత్రం యొక్క కేంద్రాన్ని స్థాపించండి.

మేము చిత్రాన్ని అనువదించడానికి మాతృకను నిర్వచించిన విధంగానే చిత్రాన్ని తిప్పడానికి మాతృకను నిర్మిస్తాము. మేము కేవలం కాల్ చేస్తాము cv2.getRotationMatrix2D NumPyని ఉపయోగించి మ్యాట్రిక్స్‌ను మాన్యువల్‌గా సృష్టించడం కంటే లైన్ 22లో పని చేస్తుంది (ఇది కొంచెం గజిబిజిగా ఉండవచ్చు).

ది cv2.getRotationMatrix2D ఫంక్షన్‌కు మూడు పారామితులు అవసరం. మొదటి ఇన్‌పుట్ కావలసిన భ్రమణ కోణం (ఈ సందర్భంలో, చిత్రం మధ్యలో). మేము చిత్రాన్ని ఎన్ని (అపసవ్యదిశలో) డిగ్రీలు తిప్పుతాము అని పేర్కొనడానికి తీటా ఉపయోగించబడుతుంది. ఇక్కడ, మేము చిత్రాన్ని 45 డిగ్రీలు తిప్పుతాము. చివరి ఎంపిక చిత్రం పరిమాణానికి సంబంధించినది.

చిత్రాన్ని స్కేలింగ్ చేయడం గురించి మేము ఇంకా చర్చించనప్పటికీ, మీరు చిత్రాన్ని దాని అసలు నిష్పత్తిలో ఉపయోగించాలని సూచించే 1.0తో ఫ్లోటింగ్ పాయింట్ నంబర్‌ను ఇక్కడ అందించవచ్చు. అయితే, మీరు 2.0 విలువను టైప్ చేస్తే, చిత్రం పరిమాణం రెట్టింపు అవుతుంది. 0.5 సంఖ్య చిత్రం పరిమాణాన్ని ఆ విధంగా తగ్గిస్తుంది.

పంక్తి 22 నుండి 23: నుండి మా భ్రమణ మాతృక M అందుకున్న తర్వాత cv2.getRotationMatrix2D ఫంక్షన్, మేము ఉపయోగించి మా చిత్రాన్ని రొటేట్ cv2.warpAffine లైన్ 23లో సాంకేతికత. ఫంక్షన్ యొక్క మొదటి ఇన్‌పుట్ మనం తిప్పాలనుకుంటున్న చిత్రం. అప్పుడు మా అవుట్‌పుట్ ఇమేజ్ యొక్క వెడల్పు మరియు ఎత్తు నిర్వచించబడతాయి, మా భ్రమణ మాతృక M. లైన్ 23లో, చిత్రం 55 డిగ్రీలతో తిప్పబడుతుంది.

మా చిత్రం తిప్పబడిందని మీరు గమనించవచ్చు.

లైన్లు 28 నుండి 30 రెండవ భ్రమణాన్ని ఏర్పాటు చేయండి. కోడ్‌లోని 22–23 పంక్తులు ఒకేలా ఉంటాయి, ఈసారి మనం 55కి విరుద్ధంగా -85 డిగ్రీలతో తిరుగుతున్నాము తప్ప.

మేము ఈ పాయింట్ వరకు చిత్రాన్ని దాని మధ్యలో తిప్పాము. మనం చిత్రాన్ని యాదృచ్ఛిక పాయింట్ చుట్టూ తిప్పాలనుకుంటే?

అనే కొత్త ఫైల్‌ని తెరిచి, రూపొందించడం ద్వారా ప్రారంభిద్దాం rotate.py:

# అవసరమైన ప్యాకేజీలను దిగుమతి చేస్తోంది

దిగుమతి మొద్దుబారిన వంటి ఉదా

దిగుమతి argparse

దిగుమతి ఇముటిల్

దిగుమతి cv2

# ఆర్గ్యుమెంట్‌పార్సర్ ఆబ్జెక్ట్‌ని సృష్టించడం మరియు ఆర్గ్యుమెంట్‌ను పార్సింగ్ చేయడం

ap_obj = argparse. ఆర్గ్యుమెంట్ పార్సర్ ( )

ap_obj. add_argument ( '-k' , '--చిత్రం' , అవసరం = నిజమే , సహాయం = 'చిత్ర మార్గం' )

వాదన = ఎవరిది ( ap_obj. పార్స్_ఆర్గ్స్ ( ) )

# చిత్రాన్ని లోడ్ చేసి, స్క్రీన్‌పై ప్రదర్శించండి

చిత్రం = cv2. imread ( వాదన [ 'చిత్రం' ] )

cv2. చూపించు ( 'Original_image' , చిత్రం )

# చిత్రం యొక్క కొలతలు ఉపయోగించి చిత్రం యొక్క మధ్యభాగాన్ని లెక్కించండి.

( ఎత్తు , వెడల్పు ) = చిత్రం. ఆకారం [ : 2 ]

( సెంటర్ఎక్స్ , కేంద్రంY ) = ( వెడల్పు / 2 , ఎత్తు / 2 )

# ఇప్పుడు, cv2ని ఉపయోగించి, మేము చిత్రాన్ని 55 డిగ్రీల వరకు తిప్పుతాము

# getRotationMatrix2D()ని ఉపయోగించి భ్రమణ మాతృకను నిర్ణయించండి

భ్రమణ మాతృక = cv2. getRotationMatrix2D ( ( సెంటర్ఎక్స్ , కేంద్రంY ) , 55 , 1.0 )

తిప్పబడిన చిత్రం = cv2. warpAffine ( చిత్రం , భ్రమణ మాతృక , ( వెడల్పు , ఎత్తు ) )

cv2. చూపించు ( 'చిత్రాన్ని 55 డిగ్రీలు తిప్పారు' , తిప్పబడిన చిత్రం )

cv2. వేచి ఉండండి ( 0 )

# చిత్రం ఇప్పుడు -85 డిగ్రీలతో తిప్పబడుతుంది.

భ్రమణ మాతృక = cv2. getRotationMatrix2D ( ( సెంటర్ఎక్స్ , కేంద్రంY ) , - 85 , 1.0 )

తిప్పబడిన చిత్రం = cv2. warpAffine ( చిత్రం , భ్రమణ మాతృక , ( వెడల్పు , ఎత్తు ) )

cv2. చూపించు ( 'చిత్రాన్ని -85 డిగ్రీలు తిప్పారు' , తిప్పబడిన చిత్రం )

cv2. వేచి ఉండండి ( 0 )

# చిత్రం భ్రమణం కొన్ని ఏకపక్ష పాయింట్ నుండి, కేంద్రం నుండి కాదు

భ్రమణ మాతృక = cv2. getRotationMatrix2D ( ( సెంటర్ఎక్స్ - 40 , కేంద్రంY - 40 ) , 55 , 1.0 )

తిప్పబడిన చిత్రం = cv2. warpAffine ( చిత్రం , భ్రమణ మాతృక , ( వెడల్పు , ఎత్తు ) )

cv2. చూపించు ( 'ఏకపక్ష పాయింట్ల నుండి ఇమేజ్ రొటేషన్' , తిప్పబడిన చిత్రం )

cv2. వేచి ఉండండి ( 0 )

లైన్ 34 నుండి 35: ఇప్పుడు, ఈ కోడ్ ఒక వస్తువును తిప్పడానికి చాలా సాధారణమైనదిగా అనిపించాలి. చిత్రాన్ని ఒక పాయింట్ చుట్టూ 40 పిక్సెల్‌లు ఎడమవైపు మరియు 40 పిక్సెల్‌ల మధ్యలో తిప్పడానికి, మేము ఆదేశిస్తాము cv2.getRotationMatrix2D దాని మొదటి పరామితికి శ్రద్ధ వహించడానికి ఫంక్షన్.

మేము ఈ భ్రమణాన్ని వర్తింపజేసినప్పుడు ఉత్పత్తి చేయబడిన చిత్రం క్రింద చూపబడింది:

భ్రమణం యొక్క కేంద్రం ఇప్పుడు (x, y)-కోఆర్డినేట్ అని మనం స్పష్టంగా చూడవచ్చు, ఇది ఎడమవైపు 40 పిక్సెల్‌లు మరియు చిత్రం యొక్క కంప్యూటెడ్ సెంటర్‌కు ఎగువన 40 పిక్సెల్‌లు.

3. చిత్రం అంకగణితం

వాస్తవానికి, ఇమేజ్ అంకగణితం అనేది డేటా రకాలపై కొన్ని అదనపు పరిమితులతో కూడిన మ్యాట్రిక్స్ అదనం, మేము తర్వాత కవర్ చేస్తాము.

లీనియర్ ఆల్జీబ్రా యొక్క కొన్ని అందమైన ఫండమెంటల్స్‌పైకి వెళ్లడానికి కొంత సమయం తీసుకుందాం.

తదుపరి రెండు మాత్రికలను కలపడాన్ని పరిగణించండి:

మ్యాట్రిక్స్ జోడింపు ఎలాంటి ఫలితాన్ని ఇస్తుంది? సాధారణ సమాధానం మూలకం ద్వారా మూలకం, మాతృక ఎంట్రీల మొత్తం:

తగినంత సులభం, సరియైనదా?

ఈ సమయంలో కూడిక మరియు తీసివేత యొక్క ప్రాథమిక కార్యకలాపాలను మనమందరం అర్థం చేసుకున్నాము. అయినప్పటికీ, చిత్రాలతో పని చేస్తున్నప్పుడు మన కలర్ స్పేస్ మరియు డేటా రకం ద్వారా విధించబడిన పరిమితులను మనం గుర్తుంచుకోవాలి.

RGB చిత్రాలలో పిక్సెల్‌లు, ఉదాహరణకు, [0, 255] మధ్య వస్తాయి. మనం చూస్తున్నప్పుడు 250 తీవ్రతతో పిక్సెల్‌కు 10 జోడించడానికి ప్రయత్నిస్తే ఏమి జరుగుతుంది?

మేము ప్రామాణిక అంకగణిత సూత్రాలను వర్తింపజేస్తే మేము 260 విలువకు చేరుకుంటాము. 260 చెల్లుబాటు అయ్యే విలువ కాదు, ఎందుకంటే RGB చిత్రాలు 8-బిట్ సంతకం చేయని పూర్ణాంకాలుగా సూచించబడతాయి.

కాబట్టి ఏమి జరగాలి? ప్రతి పిక్సెల్‌ను 0 మరియు 255 మధ్య విలువ ఉండేలా క్లిప్ చేస్తూ, [0, 255] పరిధికి మించిన పిక్సెల్ లేదని నిర్ధారించుకోవడానికి మేము చెక్‌ను అమలు చేయాలా?

లేదా మేము 'చుట్టూ చుట్టి' మరియు మాడ్యులస్ ఆపరేషన్ చేస్తాము? మాడ్యులస్ నియమాలకు అనుగుణంగా, 10 నుండి 255కి జోడించడం వలన కేవలం 9 విలువ వస్తుంది.

[0, 255] పరిధికి మించిన చిత్రాలకు కూడికలు మరియు తీసివేతలను ఎలా నిర్వహించాలి?

నిజం ఏమిటంటే సరైన లేదా తప్పు సాంకేతికత లేదు; మీరు మీ పిక్సెల్‌లతో ఎలా పని చేస్తున్నారు మరియు మీరు ఏమి సాధించాలనుకుంటున్నారు అనే దానిపై ఆధారపడి ఉంటుంది.

కానీ OpenCVలో అదనంగా మరియు NumPyలో అదనంగా తేడాలు ఉన్నాయని గుర్తుంచుకోండి. మాడ్యులస్ అంకగణితం మరియు “ర్యాప్ ఎరౌండ్” NumPy ద్వారా చేయబడుతుంది. దీనికి విరుద్ధంగా, OpenCV క్లిప్పింగ్‌ని అమలు చేస్తుంది మరియు పిక్సెల్ విలువలు పరిధి [0, 255] నుండి ఎప్పటికీ వదలకుండా చూసుకుంటుంది.

అనే కొత్త ఫైల్‌ని సృష్టించడం ద్వారా ప్రారంభిద్దాం అంకగణితం.py మరియు దానిని తెరవడం:

# python arithmetic.py --image squirrel.jpg

# అవసరమైన ప్యాకేజీలను దిగుమతి చేస్తోంది

దిగుమతి మొద్దుబారిన వంటి ఉదా

దిగుమతి argparse

దిగుమతి ఇముటిల్

దిగుమతి cv2

# ఆర్గ్యుమెంట్‌పార్సర్ ఆబ్జెక్ట్‌ని సృష్టించడం మరియు ఆర్గ్యుమెంట్‌ను పార్సింగ్ చేయడం

apObj = argparse. ఆర్గ్యుమెంట్ పార్సర్ ( )

apObj. add_argument ( '-k' , '--చిత్రం' , అవసరం = నిజమే , సహాయం = 'చిత్ర మార్గం' )

వాదనలు = ఎవరిది ( apObj. పార్స్_ఆర్గ్స్ ( ) )

చిత్రం = cv2. imread ( వాదనలు [ 'చిత్రం' ] )

cv2. చూపించు ( 'Original_image' , చిత్రం )

'''

మా పిక్సెల్‌ల విలువలు [0, 255] పరిధిలో ఉంటాయి

ఎందుకంటే చిత్రాలు NumPy శ్రేణులు, అవి సంతకం చేయని 8-బిట్ పూర్ణాంకాల వలె నిల్వ చేయబడతాయి.

cv2.add మరియు cv2.subtract వంటి ఫంక్షన్‌లను ఉపయోగిస్తున్నప్పుడు, విలువలు క్లిప్ చేయబడతాయి

ఈ పరిధికి అవి జోడించబడినా లేదా వెలుపలి నుండి తీసివేసినా కూడా

[0, 255] పరిధి. ఇక్కడ ఒక దృష్టాంతం ఉంది:

'''

ముద్రణ ( 'గరిష్టంగా 255: {}' . ఫార్మాట్ ( str ( cv2. జోడించు ( ఉదా uint8 ( [ 201 ] ) ,

ఉదా uint8 ( [ 100 ] ) ) ) ) )

ముద్రణ ( 'కనీసం 0: {}' . ఫార్మాట్ ( str ( cv2. తీసివేయుము ( ఉదా uint8 ( [ 60 ] ) ,

ఉదా uint8 ( [ 100 ] ) ) ) ) )

'''

NumPyని ఉపయోగించి ఈ శ్రేణులతో అంకగణిత కార్యకలాపాలు చేస్తున్నప్పుడు,

విలువ క్లిప్ చేయబడకుండా చుట్టుముడుతుంది

[0, 255]పరిధి. చిత్రాలను ఉపయోగిస్తున్నప్పుడు, దీన్ని ఉంచడం చాలా అవసరం

బుర్రలో.

'''

ముద్రణ ( 'చుట్టూ చుట్టండి: {}' . ఫార్మాట్ ( str ( ఉదా uint8 ( [ 201 ] ) + ఉదా. uint8 ( [ 100 ] ) ) ) )

ముద్రణ ( 'చుట్టూ చుట్టండి: {}' . ఫార్మాట్ ( str ( ఉదా uint8 ( [ 60 ] ) - ఉదా. uint8 ( [ 100 ] ) ) ) )

'''

మన ఇమేజ్‌లోని ప్రతి పిక్సెల్ ప్రకాశాన్ని 101తో గుణిద్దాం.

దీన్ని చేయడానికి, మేము మా మ్యాట్రిక్స్ వలె అదే పరిమాణంలో NumPy శ్రేణిని రూపొందిస్తాము,

వాటిని నింపి, 101తో గుణించి శ్రేణిని నింపండి

101లతో. చివరగా, మేము రెండు చిత్రాలను విలీనం చేస్తాము.

చిత్రం ఇప్పుడు 'ప్రకాశవంతంగా' ఉందని మీరు గమనించవచ్చు.

'''

మాతృక = ఉదా వాటిని ( చిత్రం. ఆకారం , dtype = 'uint8' ) * 101

చిత్రం_జోడించబడింది = cv2. జోడించు ( చిత్రం , మాతృక )

cv2. చూపించు ( 'జోడించిన చిత్రం ఫలితం' , చిత్రం_జోడించబడింది )

#ఇదే పద్ధతిలో, తీయడం ద్వారా మన చిత్రాన్ని ముదురు రంగులోకి మార్చుకోవచ్చు

అన్ని పిక్సెల్‌ల నుండి # 60 దూరంలో ఉంది.

మాతృక = ఉదా వాటిని ( చిత్రం. ఆకారం , dtype = 'uint8' ) * 60

చిత్రం_తీసివేయబడింది = cv2. తీసివేయుము ( చిత్రం , మాతృక )

cv2. చూపించు ( 'తీసిన చిత్రం ఫలితం' , చిత్రం_తీసివేయబడింది )

cv2. వేచి ఉండండి ( 0 )

లైన్లు 1 నుండి 16 మా ప్యాకేజీలను దిగుమతి చేసుకోవడం, మా ఆర్గ్యుమెంట్ పార్సర్‌ను కాన్ఫిగర్ చేయడం మరియు మా చిత్రాన్ని లోడ్ చేయడం వంటి మా సాధారణ ప్రక్రియను నిర్వహించడానికి ఉపయోగించబడుతుంది.

OpenCV మరియు NumPy జోడింపుల మధ్య వ్యత్యాసాన్ని నేను గతంలో ఎలా చర్చించానో గుర్తు చేస్తున్నారా? ఇప్పుడు మేము దానిని పూర్తిగా కవర్ చేసాము, మేము దానిని గ్రహించినట్లు నిర్ధారించుకోవడానికి ఒక నిర్దిష్ట సందర్భాన్ని చూద్దాం.

రెండు 8-బిట్ సంతకం చేయని పూర్ణాంకం NumPy శ్రేణులు నిర్వచించబడ్డాయి లైన్ 26 . 201 విలువ మొదటి శ్రేణిలోని ఏకైక మూలకం. రెండవ శ్రేణిలో ఒక సభ్యుడు మాత్రమే ఉన్నప్పటికీ, దాని విలువ 100. విలువలు OpenCV యొక్క cv2.add ఫంక్షన్‌ని ఉపయోగించి జోడించబడతాయి.

ఫలితం ఎలా ఉంటుందని మీరు అంచనా వేస్తున్నారు?

సాంప్రదాయిక అంకగణిత సూత్రాలకు అనుగుణంగా, సమాధానం 301గా ఉండాలి. కానీ మేము 8-బిట్ సంతకం చేయని పూర్ణాంకాలతో వ్యవహరిస్తున్నామని గుర్తుంచుకోండి, ఇది పరిధి [0, 255]లో మాత్రమే ఉంటుంది. మేము cv2.add పద్ధతిని ఉపయోగిస్తున్నందున, OpenCV క్లిప్పింగ్‌ను నిర్వహిస్తుంది మరియు అదనంగా గరిష్టంగా 255 ఫలితాన్ని మాత్రమే అందిస్తుంది.

దిగువ జాబితా యొక్క మొదటి పంక్తి ఈ కోడ్‌ను అమలు చేయడం ద్వారా ఫలితాన్ని చూపుతుంది:

అంకగణితం. py

గరిష్టంగా 255 : [ [ 255 ] ]

మొత్తం నిజానికి 255 సంఖ్యను ఉత్పత్తి చేసింది.

దానిని అనుసరించి, లైన్ 26 వ్యవకలనాన్ని సాధించడానికి cv2.subtractని ఉపయోగిస్తుంది. మరోసారి, మేము రెండు 8-బిట్ సంతకం చేయని పూర్ణాంకాల NumPy శ్రేణులను ఒక్కొక్క మూలకంతో నిర్వచించాము. మొదటి శ్రేణి విలువ 60, రెండవ శ్రేణి విలువ 100.

తీసివేత విలువ -40కి దారితీస్తుందని మా అంకగణితం నిర్దేశిస్తుంది, అయితే OpenCV మన కోసం క్లిప్పింగ్‌ను మరోసారి నిర్వహిస్తుంది. విలువ 0కి తగ్గించబడిందని మేము కనుగొన్నాము. దిగువన ఉన్న మా ఫలితం దీనిని ప్రదర్శిస్తుంది:

అంకగణితం. py

కనీస 0 : [ [ 0 ] ]

cv2ని ఉపయోగించి, 60 వ్యవకలనం నుండి 100ని తీసివేయండి, విలువ 0ని ఉత్పత్తి చేయండి.

గణనలను నిర్వహించడానికి OpenCV స్థానంలో NumPyని ఉపయోగిస్తే ఏమి జరుగుతుంది?

లైన్లు 38 మరియు 39 ఈ సమస్యను పరిష్కరించండి.

మొదట, రెండు 8-బిట్ సంతకం చేయని పూర్ణాంకం NumPy శ్రేణులు ఒక్కొక్క మూలకంతో నిర్వచించబడ్డాయి. మొదటి శ్రేణి విలువ 201, అయితే రెండవ శ్రేణి విలువ 100. మా జోడింపు కత్తిరించబడుతుంది మరియు మేము cv2.add ఫంక్షన్‌ని ఉపయోగిస్తే 255 విలువ తిరిగి ఇవ్వబడుతుంది.

NumPy, మరోవైపు, క్లిప్పింగ్ కాకుండా మాడ్యులో అంకగణితాన్ని 'చుట్టూ' చేస్తుంది. 255 విలువను చేరుకున్న తర్వాత NumPy సున్నాకి చుట్టుముడుతుంది మరియు 100 దశలను చేరుకునే వరకు మళ్లీ లెక్కింపు ప్రారంభమవుతుంది. ఇది దిగువ చూపిన అవుట్‌పుట్ యొక్క మొదటి పంక్తి ద్వారా నిర్ధారించబడింది:

అంకగణితం. py
చుట్టుముట్టండి: [ నాలుగు ఐదు ]

తర్వాత, మరో రెండు NumPy శ్రేణులు నిర్వచించబడ్డాయి, ఒకటి 50 విలువతో మరియు మరొకటి 100తో. ఈ వ్యవకలనం cv2.subtract పద్ధతి ద్వారా 0 ఫలితాన్ని అందించడానికి కత్తిరించబడుతుంది. కానీ క్లిప్పింగ్‌కు బదులుగా, NumPy అమలు చేస్తుందని మాకు తెలుసు. మాడ్యులో అంకగణితం. బదులుగా, మాడ్యులో విధానాలు చుట్టబడి, తీసివేత సమయంలో 0కి చేరుకున్న తర్వాత 255 నుండి వెనుకకు లెక్కించడం ప్రారంభిస్తాయి. కింది అవుట్‌పుట్ నుండి మనం దీనిని చూడవచ్చు:

అంకగణితం. py

చుట్టుముట్టండి: [ 207 ]

మరోసారి, మా టెర్మినల్ అవుట్‌పుట్ క్లిప్పింగ్ మరియు చుట్టూ చుట్టడం మధ్య వ్యత్యాసాన్ని ప్రదర్శిస్తుంది:

పూర్ణాంక అంకగణితాన్ని ప్రదర్శించేటప్పుడు మీరు కోరుకున్న ఫలితాన్ని గుర్తుంచుకోవడం చాలా ముఖ్యం. మీరు పరిధి [0, 255] వెలుపల ఏవైనా విలువలు క్లిప్ చేయాలనుకుంటున్నారా? ఆ తర్వాత OpenCV యొక్క అంతర్నిర్మిత చిత్ర అంకగణిత పద్ధతులను ఉపయోగించండి.

విలువలు [0, 255] మరియు మాడ్యులస్ అంకగణిత కార్యకలాపాల పరిధికి వెలుపల ఉన్నట్లయితే మీరు వాటిని చుట్టుముట్టాలనుకుంటున్నారా? NumPy శ్రేణులు సాధారణం వలె జోడించబడతాయి మరియు తీసివేయబడతాయి.

లైన్ 48 మా చిత్రం వలె అదే కొలతలు కలిగిన ఒక డైమెన్షనల్ NumPy శ్రేణిని నిర్వచిస్తుంది. మరోసారి, మా డేటా రకం 8-బిట్ సంతకం చేయని పూర్ణాంకాల అని మేము నిర్ధారిస్తాము. మేము 1కి బదులుగా 101 విలువలతో పూరించడానికి మా ఒక-అంకెల విలువలను 101తో గుణిస్తాము. చివరగా, అసలు ఇమేజ్‌కి 100ల మాతృకను జోడించడానికి cv2.add ఫంక్షన్‌ని ఉపయోగిస్తాము. ఇది ప్రతి పిక్సెల్ యొక్క తీవ్రతను 101 పెంచుతుంది, అలాగే 255 కంటే ఎక్కువ ప్రయత్నించే ఏవైనా విలువలు పరిధి [0, 255]కి క్లిప్ చేయబడిందని నిర్ధారిస్తుంది.

చిత్రం ఎలా గమనించదగ్గ ప్రకాశవంతంగా ఉందో మరియు అసలైన దానికంటే ఎక్కువగా 'వాష్ అవుట్'గా ఎలా కనిపిస్తుందో గమనించండి. ఎందుకంటే మేము పిక్సెల్‌లను వాటి పిక్సెల్ తీవ్రతలను 101 పెంచడం ద్వారా ప్రకాశవంతమైన రంగుల వైపు నడుపుతున్నాము.

చిత్రం యొక్క ప్రతి పిక్సెల్ తీవ్రత నుండి 60ని తీసివేయడానికి, మేము ముందుగా 60లతో నిండిన పంక్తి 54లో రెండవ NumPy శ్రేణిని ఏర్పాటు చేస్తాము.

ఈ వ్యవకలనం యొక్క ఫలితాలు క్రింది చిత్రంలో చిత్రీకరించబడ్డాయి:

మన చుట్టూ ఉన్న అంశాలు గతంలో కంటే ముదురు రంగులో కనిపిస్తాయి. ఎందుకంటే ప్రతి పిక్సెల్ నుండి 60 తీసివేయడం ద్వారా, మేము RGB కలర్ స్పేస్‌లోని పిక్సెల్‌లను ముదురు ప్రాంతాలకు తరలిస్తాము.

4. చిత్రం ఫ్లిప్పింగ్

భ్రమణ మాదిరిగానే, చిత్రాన్ని దాని x లేదా y-యాక్సిస్‌లో తిప్పడం OpenCV అందించే మరొక ఎంపిక. ఫ్లిప్పింగ్ కార్యకలాపాలు తరచుగా ఉపయోగించబడకపోయినా, మీరు వెంటనే చూడలేని వివిధ కారణాల వల్ల వాటిని తెలుసుకోవడం చాలా ప్రయోజనకరంగా ఉంటుంది.

చిత్రాలలో ముఖాలను గుర్తించే చిన్న స్టార్టప్ కంపెనీ కోసం మేము మెషిన్ లెర్నింగ్ వర్గీకరణను అభివృద్ధి చేస్తున్నాము. మా సిస్టమ్ ముఖం అంటే ఏమిటో 'నేర్చుకోవడానికి', మాకు నమూనా ముఖాలతో కూడిన ఒక రకమైన డేటాసెట్ అవసరం. దురదృష్టవశాత్తూ, కంపెనీ మాకు 40 ముఖాల చిన్న డేటాసెట్‌ను మాత్రమే అందించింది మరియు మేము మరింత సమాచారాన్ని సేకరించలేకపోయాము.

అయితే, మనం ఏమి చేస్తాము?

ముఖం ప్రతిబింబించినా లేదా ప్రతిబింబించకపోయినా ముఖంగా మిగిలిపోతుంది కాబట్టి, మేము ముఖం యొక్క ప్రతి చిత్రాన్ని అడ్డంగా తిప్పగలుగుతాము మరియు మిర్రర్డ్ వెర్షన్‌లను అదనపు శిక్షణ డేటాగా ఉపయోగించగలుగుతాము.

ఈ ఉదాహరణ తెలివితక్కువదని మరియు కృత్రిమంగా అనిపించవచ్చు, కానీ అది కాదు. ఫ్లిప్పింగ్ అనేది శిక్షణా దశలో మరింత డేటాను ఉత్పత్తి చేయడానికి బలమైన డీప్-లెర్నింగ్ అల్గారిథమ్‌లు ఉపయోగించే ఉద్దేశపూర్వక వ్యూహం.

ఈ మాడ్యూల్‌లో మీరు నేర్చుకునే ఇమేజ్ ప్రాసెసింగ్ పద్ధతులు పెద్ద కంప్యూటర్ విజన్ సిస్టమ్‌లకు పునాదిగా పనిచేస్తాయని మునుపటి నుండి స్పష్టంగా ఉంది.

లక్ష్యాలు:

ఉపయోగించి cv2.flip ఫంక్షన్, మీరు ఈ సెషన్‌లో చిత్రాన్ని అడ్డంగా మరియు నిలువుగా ఎలా తిప్పాలో నేర్చుకుంటారు.

ఫ్లిప్పింగ్ అనేది మేము అధ్యయనం చేసే తదుపరి ఇమేజ్ మానిప్యులేషన్. చిత్రం యొక్క x మరియు y-అక్షాలు తిప్పవచ్చు లేదా రెండూ కూడా చేయవచ్చు. మేము కోడింగ్‌లోకి ప్రవేశించే ముందు, మొదట ఇమేజ్ ఫ్లిప్ ఫలితాలను చూడటం ఉత్తమం. కింది చిత్రంలో క్షితిజ సమాంతరంగా తిప్పబడిన చిత్రాన్ని చూడండి:

మన అసలు చిత్రం ఎడమవైపు ఎలా ఉందో మరియు చిత్రం కుడి వైపున ఎలా అడ్డంగా ప్రతిబింబించబడిందో గమనించండి.

అనే కొత్త ఫైల్‌ని సృష్టించడం ద్వారా ప్రారంభిద్దాం flipping.py .

మీరు ఇమేజ్ ఫ్లిప్ యొక్క ఉదాహరణను చూసారు, కాబట్టి కోడ్‌ని పరిశీలిద్దాం:

# python flipping.py --image quirrel.jpg

# అవసరమైన ప్యాకేజీలను దిగుమతి చేస్తోంది

దిగుమతి argparse

దిగుమతి cv2

# ఆర్గ్యుమెంట్ పార్సర్ యొక్క వస్తువును సృష్టించడం మరియు వాదనను అన్వయించడం

apObj = argparse. ఆర్గ్యుమెంట్ పార్సర్ ( )

apObj. add_argument ( '-నేను' , '--చిత్రం' , అవసరం = నిజమే , సహాయం = 'చిత్ర మార్గం' )

వాదన = ఎవరిది ( apObj. పార్స్_ఆర్గ్స్ ( ) )

చిత్రం = cv2. imread ( వాదన [ 'చిత్రం' ] )

cv2. చూపించు ( 'అసలు' , చిత్రం )

# చిత్రాన్ని అడ్డంగా తిప్పండి

చిత్రం తిప్పబడింది = cv2. కుదుపు ( చిత్రం , 1 )

cv2. చూపించు ( 'చిత్రం అడ్డంగా తిప్పబడింది' , చిత్రం తిప్పబడింది )

# చిత్రాన్ని నిలువుగా తిప్పండి

చిత్రం తిప్పబడింది = cv2. కుదుపు ( చిత్రం , 0 )

cv2. చూపించు ( 'చిత్రం నిలువుగా తిప్పబడింది' , చిత్రం తిప్పబడింది )

# చిత్రాన్ని రెండు అక్షాల వెంట తిప్పండి

చిత్రం తిప్పబడింది = cv2. కుదుపు ( చిత్రం , - 1 )

cv2. చూపించు ( 'అడ్డంగా & నిలువుగా తిప్పబడింది' , చిత్రం తిప్పబడింది )

cv2. వేచి ఉండండి ( 0 )

మా ప్యాకేజీలను దిగుమతి చేయడానికి, మా ఇన్‌పుట్‌లను అన్వయించడానికి మరియు డిస్క్ నుండి మా చిత్రాన్ని లోడ్ చేయడానికి మనం తీసుకునే దశలు lలో నిర్వహించబడతాయి ines 1 నుండి 12 .

cv2.flip ఫంక్షన్‌ని ఆన్ చేయడం ద్వారా లైన్ 15 , చిత్రాన్ని అడ్డంగా తిప్పడం సులభం. మేము ఫ్లిప్ చేయాలనుకుంటున్న ఇమేజ్ మరియు ఇమేజ్‌ని ఎలా తిప్పాలో తెలిపే నిర్దిష్ట కోడ్ లేదా ఫ్లాగ్ cv2.flip పద్ధతికి అవసరమైన రెండు ఆర్గ్యుమెంట్‌లు.

ఫ్లిప్ కోడ్ విలువ 1 అంటే మనం చిత్రాన్ని అడ్డంగా తిప్పడానికి y-అక్షం చుట్టూ తిప్పుతాము ( లైన్ 15 ) మేము 0 యొక్క ఫ్లిప్ కోడ్‌ను పేర్కొన్నట్లయితే, మేము చిత్రాన్ని x-అక్షం గురించి తిప్పాలనుకుంటున్నాము ( లైన్ 19 ) ప్రతికూల ఫ్లిప్ కోడ్ ( పంక్తి 23 ) చిత్రాన్ని రెండు అక్షాలపై తిప్పుతుంది.

ఈ సబ్జెక్ట్‌లోని సులభమైన ఉదాహరణలలో ఒకటి చిత్రాన్ని తిప్పడం, ఇది ప్రాథమికమైనది.

తర్వాత, మేము చిత్రాలను కత్తిరించడం గురించి చర్చిస్తాము మరియు నిర్దిష్ట చిత్ర భాగాలను సంగ్రహించడానికి NumPy అర్రే స్లైస్‌లను ఉపయోగిస్తాము.

5. ఇమేజ్ క్రాపింగ్

క్రాపింగ్, పేరు సూచించినట్లుగా, ఆసక్తి ఉన్న ప్రాంతాన్ని (లేదా కేవలం ROI) ఎంచుకోవడం మరియు తీసివేయడం అనే ప్రక్రియ, ఇది మనకు ఆసక్తిని కలిగించే చిత్రం యొక్క ప్రాంతం.

ముఖాన్ని గుర్తించే అప్లికేషన్ కోసం చిత్రం నుండి ముఖం కత్తిరించబడాలి. అదనంగా, మేము చిత్రాలలో కుక్కలను కనుగొనడానికి పైథాన్ స్క్రిప్ట్‌ను రూపొందిస్తున్నట్లయితే, మేము దానిని గుర్తించినప్పుడు దాని నుండి కుక్కను కత్తిరించాలనుకోవచ్చు.

లక్ష్యాలు: చిత్రం నుండి కత్తిరించే ప్రాంతాలకు NumPy శ్రేణి స్లైసింగ్‌ని ఉపయోగించడం మరియు సులభంగా ఉపయోగించడం మా ప్రధాన లక్ష్యం.

క్రాపింగ్ : మేము చిత్రాన్ని కత్తిరించినప్పుడు, మనకు ఆసక్తి లేని బాహ్య మూలకాలను తొలగించడమే మా లక్ష్యం. మా ROIని ఎంచుకునే ప్రక్రియ తరచుగా మా ఆసక్తి ఉన్న ప్రాంతాన్ని ఎంచుకోవడంగా సూచిస్తారు.

అనే కొత్త ఫైల్‌ను సృష్టించండి పంట.పై , దాన్ని తెరిచి, కింది కోడ్‌ను జోడించండి:

# పైథాన్ క్రాప్.పై

# అవసరమైన ప్యాకేజీలను దిగుమతి చేస్తోంది

దిగుమతి cv2

# చిత్రం లోడ్ అవుతుంది మరియు స్క్రీన్‌పై ప్రదర్శించబడుతుంది

చిత్రం = cv2. imread ( 'squirrel.jpg' )

ముద్రణ ( చిత్రం. ఆకారం )

cv2. చూపించు ( 'అసలు' , చిత్రం )

# చిత్రాన్ని త్వరగా ట్రిమ్ చేయడానికి NumPy అర్రే స్లైస్‌లు ఉపయోగించబడతాయి

# మేము చిత్రం నుండి ఉడుత ముఖాన్ని కత్తిరించబోతున్నాము

ఉడుత = చిత్రం [ 35 : 90 , 35 : 100 ]

cv2. చూపించు ( 'ఉడుత ముఖం' , ఉడుత )

cv2. వేచి ఉండండి ( 0 )

# మరియు ఇప్పుడు, ఇక్కడ మేము మొత్తం శరీరాన్ని కత్తిరించబోతున్నాము

# ఉడుత

ఉడుత = చిత్రం [ 35 : 148 , 23 : 143 ]

cv2. చూపించు ( 'ఉడుత శరీరం' , ఉడుత )

cv2. వేచి ఉండండి ( 0 )

మేము డిస్క్ నుండి లోడ్ చేసే చిత్రాన్ని ఉపయోగించి పైథాన్ మరియు ఓపెన్‌సివిలో కత్తిరించడాన్ని చూపుతాము లైన్లు 5 మరియు 6 .

మేము కత్తిరించబోయే అసలు చిత్రం

ప్రాథమిక పంట పద్ధతులను మాత్రమే ఉపయోగించి, మేము చుట్టుపక్కల ప్రాంతం నుండి ఉడుత ముఖం మరియు ఉడుత శరీరాన్ని వేరు చేయాలని లక్ష్యంగా పెట్టుకున్నాము.

మేము చిత్రం గురించి మా ముందస్తు పరిజ్ఞానాన్ని ఉపయోగిస్తాము మరియు శరీరం మరియు ముఖం ఉన్న ప్రదేశానికి సంబంధించిన NumPy అర్రే స్లైస్‌లను మాన్యువల్‌గా సరఫరా చేస్తాము. సాధారణ పరిస్థితులలో, చిత్రంలో ముఖం మరియు శరీరాన్ని గుర్తించడానికి మేము సాధారణంగా మెషిన్ లెర్నింగ్ మరియు కంప్యూటర్ విజన్ అల్గారిథమ్‌లను ఉపయోగిస్తాము. అయితే ప్రస్తుతానికి విషయాలను సూటిగా ఉంచుదాం మరియు ఏదైనా గుర్తింపు నమూనాలను ఉపయోగించకుండా నివారించండి.

కేవలం ఒక లైన్ కోడ్‌తో చిత్రంలోని ముఖాన్ని మనం గుర్తించవచ్చు. లైన్ 13 , (35, 35) నుండి ప్రారంభమయ్యే చిత్రం యొక్క దీర్ఘచతురస్ర భాగాన్ని సంగ్రహించడానికి, మేము NumPy అర్రే స్లైస్‌లను (90, 100) అందిస్తాము. మేము చేసే ఎత్తు-మొదటి మరియు వెడల్పు-రెండవ క్రమంలో సూచికలతో పంటకు ఆహారం ఇవ్వడం గందరగోళంగా అనిపించవచ్చు, కానీ OpenCV చిత్రాలను NumPy శ్రేణులుగా నిల్వ చేస్తుందని గుర్తుంచుకోండి. ఫలితంగా, మేము x-అక్షానికి ముందు y-అక్షం కోసం విలువలను అందించాలి.

మా క్రాపింగ్‌ని నిర్వహించడానికి NumPyకి క్రింది నాలుగు సూచికలు అవసరం:

ప్రారంభం y: ప్రారంభంలో y-కోఆర్డినేట్. ఈ ఉదాహరణ కోసం, మేము y=35 వద్ద ప్రారంభిస్తాము.

ముగింపు y: ముగింపులో y కోఆర్డినేట్. y = 90 అయినప్పుడు మన పంట ఆగిపోతుంది.

ప్రారంభం x: స్లైస్ ప్రారంభం x కోఆర్డినేట్. పంట x=35 వద్ద ప్రారంభమవుతుంది.

ముగింపు x: స్లైస్ ముగింపు x-యాక్సిస్ కోఆర్డినేట్. x=100 వద్ద, మా స్లైస్ పూర్తయింది.

అదేవిధంగా, చిత్రం నుండి పూర్తి శరీరాన్ని సంగ్రహించడానికి మేము అసలు చిత్రం నుండి ప్రాంతాలను (23, 35) మరియు (143, 148) కత్తిరించాము లైన్ 19 .

శరీరం మరియు ముఖాన్ని మాత్రమే ప్రదర్శించడానికి చిత్రం కత్తిరించబడిందని మీరు గమనించవచ్చు.

6. చిత్రం పునఃపరిమాణం

చిత్రం యొక్క వెడల్పు మరియు ఎత్తును పెంచడం లేదా తగ్గించడం ప్రక్రియను స్కేలింగ్ లేదా సాధారణ పరిమాణం మార్చడం అంటారు. చిత్రం పరిమాణాన్ని మార్చేటప్పుడు చిత్రం యొక్క వెడల్పు మరియు దాని ఎత్తు యొక్క నిష్పత్తిలో ఉండే కారక నిష్పత్తిని పరిగణించాలి. కారక నిష్పత్తిని నిర్లక్ష్యం చేయడం వలన స్కేల్ చేయబడిన చిత్రాలు కుదించబడి మరియు వక్రీకరించినట్లు కనిపిస్తాయి:

మా ప్రారంభ చిత్రం ఎడమవైపు ఉంది. కుడివైపున, మీరు కారక నిష్పత్తిని నిర్వహించకుండా స్కేల్ చేయబడిన రెండు చిత్రాలను చూస్తారు, చిత్రం యొక్క వెడల్పు నిష్పత్తిని దాని ఎత్తుకు వక్రీకరించారు. మీ చిత్రాల పరిమాణాన్ని మార్చేటప్పుడు, మీరు సాధారణంగా కారక నిష్పత్తిని పరిగణించాలి.

మా పునఃపరిమాణం అల్గారిథమ్ ఉపయోగించే ఇంటర్‌పోలేషన్ టెక్నిక్, ఇమేజ్ పరిమాణాన్ని పెంచడానికి లేదా తగ్గించడానికి ఈ పిక్సెల్‌ల పొరుగు ప్రాంతాలను ఉపయోగించడానికి ఇంటర్‌పోలేషన్ ఫంక్షన్ యొక్క లక్ష్యాన్ని కూడా పరిగణనలోకి తీసుకోవాలి.

సాధారణంగా, చిత్రం యొక్క పరిమాణాన్ని కుదించడం చాలా ప్రభావవంతంగా ఉంటుంది. ఎందుకంటే చిత్రం నుండి పిక్సెల్‌లను తీసివేయడం అనేది ఇంటర్‌పోలేషన్ ఫంక్షన్ చేయాల్సిందల్లా. మరోవైపు, చిత్ర పరిమాణాన్ని పెంచాలంటే అంతకుముందు లేని పిక్సెల్‌ల మధ్య ఇంటర్‌పోలేషన్ పద్ధతి 'ఖాళీలను పూరించాలి'.

ఎడమవైపు మా అసలు చిత్రం ఉంది. చిత్రం మధ్యలో దాని అసలు పరిమాణంలో సగానికి తగ్గించబడింది, కానీ అది కాకుండా, చిత్రం యొక్క 'నాణ్యత'లో ఎటువంటి నష్టం జరగలేదు. అయినప్పటికీ, చిత్రం యొక్క పరిమాణం కుడివైపున గణనీయంగా పెంచబడింది. ఇది ఇప్పుడు 'ఎగిరింది' మరియు 'పిక్సలేటెడ్' గా కనిపిస్తుంది.

నేను ఇంతకు ముందు చెప్పినట్లుగా, మీరు సాధారణంగా చిత్రాన్ని పెంచడానికి బదులుగా దాని పరిమాణాన్ని తగ్గించాలనుకుంటున్నారు. చిత్ర పరిమాణాన్ని తగ్గించడం ద్వారా, మేము తక్కువ పిక్సెల్‌లను విశ్లేషిస్తాము మరియు తక్కువ 'శబ్దం'తో వ్యవహరించాల్సి ఉంటుంది, ఇది ఇమేజ్ ప్రాసెసింగ్ అల్గారిథమ్‌లను వేగంగా మరియు మరింత ఖచ్చితమైనదిగా చేస్తుంది.

అనువాదం మరియు భ్రమణం అనేవి ఇప్పటివరకు పరిష్కరించబడిన రెండు చిత్ర రూపాంతరాలు. ఇప్పుడు మనం చిత్రం పరిమాణాన్ని ఎలా మార్చాలో పరిశీలిస్తాము.

ఆశ్చర్యకరంగా, మేము cv2.resize పద్ధతిని ఉపయోగించి మా చిత్రాల పరిమాణాన్ని మారుస్తాము. నేను ఇంతకు ముందు సూచించినట్లుగా, ఈ పద్ధతిని ఉపయోగించేటప్పుడు మనం చిత్రం యొక్క కారక నిష్పత్తిని తప్పనిసరిగా పరిగణించాలి. కానీ మేము ప్రత్యేకతలను చాలా లోతుగా నమోదు చేయడానికి ముందు, మీకు ఒక ఉదాహరణ ఇవ్వడానికి నన్ను అనుమతించండి:

# python resize.py --image squirrel.jpg

# అవసరమైన ప్యాకేజీలను దిగుమతి చేస్తోంది

దిగుమతి argparse

దిగుమతి cv2

# ఆర్గ్యుమెంట్ పార్సర్ యొక్క వస్తువును సృష్టించడం మరియు వాదనను అన్వయించడం

apObj = argparse. ఆర్గ్యుమెంట్ పార్సర్ ( )

apObj. add_argument ( '-k' , '--చిత్రం' , అవసరం = నిజమే , సహాయం = 'చిత్ర మార్గం' )

వాదనలు = ఎవరిది ( apObj. పార్స్_ఆర్గ్స్ ( ) )

# చిత్రాన్ని లోడ్ చేసి, స్క్రీన్‌పై ప్రదర్శించండి

చిత్రం = cv2. imread ( వాదనలు [ 'చిత్రం' ] )

cv2. చూపించు ( 'అసలు' , చిత్రం )

# చిత్రం వక్రంగా కనిపించకుండా నిరోధించడానికి, కారక నిష్పత్తి

# తప్పనిసరిగా పరిగణించబడాలి లేదా వైకల్యంతో ఉండాలి; అందువలన, మేము ఏమి గుర్తించాము

# ప్రస్తుత చిత్రానికి కొత్త చిత్రం నిష్పత్తి.

# మన కొత్త చిత్రం వెడల్పును 160 పిక్సెల్‌లుగా చేద్దాం.

అంశం = 160.0 / చిత్రం. ఆకారం [ 1 ]

పరిమాణం = ( 160 , int ( చిత్రం. ఆకారం [ 0 ] * కోణం ) )

# ఈ లైన్ వాస్తవ పరిమాణాన్ని మార్చే కార్యకలాపాలను చూపుతుంది

చిత్రం పునఃపరిమాణం = cv2. పునఃపరిమాణం ( చిత్రం , పరిమాణం , ఇంటర్పోలేషన్ = cv2. INTER_AREA )

cv2. చూపించు ( 'చిత్రం వెడల్పు పరిమాణం మార్చబడింది' , చిత్రం పునఃపరిమాణం )

# మనం చిత్రం యొక్క ఎత్తును మార్చాలనుకుంటే? - ఉపయోగించి

# అదే సూత్రం, మేము ఆకార నిష్పత్తి ఆధారంగా లెక్కించవచ్చు

# వెడల్పు కంటే ఎత్తులో. స్కేల్డ్ తయారు చేద్దాం

# చిత్రం ఎత్తు 70 పిక్సెల్‌లు.

అంశం = 70.0 / చిత్రం. ఆకారం [ 0 ]

పరిమాణం = ( int ( చిత్రం. ఆకారం [ 1 ] * కోణం ) , 70 )

# పునఃపరిమాణాన్ని అమలు చేయండి

చిత్రం పునఃపరిమాణం = cv2. పునఃపరిమాణం ( చిత్రం , పరిమాణం , ఇంటర్పోలేషన్ = cv2. INTER_AREA )

cv2. చూపించు ( 'చిత్రం ఎత్తు పరిమాణం మార్చబడింది' , చిత్రం పునఃపరిమాణం )

cv2. వేచి ఉండండి ( 0 )

లైన్లు 1-14 , మా ప్యాకేజీలను దిగుమతి చేసిన తర్వాత మరియు మా ఆర్గ్యుమెంట్ పార్సర్‌ను కాన్ఫిగర్ చేసిన తర్వాత, మేము మా చిత్రాన్ని లోడ్ చేసి ప్రదర్శిస్తాము.

20 మరియు 21 లైన్లు: సంబంధిత కోడింగ్ ఈ లైన్లలో ప్రారంభమవుతుంది . చిత్రాన్ని పరిమాణం మార్చేటప్పుడు దాని కారక నిష్పత్తిని తప్పనిసరిగా పరిగణనలోకి తీసుకోవాలి. చిత్రం యొక్క వెడల్పు మరియు ఎత్తు మధ్య నిష్పత్తిని కారక నిష్పత్తి అంటారు.

ఎత్తు / వెడల్పు కారక నిష్పత్తి.

మేము కారక నిష్పత్తిని పరిగణనలోకి తీసుకోకపోతే, మా పునఃపరిమాణం యొక్క ఫలితాలు వక్రీకరించబడతాయి.

పై లైన్ 20 , పరిమాణం పరిమాణం గణన పూర్తయింది. మేము ఈ కోడ్ లైన్‌లో మా కొత్త ఇమేజ్ వెడల్పును 160 పిక్సెల్‌లుగా అందిస్తాము. పాత ఎత్తుకు కొత్త ఎత్తుకు ఉన్న నిష్పత్తిని లెక్కించేందుకు, మేము ఇమేజ్‌ని ఉపయోగించి యాక్సెస్ చేసే పాత వెడల్పుతో భాగించిన కొత్త వెడల్పు (160 పిక్సెల్‌లు)గా మా నిష్పత్తిని (ఆస్పెక్ట్రేషియో) నిర్వచించాము. ఆకారం[1].

చిత్రం యొక్క కొత్త కొలతలు ఆన్‌లో ఉన్నాయి పంక్తి 21 మన నిష్పత్తి మనకు తెలిసినప్పుడు ఇప్పుడు లెక్కించవచ్చు. మరోసారి, కొత్త చిత్రం 160 పిక్సెల్‌ల వెడల్పును కలిగి ఉంటుంది. పాత ఎత్తును మా నిష్పత్తితో గుణించి, ఫలితాన్ని పూర్ణాంకానికి మార్చిన తర్వాత, ఎత్తు లెక్కించబడుతుంది. మేము ఈ ఆపరేషన్ చేయడం ద్వారా చిత్రం యొక్క అసలైన కారక నిష్పత్తిని నిర్వహించగలము.

పంక్తి 24 ఇక్కడ చిత్రం నిజంగా పరిమాణం మార్చబడింది. మేము పునఃపరిమాణం చేయాలనుకుంటున్న చిత్రం మొదటి వాదన, మరియు రెండవది మేము కొత్త చిత్రం కోసం లెక్కించిన కొలతలు. మా ఇంటర్‌పోలేషన్ పద్ధతి, ఇది అసలు ఇమేజ్‌ని పునఃపరిమాణం చేయడానికి అల్గోరిథం, ఇది చివరి పరామితి.

చివరగా, ఆన్ పంక్తి 25 , మేము మా స్కేల్ చిత్రాన్ని ప్రదర్శిస్తాము.

మేము మా నిష్పత్తి (ఆస్పెక్ట్రేషియో)ని పునర్నిర్వచించాము లైన్ 31 . మా కొత్త చిత్రం యొక్క ఎత్తు 70 పిక్సెల్‌లుగా ఉంటుంది. కొత్త ఎత్తు నుండి అసలు ఎత్తు నిష్పత్తిని పొందడానికి మేము 70ని అసలు ఎత్తుతో భాగిస్తాము.

తరువాత, మేము కొత్త చిత్రం యొక్క కొలతలు ఏర్పాటు చేస్తాము. కొత్త చిత్రం 70 పిక్సెల్‌ల ఎత్తును కలిగి ఉంటుంది, ఇది ఇప్పటికే తెలిసినది. కొత్త వెడల్పును ఉత్పత్తి చేయడానికి పాత వెడల్పును నిష్పత్తితో గుణించడం ద్వారా మేము చిత్రం యొక్క అసలు కారక నిష్పత్తిని మరోసారి ఉంచవచ్చు.

అప్పుడు చిత్రం వాస్తవానికి పరిమాణం మార్చబడుతుంది లైన్ 35 , మరియు ఇది ప్రదర్శించబడుతుంది లైన్ 36.

ఇక్కడ, కారక నిష్పత్తిని ఉంచేటప్పుడు మన అసలు చిత్రం యొక్క వెడల్పు మరియు ఎత్తును తగ్గించినట్లు మనం చూడవచ్చు. కారక నిష్పత్తిని నిర్వహించకపోతే మా చిత్రం వక్రీకరించినట్లు కనిపిస్తుంది.

ముగింపు

ఈ బ్లాగ్‌లో, మేము ప్రాథమిక విభిన్న ఇమేజ్ ప్రాసెసింగ్ కాన్సెప్ట్‌లను అధ్యయనం చేసాము. మేము OpenCV ప్యాకేజీ సహాయంతో చిత్ర అనువాదాన్ని చూశాము. మేము చిత్రాన్ని పైకి, క్రిందికి, కుడి మరియు ఎడమకు తరలించే పద్ధతులను చూశాము. శిక్షణ డేటాసెట్‌గా ఇవ్వడానికి సారూప్య చిత్రాల డేటాసెట్‌ను రూపొందించినప్పుడు ఈ పద్ధతులు చాలా ఉపయోగకరంగా ఉంటాయి, కాబట్టి యంత్రం అవి ఒకే విధంగా ఉన్నప్పటికీ విభిన్న చిత్రాలను చూస్తుంది. రొటేషన్ మ్యాట్రిక్స్‌ని ఉపయోగించి కార్టీసియన్ స్పేస్‌లోని ఏదైనా పాయింట్ చుట్టూ చిత్రాన్ని ఎలా తిప్పాలో కూడా ఈ కథనం మీకు నేర్పింది. ఈ మ్యాట్రిక్స్‌ని ఉపయోగించి OpenCV ఇమేజ్‌లను ఎలా తిప్పుతుందో మీరు కనుగొన్నారు మరియు స్పిన్నింగ్ ఇమేజ్‌ల యొక్క రెండు దృష్టాంతాలను చూసారు.

ఈ విభాగంలో కూడిక మరియు తీసివేత యొక్క రెండు ప్రాథమిక (కానీ ముఖ్యమైన) చిత్ర అంకగణిత కార్యకలాపాలు పరిశీలించబడ్డాయి. మీరు చూడగలిగినట్లుగా, ప్రాథమిక మాత్రికలను జోడించడం మరియు తీసివేయడం అనేది అన్ని చిత్ర అంకగణిత కార్యకలాపాలను కలిగి ఉంటుంది.

అదనంగా, మేము ఇమేజ్ అంకగణితం యొక్క ప్రత్యేకతలను పరిశోధించడానికి OpenCV మరియు NumPyని ఉపయోగించాము. ఈ పరిమితులను తప్పనిసరిగా గుర్తుంచుకోవాలి లేదా మీ చిత్రాలపై అంకగణిత కార్యకలాపాలను అమలు చేస్తున్నప్పుడు మీరు ఊహించని ఫలితాలను పొందే ప్రమాదం ఉంది.

NumPy మాడ్యులస్ ఆపరేషన్‌ను నిర్వహించి, 'చుట్టూ చుట్టుముట్టింది' అయినప్పటికీ, OpenCV జోడింపు మరియు వ్యవకలనం పరిధి [0, 255] కంటే ఎక్కువ విలువలు పరిధి లోపల సరిపోతాయని గుర్తుంచుకోవడం ముఖ్యం. మీ స్వంత కంప్యూటర్ విజన్ అప్లికేషన్‌లను అభివృద్ధి చేస్తున్నప్పుడు, దీన్ని గుర్తుంచుకోవడం గమ్మత్తైన బగ్‌ల వేటను నివారించడంలో మీకు సహాయం చేస్తుంది.

చిత్రాన్ని తిప్పడం అనేది నిస్సందేహంగా మేము ఈ కోర్సులో అన్వేషించే సరళమైన ఆలోచనలలో ఒకటి. మెషిన్ లెర్నింగ్‌లో మరింత శిక్షణ డేటా నమూనాలను రూపొందించడానికి ఫ్లిప్పింగ్ తరచుగా ఉపయోగించబడుతుంది, దీని ఫలితంగా మరింత శక్తివంతమైన మరియు నమ్మదగిన ఇమేజ్ వర్గీకరణలు లభిస్తాయి.

చిత్రం పరిమాణాన్ని మార్చడానికి OpenCVని ఎలా ఉపయోగించాలో కూడా మేము నేర్చుకున్నాము. మీరు ఉపయోగిస్తున్న ఇంటర్‌పోలేషన్ పద్ధతి మరియు మీ అసలు చిత్రం యొక్క కారక నిష్పత్తి రెండింటినీ పరిగణనలోకి తీసుకోవడం చాలా ముఖ్యం, తద్వారా ఫలితం వక్రీకరించినట్లు కనిపించదు.

చివరగా, చిత్ర నాణ్యత సమస్య అయితే, పెద్దది నుండి చిన్న చిత్రానికి మారడం ఎల్లప్పుడూ ఉత్తమమని గుర్తుంచుకోవడం చాలా ముఖ్యం. చాలా సందర్భాలలో, చిత్రాన్ని విస్తరించడం కళాఖండాలను సృష్టిస్తుంది మరియు దాని నాణ్యతను తగ్గిస్తుంది.

ఇమేజ్ ప్రాసెసింగ్ OpenCV

1. చిత్ర అనువాదం

పిప్ ఇన్‌స్టాల్ ఇమ్యుటిల్స్

2. ఇమేజ్ రొటేషన్

పిప్ ఇన్‌స్టాల్ ఇమ్యుటిల్స్

3. చిత్రం అంకగణితం

4. చిత్రం ఫ్లిప్పింగ్

లక్ష్యాలు:

5. ఇమేజ్ క్రాపింగ్

6. చిత్రం పునఃపరిమాణం

ముగింపు

వర్గం

ప్రముఖ పోస్ట్లు

వర్చువల్‌బాక్స్ 7ని అన్‌ఇన్‌స్టాల్ చేయడం ఎలా

డిస్కార్డ్ బాట్ సృష్టి: సాధారణ దశల్లో ఎలా ప్రారంభించాలి

డెబియన్ 12లో VMware వర్క్‌స్టేషన్ 17 ప్రోను ఎలా ఇన్‌స్టాల్ చేయాలి

PySpark రీడ్ JSON()

డీప్ లెర్నింగ్ AMI కోసం సిఫార్సు చేయబడిన GPU ఉదాహరణలు ఏమిటి?

ఒకే క్రాన్ జాబ్‌లో బహుళ ఆదేశాలను ఎలా అమలు చేయాలి

డిస్కార్డ్‌లో స్లాష్ ఆదేశాలు ఏమిటి

నేను C++లో 2D అర్రేని కొత్తదాన్ని ఉపయోగించి ఎలా ప్రకటించగలను

గ్రాఫానా డాకర్ కంపోజ్

C++లో సింగిల్‌టన్‌ను ఎలా సృష్టించాలి

Windows 11లో ఉపయోగంలో ఉన్న పోర్ట్‌ల కోసం ఎలా తనిఖీ చేయాలి?

మేము వినియోగదారు పేరుపై హోవర్ చేసినట్లుగా జావాస్క్రిప్ట్ లేకుండా హోవర్ టెక్స్ట్‌ను జోడించండి

Ubuntu/Debian/RHEL/CentOS/Fedora/Rocky Linuxలో నెట్‌వర్క్ ఇంటర్‌ఫేస్ నామకరణ విధానాన్ని ఎలా మార్చాలి

సి# టోడిక్షనరీ పద్ధతి

Linux లో డైరెక్టరీని ఎలా తొలగించాలి

Java System.getProperty మరియు System.getenv మధ్య తేడా?

కొత్త జూపిటర్ హబ్ వినియోగదారు ఖాతాను ఎలా సృష్టించాలి

C ప్రోగ్రామింగ్‌లో %c ఎందుకు ఉపయోగించబడుతుంది

Node.jsలో stats.isDirectory() పద్ధతిని ఎలా ఉపయోగించాలి?

బాష్ అర్రేతో డేటాను మానిప్యులేట్ చేయడం మరియు నియంత్రించడం ఎలా