Metodat e segmentimit të imazhit. Studimi i metodave të segmentimit në imazhet e modeleve

09.05.2019 Windows 10

Këtë verë pata fatin të bëja një praktikë verore në kompani Itseez . Më kërkuan të eksploroja metoda moderne, e cila do të na lejonte të nxjerrim në pah vendndodhjet e objekteve në imazh. Në thelb, metoda të tilla mbështeten në segmentimin, kështu që unë e fillova punën time duke u njohur me këtë fushë vizion kompjuterik.
Segmentimi i imazhit - Kjo është ndarja e një imazhi në shumë fusha që e mbulojnë atë. Segmentimi përdoret në shumë fusha, për shembull, në prodhim për të treguar defektet gjatë montimit të pjesëve, në mjekësi për përpunimin parësor të imazhit, si dhe për përpilimin e hartave të terrenit nga imazhet satelitore. Për ata që janë të interesuar të kuptojnë se si funksionojnë algoritme të tilla, mirë se vini në cat. Ne do të shikojmë disa metoda nga biblioteka e vizionit kompjuterik OpenCV .

Algoritmi i segmentimit sipas pellgut ujëmbledhës (Ujëderdhës)

Algoritmi punon me imazhin në funksion të dy variablave f=I(x,y) , Ku x, y - koordinatat e pikselit:

Vlera e funksionit mund të jetë intensiteti ose madhësia e gradientit. Për kontrastin më të madh, mund të merrni një gradient nga imazhi. Nëse përgjatë boshtit OZ Kur vizatoni vlerën absolute të gradientit, kreshtat formohen në vendet ku ka një ndryshim në intensitet, dhe rrafshinat formohen në rajone homogjene. Pas gjetjes së minimumit të funksionit f , është duke u zhvilluar procesi i mbushjes me “ujë”, i cili nis nga minimumi global. Sapo niveli i ujit arrin minimumin tjetër lokal, ai fillon të mbushet me ujë. Kur dy rajone fillojnë të bashkohen, ndërtohet një ndarje për të parandaluar bashkimin e rajoneve. Uji do të vazhdojë të rritet derisa rajonet të ndahen vetëm nga ndarje të ndërtuara artificialisht (Fig. 1).

Fig.1. Ilustrim i procesit të mbushjes me ujë

Një algoritëm i tillë mund të jetë i dobishëm nëse imazhi numër i vogël minimale lokale, por në rastin e një numri të madh të tyre, ndodh ndarja e tepërt në segmente. Për shembull, nëse zbatojmë drejtpërdrejt algoritmin në Fig. 2, ne marrim shumë detaje të vogla në Fig. 3.

Oriz. 2. Imazhi origjinal

Oriz. 3. Imazhi pas segmentimit sipas algoritmit Ujore

Si të merreni me detaje të vogla?

Për të hequr qafe një tepricë të detajeve të vogla, mund të përcaktoni zona që do të lidhen me minimumin më të afërt. Ndarja do të ndërtohet vetëm nëse bashkohen dy rajone me shënues, përndryshe këto segmente do të bashkohen. Kjo qasje heq efektin e segmentimit të tepërt, por kërkon përpunimin paraprak të imazhit për të zgjedhur shënuesit që mund të caktohen në mënyrë interaktive në imazhin në Fig. 4, 5.

Oriz. 4. Imazhi me shënues

Oriz. 5. Imazhi pas segmentimit sipas algoritmit Ujëvare duke përdorur shënues

Nëse dëshironi të veproni automatikisht pa ndërhyrjen e përdoruesit, mund të përdorni, për shembull, funksionin findContours() për të theksuar shënuesit, por edhe këtu, për segmentim më të mirë, duhet të përjashtohen konturet e vogla Fig. 6., për shembull, duke i hequr ato përgjatë pragut përgjatë gjatësisë së konturit. Ose përdorni erozionin me zgjerim për të hequr detajet e vogla përpara se të nënvizoni konturet.

Oriz. 6. Konturet me gjatësi mbi një prag të caktuar janë përdorur si shënues

Si rezultat i algoritmit, marrim një maskë me një imazh të segmentuar, ku pikselët e një segmenti janë etiketuar me të njëjtën etiketë dhe formojnë një zonë të lidhur. Disavantazhi kryesor të këtij algoritmiështë përdorimi i një procedure para-përpunimi për imazhet me sasi e madhe minimumet lokale (imazhe me një strukturë komplekse dhe një bollëk ngjyrash të ndryshme).

Imazhi mat = imread("coins.jpg", CV_LOAD_IMAGE_COLOR); // zgjidhni konturet Mat imageGray, imageBin; cvtColor (imazh, imazh Gri, CV_BGR2GRAY); pragu (imageGray, imageBin, 100, 255, THRESH_BINARY); std:: vektor >konturet; std:: vektor hierarkia findContours (imageBin, konturet, hierarkia, CV_RETR_TREE, CV_CHAIN_APPROX_SIMPLE); Shenjat e mat (image.size(), CV_32SC1); shënuesit = Skalar::all(0); int compCount = 0; for(int idx = 0; idx >= 0; idx = hierarki, compCount++) ( drawContours(shënuesit, konturet, idx, Scalar::all(compCount+1), -1, 8, hierarkia, INT_MAX); ) std: :vektor colorTab (compCount); për (int i = 0; i< compCount; i++) { colorTab[i] = Vec3b(rand()&255, rand()&255, rand()&255); } watershed(image, markers); Mat wshed(markers.size(), CV_8UC3); for(int i = 0; i < markers.rows; i++) { for(int j = 0; j < markers.cols; j++) { int index = markers.at(i, j); if(index == -1) larë.at (i, j) = Vec3b(0, 0, 0); ndryshe nëse (indeksi == 0) larë.at (i, j) = Vec3b (255, 255, 255); tjetër larë.at (i, j) = colorTab; ) ) imshow ("transformimi i pellgut ujëmbledhës", wshed); presimKey (0);

Algoritmi i segmentimit MeanShift

MeanShift grupon objekte me karakteristika të ngjashme. Piksele me karakteristika të ngjashme kombinohen në një segment, dhe dalja është një imazh me zona homogjene.

Për shembull, si koordinata në hapësirën e veçorive ju mund të zgjidhni koordinatat e pikselit (x, y) dhe komponentët RGB piksel. Duke vizatuar pikselë në hapësirën e veçorive, mund të shihni grumbullime në vende të caktuara.

Oriz. 7. (a) Piksele në hapësirën e veçorive 2D. (b) Piksele që arrijnë në të njëjtën maksimum lokal janë të ngjyrosura me të njëjtën ngjyrë. (c) - funksioni i densitetit, maksimumet korrespondojnë me vendet e përqendrimit më të lartë të pikselëve. Fotografia është marrë nga artikulli.

Për ta bërë më të lehtë përshkrimin e kondensimeve të pikave, ne prezantojmë funksioni i densitetit :
– vektor i veçorive i -piksel i th, d - numri i shenjave, N - numri i pikselëve, h - parametri përgjegjës për butësinë është bërthama. Maksimumi i funksionit ndodhet në pikat e kondensimit të pikselëve të imazhit në hapësirën e veçorive. Piksele që i përkasin të njëjtit maksimum lokal kombinohen në një segment. Rezulton se për të gjetur se cilës prej qendrave të përqendrimit i përket një piksel, duhet të ecni përgjatë gradientit për të gjetur maksimumin më të afërt lokal.

Vlerësimi i gradientit nga funksioni i densitetit

Vektori i zhvendosjes mesatare mund të përdoret për të vlerësuar gradientin e funksionit të densitetit
Kerneli Epanechnikov përdoret si kernel në OpenCV:

- ky është vëllimi d -sferë dimensionale me rreze njësi.

do të thotë që shuma nuk shkon mbi të gjithë pikselët, por vetëm mbi ato që bien në një sferë me rreze h me qendër në pikën ku vektori tregon në hapësirën e veçorive. Kjo është futur posaçërisht për të zvogëluar numrin e llogaritjeve. - vëllimi d -Sfera dimensionale me rreze h Mund të vendosni veçmas rrezen për koordinatat hapësinore dhe veçmas rrezen në hapësirën e ngjyrave. - numri i pikselëve që bien në sferë. Madhësia mund të mendohet si një vlerësim i vlerës në rajon.

Prandaj, për të ecur përgjatë gradientit, mjafton të llogarisni vlerën - vektori i zhvendosjes mesatare. Duhet mbajtur mend se nëse zgjidhni një kernel të ndryshëm, vektori i zhvendosjes mesatare do të duket i ndryshëm.

Kur zgjidhni koordinatat e pikselëve dhe intensitetet e ngjyrave si veçori, pikselët me ngjyra të ngjashme dhe të vendosura afër njëri-tjetrit do të kombinohen në një segment. Prandaj, nëse zgjidhni një vektor veçori të ndryshme, atëherë pikselët do të kombinohen në segmente duke e përdorur atë. Për shembull, nëse heqim koordinatat nga tiparet, atëherë qielli dhe liqeni do të konsiderohen si një segment, pasi pikselët e këtyre objekteve në hapësirën e veçorive do të bien në një maksimum lokal.

Nëse objekti që duam të zgjedhim përbëhet nga zona që ndryshojnë shumë në ngjyrë, atëherë MeanShift nuk do të jetë në gjendje t'i kombinojë këto rajone në një, dhe objekti ynë do të përbëhet nga disa segmente. Por është mirë të përballesh me një objekt me ngjyrë uniforme në një sfond të larmishëm. Më shumë MeanShift përdoret kur zbatohet një algoritëm për gjurmimin e objekteve në lëvizje.

Shembull i kodit për të ekzekutuar algoritmin:

Mat imazh = imread("strawberry.jpg", CV_LOAD_IMAGE_COLOR); Mat imageSegment; int hapësinorRadius = 35; int ngjyraRadius = 60; int piramidale Nivelet = 3; pyrMeanShiftFiltering(image, imageSegment, spatialRadius, colorRadius, pyramid Levels); imshow ("MeanShift", segmenti i imazhit); presimKey (0);
Rezultati:

Oriz. 8. Imazhi origjinal

Oriz. 9. Pas segmentimit sipas algoritmit MeanShift

Algoritmi i segmentimit Përmbytja

Duke përdorur Përmbytja(metoda e mbushjes ose e "përmbytjes") mund të zgjidhni rajone me ngjyrë uniforme. Për ta bërë këtë, duhet të zgjidhni pikselin fillestar dhe të vendosni intervalin për ndryshimin e ngjyrës së pikselëve fqinjë në krahasim me atë origjinal. Intervali mund të jetë gjithashtu asimetrik. Algoritmi do të kombinojë pikselët në një segment (duke i mbushur me të njëjtën ngjyrë) nëse bien brenda intervalit të specifikuar. Dalja do të jetë një segment i mbushur me një ngjyrë të caktuar dhe zonën e tij në piksel.

Ky algoritëm mund të jetë i dobishëm për mbushjen e një zone me dallime të vogla ngjyrash me një sfond uniform. Një rast përdorimi Përmbytja Mund të jetë e mundur të identifikohen skajet e dëmtuara të një objekti. Për shembull, nëse, duke mbushur zona homogjene me një ngjyrë të caktuar, algoritmi mbush edhe rajonet fqinje, atëherë integriteti i kufirit midis këtyre zonave është shkelur. Në imazhin më poshtë mund të shihni se integriteti i kufijve të zonave të mbushura është ruajtur:

Oriz. 10, 11. Imazhi origjinal dhe rezultati pas mbushjes së disa zonave

Dhe fotot e mëposhtme tregojnë opsionin e punës Përmbytja nëse një nga kufijtë në imazhin e mëparshëm është i dëmtuar.

Oriz. 12, 13. Ilustrim i punës Përmbytja kur cenohet integriteti i kufirit ndërmjet zonave të mbushura

Shembull i kodit për të ekzekutuar algoritmin:

Mat imazh = imread("cherry.jpg", CV_LOAD_IMAGE_COLOR); Pika e fillimit; startPoint.x = image.cols/2; startPoint.y = image.rows/2; Scalar loDiff(20, 20, 255); Scalar upDiff(5, 5, 255); Skalar fillColor(0, 0, 255); fqinjët int = 8; Rect domain; zona int = floodFill(imazhi, pikënisja, mbushja me ngjyra, &domain, loDiff, upDiff, fqinjët); drejtkëndësh (imazh, domen, Scalar (255, 0, 0)); imshow ("Segmentimi floodFill", imazh); presim Key(0);
Tek një ndryshore zonë Numri i pikselëve "të mbushur" do të regjistrohet.
Rezultati:

Algoritmi i segmentimit GrabCut

Ky është një algoritëm ndërveprues i përzgjedhjes së objekteve, i zhvilluar si një alternativë më e përshtatshme për lasos magnetike (për të zgjedhur një objekt, përdoruesi duhej të gjurmonte skicën e tij me miun). Që algoritmi të funksionojë, mjafton të mbyllni objektin së bashku me një pjesë të sfondit në një drejtkëndësh (kap). Objekti do të segmentohet automatikisht (prehet).

Segmentimi mund të jetë i vështirë nëse ka ngjyra brenda kutisë kufizuese që ndodhin në sasi të mëdha jo vetëm në objekt, por edhe në sfond. Në këtë rast, mund të shtoni shenja shtesë të objektit (vija e kuqe) dhe sfondi (vija blu).

Le të shqyrtojmë idenë e algoritmit. Baza është algoritmi i segmentimit interaktiv GraphCut, ku përdoruesi duhet të vendosë shënues në sfond dhe në objekt. Imazhi trajtohet si një grup .Z - vlerat e intensitetit të pikselit, N - numri i përgjithshëm i pikselëve. Për të ndarë një objekt nga sfondi, algoritmi përcakton vlerat e elementeve të grupit të transparencës dhe mund të marrë dy vlera nëse = 0 , atëherë piksel i takon sfondit nëse = 1 , pastaj objekti. Parametri i brendshëm përmban një histogram të shpërndarjes së intensitetit plan të parë dhe një histogram të sfondit:
.
Detyra e segmentimit është gjetja e të panjohurave. Funksioni i energjisë konsiderohet:

Për më tepër, energjia minimale korrespondon me segmentimin më të mirë.

V(a, z) - termi është përgjegjës për lidhjen ndërmjet pikselëve. Shuma shkon mbi të gjitha çiftet e pikselëve që janë fqinjë, dis(m,n) - Distanca Euklidiane. është përgjegjëse për pjesëmarrjen e çifteve të pikselave në totalin nëse a n = a m , atëherë ky çift nuk do të merret parasysh.
- është përgjegjës për cilësinë e segmentimit, d.m.th. ndarja e objektit nga sfondi.

Duke gjetur minimumin global të funksionit të energjisë E , marrim një grup transparence. Për të minimizuar funksionin e energjisë, imazhi përshkruhet si grafik dhe kërkohet prerja minimale e grafikut. Ndryshe nga GraphCut në algoritëm GrabCut pikselët konsiderohen në hapësirën RGB, kështu që një Model Gaussian Mixture (GMM) përdoret për të përshkruar statistikat e ngjyrave. Funksionimi i algoritmit GrabCut ju mund të shihni duke ekzekutuar kampionin OpenCV

Një nga detyrat kryesore të përpunimit dhe analizës së imazhit është segmentimi, d.m.th. ndarja e një imazhi në zona për të cilat plotësohet një kriter i caktuar homogjeniteti, për shembull, duke theksuar zonat me përafërsisht të njëjtin shkëlqim në imazh. Koncepti i zonës së imazhit përdoret për të përcaktuar një grup koherent të elementeve të imazhit që kanë një të caktuar tipar i përbashkët(pronë).
Një nga kryesoret dhe mënyra të thjeshta- ky është ndërtimi i segmentimit duke përdorur një prag. Një prag është një shenjë (veti) që ndihmon në ndarjen e sinjalit të dëshiruar në klasa. Funksionimi i ndarjes së pragut është të krahasojë vlerën e shkëlqimit të çdo piksel në imazh me vlerën e dhënë pragu.

Binarizimi

Operacioni i pragut që rezulton në një imazh binar quhet binarizimi. Qëllimi i operacionit të binarizimit është të zvogëlojë rrënjësisht sasinë e informacionit që përmban imazhi. Në procesin e binarizimit, imazhi origjinal i gjysmëtonit, i cili ka një numër të caktuar nivelesh ndriçimi, shndërrohet në imazh bardh e zi, pikselët e të cilit kanë vetëm dy vlera - 0 dhe 1

Pragu i një imazhi mund të bëhet në mënyra të ndryshme.

Binarizimi me prag më të ulët

Binarizimi me prag më të ulët
Binarizimi me një prag më të ulët është operacioni më i thjeshtë, i cili përdor vetëm një vlerë pragu:

Të gjitha vlerat bëhen 1 në vend të kriterit, në në këtë rast 255 (e bardhë) dhe të gjitha vlerat e pikselit (amplitudat) që janë më të mëdha se pragu t - 0 (e zezë).

Binarizimi me pragun e sipërm
Ndonjëherë mund të përdorni një variant të metodës së parë, e cila prodhon një negativ të imazhit të marrë gjatë procesit të binarizimit. Operacioni i binarizimit me pragun e sipërm:

Binarizimi me kufizim të dyfishtë
Për të theksuar zonat në të cilat vlerat e shkëlqimit të pikselit mund të ndryshojnë brenda një diapazoni të njohur, prezantohet binarizimi me kufizim të dyfishtë (t 1
Ndryshime të tjera me pragje janë gjithashtu të mundshme, ku vetëm një pjesë e të dhënave kalohet përmes (filtri i brezit të mesëm).

Pragu jo i plotë
Ky transformim prodhon një imazh që mund të jetë më i lehtë për t'u analizuar më tej, sepse i mungon sfondi me të gjitha detajet e pranishme në imazhin origjinal.

Transformimi i pragut me shumë nivele
Ky operacion formon një imazh që nuk është binar, por përbëhet nga segmente me shkëlqim të ndryshëm.

Sa i përket binarizimit, kjo është në thelb ajo. Edhe pse mund të shtojmë se ekziston një global, i cili përdoret për të gjithë imazhin, dhe ka edhe një lokal, i cili kap një pjesë të figurës (imazhit).

Pragu lokal

Metoda Otsa
Metoda përdor një histogram të shpërndarjes së vlerave të shkëlqimit të pikselëve të imazhit raster. Një histogram ndërtohet duke përdorur vlerat p i = n i / N, ku N është numri i përgjithshëm i pikselëve në imazh, n i është numri i pikselëve me nivelin e ndriçimit i. Gama e ndriçimit ndahet në dy klasa duke përdorur pragun e nivelit të shkëlqimit k,k - një vlerë e plotë nga 0 në L. Çdo klasë korrespondon me frekuencat relative ω 0 ω 1:

Nivelet mesatare për secilën nga dy klasat e imazhit:
Tjetra, llogaritet vlera maksimale për vlerësimin e cilësisë së ndarjes së figurës në dy pjesë:
ku (σ cl)2=ω 0 ω 1 (μ 1 -μ 0) 2 është varianca ndërklasore, dhe (σ total) 2 është varianca totale për të gjithë imazhin.

Pragu i bazuar në gradientin e ndriçimit të imazhit
Le të supozojmë se imazhi i analizuar mund të ndahet në dy klasa - objekte dhe sfond. Algoritmi për llogaritjen e vlerës së pragut përbëhet nga 2 hapat e mëposhtëm:
1. Moduli i gradientit të ndriçimit përcaktohet për çdo piksel
Imazhet

2. Llogaritja e pragut:

Total

Me kënaqësi ndava me ju atë që gjeta në të ardhmen, nëse do të kem sukses dhe do të kem kohë, do të përpiqem të zbatoj disa nga algoritmet. Kjo është vetëm një pjesë e vogël e gjithçkaje që ekziston sot, por edhe unë jam i lumtur ta ndaj këtë.
Faleminderit per vemendjen.

Dërgoni punën tuaj të mirë në bazën e njohurive është e thjeshtë. Përdorni formularin e mëposhtëm

Studentët, studentët e diplomuar, shkencëtarët e rinj që përdorin bazën e njohurive në studimet dhe punën e tyre do t'ju jenë shumë mirënjohës.

Postuar në http://www.allbest.ru/

Ministria e Arsimit dhe Shkencës e Federatës Ruse

Universiteti Shtetëror i Radio Inxhinierisë Ryazan

Departamenti IIBMT

Puna e kursit

Metodat e përpunimit të imazhit. Segmentimi

Arti i përfunduar. gr. 432 milion:

Aleshin S.I.

Kontrolluar nga Assoc. departamenti IIBMT:

Kaplan M.B.

Ryazan 2014

Prezantimi

1. Prezantimi i imazheve

3. Formatet e imazhit

4. Llojet e imazheve

5.1 Ndryshimi i kontrastit

5.2 Zbutja e zhurmës

5.3 Theksimi i kufijve

5.4 Filtrimi mesatar

5.5 Segmentimi i imazhit

5.5.3 Përvijimi

5.5.7 Metodat e prerjes së grafikut

6. Përshkrimi i funksioneve

7. Testimi i algoritmit

konkluzioni

Aplikacion

Prezantimi

Në mesin e shekullit të 20-të, përpunimi i imazhit ishte kryesisht analog dhe kryhet nga pajisje optike. Teknika të tilla optike janë ende të rëndësishme sot, në fusha të tilla si holografia. Megjithatë, me rritjen dramatike të performancës së kompjuterit, këto metoda u zëvendësuan gjithnjë e më shumë nga metodat e përpunimit të imazhit dixhital. Metodat dixhitale të përpunimit të imazhit janë përgjithësisht më të sakta, më të besueshme, fleksibël dhe më të lehta për t'u zbatuar sesa metodat analoge. Përpunimi dixhital i imazhit përdor gjerësisht harduerin e specializuar si procesorët e linjës së udhëzimeve dhe sistemet me shumë procesorë. Kjo është veçanërisht e vërtetë për sistemet e përpunimit të videos. Përpunimi i imazheve kryhet gjithashtu duke përdorur softuerin e matematikës kompjuterike, për shembull, MATLAB, Mathcad, Maple, Mathematica, etj. Për këtë, ata përdorin si mjetet bazë ashtu edhe paketat shtesë të Përpunimit të Imazheve.

Interesi për metodat dixhitale të përpunimit të imazhit buron nga dy fusha kryesore të aplikimit të tij, të cilat janë përmirësimi i imazhit për të përmirësuar perceptimin vizual të njeriut dhe përpunimin e imazhit për ruajtjen, transmetimin dhe prezantimin në sistemet autonome të vizionit të makinës.

Një nga metodat më komplekse të përpunimit dixhital të imazhit është segmentimi i imazhit. Segmentimi është procesi i ndarjes së një imazhi dixhital në disa segmente që ndryshojnë nga njëri-tjetri në karakteristikat elementare, si shkëlqimi, ngjyra, cilësi, forma. Qëllimi i segmentimit është të thjeshtojë dhe ndryshojë paraqitjen e një imazhi në mënyrë që të jetë më e thjeshtë dhe më e lehtë për t'u analizuar. Zgjedhja e gabuar e segmenteve në një imazh mund të ndikojë përfundimisht në cilësinë e njohjes dhe madje ta bëjë të pamundur. Prandaj, detyra e segmentimit është jashtëzakonisht e rëndësishme dhe shumë e rëndësishme.

Ka shumë metoda të ndarjes së imazhit. Rezultati përfundimtar shpesh përcaktohet nga saktësia e segmentimit, kështu që kur zgjidhni një metodë të veçantë segmentimi, duhet t'i kushtoni vëmendje të madhe besueshmërisë së algoritmit. Megjithatë, nuk ka asnjë qasje të vetme, përgjithësisht të pranuar që do të qëndronte në themel të shumicës së algoritmeve. Nuk ka gjithashtu asnjë algoritëm të vetëm që do të lejonte segmentim të pranueshëm për çdo imazh. Kjo është një nga vështirësitë e segmentimit dhe kjo është arsyeja e numrit të madh të qasjeve të ndryshme për zgjidhjen e këtyre problemeve të përpunimit të imazhit.

Pavarësisht nga rëndësia e kësaj fushe lëndore, janë shkruar relativisht pak libra që trajtojnë si bazat teorike ashtu edhe aspektet softuerike të zgjidhjes së problemeve bazë të segmentimit të imazhit.

Ky punim përshkruan metodat bazë të përpunimit të imazhit dixhital. Vëmendje e veçantë i kushtohet metodave të segmentimit të imazhit. Një program për një nga metodat e segmentimit është zbatuar duke përdorur paketën e aplikacionit MatLAB.

1. Prezantimi i imazheve

Çështjet themelore në teorinë e përpunimit të imazhit janë çështjet e: formimit, hyrjes, përfaqësimit në një kompjuter dhe vizualizimit. Forma e një sipërfaqeje mund të përshkruhet si funksion i distancës F(x, y) nga sipërfaqja në një pikë imazhi me koordinatat x dhe y. Duke marrë parasysh që shkëlqimi i një pike në imazh varet vetëm nga shkëlqimi i sipërfaqes përkatëse, mund të supozojmë se informacioni vizual pasqyron gjendjen e shkëlqimit ose transparencës së secilës pikë me një shkallë të caktuar saktësie. Atëherë një imazh kuptohet si një funksion i kufizuar i dy ndryshoreve hapësinore f(x, y), të përcaktuara në një plan drejtkëndor të kufizuar Oxy dhe që kanë një grup të caktuar vlerash të tij. Për shembull, një fotografi bardh e zi mund të përfaqësohet si f(x, y)?0, ku 0?x?a, 0?y?b dhe f(x, y) janë ndriçimi (ndonjëherë i quajtur densitet optik ose bardhësi ) e imazhit në pikën (x, y); a - gjerësia e kornizës, b - lartësia e kornizës.

Për shkak të faktit se memoria dixhitale e një kompjuteri është e aftë të ruajë vetëm grupe të dhënash, imazhi fillimisht shndërrohet në një formë numerike (matricë). Imazhet futen në kujtesën e kompjuterit duke përdorur sensorë video. Sensori i videos konverton shpërndarjen optike të ndriçimit të imazhit në sinjale elektrike dhe më pas në kode dixhitale. Meqenëse imazhi është një funksion i dy ndryshoreve hapësinore x dhe y, dhe sinjali elektrik është një funksion i një ndryshoreje t (koha), një skanim përdoret për konvertim. Për shembull, kur përdorni një kamerë televizive, imazhi lexohet rresht pas rreshti, dhe brenda çdo rreshti, varësia e ndriçimit nga koordinata hapësinore x shndërrohet në një varësi proporcionale të amplitudës së sinjalit elektrik në kohën t. Kalimi nga fundi i rreshtit të mëparshëm në fillim të rreshtit tjetër ndodh pothuajse menjëherë.

Futja e imazheve në një kompjuter përfshin në mënyrë të pashmangshme marrjen e mostrave të imazheve përgjatë koordinatave hapësinore x dhe y dhe kuantizimin e vlerës së shkëlqimit në çdo pikë diskrete. Diskretizimi arrihet duke përdorur një rrjet koordinativ të formuar nga vija paralele me boshtet x dhe y të një sistemi koordinativ kartezian. Në çdo nyje të një grilë të tillë, bëhet një lexim i shkëlqimit ose transparencës së bartësit të informacionit të perceptuar vizualisht, i cili më pas kuantizohet dhe paraqitet në kujtesën e kompjuterit. Elementi i imazhit të marrë në procesin e kampionimit të imazhit quhet piksel. Për një paraqitje me cilësi të lartë të një imazhi gjysmëton, mjaftojnë 28 = 256 nivele kuantizimi, d.m.th. 1 piksel i një imazhi është i koduar me 1 bajt informacioni.

Karakteristikat kryesore të imazheve janë:

1. Madhësia e imazhit;

2. Thellësia e ngjyrës;

3. Leja.

2. Kodimi i imazhit me ngjyra

Ngjyra është një fenomen që rezulton nga bashkëveprimi i dritës, një objekti dhe një pajisjeje (vëzhguesi).

Është vërtetuar eksperimentalisht se çdo ngjyrë mund të përfaqësohet si shuma e sasive të caktuara të tre ngjyrave linearisht të pavarura.

Tre ngjyra të pavarura në mënyrë lineare quhen ngjyra kryesore.

Ato përcaktojnë një sistem të koordinatave të ngjyrave (CCS) ose skemë ngjyrash, d.m.th. një grup ngjyrash primare për të marrë ngjyrat e mbetura.

Skemat e ngjyrave ndahen në dy lloje: skemat e ngjyrave nga drita e emetuar dhe nga drita e reflektuar.

Sistemi RGB.

Ngjyrat e tij kryesore janë e kuqja me gjatësi vale 700 nm, jeshile me gjatësi vale 546.1 nm dhe blu me gjatësi vale 435.8 nm. Sistemi RGB është shtesë.

Në këtë rast, kjo ose ajo ngjyrë fitohet duke shtuar ngjyrat kryesore.

Sistemi CMYK.

Ky sistem përdoret për të formuar ngjyra të objekteve me ngjyrë jo të ndriçuara që thithin një pjesë të spektrit të dritës së bardhë të ndriçuar dhe reflektojnë pjesën tjetër të rrezatimit.

Sistemi CMYK është baza për printimin me ngjyra.

Ai bazohet në modelin zbritës CMY (Cyan - cyan, Magenta - magenta, Yellow) - një model i zbritjes së ngjyrave. Këtu ka ende tre ngjyra kryesore.

Për të përmirësuar cilësinë e imazhit të printuar, sistemit i është shtuar ngjyra e zezë.

Sistemi HSB.

Ky sistem bazohet në përdorimin e Hue ose Hue, Saturation dhe Lightness. Hue karakterizon një nuancë specifike të ngjyrës, ngopje - intensitetin e saj relativ, shkëlqimin e ngjyrës - sasinë e nuancës së zezë për të prodhuar një imazh më të errët.

Një variant i këtij sistemi është skema HSL.

3. Formatet e imazhit

Sot përdoren një numër i madh i formateve të ndryshme të skedarëve grafikë. Formatet më të përdorura janë TIFF, GIF, JPEG, PNG dhe BMP.

Formati TIFF (Tagget Image Format) është një nga formatet më të besueshme dhe më të gjithanshme për ruajtjen e imazheve me ngjyra të skanuara me cilësi të lartë. Mund të përdorë kompresimin duke përdorur algoritmin LZW, d.m.th. i referohet formateve të ruajtjes së imazheve pa humbje.

Formati GIF (Graphics Interchange Format) ka një gamë ngjyrash prej 256 ngjyrash dhe përdor algoritmin LZW pa humbje për kompresim. Nëse numri origjinal i ngjyrave është më shumë se 256, atëherë disa nga informacionet e ngjyrave do të humbasin.

Formati JPEG (Join Photographers Expert Group) bazohet në algoritmin e kompresimit të imazhit me të njëjtin emër. Është një algoritëm kompresimi me humbje dhe është krijuar për të ruajtur imazhe me ngjyra të plota me një raport të lartë kompresimi. Kur përdorni formatin, mund të kontrolloni parametrin e cilësisë nga 0 (ngjeshja maksimale) në 100 (cilësia maksimale). Raporti i kompresimit, në varësi të cilësisë, është nga 10 në 1000. Ky format përdoret më shpesh për të ruajtur imazhe fotografike me ngjyra të plota që nuk janë të destinuara për përpunim të mëtejshëm.

Formati PNG është një format raster për ruajtjen e informacionit grafik që përdor kompresim pa humbje duke përdorur algoritmin Deflate. Formati PNG është krijuar për të zëvendësuar formatin më të vjetër dhe më të thjeshtë GIF, dhe deri diku për të zëvendësuar formatin shumë më kompleks TIFF. Formati PNG është i pozicionuar kryesisht për përdorim në internet dhe redaktim grafik. Ka këto avantazhe kryesore ndaj GIF: një numër pothuajse i pakufizuar ngjyrash në imazh; mbështetje opsionale për kanalin alfa; mundësia e korrigjimit të gama; skanim i ndërthurur dydimensional.

Formati BMP (BitMaP) është një nga formatet reale reale të sistemit operativ Windows. Është i përshtatshëm për ruajtjen e imazheve si në formë të indeksuar me një gamë deri në 256 ngjyra, ashtu edhe në formën e imazheve RGB me ngjyra të plota me një thellësi ngjyrash 24 bit. Është e mundur të përdoret algoritmi i kompresimit RLE.

4. Llojet e imazheve

4.1 Imazhi me dy nivele (ose monokromatike).

Në këtë rast, të gjithë pikselët mund të kenë vetëm dy vlera, të cilat zakonisht quhen të zeza (binare, ose ngjyra kryesore) dhe e bardhë (zero binar, ose ngjyra e sfondit).

Çdo piksel në një imazh të tillë përfaqësohet nga një bit, pra është lloji më i thjeshtë i imazhit.

1. Imazhi gjysmëton. Një imazh i tillë me një shkallë prej 2n nivelesh është i përbërë nga shtresa n-bit.

2. Imazhi me ngjyra. Një imazh i tillë përshkruhet në një nga formatet e paraqitura më sipër.

3. Imazhi i toneve të vazhdueshme. Ky lloj imazhi mund të ketë shumë ngjyra të ngjashme (ose gjysmëtone). Kur pikselët fqinjë ndryshojnë vetëm me një, është pothuajse e pamundur që syri të dallojë ngjyrat e tyre. Si rezultat, imazhe të tilla mund të përmbajnë zona në të cilat ngjyra duket se ndryshon vazhdimisht në sy. Në këtë rast, një piksel përfaqësohet ose nga një numër i madh (në rastin e gjysmëtonit) ose nga tre komponentë (në rastin e një imazhi me ngjyra). Imazhet e toneve të vazhdueshme janë të natyrshme ose të natyrshme (në krahasim me të krijuara nga njeriu, artificiale); Ato zakonisht merren duke shkrepur me aparat fotografik dixhital ose duke skanuar fotografi ose vizatime.

4. Imazhi me tone diskrete (i quajtur edhe sintetik). Zakonisht, ky imazh merret artificialisht. Mund të ketë vetëm disa ngjyra ose shumë ngjyra, por është i lirë nga zhurmat dhe njollat e një imazhi natyral. Shembuj të imazheve të tilla përfshijnë fotografi të objekteve, makinave ose mekanizmave të krijuara nga njeriu, faqe teksti, harta, vizatime ose imazhe në një ekran kompjuteri. (Jo çdo imazh artificial do të jetë domosdoshmërisht me tone diskrete. Një imazh i krijuar nga kompjuteri që synohet të duket i natyrshëm do të ketë tone të vazhdueshme pavarësisht origjinës së tij artificiale.) Objektet artificiale, teksti dhe linjat e vizatuara kanë forma, kufij të mirëpërcaktuar. Ata kontrast të fortë me pjesën tjetër të imazhit (sfondi). Piksele ngjitur të një imazhi tone diskrete janë shpesh të vetme ose ndryshojnë shumë në vlerë. Imazhe të tilla janë të ngjeshura dobët duke përdorur metoda me humbje, pasi shtrembërimi i vetëm disa pikselave të një shkronje e bën atë të palexueshëm, duke e shndërruar stilin e zakonshëm në një stil krejtësisht të padallueshëm. Imazhet me tone diskrete zakonisht kanë shumë tepricë. Shumë nga fragmentet e tij përsëriten shumë herë në vende të ndryshme në imazh.

5. Imazhe të ngjashme me vizatimet. Këto janë imazhe me ngjyra që përmbajnë zona të mëdha me të njëjtën ngjyrë. Në këtë rast, zonat ngjitur mund të ndryshojnë shumë në ngjyrë.

5. Metodat e përpunimit të imazhit

Analiza paraprake e imazheve na lejon të konkludojmë se:

Së pari, shumica e imazheve, në procesin e formimit të tyre (skanimet e fotografimit, etj.), Ndikohen nga një sërë faktorësh negativë (dridhja e kamerës, lëvizja e pabarabartë e elementit të skanimit, etj.), duke çuar në turbullira, shfaqje të ulët - zona me kontrast dhe zhurmë etj.

Së dyti, shumica dërrmuese e metodave bazohen në identifikimin e objekteve në imazh dhe analizimin e mëtejshëm të tyre.

Kështu, përpara se të analizohet, imazhi duhet të kalojë në fazën e përgatitjes, e cila konsiston në kryerjen e operacioneve për të përmirësuar cilësinë vizuale (rritja e kontrastit, eliminimi i turbullimit, theksimi i skajeve, filtrimi) dhe operacionet për të formuar një përgatitje grafike (segmentim, nxjerrje në pah të kontureve). imazhin.

5.1 Ndryshimi i kontrastit

Kontrasti i dobët zakonisht shkaktohet nga një gamë e vogël dinamike e ndryshimeve të shkëlqimit, ose nga një jolinearitet i fortë në transmetimin e niveleve të shkëlqimit. Metoda më e thjeshtë e kontrastit është hartëzimi funksional i gradimit të shkëlqimit fij në gij, domethënë gij = R(fij). Në praktikë, hartimet funksionale lineare përdoren shumë shpesh. Nëse, si rezultat i ndriçimit të pabarabartë kur fotografoni ose bëni fotografi, lind një situatë ku zona të ndryshme të imazhit kanë kontrast të ndryshëm. Në këtë rast, algoritmet adaptive të kontrastit përdoren për të ndryshuar kontrastin. Një shembull është algoritmi lokal i përmirësimit të kontrastit. Studimet eksperimentale kanë konfirmuar efikasitetin e lartë të algoritmit nëse imazhi përmban zona me kontraste qartësisht shumë të larta ose të ulëta.

Thelbi i algoritmit është se imazhi konsiderohet si një grup i një numri të caktuar zonash lokale, dhe këto zona përpunohen duke marrë parasysh karakteristikat e tyre. Përpunimi kryhet në sekuencën e mëposhtme: faktori i fitimit të fetave të densitetit p llogaritet veçmas për secilën zonë lokale të figurës. Dhe çdo piksel i imazhit përpunohet. Nëse p është e barabartë me një, atëherë asnjë veprim nuk kryhet në një zonë lokale të imazhit (nëse p është e ndryshme nga një, atëherë kontrasti i zonës lokale rritet). Fillimisht, llogaritet kontrasti në pikën e analizuar në lidhje me lagjen më të afërt. Pastaj vlera e kontrastit relativ i shtohet unitetit, dhe vlera që rezulton pranohet në algoritëm si fitimi p, dhe më pas llogaritet duke përdorur formulën:

Kontrasti i programit të segmentimit të imazhit

ku është vlera e re e ndriçimit, është shkëlqimi aktual i imazhit të përpunuar, është vlera maksimale e kërkuar e ndriçimit të imazhit të përpunuar.

5.2 Zbutja e zhurmës

Imazhet i nënshtrohen zhurmës shtesë dhe impulseve gjatë fazës së dixhitalizimit. Zhurma shtesë është një sinjal i rastësishëm që i shtohet atij të dobishëm në daljen e sistemit në rastin në shqyrtim, zhurma shtesë lind për shkak të kokrrizave të filmit. Zhurma e impulsit, ndryshe nga zhurma shtesë, karakterizohet nga ndikimi i saj në sinjalin e dobishëm vetëm në pika të rastësishme individuale (vlera e sinjalit që rezulton në këto pika merr një vlerë të rastësishme). Zhurma e impulsit është tipike për sistemet e transmetimit dhe ruajtjes së imazhit dixhital. Kështu, në procesin e përgatitjes së imazhit, lind problemi i shtypjes së zhurmës.

Metoda më e thjeshtë për zbutjen e zhurmës në një imazh është zbutja, d.m.th. duke zëvendësuar vlerën e ndriçimit të çdo elementi me vlerën mesatare të gjetur në lagjen e tij:

ku është grupi i pikave që i përkasin fqinjësisë së pikës (përfshirë vetë pikën); - numri i pikave në lagje.

Metoda e konsideruar eliminon në mënyrë efektive zhurmën shtesë dhe impulse në çdo element imazhi.

5.3 Theksimi i kufijve

Teknikat e zbutjes së imazhit mund të heqin zhurmën në mënyrë shumë efektive. Një disavantazh i rëndësishëm i algoritmeve anti-aliasing është turbullimi i imazhit (d.m.th., një rënie në qartësinë e elementeve të konturit), dhe sasia e turbullimit është në proporcion me madhësinë e maskës së përdorur për zbutjen. Për analizën e paqartë të imazhit, veçanërisht kur llogaritni karakteristikat gjeometrike të elementeve strukturorë, është shumë e rëndësishme të hiqni turbullimin nga konturet e objekteve në imazh, domethënë të përmirësoni ndryshimin midis shkallëzimeve të shkëlqimit të elementeve konturore të objektit dhe elementet fqinje të sfondit. Në këtë rast, gjatë përpunimit të imazheve, përdoren metoda për theksimin e kontureve.

Në mënyrë tipike, përmirësimi i skajeve kryhet duke përdorur filtrim hapësinor me frekuencë të lartë. Karakteristikat e filtrave specifikohen si një maskë në të cilën vlera mesatare duhet të jetë e barabartë me zero.

Një metodë tjetër për theksimin e kufijve është i ashtuquajturi diferencim statik. Në këtë metodë, vlera e shkëlqimit të secilit element ndahet me një vlerësim statistikor të devijimit standard, domethënë (devijimi standard llogaritet në disa lagje të elementit).

5.4 Filtrimi mesatar

Filtrimi mesatar i referohet metodave jolineare të përpunimit të imazhit dhe ka përparësitë e mëposhtme mbi filtrimin linear (procedura klasike e zbutjes): ruan ndryshime të mprehta (kufijtë); zbut në mënyrë efektive zhurmën e impulsit; nuk ndryshon ndriçimin e sfondit.

Filtrimi mesatar kryhet duke lëvizur disa hapje (maskë) përgjatë një imazhi diskrete dhe duke zëvendësuar vlerën e elementit qendror të maskës me vlerën mesatare (vlera mesatare e sekuencës së renditur) të elementeve origjinale brenda aperturës. Në përgjithësi, hapja mund të ketë një larmi formash, por në praktikë apertura katrore e madhësisë

5.5 Segmentimi i imazhit

Segmentimi i imazhit kuptohet si procesi i ndarjes së tij në pjesë përbërëse që kanë një kuptim kuptimplotë: objektet, kufijtë e tyre ose fragmente të tjera informative, tipare karakteristike gjeometrike, etj. Në rastin e automatizimit të metodave të përvetësimit të imazhit, segmentimi duhet të konsiderohet si Faza kryesore fillestare e analizës, e cila konsiston në ndërtimin e një përshkrimi zyrtar të imazheve, cilësia e të cilave përcakton në masë të madhe suksesin e zgjidhjes së problemit të njohjes dhe interpretimit të objekteve.

Në përgjithësi, segmentimi është operacioni i ndarjes së një grupi të fundëm të një plani në të cilin funksioni i imazhit origjinal është përcaktuar në nënbashkësi të lidhura jo bosh në përputhje me disa kallëzues të përcaktuar në grup dhe duke marrë vlera të vërteta kur çdo çift pikat nga çdo nëngrup plotësojnë disa kritere homogjeniteti (për shembull, kriteri i homogjenitetit bazuar në një vlerësim të ndryshimit maksimal në shkëlqimin e një piksel individual dhe vlerës mesatare të shkëlqimit të llogaritur në zonën përkatëse).

5.5.1 Metodat e segmentimit të pragut

Pragu është një nga metodat kryesore për segmentimin e imazhit për shkak të vetive të tij intuitive. Kjo metodë përqendrohet në përpunimin e imazheve, zona individuale homogjene të të cilave ndryshojnë në ndriçimin mesatar. Metoda më e zakonshme e segmentimit me prag është segmentimi binar, domethënë kur kemi në dispozicion dy lloje zonash homogjene.

Në këtë rast, imazhi përpunohet piksel pas piksel dhe konvertimi i secilit piksel të figurës hyrëse në dalje përcaktohet nga relacioni:

ku është një parametër përpunimi i quajtur pragu dhe janë nivelet e ndriçimit të daljes. Përpunimi me pikselë, pozicioni i të cilave në imazh nuk luan ndonjë rol, quhet përpunimi i pikës. Nivelet luajnë rolin e shenjave. Ato përdoren për të përcaktuar se cili lloj i një pike të caktuar klasifikohet si: H0 ose H1. Ose ata thonë se H0 përbëhet nga pikat e sfondit, dhe H1 nga pikat e interesit. Si rregull, nivelet korrespondojnë me nivelet e bardhë dhe të zezë. Ne do t'i quajmë klasat H1 (aka klasa e interesit) klasën e objektit dhe klasën H0 klasën e sfondit.

Natyrisht, segmentimi mund të jetë jo vetëm binar, dhe në këtë rast ka më shumë se dy klasa ekzistuese. Ky lloj segmentimi quhet me shumë nivele. Imazhi që rezulton nuk është binar, por përbëhet nga segmente me shkëlqim të ndryshëm. Formalisht, ky operacion mund të shkruhet si më poshtë:

ku është numri i niveleve dhe janë klasat e imazhit. Në këtë rast, për secilën nga klasat, duhet të vendoset një prag i përshtatshëm që do t'i ndante këto klasa nga njëra-tjetra. Imazhet binare janë më të lehta për t'u ruajtur dhe përpunuar sesa imazhet që kanë shumë nivele ndriçimi.

Gjëja më e vështirë në lidhje me pragun është vetë procesi i përcaktimit të pragut. Pragu shpesh shkruhet si funksion i formës:

ku është imazhi dhe është disa karakteristikë e pikës së imazhit, për shembull, ndriçimi mesatar në lagjen e përqendruar në këtë pikë.

Nëse vlera e pragut varet vetëm nga, domethënë e njëjtë për të gjitha pikat e imazhit, atëherë një prag i tillë quhet global. Nëse pragu varet nga koordinatat hapësinore, atëherë një prag i tillë quhet lokal. Nëse varet nga karakteristikat, atëherë një prag i tillë quhet adaptiv. Kështu, përpunimi konsiderohet global nëse zbatohet për të gjithë imazhin në tërësi, dhe lokal nëse zbatohet në një zonë të caktuar të zgjedhur.

Përveç dallimeve të listuara midis algoritmeve, ka shumë më tepër metoda. Shumë prej tyre janë thjesht një kombinim i të tjerëve, por shumica e tyre, në një mënyrë ose në një tjetër, bazohen në analizën e histogramit të imazhit origjinal, megjithatë, ka qasje thelbësore të tjera që nuk ndikojnë drejtpërdrejt në analizën e histogrameve ose kalohet prej tyre në analizën e disa funksioneve të tjera.

5.5.2 Metodat për zonat e rritjes

Metodat e këtij grupi bazohen në përdorimin e veçorive të imazhit lokal. Ideja e metodës së rritjes së zonës është që fillimisht të analizohet pika e fillimit, pastaj pikat fqinje të saj, etj. në përputhje me disa kritere të homogjenitetit, dhe përfshirjen pasuese të pikave të analizuara në një grup ose në një tjetër (numri i pikave fillestare duhet të jetë i barabartë me numrin e zonave homogjene në imazh). Versionet më efikase të metodës nuk përdorin piksele individuale si pikënisje, por e ndajnë imazhin në një numër zonash të vogla. Më pas çdo zonë kontrollohet për uniformitet dhe nëse rezultati i testit është negativ, zona përkatëse ndahet në seksione më të vogla. Procesi vazhdon derisa të gjitha zonat e përzgjedhura të kalojnë testin e homogjenitetit. Pas kësaj, formimi i zonave homogjene fillon duke përdorur zgjatime.

Segmentimi i pragut dhe segmentimi i bazuar në kriterin e homogjenitetit bazuar në ndriçimin mesatar shpesh nuk japin rezultatet e dëshiruara. Ky segmentim zakonisht rezulton në një numër të konsiderueshëm rajonesh të vogla që nuk kanë prototipe reale në imazh. Rezultatet më efektive fitohen nga segmentimi bazuar në kriterin e homogjenitetit bazuar në teksturën (ose veçoritë e teksturës).

5.5.3 Përvijimi

Nuk është e pazakontë të hasësh problemin e gjetjes së perimetrit, lakimit, faktorëve të formës, sipërfaqes specifike të objekteve, etj. Të gjitha detyrat e listuara lidhen në një mënyrë ose në një tjetër me analizën e elementeve konturore të objekteve.

Metodat për identifikimin e kontureve (kufijve) në një imazh mund të ndahen në klasat kryesore të mëposhtme:

metodat e filtrimit me kalim të lartë;

metodat e diferencimit hapësinor;

Metodat e përafrimit funksional.

E zakonshme për të gjitha këto metoda është tendenca për të konsideruar kufijtë si një zonë e ndryshimit të mprehtë në funksionin e ndriçimit të imazhit; Ajo që i dallon është modeli i prezantuar matematik i konceptit të kufirit dhe algoritmi për kërkimin e pikave kufitare.

Në përputhje me detyrat e caktuara, kërkesat e mëposhtme vendosen në algoritmet e nxjerrjes së kontureve: konturet e zgjedhura duhet të jenë të holla, pa thyerje dhe të mbyllura. Kështu, procesi i identifikimit të kontureve është disi i ndërlikuar për shkak të nevojës për të aplikuar algoritme për rrallimin dhe eliminimin e boshllëqeve. Sidoqoftë, kjo nuk jep gjithmonë rezultatin e dëshiruar - në shumicën e rasteve, konturet nuk janë të mbyllura dhe, si rezultat, të papërshtatshme për një numër procedurash analize.

Problemi që ka lindur mund të zgjidhet duke konturuar me një algoritëm të gjurmimit të skajeve duke përdorur metodën "bug", e cila ju lejon të nënvizoni konturet e mbyllura të objekteve. Thelbi i algoritmit është si më poshtë: një pikë e caktuar kufitare fillestare zgjidhet në objekt dhe kontura gjurmohet në mënyrë sekuenciale derisa të arrihet pika e fillimit. Në rastin e gjurmimit të konturit në drejtim të akrepave të orës, për të arritur në pikën fillestare, kryhet një lëvizje piksel pas piksel në të djathtë nëse piksel është jashtë objektit dhe në të majtë nëse është në objekt.

Kontura e zgjedhur në këtë mënyrë është një kod zinxhir i mbyllur, d.m.th. një sekuencë koordinatash të pikave kufitare të një objekti, e cila është shumë e përshtatshme për zgjidhjen e problemeve të caktuara.

5.5.4 Metodat e bazuara në grupim

Metoda K-means është një metodë përsëritëse që përdoret për të ndarë një imazh në grupe K. Algoritmi bazë është dhënë më poshtë:

1. Zgjidhni qendrat e grupimit K, rastësisht ose bazuar në disa heuristika;

2. Vendosni çdo piksel imazhi në një grup, qendra e të cilit është më afër këtij piksel;

3. Rillogaritni qendrat e grupimit duke matur mesatarisht të gjithë pikselët në grup;

4. Përsëritni hapat 2 dhe 3 deri në konvergjencë (për shembull, kur pikselët mbeten në të njëjtin grup).

Këtu, distanca zakonisht merret si shuma e katrorëve ose vlerave absolute të dallimeve midis pikselit dhe qendrës së grupimit. Dallimi zakonisht bazohet në ngjyrën, shkëlqimin, strukturën dhe vendndodhjen e pikselit, ose një shumë të ponderuar të këtyre faktorëve.

K mund të zgjidhet manualisht, rastësisht ose heuristike.

Ky algoritëm është i garantuar të konvergojë, por mund të mos rezultojë në një zgjidhje optimale.

Cilësia e zgjidhjes varet nga grupi fillestar i grupimeve dhe vlera e K.

5.5.5 Metodat e histogramit

Metodat e bazuara në histogram janë shumë efektive kur krahasohen me metodat e tjera të segmentimit të imazhit, sepse ato kërkojnë vetëm një kalim përmes pikselëve. Në këtë metodë, një histogram llogaritet mbi të gjitha pikselat në imazh dhe minimumi dhe maksimumi i tij përdoren për të gjetur grupime në imazh. Ngjyra ose shkëlqimi mund të përdoren në krahasim.

Një përmirësim në këtë metodë është aplikimi i saj në mënyrë rekursive në grupimet në imazh në mënyrë që t'i ndajmë ato në grupime më të vogla. Procesi përsëritet me grupe gjithnjë e më të vogla derisa të mos shfaqen grupime të reja.

Një pengesë e kësaj metode është se mund të ketë vështirësi në gjetjen e minimumeve dhe maksimumeve të rëndësishme në imazh. Në këtë metodë të klasifikimit të imazheve, metrika e distancës dhe përputhja e rajonit të integruar janë të ngjashme.

Qasjet e bazuara në histogram gjithashtu mund të përshtaten shpejt nëpër korniza të shumta duke ruajtur avantazhin e tyre të shpejtësisë në një kalim të vetëm. Një histogram mund të ndërtohet në disa mënyra kur merren parasysh korniza të shumta. E njëjta qasje që përdoret për një kornizë mund të zbatohet për disa, dhe pasi të kombinohen rezultatet, uljet dhe lartësitë që ishin të vështira për t'u izoluar bëhen më të dukshme. Një histogram mund të aplikohet gjithashtu në bazë për piksel, ku informacioni përdoret për të përcaktuar ngjyrën më të zakonshme për një pozicion të caktuar piksel. Kjo qasje përdor segmentimin e bazuar në objektet në lëvizje dhe mjediset e palëvizshme, gjë që ofron një lloj tjetër segmentimi të dobishëm në ndjekjen e videos.

5.5.6 Metodat për zonat e rritjes

E para ishte metoda e rritjes së sipërfaqeve nga farat. Kjo metodë merr imazhe dhe një grup farash si hyrje. Farat shënojnë objektet për t'u theksuar. Rajonet gradualisht rriten duke krahasuar të gjithë pikselët fqinjë të pabanuar me rajonin. Diferenca d midis shkëlqimit të pikselit dhe ndriçimit mesatar të rajonit përdoret si masë e ngjashmërisë. Pikseli me diferencën më të vogël të tillë i shtohet zonës përkatëse. Procesi vazhdon derisa të gjithë pikselët të shtohen në një nga rajonet.

Metoda e rritjes së sipërfaqeve nga farat kërkon të dhëna shtesë. Rezultati i segmentimit varet nga zgjedhja e farave. Zhurma në imazh mund të shkaktohet nga farat e vendosura keq. Metoda e rritjes së rajoneve pa përdorur fara është një algoritëm i modifikuar që nuk kërkon fara të qarta. Fillon me një rajon - piksel i zgjedhur këtu ka pak efekt në segmentimin përfundimtar. Në çdo përsëritje, ai merr në konsideratë pikselët fqinjë në të njëjtën mënyrë si metoda e rritjes së rajonit duke përdorur farat. Por aty ndryshon, që nëse minimumi nuk është më i vogël se pragu i specifikuar, atëherë ai shtohet në zonën e duhur. Përndryshe, piksel konsiderohet shumë i ndryshëm nga të gjitha rajonet aktuale dhe krijohet një rajon i ri që përmban këtë piksel.

Një variant i kësaj metode bazohet në përdorimin e shkëlqimit të pikselit. Mesatarja dhe varianca e rajonit dhe shkëlqimi i pikselit kandidat përdoren për të ndërtuar statistikat e testit. Nëse statistika e testit është mjaft e vogël, atëherë piksel i shtohet rajonit dhe mesatarja dhe varianca e rajonit rillogariten. Përndryshe, piksel injorohet dhe përdoret për të krijuar një rajon të ri.

5.5.7 Metodat e prerjes së grafikut

Metodat e prerjes së grafikut mund të aplikohen në mënyrë efektive për segmentimin e imazhit. Në këto metoda, një imazh përfaqësohet si një grafik i padrejtuar i peshuar. Në mënyrë tipike, një piksel ose grup pikselësh shoqërohet me një kulm dhe peshat e skajeve përcaktojnë ngjashmërinë ose mosngjashmërinë e pikselëve fqinjë. Më pas, grafiku pritet sipas një kriteri të krijuar për të marrë grupime "të mira". Çdo pjesë e kulmeve (pikselave) të prodhuara nga këto algoritme konsiderohet një objekt në imazh.

5.5.8 Segmentimi i pellgut ujëmbledhës

Në segmentimin e pellgut ujëmbledhës, imazhi konsiderohet si një hartë e zonës, ku vlerat e shkëlqimit përfaqësojnë vlerat e lartësisë në lidhje me një nivel të caktuar. Nëse kjo zonë është e mbushur me ujë, atëherë formohen pishina. Kur mbushen më tej me ujë, këto pishina kombinohen. Vendet ku bashkohen këto pellgje janë shënuar si vija ujëmbledhëse.

Në këtë interpretim, merren parasysh tre lloje pikash:

1. Minimumi lokal;

2. pika të vendosura në një shpat, d.m.th. nga i cili uji rrokulliset poshtë në të njëjtin minimum lokal;

3. pikët maksimale lokale, d.m.th. nga e cila uji rrokulliset në më shumë se një minimum.

Ndarja e objekteve prekëse në një imazh është një nga problemet e rëndësishme të përpunimit të imazhit. Shpesh për zgjidhjen e këtij problemi përdoret e ashtuquajtura metodë e pellgut ujëmbledhës shënues. Transformimet që përdorin këtë metodë duhet të identifikojnë "pellgjet ujëmbledhëse" dhe "vijat e pellgut ujëmbledhës" në imazh duke përpunuar zonat lokale në varësi të karakteristikave të tyre të ndriçimit.

Metoda e pellgut ujëmbledhës të markerit është një nga metodat më efektive të segmentimit të imazhit.

Gjatë zbatimit të kësaj metode, kryhen procedurat e mëposhtme themelore:

1. Llogaritet funksioni i segmentimit. Bëhet fjalë për imazhet ku objektet ndodhen në zona të errëta dhe janë të vështira për t'u parë.

2. Llogaritja e shënuesve në plan të parë të imazheve. Ato llogariten bazuar në një analizë të lidhjes së pikselëve të secilit objekt.

3. Llogaritja e shënuesve të sfondit. Ato përfaqësojnë piksele që nuk janë pjesë e objekteve.

4. Modifikimi i funksionit të segmentimit bazuar në vlerat e vendndodhjes së shënuesve të sfondit dhe shënuesve në plan të parë.

Një nga aplikimet më të rëndësishme të segmentimit sipas pellgjeve ujëmbledhëse është zgjedhja e objekteve me shkëlqim uniform (në formën e pikave) nga sfondi i një imazhi. Zonat e karakterizuara nga ndryshime të vogla në shkëlqim kanë vlera të vogla gradienti. Prandaj, në praktikë, shpesh ndodh një situatë kur metoda e segmentimit të pellgut ujëmbledhës zbatohet jo për vetë imazhin, por për gradientin e tij.

6. Përshkrimi i funksioneve

Ky punim paraqet një algoritëm të segmentimit të imazhit duke përdorur metodën e pellgut ujëmbledhës shënues.

Funksionet kryesore të përdorura gjatë krijimit të një programi:

Funksioni fspecial krijon një filtër dydimensional të llojit të specifikuar;

Funksioni i imfilterit është një operacion morfologjik për krijimin e një imazhi gradient;

Funksioni i ujëmbledhësit konverton një pellg ujëmbledhës nga një imazh;

Funksioni label2rgb konverton imazhin origjinal në shkallë gri;

Funksioni imregionalmax përcakton të gjitha maksimat lokale të imazhit;

Funksioni imextendedmin gjen pika "të ulëta" në imazh që shtrihen më thellë se një nivel i caktuar pragu në krahasim me mjedisin e tyre të afërt;

Funksioni imimposemin modifikon imazhin në shkallë gri në mënyrë që minimumet lokale të arrihen vetëm në pozicionet e shënuara; vlerat e tjera të pikselit rriten për të eliminuar të gjitha pikat e tjera minimale lokale;

Funksionet rindërtojnë dhe plotësojnë - rindërtimi i imazhit duke përdorur operacionet morfologjike të hapjes (mbylljes.)

7. Testimi i algoritmit

Gjatë zbatimit të kësaj metode, u kryen procedurat e mëposhtme:

1. Lexoni imazhin dhe kthejeni atë në shkallë gri (Figura 1);

Figura 1. Imazhe origjinale (majtas) dhe gjysmëtone (djathtas).

2. Ne përdorim vlerat e gradientit si funksion segmentimi (Figura 2);

Figura 2. Vlerat e gradientit.

3. Kryejmë operacione morfologjike në imazh (Figura 3);

Figura 3. Rezultati i aplikimit të operacioneve morfologjike hapje-mbyllje përmes rindërtimit të imazhit.

4. Llogaritni shënuesit e planit të parë dhe të sfondit të figurës (Figura 4);

Figura 4. Shenjat e planit të parë (majtas) dhe sfondit (djathtas) të një imazhi.

5. Ndërtojmë kufijtë e pellgjeve ujëmbledhëse (Figura 5);

Figura 5. Kufijtë e pellgut ujëmbledhës.

6. Shfaq shënuesit dhe kufijtë e objekteve në një imazh gjysmëton (Figura 6);

Figura 6. Shënuesit dhe kufijtë e objekteve.

7. Shfaqni rezultatin e segmentimit duke përdorur një imazh me ngjyra (majtas) dhe duke përdorur një modalitet gjysmë transparent (djathtas).

Figura 7 Rezultatet e segmentimit.

konkluzioni

Në këtë punim, është zhvilluar një metodë e pellgut ujëmbledhës shënues për segmentimin e imazhit.

Zbatimi i drejtpërdrejtë i algoritmit të segmentimit të pellgut ujëmbledhës rezulton në segmentim të tepërt, kështu që një qasje e bazuar në shënues përdoret për të menaxhuar segmentimin e tepërt.

Një shënues përfaqëson një komponent të lidhur që i përket një imazhi. Gjithashtu, para segmentimit sipas pellgjeve ujëmbledhëse, është kryer parapërpunimi i nevojshëm i imazhit.

Lista e burimeve të përdorura

1. Gonzalez R., Woods R. Përpunimi dixhital i imazhit. - M.: Tekhnosferë, 2005. 1072 f.

2. Pratt W. Përpunimi dixhital i imazhit. - M.: Mir, libri 1, 1982. 312 f.

3. Yaroslavsky L.P. Hyrje në përpunimin dixhital të imazhit. - M: Sov. radio, 1979. 312 f.

4. Pratt W. Përpunimi dixhital i imazhit. - M: Paqe, libër. 1, 1982. 480 f.

5. http://www.ict.edu.ru/lib/

6. http://matlab.exponenta.ru/imageprocess/book2/76.php

7. Vizilter Yu.V. Përpunimi dhe analiza e imazheve dixhitale me shembuj në LabVIEW dhe IMAQ Vision. - M: DMK, 2011. 464 f.

8. Gonzalez R., Woods R., Eddins S. Përpunimi dixhital i imazhit në MATLAB. - M: Teknosferë, 2006. 616 f.

9. http://matlab.exponenta.ru/imageprocess/book2/48.php

10. Salomon D. Kompresimi i të dhënave, imazheve dhe zërit. - M.: Tekhnosferë, 2004. 368 f.

Aplikacion

Ne numërojmë imazhin

rgb=imread("C:\Users\Name\Documents\MATLAB\picture1.jpeg");

Le ta imagjinojmë atë si një gjysmëton

I=rgb2gray(rgb);figura,imshow(I);

Llogaritni vlerën e gradientit

hy=fspecial("sobel"); hx=hy";

Iy=imfilter(double(I), hy, "replikoj");

Ix=imfilter(double(I), hx, "replicate");

gradmag=sqrt(Ix.^2+Iy.^2);

Le të zbatojmë metodën e pellgut ujëmbledhës

L=pellgu ujëmbledhës(gradmag);Lrgb=label2rgb(L);

Operacionet morfologjike

se = strel("disk",15);

Ie = imerode(I, se);Iobr = imreconstruct(dmth., I);

Iobrd = imdilate(Iobr, se);

Iobrcbr = rindërtoj(përfundoj(Iobrd), plotësoj(Iobr));

Iobrcbr = plotësoj(Iobrcbr);

Le të llogarisim maksimumin lokal

fgm = imregionalmax(Iobrcbr);

Le të vendosim shënues në imazh

I2 = I;I2(fgm) = 255;

Heqja e pikselëve individualë të izoluar

se2 = strel(ones(3,3));fgm2 = imclose(fgm, se2);fgm3 = imerode(fgm2, se2);

Hiqni një numër të caktuar pikselësh

fgm4 = bwareaopen(fgm3, 20);

Mbivendosni atë në imazhin origjinal

I3 = I;I3(fgm4) = 255;

Le të llogarisim shënuesit e sfondit

bw = im2bw(Iobrcbr, graythresh(Iobrcbr));

Matja e distancës në vijën e pellgut ujëmbledhës

D = bwdist(bw);DL = pellgu ujëmbledhës(D);bgm = DL == 0;

figura, imshow (bgm), titull ("bgm");

Rregullimi i vlerës së gradientit

gradmag2 = imimposemin(gradmag, bgm | fgm4);

L = pellgu ujëmbledhës(gradmag2);

Aplikoni shënuesit dhe kufijtë e objekteve në imazhin burimor

I4 = I;I4(përmirësohem(L == 0, ato(3, 3)) | bgm | fgm4) = 255;

Shfaqni rezultatin duke përdorur një imazh me ngjyra

Lrgb = label2rgb(L, "jet", "w", "përzierje");

Le të aplikojmë shënues dhe kufijtë e objekteve në një imazh të tejdukshëm

figura, tregoj(unë), mbaj

himage = imshow(Lrgb);

set(image, "AlphaData", 0.3);

titulli ("Lrgb2");

Postuar në Allbest.ru

...

Dokumente të ngjashme

Sistemet radiografike dixhitale. Metodat për analizën automatike të imazhit në mjedisin MatLab. Analiza e imazhit me rreze X. Filtrimi, segmentimi, përmirësimi i imazhit. Aftësitë e harduerit për normalizimin paraprak të imazhit.

puna e kursit, shtuar 12/07/2013

Zgjedhja e metodave të përpunimit dhe segmentimit të imazhit. Baza matematikore e filtrave të aplikuar. Histogrami i ndriçimit të imazhit. Zbatimi i softuerit të një metode komplekse të përpunimit të imazhit. Testimi i softuerit të zhvilluar.

puna e kursit, shtuar 18.01.2017

Studimi dhe zbatimi i softuerit në mjedisin Matlab të metodave për përpunimin, analizën, filtrimin, segmentimin dhe përmirësimin e cilësisë së imazheve mjekësore me rreze X. Sistemet radiografike dixhitale. Zhvillimi i algoritmeve me bazë statike.

puna e kursit, shtuar 20.01.2016

Sisteme moderne për analizën e teksturës së imazheve. Shembuj të segmentimit të teksturës së imazheve me një kanal. Përdorimi i veçorive të marra nga një histogram i ndriçimit të rendit të dytë për klasifikimin e fotografive ajrore spektrozonale.

abstrakt, shtuar më 15.01.2017

Grafika kompjuterike dhe përpunimi i imazheve nga kompjuterët elektronikë janë aspekti më i rëndësishëm i përdorimit të kompjuterëve në të gjitha sferat e veprimtarisë njerëzore. Zhvillimi i një “nënsistemi të segmentimit linear”, përshkrimi i algoritmit dhe logjikës.

tezë, shtuar 23.06.2008

Problemet e përpunimit dixhital të imazhit. Metodat e segmentimit të pragut. Krijimi i një programi për paraqitjen e një vizatimi në formën e një matrice dhe aplikimi i përpunimit të pragut në të. Zhvillimi i një ndërfaqeje për një program për ngarkimin dhe filtrimin e imazheve me një prag të zgjedhur.

puna e kursit, shtuar 11/12/2012

Përshkrimi i metodave matematikore për paraqitjen dhe përpunimin e imazheve grafike. Përshkrimi i shtesës së softuerit të zhvilluar. Përshkrimi i funksioneve dhe atributet e tyre. Prezantimi dhe përpunimi i imazheve grafike. Rezultatet e testimit të programit.

puna e kursit, shtuar 27.01.2015

Problemi i përpunimit hapësinor të imazhit në prani të zhurmës dhe ndërhyrjes. Metodat e optimizimit për përpunimin hapësinor të imazhit. Struktura e një programi të specializuar, një përshkrim i ndërfaqes së tij të përdoruesit. Vlerësimi i kostos.

tezë, shtuar 06/10/2013

Zbulimi i detajeve dhe kufijve të tyre në një imazh. Zbatimi i algoritmeve të renditjes. Përdorimi i algoritmeve të kuantizimit të modalitetit adaptiv në mënyrën e përpunimit fragment pas fragmenti. Filtrim i përgjithshëm linear i imazhit. Restaurimi i zonave të munguara.

puna e kursit, shtuar 17.06.2013

Rishikimi i softuerit ekzistues për automatizimin e zgjedhjes së skajeve në një imazh. Zhvillimi i një modeli matematikor për përpunimin e imazhit dhe nxjerrjen e kontureve në shkallë gri dhe softuer për algoritmet e përpunimit të imazhit.

Segmentimi i Ujëmbledhës i Drejtuar

Shumë shpesh, kur analizohen imazhet, lind detyra e ndarjes së pikselëve të imazhit në grupe sipas karakteristikave të caktuara. Ky proces i ndarjes në grupe quhet segmentim. Më të njohurit janë dy lloje të segmentimit - segmentimi sipas shkëlqimit për imazhet binare dhe segmentimi sipas koordinatave të ngjyrave për imazhet me ngjyra. Metodat e segmentimit mund të konsiderohen si një zyrtarizim i konceptit të dallimit të një objekti nga sfondi ose konceptet që lidhen me një gradient ndriçimi. Algoritmet e segmentimit karakterizohen nga disa parametra të besueshmërisë dhe saktësisë së përpunimit. Ato varen nga sa plotësisht merren parasysh karakteristikat shtesë të shpërndarjes së shkëlqimit në zonat e objekteve ose sfondit, numri i ndryshimeve të shkëlqimit, forma e objekteve, etj.

Ka shumë imazhe që përmbajnë objektin e interesit me një shkëlqim mjaft uniform në një sfond me shkëlqim të ndryshëm. Shembujt përfshijnë tekstin e shkruar me dorë, një seri imazhesh mjekësore, etj. Nëse shkëlqimi i pikave të objektit ndryshon ndjeshëm nga shkëlqimi i pikave të sfondit, atëherë zgjidhja e problemit të vendosjes së një pragu është një detyrë e thjeshtë. Në praktikë, kjo nuk është aq e thjeshtë, pasi imazhi në studim i nënshtrohet zhurmës dhe lejohet disa ndryshime në vlerat e shkëlqimit. Ekzistojnë disa qasje analitike për kufirin e pragut të shkëlqimit. Një metodë është vendosja e pragut në një nivel të tillë që shuma totale e elementeve me ndriçim nënpragësh të jetë në përputhje me probabilitetet e mëparshme të atyre vlerave të ndriçimit.

Qasje të ngjashme mund të aplikohen për përpunimin e imazheve me ngjyra dhe spektrozonale. Ekziston edhe një lloj segmentimi i quajtur segmentimi i konturit. Shumë shpesh, analiza e imazhit përfshin operacione të tilla si marrja e konturit të jashtëm të imazheve të objekteve dhe regjistrimi i koordinatave të pikave në këtë kontur. Ekzistojnë tre qasje kryesore për përfaqësimin e kufijve të një objekti: përafrimi i kurbës, gjurmimi i konturit dhe lidhja e pikave të rënies. Për të përfunduar analizën, duhet theksuar se ekziston edhe segmentimi i teksturës dhe segmentimi i formës.

Lloji më i thjeshtë i segmentimit është segmentimi i pragut. Ka gjetur aplikim shumë të gjerë në robotikë. Kjo shpjegohet me faktin se në këtë zonë, imazhet e objekteve në studim, në pjesën më të madhe, kanë një strukturë mjaft uniforme dhe sfondi i tyre bie në sy. Por përveç kësaj, për përpunim të besueshëm, duhet të dini se imazhi përbëhet nga një objekt dhe një sfond, shkëlqimi i të cilit është në intervale rreptësisht të njohura dhe nuk kryqëzohet me njëri-tjetrin.

Zhvillimi i teknologjive të përpunimit të imazhit ka çuar në shfaqjen e qasjeve të reja për zgjidhjen e problemeve të segmentimit të imazhit dhe aplikimin e tyre në zgjidhjen e shumë problemeve praktike.

Në këtë punim, ne do të shqyrtojmë një qasje relativisht të re për zgjidhjen e problemit të segmentimit të imazhit - metodën e pellgut ujëmbledhës. Le të shpjegojmë shkurtimisht emrin e kësaj metode dhe cili është thelbi i saj.

Propozohet të konsiderohet imazhi si një hartë e zonës, ku vlerat e shkëlqimit përfaqësojnë vlerat e lartësisë në lidhje me një nivel të caktuar. Nëse kjo zonë është e mbushur me ujë, atëherë formohen pishina. Kur mbushen më tej me ujë, këto pishina kombinohen. Vendet ku bashkohen këto pellgje janë shënuar si vija ujëmbledhëse.

Metoda e pellgut ujëmbledhës të markerit është një nga metodat më efektive të segmentimit të imazhit. Gjatë zbatimit të kësaj metode, kryhen procedurat e mëposhtme themelore:

Llogaritet funksioni i segmentimit. Bëhet fjalë për imazhet ku objektet ndodhen në zona të errëta dhe janë të vështira për t'u parë.

Llogaritja e shënuesve në plan të parë të imazheve. Ato llogariten bazuar në një analizë të lidhjes së pikselëve të secilit objekt.

Llogaritja e shënuesve të sfondit. Ato përfaqësojnë piksele që nuk janë pjesë e objekteve.

Modifikimi i funksionit të segmentimit bazuar në vlerat e vendndodhjes së shënuesve të sfondit dhe shënuesve në plan të parë.

Llogaritjet e bazuara në një funksion segmentimi të modifikuar.

Në këtë shembull, funksionet më të përdorura të kutisë së veglave të përpunimit të imazhit janë fspecial, imfilter, ujëmbledhës, label2rgb, imopen, mbyll, imreconstruct, imcomplement, imregionalmax, bwareaopen, graythresh dhe imimposemin.

Hapi 1: Lexoni një imazh me ngjyra dhe kthejeni atë në shkallë gri.
Hapi 2: Përdorimi i vlerës së gradientit si funksion i segmentimit.
Hapi 3: Etiketimi i objekteve në plan të parë.
Hapi 4: Llogaritni shënuesit e sfondit.
Hapi 6: Vizualizimi i rezultatit të përpunimit.

Hapi 1: Lexoni një imazh me ngjyra dhe kthejeni atë në shkallë gri.

Lexojmë të dhënat nga skedari pears.png rgb=imread("pears.png"); dhe t'i paraqisni ato si një imazh gjysmëton. I=rgb2gri(rgb); imshow(I) text(732,501,"...",... "FontSize",7,"Horizontal Alignment","djathtas")

Hapi 2: Përdorimi i vlerës së gradientit si funksion i segmentimit.

Operatori Sobel, funksioni i imfilterit dhe llogaritje të tjera përdoren për të llogaritur vlerën e gradientit. Gradienti ka vlera të mëdha në kufijtë e objekteve dhe vlera të vogla (në shumicën e rasteve) jashtë kufijve të objekteve.

Hy=fspecial("sobel"); hx=hy"; Iy=imfilter(double(I), hy, "replicate"); Ix=imfilter(double(I), hx, "replicate"); gradmag=sqrt(Ix.^2+Iy.^2 Figura, imshow (gradmag,), titull ("vlera gradient")

Kështu, pasi të keni llogaritur vlerat e gradientit, mund të filloni të segmentoni imazhet duke përdorur metodën e konsideruar të pellgut ujëmbledhës të shënuesit.

L=pellgu ujëmbledhës(gradmag); Lrgb=label2rgb(L); figura, imshow (Lrgb), titull ("Lrgb")

Megjithatë, pa llogaritje të mëtejshme shtesë, një segmentim i tillë do të jetë sipërfaqësor.

Hapi 3: Etiketimi i objekteve në plan të parë.

Procedura të ndryshme mund të përdoren për të etiketuar objektet në plan të parë. Ky shembull do të përdorë teknologji morfologjike të quajtura "hapje përmes restaurimit" dhe "mbyllje përmes restaurimit". Këto operacione ju lejojnë të analizoni rajonin e brendshëm të objekteve të imazhit duke përdorur funksionin imregionalmax.

Siç u përmend më lart, gjatë shënimit të objekteve në plan të parë, përdoren gjithashtu operacione morfologjike. Le të shohim disa prej tyre dhe të krahasojmë. Së pari, ne zbatojmë operacionin e zgjerimit duke përdorur funksionin imopen.

Se=strel("disk", 20); Io=imopen(I, se); figura, tregoj (Io), titull ("Io")

Ie=imerode(I, se); Iobr=imrindërtoj(dmth, unë); figurë, imshow (Iobr), titull ("Iobr")

Operacionet e mëvonshme morfologjike të hapjes dhe mbylljes do të rezultojnë në lëvizjen e njollave të errëta dhe formimin e shënuesve. Le të analizojmë operacionet e mbylljes morfologjike. Për ta bërë këtë, së pari përdorni funksionin imclose:

Ioc=imclose(Io, se); figura, tregoj (Ioc), titull ("Ioc")

Iobrd=imdilate(Iobr, se); Iobrcbr=imrindërtoj(përfundoj(Iobrd), plotësoj(Iobr)); Iobrcbr=përfundoj(Iobrcbr); figura, imshow (Iobrcbr), titull ("Iobrcbr")

Një analizë krahasuese vizuale e Iobrcbr dhe Ioc tregon se rindërtimi i paraqitur bazuar në operacionet morfologjike të hapjes dhe mbylljes është më efektiv në krahasim me operacionet standarde të hapjes dhe mbylljes. Le të llogarisim maksimumin lokal të Iobrcbr dhe të marrim shënuesit e planit të parë.

Fgm=imregionalmax(Iobrcbr); figurë, imshow (fgm), titull ("fgm")

Le të aplikojmë shënuesit në plan të parë në imazhin origjinal.

I2=I; I2(fgm)=255; figura, imshow(I2), titulli ("fgm e mbivendosur mbi imazhin origjinal")

Vini re se disa objekte të fshehura ose të mbyllura në imazh nuk janë të shënuara. Kjo veti ndikon në formimin e rezultatit dhe shumë objekte të tilla imazhi nuk do të përpunohen nga pikëpamja e segmentimit. Kështu, shënuesit në plan të parë tregojnë vetëm kufijtë e shumicës së objekteve. Kufijtë e përfaqësuar në këtë mënyrë i nënshtrohen përpunimit të mëtejshëm. Në veçanti, këto mund të jenë operacione morfologjike.

Se2=strel(ones(5, 5)); fgm2=imclose(fgm, se2); fgm3=imerode(fgm2, se2);

Si rezultat i këtij operacioni, pikselët individualë të izoluar të imazhit zhduken. Ju gjithashtu mund të përdorni funksionin bwareaopen, i cili ju lejon të hiqni një numër të caktuar pikselësh.

Fgm4=bwareaopen(fgm3, 20); I3=I; I3(fgm4)=255; figura, titulli imshow(I3) ("fgm4 i mbivendosur në imazhin origjinal")

Hapi 4: Llogaritni shënuesit e sfondit.

Tani le të kryejmë operacionin e shënimit të sfondit. Në imazhin Iobrcbr, pikselët e errët i përkasin sfondit. Kështu, mund të zbatohet operacioni i pragut të imazhit.

Bw=im2bw(Iobrcbr, graythresh(Iobrcbr)); figura, tregoj (bw), titull ("bw")

Pixelat e sfondit janë të errët, por ne nuk mund të kryejmë thjesht operacione morfologjike në shënuesit e sfondit dhe të marrim kufijtë e objekteve që po segmentojmë. Ne duam të "hollojmë" sfondin në atë mënyrë që të marrim një skelet të vërtetë të imazhit, ose të ashtuquajturin plan të parë të imazhit gjysmëton. Kjo llogaritet duke përdorur një qasje të pellgut ujëmbledhës dhe bazuar në matjet e distancës (në vijat e pellgut ujëmbledhës).

D=bwdist(bw); DL=pellgu ujëmbledhës(D); bgm=DL==0; figura, tregoj (bgm), titull ("bgm")

Hapi 5: Llogaritja duke përdorur metodën e shënuesit të pellgut ujëmbledhës bazuar në funksionin e modifikuar të segmentimit.

Funksioni imimposemin mund të përdoret për të përcaktuar me saktësi minimumet lokale në një imazh. Bazuar në këtë, funksioni imimposemin mund të rregullojë gjithashtu vlerat e gradientëve në imazh dhe kështu të rafinojë vendndodhjen e shënuesve të planit të parë dhe të sfondit.

Gradmag2=imimposemin(gradmag, bgm | fgm4);

Së fundi, kryhet një operacion segmentimi i bazuar në pellgun ujëmbledhës.

L=pellgu ujëmbledhës(gradmag2);

Hapi 6: Vizualizimi i rezultatit të përpunimit.

Le të shfaqim shënuesit e mbivendosur në plan të parë, shënuesit e sfondit dhe kufijtë e objekteve të segmentuara në imazhin origjinal.

I4=I; I4(imdilate(L==0, ones(3, 3))|bgm|fgm4)=255; figura, imshow(I4) titulli ("Shënuesit dhe kufijtë e objekteve të mbivendosura mbi imazhin origjinal")

Si rezultat i këtij ekrani, ju mund të analizoni vizualisht vendndodhjen e shënuesve të planit të parë dhe të sfondit.

Është gjithashtu me interes të shfaqen rezultatet e përpunimit duke përdorur një imazh me ngjyra. Matrica që krijohet nga funksionet e basenit dhe bwlabel mund të konvertohet në një imazh me ngjyrë të vërtetë duke përdorur funksionin label2rgb.

Lrgb=label2rgb(L, "jet", "w", "përzier"); figura, imshow (Lrgb) titulli ("Lrgb")

Ju gjithashtu mund të përdorni modalitetin gjysmë transparent për të mbivendosur një matricë pseudo-ngjyrash të shenjave në krye të imazhit origjinal.

Figura, imshow(I), mbaj në himage=imshow(Lrgb); set(image, "AlphaData", 0.3); titull ("Lrgb i mbivendosur në imazhin origjinal në modalitetin gjysmë transparent")

Një nga detyrat kryesore të përpunimit dhe analizës së imazhit është segmentimi, d.m.th. ndarja e një imazhi në zona për të cilat plotësohet një kriter i caktuar homogjeniteti, për shembull, duke theksuar zonat me përafërsisht të njëjtin shkëlqim në imazh. Koncepti i një zone imazhi përdoret për të përcaktuar një grup koherent të elementeve të imazhit që kanë një veçori të përbashkët (veti).
Një nga mënyrat kryesore dhe më të thjeshta është ndërtimi i segmentimit duke përdorur një prag. Një prag është një shenjë (veti) që ndihmon në ndarjen e sinjalit të dëshiruar në klasa. Operacioni i ndarjes së pragut është të krahasojë vlerën e shkëlqimit të çdo piksel në imazh me një vlerë të caktuar të pragut.

Binarizimi

Operacioni i pragut që rezulton në një imazh binar quhet binarizimi. Qëllimi i operacionit të binarizimit është të zvogëlojë rrënjësisht sasinë e informacionit që përmban imazhi. Në procesin e binarizimit, imazhi origjinal i gjysmëtonit, i cili ka një numër të caktuar nivelesh ndriçimi, shndërrohet në një imazh bardh e zi, pikselët e të cilit kanë vetëm dy vlera - 0 dhe 1.

Pragu i një imazhi mund të bëhet në mënyra të ndryshme.

Binarizimi me prag më të ulët

Binarizimi me prag më të ulët
Binarizimi me një prag më të ulët është operacioni më i thjeshtë, i cili përdor vetëm një vlerë pragu:

Të gjitha vlerat në vend të kriterit bëhen 1, në këtë rast 255 (e bardhë) dhe të gjitha vlerat (amplitudat) e pikselave që janë më të mëdha se pragu t - 0 (e zezë).

Pragu lokal