Kako podesiti pametne telefone i računare. Informativni portal
  • Dom
  • Programi
  • Kutija alata za obradu slike. Kratki tečaj teorije obrade slike

Kutija alata za obradu slike. Kratki tečaj teorije obrade slike

Segmentacija slike

Segmentacija uspostavlja karakteristične podskupove piksela ili dijeljenje slike na povezane regije, od kojih je svaka u nekom smislu “homogena”. Procesi segmentacije i ekstrakcije karakteristika mogu se posmatrati kao dodeljivanje oznaka pikselima koje definišu posebne klase kojima ovi pikseli pripadaju. Dakle, izlaz procesa segmentacije je simbolična slika u kojoj su vrijednosti piksela oznake, a ne nivoi svjetline.

Klasifikacija modela slike

Za segmentaciju slika koristi se jedan ili drugi model koji daje više ili manje adekvatan opis stvarnih slika. Postoje dvije glavne klase modela slike: statistički i prostorni. Statistički modeli opisuju kolekciju tačaka ili regiona slike. Prostorni modeli opisuju dekompoziciju slike na njene sastavne dijelove ili regije.

Statistički modeli prvog reda opisuju kolekciju pikselnih elemenata slike bez obzira na njihovu lokaciju u prostoru. Najjednostavniji opis ovog tipa je gustina vjerovatnoće distribucije vrijednosti svjetline, koja se izračunava pomoću histograma vrijednosti svjetline. Često se vjeruje da je gustoća vjerojatnosti distribucije vrijednosti stvarne slike aproksimirana nekim standardom, na primjer, Gaussovom funkcijom gustoće vjerojatnosti ili mješavinom takvih funkcija.

Modeli prvog reda ne uzimaju u obzir da se slika sastoji od bilo kakvih koordiniranih dijelova (elementa teksture, objekata, itd.). Međusobni raspored elemenata u prostoru uzima se u obzir modelima skupova slikovnih tačkastih elemenata višeg reda. Jedan od modela je matrica susjedstva vrijednosti luma, čiji elementi predstavljaju frekvencije parova vrijednosti luma na odabranom ofsetu. U praksi se vrijednost pomaka bira dovoljno mala, jer s velikim pomakom vrijednosti svjetline postaju nezavisne jedna od druge.

Druga metoda za opisivanje prostornih odnosa između elemenata piksela slike je razmatranje gustoće vjerovatnoće distribucije vrijednosti lokalnog obilježja, što je često efikasnije od korištenja gustoće vjerovatnoće distribucije vrijednosti svjetline višeg reda. . Posebno su korisne u segmentaciji slike lokalne karakteristike zbog prisutnosti rubova, na primjer, vrijednosti različitih diferencijalnih operatora za mjerenje gradijenta svjetline.

Statistički modeli slike također uključuju modele slučajnih polja i vremenskih serija, koji se uglavnom koriste u modeliranju teksture.

Prostorni modeli opisuju sliku u terminima regiona. Slika se može predstaviti kao kolekcija objekata u pozadini, raščlanjenih na regije na neki pravilan ili nasumičan način, kao model oblika regiona. Prostorni modeli općenito dozvoljavaju da se iz slike izdvoji više informacija nego modeli statistike raspodjele svjetline. Međutim, do sada se koriste samo prilično jednostavni modeli, a njihov matematički aparat zahtijeva daljnji razvoj.

Segmentacija slike pragom

Najjednostavniji i najčešće korišteni metod segmentacije slike je prag. U brojnim standardnim metodama za izdvajanje dijelova slike po pragu, vrijednosti praga se određuju direktno iz histograma slike (statistički model slike prvog reda). Istorijski gledano, prva metoda u ovoj grupi metoda je mod metoda. Metoda proizilazi iz pretpostavke da slika sadrži poznati broj klasa tačaka homogenih po svjetlini. Osim toga, vjeruje se da granična područja između zatvorenih područja zauzimaju relativno malu površinu slike. Stoga bi na histogramu trebali odgovarati međumodnim dolinama, unutar kojih su postavljeni pragovi segmentacije.

Međutim, stvarne slike se ne uklapaju dobro sa napravljenim pretpostavkama. U pravilu su granice između područja zamagljene, a modalna struktura histograma nedovoljno izražena. Osim toga, čak i kada histogram ima vidljive modove, njegova korita mogu biti toliko široka i ravna da je teško locirati dno korita.

Ako stvarna slika ne ispunjava uslove mod metode, primjenjuju se sljedeća četiri pristupa. Prvo, poboljšanje histograma, uključujući na osnovu lokalnih svojstava slike koristeći informacije o gradijentu, statistiku drugog reda, analizu zakrivljenosti funkcije kumulativne distribucije. Drugo, aproksimacija histograma mješavinom normalnih distribucija i korištenje statističkih metoda za optimalno odvajanje ove mješavine. Nedostatak ovog pristupa je velika računska složenost; štaviše, Gaussov često slabo aproksimira realne modove. Treće, uvođenje empirijske mjere kvaliteta segmentirane slike i maksimizacija odgovarajuće funkcije kriterija - diskriminantni pristup, entropijski pristup, pristup momentu itd. Četvrto, prelazak na korištenje drugih statistika za izbor praga, posebno izbor praga direktno prema lokalnim karakteristikama. Upotreba lokalnih karakteristika omogućava segmentiranje složenih stvarnih slika višeg kvaliteta.

Analiza histograma daje zadovoljavajući kvalitet segmentacije onih slika koje se sastoje od područja ujednačene svjetline. Međutim, pri odabiru malih objekata na složenoj pozadini, tačke objekata ne pokazuju vidljive vrhove u histogramu svjetline. Stoga se koristi obrada s promjenjivim pragom: za male fragmente slike izrađuju se histogrami koji se provjeravaju na bimodalnost, a pronađeni lokalni pragovi se interpoliraju na ostatak slike.

Određeni broj algoritama zasnovanih na diskriminantnoj analizi je predložen u radovima Ost. Neka G={0,1,...,L) - moguće vrijednosti svjetline slike. Prag dijeli distribuciju vrijednosti svjetline slike u dvije klase C 0={0,1,...,t) i C 1={t+1,t+2,...,L}, tÎ G... Optimalni prag t* definisano kao

gdje je varijansa distribucije vrijednosti svjetline slike u cjelini, w0 je vjerovatnoća da slučajna tačka pripada pozadini, https://pandia.ru/text/80/299/images/image004_46 .gif "width =" 21 "height =" 24 " > - prosječan nivo svjetline pozadine (klasa C 0).

Ako se područja objekta i pozadine oštro razlikuju jedno od drugog, histogram funkcije kriterija može biti multimodalan. Stoga je potrebno odrediti sve lokalne vrhove, što ozbiljno smanjuje konkurentnost metode.

Entropijski kriterijum za izbor optimalnog praga. Koristeći ranije uvedene definicije, histogram vrijednosti svjetline može se smatrati kao L-simbolički izvor informacija sa entropijom

,

gdje pi Je vjerovatnoća svjetline sa vrijednošću i.

Entropija izvora je zbir entropije objekta H 0 i pozadinska entropija H 1, a optimalni prag treba da daje maksimalnu vrijednost ove sume:

, (2)

pri čemu .

Pošto svaki od pojmova H 0 i H 1 karakterizira uniformnost raspodjele svjetline u odgovarajućim intervalima i naglo se smanjuje kada "vanzemaljski" fragment histograma padne u ovaj interval, maksimum entropijskog kriterija odgovarat će najboljoj opciji segmentacije. Nedostatak ove metode je što funkcija kriterija može imati nekoliko maksimuma bliskih vrijednosti.

Za razliku od diskriminantnog pristupa, metoda očuvanja momenta uvodi sve momente slike do (2 k+1) narudžba uključuje:

.

Smatra se da optimalni prag osigurava jednakost odgovarajućih momenata segmentirane i originalne slike. Međutim, ako k> 3, onda postoje poteškoće povezane s nedostatkom analitičkog rješenja problema.

Prelazak sa izbora praga prema histogramu svjetline na korištenje drugih statistika, nesumnjivo, komplikuje algoritme segmentacije, ali omogućava bolju segmentaciju složenih slika. Za odabir objekata male veličine, izgleda obećavajuće odabrati prag direktno iz lokalnih svojstava tačaka slike.

Metoda maksimalnog prosječnog kontrasta. Metoda se zasniva na jednostavnom heurističkom određivanju optimalnog praga: optimalnim pragom za segmentaciju slike smatra se prag koji razlikuje više visokog kontrasta i manje niskokontrastnih razlika u svjetlini od bilo kojeg drugog praga. Kvantitativni izraz kriterija je prosječni kontrast svih razlika u svjetlini dodijeljenih ovim pragom. Prag koji odgovara maksimalnom prosječnom kontrastu je optimalan. Ako su dvije susjedne tačke X 1=(X 1,y 1) i X 2=(x 2,y 2) imaju vrijednosti svjetline f(X 1) i f(X 2) (bez gubitka općenitosti f(X 1) £ f(X 2)), zatim broj padova dodijeljen pragom t, jednako:

gdje

Potpuni kontrast koji odgovara pragu t, jednako je:

gdje je DIV_ADBLOCK169 ">

. (3)

Na osnovu matrica susjedstva vrijednosti svjetline koje je predložio Haralik, razmatra se sljedeća metoda segmentacije. Za sliku, matrice zajedničkog izgleda nivoa svjetline parova susjednih tačaka u horizontali P 1.0 i vertikalno P 1,90 smjerova, kao i ukupna prijelazna matrica veličine ( L+1) ´ ( L+1):

Pvh=P 1,0 +P 1,90.

Proizvoljan prag t dijeli tačke slike u dvije klase WITH 0 i WITH 1, a prijelazna matrica - za 4 bloka.

1

Razmatraju se matematičke metode segmentacije slike Dicom standarda. Razvijaju se matematičke metode Dicom segmentacije slike za probleme prepoznavanja medicinskih slika. Dijagnoza bolesti zavisi od kvalifikacija istraživača i zahteva od njega vizuelnu segmentaciju, a matematičke metode za obradu rasterskih slika su alat za ovu dijagnozu. Obrada medicinskih slika dobijenih hardverom bez preliminarne obrade grafičkih podataka u većini slučajeva daje netačne rezultate. Provedene su procedure za isticanje kontura objekata Canny metodom i dodatni algoritmi za obradu rasterskih slika. Rezultati istraživanja omogućavaju da se izračunaju morfometrijska, geometrijska i histogramska svojstva formacija u ljudskom tijelu, neophodna za dalje liječenje pacijenta, te da se obezbijedi efikasan medicinski tretman. Razvijeni principi kompjuterski potpomognute analize medicinskih slika efikasno se koriste za operativne zadatke medicinske dijagnostike specijalizovane onkološke ustanove, kao i u obrazovne svrhe.

prepoznavanje uzoraka

segmentacija objekata od interesa

medicinske slike

1. Vlasov A.V., Tsapko I.V. Modifikacija Cannyjevog algoritma primijenjena na obradu rendgenskih slika // Bilten nauke Sibira. - 2013. - br. 4 (10). - S. 120-127.

2. Gonzales R., Woods R. Digitalna obrada slike. - M.: Tehnosfera, 2006.-- S. 1072.

3. Kuljabičev Yu.P., Pivtoratskaya S.V. Strukturni pristup izboru karakteristika u sistemima za prepoznavanje uzoraka // Prirodne i tehničke znanosti. - 2011. - br. 4. - Str. 420–423.

4. Nikitin OR, Pasečnik A.S. Konturiranje i segmentacija u zadacima automatizirane dijagnostike patologija // Metode i uređaji za prijenos i obradu informacija. - 2009. - br. 11. - P. 300–309.

5. Canny J. Računalni pristup detekciji rubova // IEEE Transactions on pattern analysis and machine intelligence. - 1986. - br. 6. - P.679–698.

6. DICOM - Način pristupa: http://iachel.ru/ zob23tai-staihroe / DICOM

7. Doronicheva A.V., Sokolov A.A., Savin S.Z. Korištenje Sobel operatora za automatsko otkrivanje rubova u medicinskim slikama // Journal of Mathematics and System Science. - 2014. - Vol. 4, broj 4 - P. 257-260.

8. Jähne B., Scharr H., Körkel S. Principi dizajna filtera // Handbook of Computer Vision and Applications. Academic Press. - 1999.-- 584 str.

Jedan od prioritetnih pravaca u razvoju medicine u Rusiji je prelazak na sopstvene inovativne tehnologije za elektronsku registraciju, skladištenje, obradu i analizu medicinskih slika organa i tkiva pacijenata. To je zbog povećanja količine informacija prikazanih u vidu slika u dijagnostici društveno značajnih bolesti, prvenstveno onkoloških, čije liječenje u većini slučajeva ima rezultat tek u ranim fazama.

Prilikom dijagnosticiranja slika standarda DICOM utvrđuje se patološko područje, a kada se potvrdi njegova patološka priroda, rješava se problem klasifikacije: pripisivanje nekoj od poznatih vrsta ili identifikacija nove klase. Očigledna poteškoća su nedostaci u rezultirajućem snimku, kako zbog fizičkih ograničenja opreme tako i zbog dopuštenih granica opterećenja na ljudsko tijelo. Kao rezultat toga, softver je taj koji ima zadatak dodatne obrade slika kako bi se povećala njihova dijagnostička vrijednost za liječnika, da bi se predstavili u pogodnijem obliku i da bi se istakla glavna stvar iz velike količine dobijenih podataka. .

Svrha studije... Razvijaju se matematičke metode Dicom segmentacije slike za probleme prepoznavanja medicinskih slika. Dijagnoza bolesti zavisi od kvalifikacija istraživača i zahteva od njega vizuelnu segmentaciju, a matematičke metode za obradu rasterskih slika su alat za ovu dijagnozu. Obrada medicinskih slika dobijenih hardverom bez preliminarne obrade grafičkih podataka u većini slučajeva daje netačne rezultate. To je zbog činjenice da su u početku slike dobijene nezadovoljavajućeg kvaliteta.

Materijal i metode istraživanja

Kao materijal za istraživanje koriste se kompjuterski tomogrami pacijenata specijalizirane kliničke ustanove. Prije analize stvarnih grafičkih podataka potrebno je pripremiti sliku ili izvršiti prethodnu obradu. Ova faza rješava problem poboljšanja vizualnog kvaliteta medicinskih slika. Korisno je podijeliti cijeli proces obrade slike u dvije široke kategorije: metode u kojima su i ulaz i izlaz slike; metode, gdje su ulazni podaci slike, a kao rezultat rada, izlazni podaci su znaci i atributi identificirani na osnovu ulaznih podataka. Ovaj algoritam ne podrazumijeva da se svaki od gore navedenih procesa primjenjuje na sliku. Evidentiranje podataka je prvi od procesa prikazanih na Sl. jedan.

Rice. 1. Glavne faze digitalne obrade grafičkih podataka

Registracija može biti prilično jednostavna, kao u primjeru kada je originalna slika digitalna. Tipično, korak registracije slike uključuje prethodnu obradu podataka, kao što je zumiranje slike. Poboljšanje slike jedno je od najjednostavnijih i najupečatljivijih područja predobrade. U pravilu, problem pronalaženja slabo prepoznatljivih piksela ili povećanja kontrasta u originalnoj slici određen je metodama poboljšanja informativnog sadržaja slika. Jedna od često korištenih metoda poboljšanja informativnog sadržaja slika je poboljšanje kontrasta slike, jer se povećavaju granice predmeta interesovanja. Treba imati na umu da je poboljšanje kvaliteta slike u određenoj mjeri subjektivan zadatak u obradi slike. Restauracija slike - ovaj zadatak se također odnosi na poboljšanje vizualnog kvaliteta podataka. Metode restauracije slike zasnovane su na matematičkim i probabilističkim modelima deformacije grafičkih podataka. Obradu slike kao fazu treba odvojiti od koncepta obrade slike kao cjelokupnog procesa promjene slike i dobijanja nekih podataka. Segmentacija, ili proces isticanja objekata od interesa, dijeli sliku na njene sastavne objekte ili dijelove. Automatski odabir objekata od interesa je u određenoj mjeri težak zadatak u digitalnoj obradi slike. Previše detaljna segmentacija otežava obradu slike ako trebate istaknuti objekte od interesa. Ali netačna ili nedovoljno detaljna segmentacija u većini zadataka dovodi do grešaka u završnoj fazi obrade slike. Prezentacija i opis grafičkih podataka, po pravilu, prati fazu isticanja objekata od interesa na slici, čiji izlaz, u većini slučajeva, sadrži neobrađene piksele koji formiraju granice regiona ili formiraju sve piksele slike. regioni. Kod ovakvih opcija potrebno je podatke transformisati u oblik koji je dostupan za kompjutersku analizu. Prepoznavanje uzoraka je proces koji dodjeljuje identifikator objektu (na primjer, "radijus") na osnovu njegovih opisa. Hajde da definišemo odnos između baze znanja i modula za obradu slika. Baza znanja (tj. informacija o problematičnoj oblasti) je na neki način šifrovana unutar samog sistema za obradu slike. Ovo znanje može biti prilično jednostavno, kao što je detaljna indikacija objekata na slici, gdje se područje od interesa treba nalaziti. Ovo znanje omogućava ograničavanje područja pretraživanja. Baza znanja upravlja radom svakog modula za obradu i njihovom interakcijom, što je prikazano na Sl. 1 sa strelicama koje pokazuju u dva smjera između modula i baze znanja. Čuvanje i štampanje rezultata često takođe zahteva posebne tehnike obrade slika. Nedostatak ovih faza obrade slike u sistemu za obradu medicinske slike je u tome što greške nastale u prvim fazama obrade, na primjer, prilikom unosa ili isticanja objekata od interesa na slici, mogu dovesti do nemogućnosti ispravne klasifikacije. Obrada podataka se vrši strogo sekvencijalno i u većini slučajeva ne postoji mogućnost vraćanja na prethodne faze obrade, čak i ako su prethodno dobijeni netačni rezultati. Metode u fazi predprocesiranja su prilično raznolike - odabir objekata od interesa, njihovo skaliranje, korekcija boja, podešavanje prostorne rezolucije, promjena kontrasta itd. Jedna od prioritetnih radnji u fazi prethodne obrade slike je podešavanje kontrasta i svjetline. Kada se koriste odgovarajuće maske, moguće je kombinirati dvije faze (filtriranje i pretprocesiranje) kako bi se povećala brzina analize podataka. Konačni rezultat analize slike u većini slučajeva određen je nivoom kvaliteta segmentacije, a stepen detaljnosti objekata od interesa zavisi od konkretnog zadatka. Iz tog razloga nije razvijena posebna metoda ili algoritam koji bi bio prikladan za rješavanje svih problema identifikacije objekata od interesa. Konturiranje područja je namijenjeno odabiru objekata sa određenim svojstvima na slikama. Ovi objekti po pravilu odgovaraju objektima ili njihovim dijelovima koje dijagnostičari obilježavaju. Rezultat konturiranja je binarna ili hijerarhijska (višefazna) slika, gdje svaki nivo slike odgovara određenoj klasi odabranih objekata. Segmentacija je teška faza u obradi i analizi medicinskih podataka bioloških tkiva, jer je potrebno razgraničiti područja koja odgovaraju različitim objektima ili strukturama na histološkom nivou: ćelije, organele, artefakti itd. To je zbog velike varijabilnosti njihovih parametara, niskog nivoa kontrasta analiziranih slika i složenog geometrijskog odnosa objekata. U većini slučajeva, da bi se dobio najefikasniji rezultat, potrebno je dosljedno koristiti različite metode segmentacije objekata od interesa na slici. Na primjer, za određivanje granica objekta od interesa koristi se metoda morfološkog gradijenta, nakon čega se provodi segmentacija praga za područja koja su pogodna za neznatne razlike u karakteristikama svjetline. Za obradu slika kod kojih su nepovezana homogena područja različita po prosječnoj svjetlini, odabrana je metoda Canny segmentacije, a istraživanja su provedena na kliničkom primjeru. Modeliranje je slabo primjenjivo za prepoznavanje stvarnih kliničkih slika. Praktično iskustvo i stručna mišljenja o ishodu analize slike su od velike važnosti. Za probnu sliku odabrana je kompjuterizovana tomografska slika, na kojoj je eksplicitno prisutan predmet interesovanja, prikazan na sl. 2.

Rice. 2. Slika kompjuterizovane tomografije sa predmetom interesovanja

Za implementaciju dijeljenja koristimo Canny metodu. Ovaj pristup je otporan na buku i u većini slučajeva pokazuje bolje rezultate od drugih metoda. Canny metoda uključuje četiri koraka:

1) predprocesiranje - zamućenje slike (smanjujemo varijansu aditivnog šuma);

2) provođenje diferencijacije zamućene slike i naknadno izračunavanje vrijednosti gradijenta u smjeru x i y;

3) implementacija ne maksimalnog potiskivanja slike;

4) prag slike.

U prvoj fazi Canny algoritma, slika se izglađuje pomoću maske sa Gaussovim filterom. Gausova jednadžba raspodjele u N dimenzijama ima oblik

ili u konkretnom slučaju za dvije dimenzije

(2)

gdje je r radijus zamućenja, r 2 = u 2 + v 2; σ je standardna devijacija Gausove distribucije.

Ako koristimo 2 dimenzije, onda ova formula definira površinu koncentričnih krugova koji imaju Gaussovu distribuciju od središnje točke. Pikseli sa distribucijom različitom od nule koriste se za definiranje matrice konvolucije koja će se primijeniti na originalnu sliku. Vrijednost svakog piksela postaje ponderisani prosjek za susjedstvo. Početna vrijednost piksela poprima maksimalnu težinu (ima maksimalnu Gausovu vrijednost), a susjedni pikseli poprimaju minimalnu težinu, ovisno o udaljenosti do njih. Teoretski, distribucija u svakoj tački na slici treba da bude različita od nule, što prati izračunavanje težinskih koeficijenata za svaki piksel na slici. Ali u praksi, pri izračunavanju diskretne aproksimacije Gaussove funkcije, pikseli na udaljenosti > 3σ se ne uzimaju u obzir, jer je prilično mala. Dakle, program koji obrađuje sliku treba da izračuna matricu × kako bi osigurao da je aproksimacija Gaussove distribucije dovoljno tačna.

Rezultati istraživanja i njihova rasprava

Rezultat rada Gaussovog filtera sa podacima jednakim 5 za veličinu Gausove maske i 1,9 za vrijednost parametra σ - standardna devijacija Gausove distribucije, prikazan je na Sl. 3. Sljedeći korak je traženje gradijenta područja od interesa koristeći konvoluciju izglađene slike sa derivatom Gaussove funkcije u vertikalnom i horizontalnom smjeru vektora.

Primijenimo Sobel operator da riješimo ovaj problem. Proces se zasniva na jednostavnom pomicanju filter maske od piksela do piksela na slici. Za svaki piksel (x, y), odgovor filtera se izračunava iz unaprijed definiranih veza. Rezultat je početni odabir ivica. Sljedeći korak je upoređivanje svakog piksela sa njegovim susjedima duž smjera gradijenta i izračunavanje lokalnog maksimuma. Informacija o smjeru gradijenta je neophodna kako bi se uklonili pikseli blizu granice bez probijanja same granice u blizini lokalnih maksimuma gradijenta, što znači da pikseli granica određuju tačke u kojima je lokalni maksimum gradijenta dosegnut u smjeru vektora gradijenta. Ovaj pristup može značajno smanjiti detekciju lažnih ivica i obezbjeđuje debljinu granice objekta od jednog piksela, što je empirijski potvrđeno softverskom implementacijom algoritma za segmentiranje abdominalnog reza na slici kompjuterizovane tomografije prikazanoj ispod na Sl. 4.

Sljedeći korak je korištenje praga za određivanje gdje je granica na svakom datom pikselu na slici. Što je prag niži, to će više granica biti u objektu od interesa, ali će rezultat biti podložniji šumu i iscrtavanju nepotrebnih slikovnih podataka. Visoki prag može zanemariti slabe ivice područja ili dobiti granicu s više područja. Razgraničenje granice primjenjuje dva praga filtriranja: ako je vrijednost piksela iznad gornje granice, uzima maksimalnu vrijednost (granica se smatra valjanom), ako je ispod, piksel je potisnut, uzimaju se točke s vrijednošću koja pada unutar raspona između pragova fiksnu prosječnu vrijednost. Piksel se pridružuje grupi ako je dodirne u jednom od osam smjerova. Jedna od prednosti Canny metode je da se tokom obrade slike vrši prilagođavanje specifičnostima segmentacije. Ovo se postiže uvođenjem dvostepenog praga redundantnog odsecanja podataka. Određena su dva nivoa praga, gornji je p visok, a donji je nizak, pri čemu je p visoko> p nizak. Vrijednosti piksela iznad p visoke vrijednosti su označene kao da odgovaraju ivici (slika 5).

Rice. 3. Primjena Gaussovog filtera na CT skeniranju sa objektom od interesa

Rice. 4. Suzbijanje ne-maksima na segmentiranoj slici

Rice. 5. Primjena Cannyjevog algoritma segmentacije sa različitim vrijednostima nivoa praga

Praksa pokazuje da postoji određeni interval na skali nivoa praga osjetljivosti na kojem je vrijednost površine predmeta od interesa praktički nepromijenjena, ali u isto vrijeme postoji određeni nivo praga, nakon kojeg se „prekida ” metode konturiranja je zabilježen i rezultat identifikacije područja od interesa postaje neizvjestan. Ovaj nedostatak algoritma može se nadoknaditi kombinacijom Cannyjevog algoritma sa Houghovom transformacijom za pronalaženje krugova. Kombinacija algoritama omogućava da se objekti proučavanja istaknu što je jasnije moguće, kao i da se eliminišu praznine u konturama.

zaključci

Time je riješen problem formuliranja tipičnih karakteristika patoloških objekata na medicinskim slikama, što će omogućiti operativnu analizu podataka o specifičnim patologijama u budućnosti. Važni parametri za određivanje ocjene kvaliteta segmentacije su vjerovatnoće lažnih uzbuna i promašaja - odbijanja. Ovi parametri određuju primenu automatizacije metode analize. Segmentacija u rješavanju problema klasifikacije i prepoznavanja objekata na slikama je jedan od najvažnijih. Metode konturiranja zasnovane na segmentaciji granica regiona - Sobel, Canny, Prewit, Laplassian - su dobro istražene i primenjene. Ovaj pristup je određen činjenicom da je koncentracija pažnje osobe tokom analize slike često fokusirana na granice između manje ili više homogenih zona u smislu svjetline. Na osnovu toga, konture često služe kao osnova za definiranje različitih karakteristika za interpretaciju slika i objekata u njima. Glavni zadatak algoritama za segmentiranje zona od interesa je izgradnja binarne slike koja sadrži zatvorena područja strukturnih podataka na slici. U odnosu na medicinske slike, ova područja su granice organa, vena, MCC, kao i tumora. Razvijeni principi kompjuterske analize medicinskih slika efikasno se koriste kako za operativne zadatke medicinske dijagnostike specijalizovane onkološke ustanove tako i za obrazovne svrhe.

Istraživan uz podršku programa "Daleki istok", grant broj 15-I-4-014o.

Recenzenti:

Kosykh N.E., doktor medicinskih nauka, profesor, glavni istraživač, FGBUN "Računarski centar" FEB RAS, Khabarovsk;

Levkova EA, MD, DSc, profesor, Dalekoistočni državni transportni univerzitet, Habarovsk.

Bibliografska referenca

Doronicheva A.V., Savin S.Z. METODA SEGMENTACIJE MEDICINSKIH SLIKA // Fundamentalna istraživanja. - 2015. - br. 5-2. - S. 294-298;
URL: http://fundamental-research.ru/ru/article/view?id=38210 (datum pristupa: 06.04.2019.). Predstavljamo Vam časopise koje izdaje "Akademija prirodnih nauka"

Jedan od glavnih ciljeva kompjuterskog vida u obradi slike je tumačenje sadržaja slike. Da biste to učinili, potrebno je kvalitativno odvojiti pozadinu od objekata. Segmentacija dijeli sliku na njene sastavne dijelove ili objekte. Odvaja objekt od pozadine tako da možete lako obraditi slike i identificirati njegov sadržaj. U ovom slučaju, odabir kontura na slici je osnovni alat za segmentaciju slike visokog kvaliteta. Ovaj članak pokušava da prouči performanse često korišćenih algoritama za detekciju ivica za dalju segmentaciju slike, kao i njihovo poređenje pomoću softverskog alata MATLAB.

Uvod

Segmentacija slike je veliki korak za analizu slike. Ona dijeli sliku na njene sastavne dijelove ili objekte. Nivo detalja zajedničkih područja zavisi od problema koji se rješava. Na primjer, kada objekti od interesa prestanu da održavaju integritet, razbiju se na manje, sastavne dijelove, proces segmentacije treba zaustaviti. Algoritmi za segmentaciju slike najčešće se temelje na diskontinuitetu i sličnosti vrijednosti na slici. Pristup diskontinuiteta osvetljenosti zasniva se na naglim promenama vrednosti intenziteta, dok se sličnost zasniva na podeli slike na slična područja prema većem broju unapred određenih kriterijuma. Dakle, izbor algoritma za segmentaciju slike direktno zavisi od problema koji treba rešiti. Detekcija ivica je dio segmentacije slike. Shodno tome, efikasnost rješavanja mnogih problema obrade slike i kompjuterskog vida ovisi o kvalitetu odabranih granica. Njihovo isticanje na slici može se klasifikovati kao algoritmi segmentacije zasnovani na diskontinuitetima osvetljenosti.

Proces otkrivanja finih diskontinuiteta u svjetlini na slici naziva se proces poboljšanja ruba. Praznine su nagle promjene u grupi piksela koji su granice objekata. Klasični algoritam za detekciju ivica koristi konvoluciju slike koristeći operator koji se zasniva na osjetljivosti na velike razlike u svjetlini na slici i vraća nulu kada prolazi kroz homogena područja. Sada je dostupan veliki broj algoritama za detekciju ivica, ali nijedan od njih nije univerzalan. Svaki od postojećih algoritama rješava svoju klasu problema (odnosno, kvalitativno razlikuje granice određenog tipa). Da bi se odredio odgovarajući algoritam za detekciju ivica, potrebno je uzeti u obzir parametre kao što su orijentacija i struktura konture, kao i prisustvo i vrsta šuma na slici. Geometrija operatora postavlja karakteristični smjer u kojem je najosjetljivija na granice. Postojeći operatori služe za pronalaženje vertikalnih, horizontalnih ili dijagonalnih granica. Odabir granica objekata je težak zadatak u slučaju vrlo bučne slike, budući da je operater osjetljiv na promjene svjetline, pa će se stoga i šum smatrati nekim objektom na slici. Postoje algoritmi koji vam omogućavaju da se u velikoj mjeri riješite šuma, ali zauzvrat značajno oštećuju rubove slike, izobličujući ih. A budući da većina obrađenih slika sadrži šum, algoritmi za smanjenje šuma su vrlo popularni, ali to utiče na kvalitet odabranih kontura.

Također, pri detekciji kontura objekata javljaju se problemi kao što su pronalaženje lažnih kontura, pozicioniranje kontura, nedostajuće prave konture, šum u obliku šuma, veliko vrijeme računanja, itd. Stoga je cilj istražiti i uporediti mnoge obrađene slike i analizirati kvalitet algoritama u različitim uslovima.

Ovaj članak je pokušaj da se pregledaju najpopularniji algoritmi za izbor kontura za segmentaciju, kao i njihova implementacija u MATLAB softverskom okruženju. Drugi dio uvodi osnovne definicije koje se koriste u literaturi. Treći pruža teoretsko-matematički i objašnjava različite kompjuterske pristupe konturiranju. Četvrti dio pruža komparativnu analizu različitih algoritama, praćenih slikama. Peti dio sadrži pregled dobijenih rezultata i zaključak.

Segmentacija slike

Segmentacija slike je proces dijeljenja digitalne slike na više regija ili skupova piksela. U stvari, to je podjela na različite objekte koji imaju istu teksturu ili boju. Rezultat segmentacije je skup regija koje pokrivaju cijelu sliku zajedno i skup kontura izdvojenih iz slike. Svi pikseli iz istog područja su slični na neki način, kao što su boja, tekstura ili intenzitet. Susjedna područja se međusobno razlikuju po istim karakteristikama. Različiti pristupi pronalaženju granica između regiona zasnovani su na nehomogenosti u nivoima osvetljenosti. Dakle, izbor metode segmentacije slike ovisi o problemu koji treba riješiti.

Metode zasnovane na domeni su zasnovane na kontinuitetu. Ovi algoritmi dijele cijelu sliku u podoblasti ovisno o nekim pravilima, na primjer, svi pikseli date grupe moraju imati određenu sivu vrijednost. Ovi algoritmi se oslanjaju na uobičajene obrasce vrijednosti intenziteta u klasterima susjednih piksela.

Segmentacija praga je najjednostavniji tip segmentacije. Na osnovu toga, područja se mogu klasificirati prema osnovnom rasponu vrijednosti koje zavise od intenziteta piksela slike. Prag konvertuje ulaznu sliku u binarnu.

Tehnike segmentacije zasnovane na detekciji područja direktno pronalaze nagle promjene u vrijednostima intenziteta. Takve metode se nazivaju granične metode. Detekcija granica je fundamentalni problem u analizi slike. Tehnike isticanja granica se obično koriste za pronalaženje nepravilnosti na slici u sivim tonovima. Pronalaženje praznina u slikama u sivim tonovima je najvažniji pristup poboljšanju ivica.

Algoritmi za detekciju granica

Granice objekata na slici uvelike smanjuju količinu podataka koje je potrebno obraditi, a istovremeno zadržava važne informacije o objektima na slici, njihovom obliku, veličini, količini. Glavna karakteristika tehnike detekcije granica je mogućnost izdvajanja precizne linije sa dobrom orijentacijom. U literaturi je opisano mnogo algoritama koji vam omogućavaju da otkrijete granice objekata, ali nigdje nema opisa kako procijeniti rezultate obrade. Rezultati se procjenjuju na čisto individualnoj osnovi i ovise o području njihove primjene.

Detekcija ivica je osnovni alat za segmentaciju slike. Takvi algoritmi pretvaraju ulaznu sliku u sliku sa obrisima objekta, uglavnom u sivim tonovima. U obradi slike, posebno u sistemima kompjuterskog vida, uz pomoć selekcije kontura, razmatraju se bitne promjene u nivou svjetline na slici, fizičkim i geometrijskim parametrima objekta na sceni. To je fundamentalni proces koji ocrtava objekte, čime se stječe određeno znanje o slici. Detekcija granica je najpopularniji pristup za otkrivanje značajnih diskontinuiteta.

Granica je lokalna varijacija svjetline na slici. Obično se protežu duž ivice između ta dva područja. Granice vam mogu pomoći da steknete osnovno razumijevanje slike. Njihove funkcije akvizicije koriste napredni algoritmi kompjuterskog vida i polja kao što su medicinsko snimanje, biometrija i slično. Otkrivanje granica je aktivna oblast istraživanja jer olakšava analizu slike na visokom nivou. Postoje tri vrste prekida u slikama u sivim tonovima: tačka, linija i granica. Prostorne maske se mogu koristiti za otkrivanje sve tri vrste diskontinuiteta.

U tehničkoj literaturi je dat i opisan veliki broj algoritama za odabir kontura i granica. Ovaj rad govori o najpopularnijim metodama. To uključuje Roberts, Sobel, Prewitt, Kirsch, Robinson operator, Cannyjev algoritam i LoG algoritam.

Roberts operater

Robertsov operator isticanja granica uveo je Lawrence Roberts 1964. godine. Izvodi jednostavne i brze 2D proračune prostornih dimenzija na slici. Ova tehnika naglašava područja visoke prostorne frekvencije koja često odgovaraju ivicama. Slika u nijansama sive se unosi na ulaz operatera. Vrijednost piksela izlazne slike u svakoj tački pretpostavlja određenu količinu prostornog gradijenta ulazne slike u istoj tački.

Sobel operater

Sobel operater je uveo Sobel 1970. godine. Ova metoda detekcije granica koristi aproksimaciju derivacije. Ovo omogućava da se ivica otkrije tamo gdje je gradijent najveći. Ova metoda detektuje broj gradijenata na slici, čime se ističu oblasti visoke prostorne frekvencije koje odgovaraju ivicama. Općenito, ovo je dovelo do pronalaženja procijenjene apsolutne vrijednosti gradijenta u svakoj tački na ulaznoj slici. Ovaj operator se sastoji od dvije matrice 3 × 3. Druga matrica se razlikuje od prve samo po tome što je rotirana za 90 stepeni. Ovo je vrlo slično Robertsovom operateru.

Detekcija granica ovom metodom je kompjuterski mnogo lakša nego Sobel metodom, ali dovodi do većeg šuma u rezultujućoj slici.

Operater Prewitt

Detekciju granica od strane ovog operatera predložio je Prewitt 1970. godine. Ispravan smjer u ovom algoritmu bio je procijeniti veličinu i orijentaciju granice. Iako je ocrtavanje granica dosadan zadatak, ovaj pristup daje prilično dobre rezultate. Ovaj algoritam se zasniva na upotrebi maski 3x3, koje uzimaju u obzir 8 mogućih pravaca, ali pravi pravci daju najbolje rezultate. Sve maske konvolucije su izračunate.

Kirsch operater

Detekciju granica ovom metodom uveo je Kirsch 1971. godine. Algoritam se zasniva na korištenju samo jedne maske, koja se rotira u osam glavnih smjerova: sjever, sjeverozapad, zapad, jugozapad, jug, jugoistok, istok i sjeveroistok. Maske su sledeće:

Veličina ivice je definirana kao maksimalna vrijednost pronađena pomoću maske. Smjer određen maskom daje maksimalnu vrijednost. Na primjer, k 0 maska ​​odgovara vertikalnoj granici, a k 5 maska ​​odgovara dijagonalnoj. Također možete primijetiti da su posljednje četiri maske zapravo iste kao prva, one su zrcalne slike oko središnje ose matrice.

Robinson Operator

Robinsonova metoda, uvedena 1977. godine, slična je Kiršovoj, ali jednostavnija za implementaciju zbog upotrebe koeficijenata 0, 1 i 2. Maske ovog operatora su simetrične u odnosu na centralnu os ispunjenu nulama. Dovoljno je dobiti rezultat obrade prve četiri maske, dok se ostale mogu dobiti invertiranjem prve.

Maksimalna vrijednost dobijena nakon primjene sve četiri maske na piksel i njegovu okolinu smatra se veličinom gradijenta, a ugao gradijenta može se aproksimirati kao ugao maskiranih nul linija koje daju maksimalan odgovor.

Odabir konture korištenjem Marr-Hildreth metode

Marr-Hildreth (1980) metoda je tehnika detekcije rubova digitalne slike koja detektuje neprekidne krive gdje god su uočljive brze i nagle promjene u svjetlini grupe piksela. Ovo je prilično jednostavna metoda, radi koristeći konvoluciju slike s LoG funkcijom ili kao brzu aproksimaciju s DoG. Nule u obrađenom rezultatu odgovaraju konturama. Algoritam detektora granica sastoji se od sljedećih koraka:

  • zamutiti sliku pomoću Gaussove metode;
  • primjena Laplaceovog operatora na mutnu sliku (često se prva dva koraka kombinuju u jedan);
  • vršimo proračunski ciklus i kao rezultat gledamo promjenu predznaka. Ako se predznak promijenio iz negativnog u pozitivan i vrijednost promjene vrijednosti je veća od određenog unaprijed određenog praga, onda definirajte ovu tačku kao granicu;
  • Za najbolje rezultate, korak koji koristi Laplaceov operator može se izvesti kroz histerezu kao što je implementirano u Cannyjevom algoritmu.

Izbor konture metodom LoG

Laplasov Gausov algoritam za konturiranje je predložen 1982. Ovaj algoritam je drugi izvod, definisan kao:

Izvodi se u dva koraka. U prvom koraku izglađuje sliku, a zatim izračunava Laplaceovu funkciju, što rezultira formiranjem dvostrukih kontura. Definiranje kontura se svodi na pronalaženje nula na sjecištu dvostrukih granica. Kompjuterska implementacija Laplaceove funkcije obično se provodi kroz sljedeću masku:

Laplasian obično koristi pronalaženje piksela na tamnoj ili svijetloj strani granice.

Canny Border Detector

Canny Border Detector je jedan od najpopularnijih algoritama za detekciju rubova. Prvi ga je predložio John Canney u svojoj magistarskoj tezi 1983. godine, a još uvijek je superioran u odnosu na mnoge algoritme razvijene kasnije. Važan korak u ovom algoritmu je eliminacija šuma na konturama, što može značajno uticati na rezultat, dok je potrebno sačuvati granice što je više moguće. Ovo zahtijeva pažljiv odabir vrijednosti praga prilikom obrade ove metode.

algoritam:

  • zamutiti originalnu sliku f (r, c) koristeći Gaussovu funkciju f ^ (r, c). f ^ (r, c) = f (r, c) * G (r, c, 6);
  • potražite gradijent. Ivice su ocrtane tamo gde gradijent zauzima svoju maksimalnu vrednost;
  • suzbijanje ne-maksima. Samo lokalni maksimumi su označeni kao granice;
  • rezultujuće granice se određuju potiskivanjem svih rubova koji nisu ograničeni određenom granicom.

Za razliku od Robertsovih i Sobelovih operatora, Cannyjev algoritam nije previše osjetljiv na šum slike.

Eksperimentalni rezultati

Ovaj dio predstavlja rezultate prethodno opisanih algoritama za otkrivanje granica objekata na slici.

Svi opisani algoritmi implementirani su u softverskom okruženju MATLAB R2009a i testirani na fotografiji univerziteta. Cilj eksperimenta je da se dobije obrađena slika sa savršeno definisanim konturama. Originalna slika i rezultati njene obrade prikazani su na slici 1.

Slika 1 - Originalna slika i rezultat rada različitih algoritama za izdvajanje kontura


Analizom dobijenih rezultata otkrivene su sljedeće pravilnosti: operateri Robertsa, Sobela i Prewitta daju vrlo različite rezultate. Marr-Hildreth, LoG i Kanney su pronašli konture objekta na gotovo isti način, Kirsch i Robinson su dali isti rezultat. Ali posmatrajući dobijene rezultate, možemo zaključiti da Cannyjev algoritam radi red veličine bolje od ostalih.

zaključci

Obrada slike je oblast koja se brzo razvija u disciplini kompjuterskog vida. Njegov rast zasniva se na visokim dostignućima u digitalnoj obradi slike, razvoju računarskih procesora i uređaja za skladištenje informacija.

U ovom članku je učinjen pokušaj da se u praksi prouče metode isticanja kontura objekata na osnovu diskontinuiteta svjetline slike u sivim tonovima. Proučavanje relativnih performansi svake od metoda predstavljenih u ovom članku obavljeno je pomoću softverskog alata MATLAB. Analiza rezultata obrade slike pokazala je da metode kao što su Marr-Hildreth, LoG i Canny daju gotovo iste rezultate. Ali ipak, prilikom obrade ove probne slike, najbolji rezultati se mogu uočiti nakon rada Canny algoritma, iako pod drugim uvjetima može se pokazati da je druga metoda bolja.

Čak i uzimajući u obzir činjenicu da je pitanje detekcije granica na slici dovoljno dobro osvijetljeno u modernoj tehničkoj literaturi, to i dalje ostaje prilično naporan zadatak, budući da kvalitativni odabir granica uvijek ovisi o mnogim faktorima koji utječu na rezultat.

Spisak korišćene literature

1. Canny J.F. (1983) Pronalaženje ivica i linija na slikama, magistarska teza, MIT, AI Lab. TR-720.
2. Canny J.F. (1986) Računski pristup detekciji ivica, IEEE Transaction on Pattern Analysis and Machine Intelligence, 8. - P. 679-714.
3. Courtney P, Thacker N.A. (2001) Karakterizacija performansi u kompjuterskom vidu: Uloga statistike u testiranju i dizajnu, Poglavlje u: Sistemi za snimanje i vid: teorija, procena i primena, Jacques Blanc-Talon i Dan Popescu (urednici), NOVA Science Books.
4. Hanzi Wang (2004) Robusna statistika za kompjuterski vid: prilagođavanje modela, segmentacija slike i analiza vizuelnog pokreta, doktorska teza, Univerzitet Monash, Australija.
5. Huber P.J. (1981) Robust Statistics, Wiley New York.
6. Kirsch R. (1971) Kompjutersko određivanje konstitutivne strukture bioloških slika, Računari i biomedicinska istraživanja, 4. - P. 315–328.
7. Lakshmi S, Sankaranarayanan V. (2010) Studija tehnika detekcije rubova za pristupe segmentacijskog računanja, Computer Aided Soft Computing Techniques for Imaging and Biomedical Applications. - str. 35-41.
8. Lee K., Meer P. (1998) Robust Adaptive Segmentation of Range Images, IEEE Trans. Analiza uzoraka i inteligencija mašina, 20 (2). - str. 200-205.
9. Marr D, Hildreth E. (1980) Theory of edge detection, Proc. Londonsko kraljevsko društvo, B, 207. - P. 187-217.
10. Marr D. (1982) Vision, Freeman Publishers.
11. Marr P., Doron Mintz. (1991) Robusna regresija za kompjuterski vid: Pregled, Međunarodni časopis za kompjutersku viziju, 6 (1). - str. 59-70.
12. Orlando J. Tobias, Rui Seara (2002) Segmentacija slike histogramskim pragom korištenjem nejasnih skupova, IEEE Transakcije o obradi slike, Vol.11, No.12. - P. 1457-1465.
13. Punam Thakare (2011) Studija o segmentaciji slike i tehnikama detekcije ivica, Međunarodni časopis za računarsku nauku i inženjerstvo, tom 3, br.2. - P. 899-904.
14. Rafael C., Gonzalez, Richard E. Woods, Steven L. Eddins (2004) Digitalna obrada slika pomoću MATLAB-a, Pearson Education Ptd. Ltd, Singapur.
15. Ramadevi Y. (2010) Segmentacija i prepoznavanje objekata upotrebom tehnika detekcije ivica, Međunarodni časopis za kompjuterske nauke i informacione tehnologije, Vol 2, br.6. - P. 153-161.
16. Roberts L. (1965) Mašinska percepcija 3-D čvrstih tijela, optička i elektrooptička obrada informacija, MIT Press.
17. Robinson G. (1977) Detekcija ivica pomoću maski gradijenta kompasa, Kompjuterska grafika i obrada slika, 6. - P. 492-501.
18. Rousseeuw P. J., Leroy A. (1987) Robust Regression and outlier detection, John Wiley & Sons, New York.
19. Senthilkumaran N., Rajesh R. (2009) Tehnike detekcije ivica za segmentaciju slike - Pregled pristupa mekom računarstvu, Međunarodni časopis za nedavne trendove u inženjerstvu, Vol. 1, br. 2. - P. 250-254.
20. Sowmya B., Sheelarani B. (2009) Segmentacija slike u boji upotrebom tehnika mekog računarstva, Međunarodni časopis za aplikacije mekog računarstva, broj 4. - P. 69-80.
21. Umesh Sehgal (2011) Tehnike detekcije ivica u digitalnoj obradi slike koristeći Fuzzy Logic, Međunarodni časopis za istraživanje u IT i menadžmentu, Vol.1, Izdanje 3. - P. 61-66.
22. Yu, X, Bui, T.D. & et al. (1994) Robust Estimation for Range Image Segmentation and Reconstruction, IEEE trans. Analiza uzoraka i mašinska inteligencija, 16 (5). - P. 530-538.

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

Ministarstvo obrazovanja i nauke Ruske Federacije

Rjazanski državni radiotehnički univerzitet

Odsjek IIBMT

Rad na kursu

Metode obrade slike. Segmentacija

Završeno čl. gr. 432M:

Aljošin S.I.

Provjerio doc. odjelu IIBMT:

Kaplan M.B.

Rjazanj 2014

Uvod

1. Predstavljanje slika

3. Formati slika

4. Vrste slika

5.1 Promjena kontrasta

5.2 Uglađivanje šuma

5.3 Podcrtajte granice

5.4 Filtriranje medijana

5.5 Segmentacija slike

5.5.3 Odabir kontura

5.5.7 Metode rezanja grafikona

6. Opis funkcija

7. Testiranje algoritma

Zaključak

Dodatak

Uvod

Sredinom 20. stoljeća obrada slike je uglavnom bila analogna i obavljala se optičkim uređajima. Takve optičke tehnike su i danas važne u oblastima kao što je holografija. Međutim, sa dramatičnim povećanjem performansi računara, ove tehnike su sve više zamenjene digitalnom obradom slike. Tehnike digitalne obrade slike općenito su preciznije, pouzdanije, fleksibilnije i lakše za implementaciju od analognih tehnika. U digitalnoj obradi slike široko se koristi specijalizovana oprema kao što su cevovodni procesori i višeprocesorski sistemi. Ovo posebno važi za sisteme za obradu video zapisa. Obrada slika se takođe izvodi pomoću kompjuterskog matematičkog softvera, na primer, MATLAB, Mathcad, Maple, Mathematica, itd. Za to koriste i osnovne alate i pakete ekstenzija za obradu slika.

Interes za tehnike obrade digitalne slike raste iz dva glavna područja njihove primjene, a to su poboljšanje kvaliteta slike kako bi se poboljšala njena vizualna percepcija od strane ljudi i obrada slika za njihovo skladištenje, prijenos i prezentaciju u autonomnim sistemima strojnog vida.

Jedna od najsloženijih tehnika obrade digitalne slike je segmentacija slike. Segmentacija je proces podjele digitalne slike na nekoliko segmenata koji se međusobno razlikuju po osnovnim karakteristikama kao što su svjetlina, boja, tekstura, oblik. Svrha segmentacije je pojednostaviti i modificirati prikaz slike tako da je lakše i lakše analizirati. Nepravilan odabir segmenata na slici može u konačnici uticati na kvalitet prepoznavanja, pa čak i onemogućiti ga. Stoga je zadatak segmentacije izuzetno važan i vrlo hitan.

Postoji mnogo metoda segmentacije slike. Krajnji rezultat je često određen preciznošću segmentacije, pa pri odabiru jedne ili druge metode segmentacije veliku pažnju treba obratiti na pouzdanost algoritma. Međutim, ne postoji jedinstven, opšte prihvaćen pristup koji bi bio u osnovi većine algoritama. Također ne postoji jedinstven algoritam koji bi omogućio prihvatljivu segmentaciju za bilo koju sliku. To je jedna od složenosti segmentacije i to je razlog velikog broja različitih pristupa rješavanju ovih problema obrade slike.

Uprkos važnosti ovog predmetnog područja, napisano je relativno malo knjiga u kojima bi se razmatrali i teorijske osnove i softverski aspekti rješavanja glavnih problema segmentacije slike.

Ovaj rad opisuje glavne metode obrade digitalnih slika. Posebna pažnja posvećena je metodama segmentacije slike. Program za jednu od metoda segmentacije implementiran je pomoću MatLAB aplikacijskog paketa.

1. Predstavljanje slika

Osnovna pitanja u teoriji obrade slike su: formiranje, unos, kompjutersko predstavljanje i vizualizacija. Oblik površine može se opisati kao funkcija udaljenosti F (x, y) od površine do tačke slike sa koordinatama x i y. Uzimajući u obzir da svjetlina tačke na slici ovisi isključivo o svjetlini odgovarajućeg područja površine, možemo pretpostaviti da vizualna informacija odražava stanje svjetline ili transparentnosti svake tačke s određenim stupnjem tačnosti. Tada se slika shvata kao ograničena funkcija dvije prostorne varijable f (x, y), date na ograničenoj pravokutnoj ravni Oxy i koja ima određeni skup svojih vrijednosti. Na primjer, crno-bijela fotografija može se predstaviti kao f (x, y)? 0, gdje je 0? X? A, 0? Y? B, a f (x, y) je svjetlina (ponekad se naziva optička gustina ili bjelina) slike u tački (x, y); a - širina okvira, b - visina okvira.

Zbog činjenice da je digitalna memorija računara sposobna da pohranjuje samo nizove podataka, slika se prvo pretvara u određeni numerički oblik (matricu). Slike se unose u memoriju računara pomoću video senzora. Video senzor pretvara optičku distribuciju svjetline slike u električne signale, a zatim u digitalne kodove. Pošto je slika funkcija dvije prostorne varijable x i y, a električni signal funkcija jedne varijable t (vrijeme), tada se za transformaciju koristi sweep. Na primjer, kada se koristi televizijska kamera, slika se čita red po red, a unutar svake linije ovisnost svjetline o prostornoj koordinati x pretvara se u proporcionalnu ovisnost amplitude električnog signala o vremenu t. Prijelaz s kraja prethodnog reda na početak sljedećeg je gotovo trenutan.

Unošenje slika u računar je neizbežno povezano sa uzorkovanjem slika u prostornim koordinatama x i y i kvantizacijom vrednosti osvetljenosti u svakoj diskretnoj tački. Diskretizacija se postiže korišćenjem koordinatne mreže formirane od linija paralelnih sa x i y osama Dekartovog koordinatnog sistema. Na svakom čvoru takve rešetke vrši se očitavanje svjetline ili prozirnosti nosača vizualno perceptibilne informacije, koja se zatim kvantizira i predstavlja u memoriji računala. Element slike dobijen u procesu uzorkovanja slike naziva se piksel. Za kvalitetan prikaz slike u polutonu dovoljno je 28 = 256 nivoa kvantizacije, tj. 1 piksel slike je kodiran sa 1 bajtom informacije.

Glavne karakteristike slika su:

1. Veličina slike;

2. Dubina boje;

3. Rezolucija.

2. Kodiranje slika u boji

Boja je pojava koja nastaje interakcijom svjetlosti, objekta i uređaja (posmatrača).

Eksperimentalno je utvrđeno da se svaka boja može predstaviti kao zbir određenih količina tri linearno nezavisne boje.

Tri linearno nezavisne boje nazivaju se primarne boje.

Oni definišu koordinatni sistem boja (CFR) ili šemu boja, tj. skup primarnih boja za dobijanje ostalih boja.

Postoje dvije vrste shema boja: emitovano svjetlo i sheme boja reflektovanog svjetla.

RGB sistem.

Njegove primarne boje su crvena na 700 nm, zelena na 546,1 nm i plava na 435,8 nm. RGB je aditivni.

U ovom slučaju, jedna ili druga boja se dobija dodavanjem primarnih boja.

CMYK sistem.

Ovaj sistem se koristi za formiranje boja obojenih nesvetlećih objekata, koji apsorbuju deo spektra osvetljene bele svetlosti i reflektuju ostatak zračenja.

CMYK je osnova za štampu u boji.

Zasnovan je na subtraktivnom CMY modelu (cijan za cijan, magenta za magenta, žuta za žutu), modelu oduzimanja boja. Ovdje još uvijek postoje tri glavne boje.

Da bi se poboljšao kvalitet štampane slike, sistemu je dodata crna boja.

HSB sistem.

Ovaj sistem se zasniva na upotrebi nijanse ili nijanse, zasićenosti i svetlosti. Nijansa opisuje specifičnu nijansu boje, zasićenost - njen relativni intenzitet, svjetlinu boje - količinu crne nijanse za dobivanje tamnije slike.

Varijacija ovog sistema je HSL šema.

3. Formati slika

Trenutno se koristi veliki broj različitih formata grafičkih datoteka. Najrasprostranjeniji formati su TIFF, GIF, JPEG, PNG i BMP.

TIFF (Tagget Image Format) jedan je od najpouzdanijih i najraznovrsnijih formata za pohranjivanje visokokvalitetnih skeniranih slika u boji. Može koristiti LZW kompresiju, tj. pripada formatima za skladištenje slika bez gubitaka.

GIF (Graphics Interchange Format) ima paletu od 256 boja i koristi LZW algoritam bez gubitaka za kompresiju. Ako je originalni broj boja veći od 256, tada će se neke informacije o boji izgubiti.

JPEG (Join Photographers Expert Group) format je baziran na istoimenom algoritmu kompresije slike. Odnosi se na algoritme kompresije sa gubicima i dizajniran je za pohranjivanje slika u punoj boji s visokim omjerom kompresije. Kada koristite format, moguće je kontrolisati parametar kvaliteta od 0 (maksimalna kompresija) do 100 (maksimalni kvalitet). Omjer kompresije, ovisno o kvaliteti, je od 10 do 1000. Ovaj format se najčešće koristi za pohranjivanje fotografija u punoj boji koje nisu namijenjene za daljnju obradu.

PNG format je rasterski format za pohranjivanje grafičkih informacija korištenjem kompresije bez gubitaka pomoću algoritma Deflate. PNG format je dizajniran da zamijeni stariji i jednostavniji GIF format, te da u određenoj mjeri zamijeni mnogo složeniji TIFF format. PNG format je prvenstveno pozicioniran za upotrebu na Internetu i za uređivanje grafike. Ima sljedeće glavne prednosti u odnosu na GIF: praktično neograničen broj boja na slici; opciona podrška za alfa kanal; mogućnost gama korekcije; dvodimenzionalno isprepleteno skeniranje.

BMP (BitMaP) format se odnosi na izvorne bitmap formate operativnog sistema Windows. Pogodan je za pohranjivanje slika kako u indeksiranom obliku s paletom do 256 boja, tako iu obliku RGB slika u punoj boji sa dubinom boje od 24 bita. Može se koristiti RLE algoritam kompresije.

4. Vrste slika

4.1 Dvoslojna (ili monohromatska) slika

U ovom slučaju, svi pikseli mogu imati samo dvije vrijednosti, koje se obično nazivaju crnim (binarni jedan ili osnovna boja) i bijelim (binarna nula ili boja pozadine).

Svaki piksel takve slike predstavljen je jednim bitom, tako da je ovo najjednostavniji tip slike.

1. Polutonska slika. Takva slika 2n nivoa je sastavljena od n-bitnih slojeva.

2. Slika u boji. Takva slika je opisana u jednom od gore predstavljenih formata.

3. Slika sa kontinuiranim tonom. Ova vrsta slike može imati mnogo sličnih boja (ili polutonova). Kada se susjedni pikseli razlikuju samo za jedan, oko je gotovo nemoguće razlikovati njihove boje. Kao rezultat toga, takve slike mogu sadržavati područja u kojima se oku čini da se boja neprestano mijenja. U ovom slučaju, piksel je predstavljen ili velikim brojem (u sivim tonovima) ili sa tri komponente (u slučaju slike u boji). Neprekidne tonske slike su prirodne ili prirodne (za razliku od umjetnih, umjetnih); obično se dobijaju slikanjem digitalnim fotoaparatom ili skeniranjem fotografija ili crteža.

4. Slika diskretnog tona (naziva se i sintetička). Obično se ova slika dobiva umjetno. Može imati samo nekoliko boja ili mnogo boja, ali nema šum i mrlje prirodne slike. Primeri takvih slika su fotografije objekata, mašina ili mehanizama koje je napravio čovek, stranice teksta, karte, crteži ili slike na ekranu računara. (Neće svaka veštačka slika nužno biti diskretno-tonalna. Kompjuterski generisana slika, koja treba da izgleda prirodno, imaće neprekidne tonove, uprkos svom veštačkom poreklu.) Veštački objekti, tekstovi, nacrtane linije imaju oblik, dobro definisane granice. Oni su u jakom kontrastu s ostatkom slike (pozadinom). Susjedni pikseli slike diskretnog tona često su pojedinačni ili se jako razlikuju. Takve slike su loše komprimirane metodama s gubitkom podataka, jer izobličenje samo nekoliko piksela slova čini ih nečitkim, pretvara poznato lice u potpuno nerazlučivo. Slike diskretnih tonova obično nose dosta suvišnosti. Mnogi njeni fragmenti se ponavljaju mnogo puta na različitim mjestima slike.

5. Slike poput crtanih filmova. Ovo su slike u boji sa velikim površinama iste boje. U ovom slučaju, kontaktna područja mogu značajno varirati u svojoj boji.

5. Metode obrade slike

Preliminarna analiza slika nam omogućava da zaključimo da:

Prvo, na većinu slika, u procesu njihovog formiranja (fotografija skeniranje i sl.), utiče niz negativnih faktora (vibracija fotoaparata, neravnomerno kretanje elementa za skeniranje, itd.), što dovodi do zamućenja, izgleda područja sa niskim kontrastom i bukom itd.

Drugo, ogromna većina metoda temelji se na odabiru objekata na slici i njihovoj daljnjoj analizi.

Dakle, prije analize, slika mora proći kroz pripremnu fazu, koja se sastoji u izvođenju operacija za poboljšanje vizualnog kvaliteta (povećanje kontrasta, eliminisanje zamućenja, podvlačenje granica, filtriranje) i formiranje grafičke pripreme (segmentacija, isticanje obrisa) slika.

5.1 Promjena kontrasta

Slab kontrast je obično uzrokovan malim dinamičkim rasponom promjene svjetline ili jakom nelinearnošću u prijenosu nivoa svjetline. Najjednostavniji kontrastni metod je funkcionalno preslikavanje gradacije svjetline fij do gij, odnosno gij = R (fij). U praksi se vrlo često koriste linearne funkcije preslikavanja. Ako, kao rezultat neravnomjernog osvjetljenja prilikom fotografisanja ili fotografisanja, nastane situacija da različita područja slike imaju različit kontrast. U ovom slučaju, adaptivni kontrastni algoritmi se koriste za promjenu kontrasta. Primjer je algoritam lokalnog poboljšanja kontrasta. Eksperimentalne studije su potvrdile visoku efikasnost algoritma u slučaju da slika sadrži područja sa jasno precijenjenim ili potcijenjenim kontrastima.

Suština algoritma je da se snimak posmatra kao skup određenog broja lokalnih područja, a ta područja se obrađuju uzimajući u obzir njihove karakteristike. Obrada se izvodi u sljedećem redoslijedu: dobit rezova gustoće p izračunava se zasebno za svako lokalno područje slike. I vrši se obrada svakog piksela slike. Ako je p jednako jedan, tada se nikakva radnja ne izvodi na lokalnom području slike (ako je p različit od jedinice, tada se povećava kontrast lokalnog područja). U početku se kontrast izračunava na analiziranoj tački u odnosu na najbližu okolinu. Zatim se vrijednost relativnog kontrasta dodaje jedinici, a rezultirajuća vrijednost se uzima u algoritmu kao pojačanje p, a zatim se izračunavanje vrši pomoću formule:

kontrast programa za segmentaciju slike

gdje je nova vrijednost svjetline, je trenutna svjetlina obrađene slike, je potrebna maksimalna vrijednost svjetline obrađene slike.

5.2 Uglađivanje šuma

U fazi digitalizacije, slike su izložene aditivnom i impulsnom šumu. Aditivni šum je neki nasumični signal koji se dodaje korisnom na izlazu sistema; u ovom slučaju aditivni šum nastaje zbog zrnatosti filma. Impulsni šum, za razliku od aditivnog šuma, karakteriše dejstvo na korisni signal samo u odvojenim slučajnim tačkama (vrednost rezultirajućeg signala u tim tačkama poprima slučajnu vrednost). Impulsni šum je uobičajen u sistemima za prenos i skladištenje digitalne slike. Tako se u procesu pripreme slike javlja problem suzbijanja šuma.

Najjednostavniji metod za izglađivanje šuma na slici je izglađivanje, tj. zamjenjujući vrijednost svjetline svakog elementa prosječnom vrijednošću pronađenom u njegovoj blizini:

gdje je skup tačaka koje pripadaju blizini tačke (uključujući samu tačku); - broj bodova u susjedstvu.

Razmatrana metoda efikasno eliminiše aditivni i impulsni šum u svakom elementu slike.

5.3 Podcrtajte granice

Tehnike izglađivanja slike mogu vrlo efikasno ukloniti šum. Značajan nedostatak anti-aliasing algoritama je zamućenje slike (tj. smanjenje oštrine elemenata konture), dok je količina zamućenja proporcionalna veličini maske koja se koristi za izglađivanje. Za nedvosmislenu analizu slika, posebno pri proračunu geometrijskih karakteristika strukturnih elemenata, vrlo je važno ukloniti zamućenje kontura objekata na slici, odnosno poboljšati razliku između gradacije svjetline elemenata konture objekta i susjedni elementi pozadine. U ovom slučaju, obrada slike koristi tehnike poboljšanja ivica.

Obično se poboljšanje ivica izvodi pomoću visokofrekventnog prostornog filtriranja. Karakteristike filtera su postavljene u obliku maske, u kojoj prosječna vrijednost mora biti jednaka nuli.

Druga metoda isticanja granica je takozvana statička diferencijacija. Kod ove metode, vrijednost svjetline svakog elementa se dijeli sa statističkom procjenom standardne devijacije, odnosno (standardna devijacija se izračunava u određenom susjedstvu elementa).

5.4 Filtriranje medijana

Filtriranje medijana odnosi se na nelinearne metode obrade slike i ima sljedeće prednosti u odnosu na linearno filtriranje (klasični postupak izglađivanja): zadržava oštre padove (granice); efikasno ublažava impulsnu buku; ne mijenja svjetlinu pozadine.

Medijansko filtriranje se vrši pomeranjem određenog otvora (maske) duž diskretne slike i zamenom vrednosti centralnog elementa maske srednjom vrednošću (prosečnom vrednošću uređenog niza) originalnih elemenata unutar otvora. Općenito, otvor može imati različite oblike, ali u praksi najčešće korišteni otvor je kvadrat

5.5 Segmentacija slike

Segmentacija slike se podrazumijeva kao proces njezine podjele na sastavne dijelove koji imaju smisleno značenje: objekte, njihove granice ili druge informativne fragmente, karakteristične geometrijske karakteristike i sl. sliku, čiji kvalitet u velikoj mjeri određuje uspješnost rješavanja problema prepoznavanja. i interpretacija objekata.

U općenitom slučaju, segmentacija je operacija dijeljenja konačnog skupa ravnine na kojoj je funkcija originalne slike definirana na neprazne povezane podskupove u skladu s nekim predikatom definiranim na skupu i uzimajući prave vrijednosti kada je bilo koji par tačaka iz svakog podskupa zadovoljava neki kriterijum homogenosti (na primer, kriterijum homogenosti zasnovan na proceni maksimalne razlike između osvetljenosti pojedinačnog piksela i prosečne vrednosti osvetljenosti izračunate za odgovarajuću oblast).

5.5.1 Metode segmentacije praga

Prag je jedan od glavnih metoda segmentacije slike zbog svojih intuitivnih svojstava. Ova metoda je fokusirana na obradu slike, čija pojedinačna homogena područja karakterizira srednja svjetlina. Najčešći metod segmentacije praga je binarna segmentacija, odnosno kada na raspolaganju imamo dvije vrste homogenih područja.

U ovom slučaju, slika se obrađuje piksel po piksel i konverzija svakog piksela ulazne slike u izlaznu se određuje iz omjera:

gdje je parametar obrade, koji se naziva prag, i nivoi izlazne svjetline. Obrada po pikselima, čija pozicija na slici ne igra nikakvu ulogu, naziva se obrada tačke. Nivoi i igraju ulogu etiketa. Po njima se određuje kojoj vrsti datu tačku treba pripisati: H0 ili H1. Ili kažu da se H0 sastoji od pozadinskih tačaka, a H1 od tačaka interesa. Tipično, nivoi i odgovaraju bijelim i crnim nivoima. Klase H1 (aka klasa od interesa) ćemo nazvati klasom objekta, a klasu H0 klasom pozadine.

Naravno, segmentacija ne može biti samo binarna, iu ovom slučaju postoji više od dvije postojeće klase. Ova vrsta segmentacije se naziva višeslojnom. Dobijena slika nije binarna, već se sastoji od segmenata različite svjetline. Formalno, ova operacija se može napisati na sljedeći način:

gdje je broj nivoa, a su klase slika. U tom slučaju, za svaku od klasa mora se postaviti odgovarajući prag, koji bi ove klase odvajao jednu od druge. Binarne slike je lakše pohraniti i njima manipulirati od slika koje imaju mnogo nivoa svjetline.

Najteži dio postavljanja praga je sam proces postavljanja praga. Prag se često piše kao funkcija oblika:

gdje je slika, i neka je karakteristika tačke slike, na primjer, prosječna svjetlina u susjedstvu sa središtem u ovoj tački.

Ako vrijednost praga ovisi samo o, odnosno ista za sve točke slike, onda se takav prag naziva globalnim. Ako prag ovisi o prostornim koordinatama, tada se takav prag naziva lokalnim. Ako zavisi od karakteristike, onda se takav prag naziva adaptivan. Dakle, obrada se smatra globalnom ako se odnosi na cijelu sliku u cjelini, a lokalnom ako se odnosi na neko odabrano područje.

Pored gore navedenih razlika algoritama, postoji mnogo više metoda. Mnogi od njih su samo skup drugih, ali većina njih, na ovaj ili onaj način, temelji se na analizi histograma originalne slike, međutim, postoje i fundamentalno različiti pristupi koji ne utječu na analizu histograma. u njihovom direktnom obliku ili prelaze sa njih na analizu nekih drugih funkcija.

5.5.2 Metode povećanja površine

Metode ove grupe zasnivaju se na upotrebi lokalnih karakteristika slike. Ideja metode izgradnje područja je da se prvo analizira početna tačka, zatim njene susjedne tačke, itd. u skladu sa nekim kriterijumom homogenosti, iu naknadnom upisu analiziranih tačaka u jednu ili drugu grupu (broj polaznih tačaka treba da bude jednak broju homogenih oblasti na slici). U efikasnijim verzijama metode, početna tačka nisu pojedinačni pikseli, već podjela slike na niz malih područja. Zatim se svako područje provjerava ujednačenost, a ako je rezultat testa negativan, odgovarajuća površina se dijeli na manje dijelove. Proces se nastavlja sve dok sva odabrana područja ne prođu test uniformnosti. Nakon toga uz pomoć građenja počinje formiranje homogenih područja.

Segmentacija uniformnosti zasnovana na pragu i osvetljenosti često ne daje željene rezultate. Takva segmentacija obično dovodi do pojave značajnog broja malih područja koja nemaju prave prototipove na slici. Najefikasniji rezultati se dobijaju segmentacijom prema kriterijumu homogenosti na osnovu teksture (ili karakteristika teksture).

5.5.3 Odabir kontura

Nije neuobičajeno da se suočimo s problemom pronalaženja perimetara, zakrivljenosti, faktora oblika, specifične površine objekata itd. Svi ovi zadaci se na ovaj ili onaj način odnose na analizu konturnih elemenata objekata.

Metode za isticanje kontura (ivica) na slici mogu se podijeliti u sljedeće glavne klase:

metode visokofrekventnog filtriranja;

metode prostorne diferencijacije;

metode funkcionalne aproksimacije.

Zajedničko za sve ove metode je tendencija da se granice posmatraju kao područje oštrog pada funkcije svjetline slike; ono što ih razlikuje je uvedeni matematički model koncepta granice i algoritam za pronalaženje graničnih tačaka.

U skladu sa postavljenim zadacima, algoritmima za identifikaciju kontura postavljaju se sljedeći zahtjevi: odabrane konture moraju biti istanjene, bez prekida i zatvorene. Stoga je proces izdvajanja kontura donekle kompliciran zbog potrebe primjene algoritama za stanjivanje i eliminaciju praznina. Međutim, to ne daje uvijek željeni rezultat - u većini slučajeva konture nisu zatvorene i, kao rezultat, neprikladne za brojne postupke analize.

Problem se može riješiti konturiranjem s algoritmom za praćenje granica metodom "buba" koja vam omogućava da odaberete zatvorene konture objekata. Suština algoritma je sljedeća: na objektu se odabire određena početna granična točka, a zatim se vrši sekvencijalno praćenje konture dok se ne dođe do početne točke. U slučaju praćenja konture u smjeru kazaljke na satu do početne točke, vrši se pomicanje piksela udesno, ako je piksel izvan objekta, i lijevo, ako je na objektu.

Ovako odabrana kontura je kod zatvorenog lanca, tj. niz koordinata graničnih tačaka objekta, što je vrlo pogodno za rješavanje zadataka.

5.5.4 Metode zasnovane na grupisanju

Metoda K-Means je iterativna metoda koja se koristi za podjelu slike u K klastera. Osnovni algoritam je prikazan u nastavku:

1. Odaberite K centara klastera, nasumično ili na osnovu neke heurističke;

2. Postavite svaki piksel slike u klaster, čiji je centar najbliži ovom pikselu;

3. Ponovo izračunajte centre klastera usrednjavanjem svih piksela u klasteru;

4. Ponovite korake 2 i 3 do konvergencije (na primjer, kada pikseli ostanu u istom klasteru).

Ovdje se udaljenost obično uzima kao zbir kvadrata ili apsolutne vrijednosti razlika između piksela i centra klastera. Razlika se obično zasniva na boji, svjetlini, teksturi i lokaciji piksela ili ponderiranom zbroju ovih faktora.

K se može odabrati ručno, nasumično ili heuristički.

Zagarantovano je da će ovaj algoritam konvergirati, ali možda neće dovesti do optimalnog rješenja.

Kvalitet rješenja ovisi o početnom skupu klastera i vrijednosti K.

5.5.5 Metode koje koriste histogram

Tehnike histograma su veoma efikasne u poređenju sa drugim tehnikama segmentacije slike jer zahtevaju samo jedan prolaz piksela. U ovoj metodi, histogram se izračunava preko svih piksela na slici, a njegovi minimumi i maksimumi se koriste za pronalaženje klastera na slici. Za poređenje se može koristiti boja ili svjetlina.

Poboljšanje ove metode je da se rekurzivno primjenjuje na klastere na slici kako bi ih podijelili u manje klastere. Proces se ponavlja sa sve manjim klasterima sve dok se novi klasteri ne prestanu pojavljivati.

Jedan nedostatak ove metode je što može biti teško pronaći značajne uspone i padove na slici. U ovoj metodi klasifikacije slika, metrika udaljenosti i poređenje integrisanih regiona su slični.

Pristupi zasnovani na histogramu takođe se mogu brzo prilagoditi za više kadrova, uz zadržavanje prednosti u brzini u jednom prolazu. Histogram se može izgraditi na nekoliko načina kada se uzme u obzir nekoliko okvira. Isti pristup koji se koristi za jedan okvir može se primijeniti na nekoliko, a nakon kombinovanja rezultata, minimumi i maksimumi koje je bilo teško izdvojiti postaju uočljiviji. Histogram se također može primijeniti na svaki piksel, gdje se informacije koriste za određivanje najčešće boje za datu poziciju piksela. Ovaj pristup koristi segmentaciju zasnovanu na pokretnim objektima i stacionarnom okruženju, što pruža drugačiju vrstu segmentacije korisnu u video praćenju.

5.5.6 Tehnike širenja područja

Prva je bila metoda uzgoja površina iz sjemena. Ova metoda uzima sliku i set sjemenki kao ulaz. Sjemenke označavaju objekte koje treba odabrati. Područja rastu postepeno, upoređujući sve nezauzete susjedne piksele sa površinom. Razlika q između osvetljenosti piksela i prosečne osvetljenosti oblasti koristi se kao mera sličnosti. Piksel sa najmanjom takvom razlikom dodaje se odgovarajućoj oblasti. Proces se nastavlja sve dok se svi pikseli ne dodaju u jednu od regija.

Metoda zarastanja površina iz sjemena zahtijeva dodatni unos. Rezultat segmentacije zavisi od izbora semena. Šum slike može uzrokovati loše postavljanje sjemena. Metoda rasta površine bez sjemena je modificirani algoritam koji ne zahtijeva eksplicitno sjeme. Počinje s jednom površinom - piksel koji je ovdje odabran ima mali utjecaj na konačnu segmentaciju. Na svakoj iteraciji, tretira susjedne piksele na isti način kao i metodu uzgoja regiona pomoću sjemena. Ali tu se razlikuje da ako minimum nije manji od datog praga, onda se dodaje odgovarajućem području. U suprotnom, piksel se smatra veoma različitim od svih trenutnih regiona i kreira se nova regija koja sadrži ovaj piksel.

Jedna varijacija ove metode zasniva se na korištenju svjetline piksela. Srednja vrijednost i varijansa površine i svjetlina kandidata kandidata koriste se za konstruiranje statistike testa. Ako je testna statistika dovoljno mala, tada se piksel dodaje površini, a srednja vrijednost i varijansa površine se ponovo izračunavaju. U suprotnom, piksel se zanemaruje i koristi za kreiranje novog područja.

5.5.7 Metode rezanja grafikona

Tehnike rezanja grafa mogu se efikasno primijeniti na segmentaciju slike. U ovim metodama, slika je predstavljena kao ponderirani neusmjereni graf. Tipično, piksel ili grupa piksela je povezana s vrhom, a težine rubova određuju sličnost ili različitost susjednih piksela. Graf se zatim siječe prema kriteriju dizajniranom da proizvede "dobre" klastere. Svaki dio vrhova (piksela) dobiven ovim algoritmima smatra se objektom na slici.

5.5.8 Segmentacija sliva

U segmentaciji metodom vododjelnice, slika se smatra nekom vrstom karte područja, gdje vrijednosti svjetline predstavljaju vrijednosti visina u odnosu na određeni nivo. Ako se ovo područje napuni vodom, tada se formiraju bazeni. Daljnjim punjenjem vodom ovi bazeni se kombinuju. Spojevi ovih slivova su označeni kao razvodne linije.

U ovom tumačenju razmatraju se tri vrste tačaka:

1. lokalni minimum;

2. tačke koje se nalaze na padini, tj. iz kojih se voda spušta do istog lokalnog minimuma;

3. tačke lokalnog maksimuma, tj. iz kojih se voda kotrlja u više od jednog minimuma.

Odvajanje dodirnih objekata na slici jedan je od važnih zadataka obrade slike. Za rješavanje ovog problema često se koristi tzv. Prilikom transformacije pomoću ove metode, trebate odrediti "slivove" i "vodne linije" na slici obradom lokalnih područja ovisno o njihovim karakteristikama svjetline.

Metoda markera vododjelnice jedna je od najefikasnijih metoda segmentacije slike.

Prilikom implementacije ove metode izvode se sljedeće osnovne procedure:

1. Izračunava se funkcija segmentacije. Primjenjuje se na slike na kojima se objekti nalaze u tamnim područjima i teško ih je vidjeti.

2. Proračun markera prednjeg plana slika. Oni se izračunavaju na osnovu analize povezanosti piksela svakog objekta.

3. Proračun pozadinskih markera. To su pikseli koji nisu dio objekata.

4. Modifikacija funkcije segmentacije na osnovu vrijednosti lokacije markera pozadine i markera prednjeg plana.

Jedna od najvažnijih primjena segmentacije duž slivova je odabir objekata homogenih po svjetlini (u obliku mrlja) na pozadini slike. Područja s malim varijacijama svjetline imaju niske vrijednosti gradijenta. Stoga se u praksi često događa situacija kada se metoda segmentacije vododjelnice primjenjuje ne na samu sliku, već na njen gradijent.

6. Opis funkcija

Ovaj rad predstavlja algoritam za segmentaciju slike korištenjem markerske metode vododjelnice.

Glavne funkcije koje se koriste prilikom kreiranja programa:

Funkcija fspecial kreira dvodimenzionalni filter specificiranog tipa;

Imfilter funkcija - morfološka operacija kreiranja slike gradijenta;

Funkcija vododjelnice transformacije sliva iz slike;

Funkcija label2rgb pretvara originalnu sliku u sive nijanse;

Funkcija imregionalmax određuje sve lokalne maksimume slike;

Funkcija imextendedmin pronalazi "niske" tačke na slici koje su dublje od određenog unapred određenog nivoa praga u poređenju sa njihovom neposrednom okolinom;

Funkcija imimposemin modificira sliku u nijansama sive tako da se lokalni minimumi postižu samo na označenim pozicijama; druge vrijednosti piksela se povećavaju kako bi nestale sve ostale točke lokalnog minimuma;

Imreconstruct i Implement funkcije su rekonstrukcija slike pomoću morfoloških operacija otvaranja (zatvaranja).

7. Testiranje algoritma

Prilikom implementacije ove metode izvršene su sljedeće procedure:

1. Čitamo sliku i pretvaramo je u sive tonove (slika 1);

Slika 1. Originalne (lijevo) i slike u nijansama sive (desno).

2. Koristite vrijednosti gradijenta kao funkciju segmentacije (slika 2);

Slika 2. Vrijednosti gradijenta.

3. Izvodimo morfološke operacije na slici (slika 3);

Slika 3. Rezultat primjene morfoloških operacija otvaranja - zatvaranja kroz rekonstrukciju slike.

4. Izračunajte markere prednjeg plana i pozadine slike (slika 4);

Slika 4. Markeri prednjeg plana (lijevo) i pozadine (desno) slike.

5. Gradimo granice slivova (Slika 5);

Slika 5. Granice slivova.

6. Prikazati markere i granice objekata na polutonskoj slici (slika 6);

Slika 6. Markeri i granice objekata.

7. Prikažite rezultat segmentacije koristeći sliku u boji (lijevo) i korištenjem polutransparentnog načina rada (desno).

Slika 7 Rezultati segmentacije.

Zaključak

U ovom radu razvijena je metoda markera za segmentaciju slike.

Direktna primjena algoritma segmentacije vododjelnice rezultira prekomjernom segmentacijom, stoga se za upravljanje prekomjernom segmentacijom koristi pristup baziran na ideji markera.

Marker je povezana komponenta koja pripada slici. Također, prije segmentacije duž slivova, izvršena je neophodna preliminarna obrada slike.

Spisak korištenih izvora

1. Gonzalez R., Woods R. Digitalna obrada slike. - M.: Tehnosfera, 2005. 1072 str.

2. Pratt W. Digitalna obrada slike. - M.: Mir, knjiga 1, 1982.312s.

3. Yaroslavsky L. P. Uvod u digitalnu sliku. - M: Sov. radio, 1979.312 str.

4. Pratt W. Digitalna obrada slike. - M: Mir, knjiga. 1, 1982.480s.

5.http: //www.ict.edu.ru/lib/

6.http: //matlab.exponenta.ru/imageprocess/book2/76.php

7. Vizilter Yu.V. Obrada i analiza digitalnih slika sa primjerima u LabVIEW i IMAQ VIsion. - M: DMK, 2011.464 str.

8. Gonzalez R., Woods R., Eddins S. Digitalna obrada slike u MATLAB-u. - M: Tehnosfera, 2006.616 str.

9.http: //matlab.exponenta.ru/imageprocess/book2/48.php

10. Salomon D. Kompresija podataka, slika i zvuka. - M.: Tehnosfera, 2004.368 str.

Dodatak

Brojimo sliku

rgb = imread ("C: \ Korisnici \ Ime \ Dokumenti \ MATLAB \ picture1.jpeg");

Hajde da to predstavimo kao sivu ton

I = rgb2siva (rgb);slika, imshow (I);

Izračunajte vrijednost gradijenta

hy = fspecial ("sobel"); hx = hy ";

Iy = imfilter (dvostruki (I), hy, "repliciranje");

Ix = imfilter (dvostruki (I), hx, "repliciranje");

gradmag = sqrt (Ix. ^ 2 + Iy. ^ 2);

Primijenite metodu vododjelnice

L = vododjelnica (gradmag);Lrgb = label2rgb (L);

Morfološke operacije

se = strel ("disk", 15);

Ie = imerode (I, se); Iobr = imrekonstruisati (Ie, I);

Iobrd = imdilat (Iobr, se);

Iobrcbr = imrekonstrukt (imkomplement (Iobrd), dopuna (Iobr));

Iobrcbr = dopuna (Iobrcbr);

Izračunavamo lokalne maksimume

fgm = imregionalmax (Iobrcbr);

Postavite markere na sliku

I2 = I, I2 (fgm) = 255;

Uklanjanje pojedinačnih izolovanih piksela

se2 = strel (jedinice (3,3)); fgm2 = zatvoreno (fgm, se2); fgm3 = imerode (fgm2, se2);

Brisanje određenog broja piksela

fgm4 = bwareaopen (fgm3, 20);

Preklapanje na originalnu sliku

I3 = I, I3 (fgm4) = 255;

Izračunajte oznake pozadine

bw = im2bw (Iobrcbr, graythresh (Iobrcbr));

Mjerenje udaljenosti do linije vododjelnice

D = bwdist (bw), DL = vododjelnica (D), bgm = DL == 0;

slika, imshow (bgm), naslov ("bgm");

Podešavanje vrijednosti gradijenta

gradmag2 = imimposemin (gradmag, bgm | fgm4);

L = sliv (gradmag2);

Dodajte markere i ivice objekata originalnoj slici

I4 = I; I4 (imdilat (L == 0, jedinice (3, 3)) | bgm | fgm4) = 255;

Prikaz rezultata pomoću slike u boji

Lrgb = label2rgb (L, "jet", "w", "promiješaj");

Dodajte markere i ivice objekata na poluprozirnu sliku

figurirati, pokazati (I), čekati

himage = imshow (Lrgb);

set (himage, "AlphaData", 0,3);

naslov ("Lrgb2");

Objavljeno na Allbest.ru

...

Slični dokumenti

    Digitalni radiografski sistemi. Metode za automatsku analizu slika u MatLab okruženju. Analiza rendgenskih snimaka. Filtriranje, segmentacija, poboljšanje slike. Hardverske mogućnosti preliminarne normalizacije slike.

    seminarski rad, dodan 07.12.2013

    Izbor metoda za obradu i segmentaciju slika. Matematičke osnove primijenjenih filtera. Histogram svjetline slike. Softverska implementacija integrirane metode obrade slike. Testiranje razvijenog softvera.

    seminarski rad dodan 18.01.2017

    Proučavanje i implementacija softvera u Matlab okruženju metoda za obradu, analizu, filtriranje, segmentaciju i poboljšanje kvaliteta rendgenskih medicinskih slika. Digitalni radiografski sistemi. Razvoj statički baziranih algoritama.

    seminarski rad dodan 20.01.2016

    Savremeni sistemi za analizu teksture slika. Primjeri segmentacije teksture jednopojasnih slika. Upotreba karakteristika dobijenih na osnovu histograma svjetline drugog reda za klasifikaciju spektrozonskih aerofotografija.

    sažetak, dodan 15.01.2017

    Kompjuterska grafika i obrada slika elektronskim računarima su najvažniji aspekt upotrebe računara u svim sferama ljudske delatnosti. Razvoj "podsistema linearne segmentacije", opis algoritma i logike.

    teza, dodana 23.06.2008

    Problemi obrade digitalne slike. Metode segmentacije praga. Kreiranje programa za predstavljanje slike u obliku matrice i primjenu praga na nju. Izrada interfejsa programa za učitavanje i filtriranje slika sa odabranim pragom.

    seminarski rad, dodan 12.11.2012

    Opis matematičkih metoda prezentacije i obrade grafičkih slika. Opis razvijenog softverskog dodatka. Opis funkcija i njihovih atributa. Predstavljanje i obrada grafičkih slika. Rezultati testiranja programa.

    seminarski rad dodan 27.01.2015

    Problem prostorno-vremenske obrade slike u prisustvu šuma i smetnji. Metode optimizacije za prostorno-vremensku obradu slike. Struktura specijalizovanog programa, opis njegovog korisničkog interfejsa. Procjena troškova.

    teze, dodato 10.06.2013

    Detekcija detalja i njihovih granica slike. Primjena rang algoritama. Korištenje algoritama za adaptivnu kvantizaciju modova u načinu obrade fragment po fragment. Generalizirano linearno filtriranje slika. Obnova nedostajućih područja.

    seminarski rad, dodan 17.06.2013

    Pregled postojećeg softvera za automatizaciju odabira ivica na slici. Razvoj matematičkog modela za obradu slike i detekciju ivica u sivim tonovima i softvera za algoritame obrade slike.

Uređivanje slika i stvaranje kolaža bilo bi prilično uzbudljivo da ne morate većinu svog vremena provoditi na mukotrpnom obilježavanju objekata. Zadatak postaje još teži kada su granice objekata zamagljene ili postoji transparentnost. Photoshop alati kao što su magnetni laso i magični štapić nisu baš pametni jer se fokusiraju samo na karakteristike slike niskog nivoa. Vraćaju čvrste (tvrde) granice, koje onda treba ručno ispraviti. Adobeov pristup semantičke meke segmentacije pomaže u rješavanju ovog zastrašujućeg zadatka rezanjem slike na slojeve koji odgovaraju semantički značajnim područjima i dodavanjem glatkih prijelaza na rubovima.

"Meka" segmentacija

Tim istraživača iz laboratorije CSAIL na MIT-u i švicarskog univerziteta ETH Zürich, koji rade pod vodstvom Yagyza Aksoya, predložio je pristup ovom problemu zasnovan na spektralnoj segmentaciji, dodajući mu moderna dostignuća u dubokom učenju. Uz pomoć informacija o teksturi i boji, kao i ekstrahovanih semantičkih karakteristika visokog nivoa, iz slike se gradi graf posebnog tipa. Tada se iz ovog grafa gradi Kirchhoffova matrica (Laplasova matrica). Koristeći spektralnu dekompoziciju ove matrice, algoritam generiše meke konture objekata. Slika koja se reže na slojeve dobijena korišćenjem sopstvenih vektora može se zatim koristiti za uređivanje.

Pregled predloženog pristupa

Opis modela

Razmotrimo metodu stvaranja semantički značajnih slojeva korak po korak:

1. Spektralna maska. Predloženi pristup nastavlja rad Levina i njegovih kolega, koji su prvi upotrijebili Kirchhoffovu matricu u problemu automatske konstrukcije maske. Izgradili su matricu L, koja definira parnu sličnost između piksela u nekom lokalnom području. Koristeći ovu matricu, oni minimiziraju kvadratni funkcionalni αᵀLα sa korisničkim ograničenjima, gdje α specificira vektor vrijednosti transparentnosti za sve piksele datog sloja. Svaka meka kontura je linearna kombinacija K svojstvenih vektora koji odgovaraju najmanjim svojstvenim vrijednostima L, što maksimizira takozvanu rijetkost maske.

2. Afinitet boja. Da bi izračunali znakove ne-lokalne blizine boja, istraživači generiraju 2.500 superpiksela i procjenjuju blizinu između svakog superpiksela i svih superpiksela u susjedstvu s radijusom od 20% veličine slike. Korištenje ne-lokalne blizine osigurava da područja s vrlo sličnim bojama ostanu koherentna u složenim scenama poput ove ispod.

Ne-lokalna blizina boja

3. Semantički afinitet. Ova faza vam omogućava da odaberete semantički povezana područja slike. Semantička blizina podstiče spajanje piksela koji pripadaju istom objektu scene i kažnjava spajanje piksela različitih objekata. Ovdje istraživači koriste prednost prethodnog napretka u prepoznavanju obrazaca i izračunavaju, za svaki piksel, vektor karakteristika koji je u korelaciji sa objektom piksela. Vektori karakteristika se izračunavaju pomoću neuronske mreže, o čemu ćemo detaljnije govoriti u nastavku. Semantički afinitet, kao i boja, definira se u terminima superpiksela. Međutim, za razliku od afiniteta boja, semantički afinitet povezuje samo najbliže superpiksele, podstičući stvaranje koherentnih objekata. Kombinacija nelokalne blizine boja i lokalne semantičke blizine omogućava stvaranje slojeva koji pokrivaju slike fragmenta jednog semantički povezanog objekta (na primjer, vegetacija, nebo, druge vrste pozadine) koje su nepovezane u prostoru.

Semantički afinitet

4. Kreiranje slojeva. U ovom koraku, koristeći prethodno izračunatu blizinu, konstruiše se matrica L. Iz ove matrice se izdvajaju sopstveni vektori koji odgovaraju 100 najmanjih sopstvenih vrednosti, a zatim se primenjuje algoritam retkosti koji iz njih izdvaja 40 vektora duž kojih se slojevi su konstruisani. Zatim se broj slojeva ponovo smanjuje koristeći k-means algoritam za grupisanje za k = 5. Ovo radi bolje nego jednostavno sparingovanje 100 sopstvenih vektora na pet, pošto tako drastično smanjenje dimenzije čini problem prevaziđenim. Istraživači su odabrali konačan broj kontura na 5 i tvrde da je to razuman broj za većinu slika. Međutim, ovaj broj se može ručno promijeniti u zavisnosti od slike koja se obrađuje.


Meke konture prije i poslije grupiranja

5. Vektori semantičkih karakteristika. Za izračunavanje semantičke blizine korišteni su vektori karakteristika, izračunati pomoću neuronske mreže. Neuronska mreža je bazirana na DeepLab-ResNet-101, obučenoj na problemu metričkog predviđanja. Tokom treninga podsticano je maksimiziranje L2-razdaljine između karakteristika različitih objekata. Dakle, neuronska mreža minimizira udaljenost između karakteristika koje odgovaraju jednoj klasi i maksimizira udaljenost u drugom slučaju.

Kvalitativno poređenje sa sličnim metodama

Slike ispod prikazuju rezultate predloženog pristupa (označenog sa "Naš rezultat") u poređenju sa rezultatima najbližeg pristupa meke segmentacije - metodom spektralnog maskiranja - i dve najsavremenije metode semantičke segmentacije: PSPNet scena metoda obrade i metoda segmentacije objekata Mask R-CNN.


Kvalitativna poređenja meke semantičke segmentacije s drugim pristupima

Može se zamijeniti da su PSPNet i Mask R-CNN skloni greškama na granicama objekata, a meke konture konstruirane spektralnom metodom često prelaze granice objekata. U isto vrijeme, opisana metoda u potpunosti pokriva objekt, ne kombinujući ga s drugim, i postiže visoku preciznost na rubovima, dodajući meke prijelaze gdje je to potrebno. Međutim, treba napomenuti da semantičke karakteristike korištene u ovoj metodi ne razlikuju dva različita objekta koji pripadaju istoj klasi. Kao rezultat toga, više objekata je predstavljeno na jednom sloju, što se može vidjeti na primjeru slika žirafa i krava.

Uređivanje slika s mekim semantičkim obrisima

Ispod je nekoliko primjera kako koristiti meke staze za uređivanje slika i stvaranje kolaža. Meke staze se mogu koristiti za primjenu specifičnih uređivanja na različite slojeve: dodavanje zamućenja pokreta (2), odvojena podešavanja boja za ljude i pozadinu (5, 6), odvojeno oblikovanje za balon, nebo, pejzaž i osobu (8) ... Naravno, isto se može učiniti pomoću ručno kreiranih maski ili klasičnih algoritama za odabir konture, ali s automatskim odabirom semantički značajnih objekata, takvo uređivanje postaje mnogo lakše.

Korištenje meke semantičke segmentacije za uređivanje slika

Zaključak

Ova metoda automatski kreira meke konture koje odgovaraju semantički značajnim područjima slike koristeći mješavinu informacija visokog nivoa iz neuronske mreže i funkcija niskog nivoa. Međutim, ova metoda ima nekoliko ograničenja. Prvo, relativno je spor: vrijeme obrade slike od 640 x 480 je 3-4 minute. Drugo, ova metoda ne stvara odvojene slojeve za različite objekte iste klase. I treće, kao što je prikazano u nastavku, ova metoda može pogriješiti u početnim fazama obrade u slučajevima kada su boje objekata vrlo slične (primjer na vrhu), ili kada se kombiniraju meke staze u blizini velikih prijelaznih područja (donji primjer).

Slučajevi greške algoritma

Međutim, meke staze kreirane opisanom metodom pružaju pogodan srednji prikaz slike, omogućavajući vam da potrošite manje vremena i truda prilikom uređivanja slika.

Top srodni članci