Alat za obradu slike. Kratki tečaj teorije obrade slika

17.06.2019 Programi

Segmentacija slike

Segmentacija uspostavlja karakteristične podskupove piksela ili dijeljenje slike na povezane regije, od kojih je svaka u nekom smislu "homogena". Procesi segmentacije i izdvajanja obilježja mogu se promatrati kao dodjeljivanje oznaka pikselima koje definiraju posebne klase kojima ti pikseli pripadaju. Dakle, rezultat procesa segmentacije je simbolična slika u kojoj su vrijednosti piksela oznake, a ne razine svjetline.

Klasifikacija modela slike

Za segmentaciju slika koristi se jedan ili drugi model koji daje više ili manje adekvatan opis stvarnih slika. Postoje dvije glavne klase modela slike: statistički i prostorni. Statistički modeli opisuju kolekciju slikovnih točaka ili regija. Prostorni modeli opisuju dekompoziciju slike na njezine sastavne dijelove ili regije.

Statistički modeli prvog reda opisuju skup pikselnih elemenata slike bez obzira na njihov položaj u prostoru. Najjednostavniji opis ove vrste je gustoća vjerojatnosti distribucije vrijednosti svjetline, koja se izračunava pomoću histograma vrijednosti svjetline. Često se vjeruje da je gustoća vjerojatnosti distribucije vrijednosti stvarne slike aproksimirana nekim standardom, na primjer, Gaussovom funkcijom gustoće vjerojatnosti ili mješavinom takvih funkcija.

Modeli prvog reda ne uzimaju u obzir da se slika sastoji od bilo kakvih koordiniranih dijelova (elementa teksture, objekata itd.). Međusobni raspored elemenata u prostoru uzet je u obzir modelima skupova slikovnih točkastih elemenata višeg reda. Jedan od modela je susjedna matrica luma vrijednosti, čiji elementi predstavljaju frekvencije parova vrijednosti luma na odabranom offsetu. U praksi se vrijednost pomaka bira dovoljno mala, jer s velikim pomakom vrijednosti svjetline postaju neovisne jedna o drugoj.

Druga metoda opisivanja prostornih odnosa između elemenata piksela slike je razmatranje gustoće vjerojatnosti distribucije vrijednosti lokalne značajke, što je često učinkovitije od korištenja gustoće vjerojatnosti distribucije vrijednosti svjetline višeg reda. . Posebno su korisne u segmentaciji slike lokalne značajke zbog prisutnosti rubova, na primjer, vrijednosti različitih diferencijalnih operatora za mjerenje gradijenta svjetline.

Statistički modeli slike također uključuju modele slučajnih polja i vremenskih serija, koji se uglavnom koriste u modeliranju teksture.

Prostorni modeli opisuju sliku u terminima regija. Slika se može predstaviti kao skup objekata u pozadini, raščlanjenih na regije na neki pravilan ili slučajan način, kao model oblika regija. Prostorni modeli općenito omogućuju izdvajanje više informacija iz slike nego modeli statistike raspodjele svjetline. Međutim, do sada se koriste samo prilično jednostavni modeli, a njihov matematički aparat zahtijeva daljnji razvoj.

Segmentacija slike prema pragu

Najjednostavnija i najčešće korištena metoda segmentacije slike je postavljanje praga. U brojnim standardnim metodama za izdvajanje dijelova slike po pragu, vrijednosti praga se određuju izravno iz histograma slike (statistički model slike prvog reda). Povijesno gledano, prva metoda u ovoj skupini metoda je mod metoda. Metoda proizlazi iz pretpostavke da slika sadrži poznati broj klasa točaka homogenih po svjetlini. Osim toga, vjeruje se da granična područja između zatvorenih područja zauzimaju relativno malo područje slike. Stoga bi na histogramu trebali odgovarati međumodnim dolinama unutar kojih su postavljeni pragovi segmentacije.

Međutim, stvarne slike se ne uklapaju dobro s iznesenim pretpostavkama. U pravilu su granice između područja nejasne, a modalna struktura histograma nedovoljno izražena. Osim toga, čak i kada histogram ima vidljive modove, njegova korita mogu biti toliko široka i ravna da je teško locirati dno korita.

Ako stvarna slika ne zadovoljava uvjete mod metode, primjenjuju se sljedeća četiri pristupa. Prvo, poboljšanje histograma, uključujući na temelju lokalnih svojstava slike pomoću informacija o gradijentu, statistike drugog reda, analize zakrivljenosti kumulativne funkcije distribucije. Drugo, aproksimacija histograma mješavinom normalnih distribucija i korištenje statističkih metoda za optimalno odvajanje ove smjese. Nedostatak ovog pristupa je velika računska složenost; štoviše, Gaussov često slabo aproksimira stvarne modove. Treće, uvođenje empirijske mjere kvalitete segmentirane slike i maksimiziranje odgovarajuće funkcije kriterija - diskriminantni pristup, entropijski pristup, pristup momentu itd. Četvrto, prijelaz na korištenje drugih statistika za izbor praga, posebice izbor praga izravno prema lokalnim značajkama. Korištenje lokalnih značajki omogućuje segmentiranje složenih stvarnih slika s višom kvalitetom.

Analiza histograma osigurava zadovoljavajuću kvalitetu segmentacije onih slika koje se sastoje od područja ujednačene svjetline. Međutim, pri odabiru malih objekata na složenoj pozadini, točke objekata ne pokazuju vidljive vrhove u histogramu svjetline. Stoga se koristi obrada s promjenjivim pragom: za male fragmente slike izrađuju se histogrami koji se provjeravaju na bimodalnost, a pronađeni lokalni pragovi interpoliraju na ostatak slike.

U djelima Osta predložen je niz algoritama koji se temelje na diskriminantnoj analizi. Neka G={0,1,...,L) - moguće vrijednosti svjetline slike. Prag dijeli raspodjelu vrijednosti svjetline slike u dvije klase C 0={0,1,...,t) i C 1={t+1,t+2,...,L}, tÎ G... Optimalni prag t* definirano kao

gdje je varijanca distribucije vrijednosti svjetline slike u cjelini, w0 je vjerojatnost slučajne točke koja pripada pozadini, https://pandia.ru/text/80/299/images/image004_46 .gif "width =" 21 "height =" 24 " > - prosječna razina svjetline pozadine (klasa C 0).

Ako se područja objekta i pozadine međusobno oštro razlikuju, histogram funkcije kriterija može biti multimodalan. Stoga je potrebno odrediti sve lokalne vrhove, što ozbiljno smanjuje konkurentnost metode.

Entropijski kriterij za izbor optimalnog praga. Koristeći ranije uvedene definicije, histogram vrijednosti svjetline može se smatrati kao L-simbolički izvor informacija s entropijom

gdje pi Je li vjerojatnost svjetline s vrijednošću i.

Entropija izvora je zbroj entropije objekta H 0 i pozadinska entropija H 1, a optimalni prag trebao bi dati maksimalnu vrijednost ovog zbroja:

, (2)

pri čemu .

Budući da svaki od pojmova H 0 i H 1 karakterizira ujednačenost raspodjele svjetline u odgovarajućim intervalima i naglo se smanjuje kada "vanzemaljski" fragment histograma padne u ovaj interval, maksimum entropijskog kriterija odgovarat će najboljoj opciji segmentacije. Nedostatak ove metode je što kriterijska funkcija može imati nekoliko maksimuma bliskih vrijednosti.

Za razliku od diskriminantnog pristupa, metoda očuvanja trenutka uvodi sve trenutke slike do (2 k+1) narudžba uključuje:

Smatra se da optimalni prag osigurava jednakost odgovarajućih momenata segmentirane i originalne slike. Međutim, ako k> 3, tada postoje poteškoće povezane s nedostatkom analitičkog rješenja problema.

Prijelaz s izbora praga prema histogramu svjetline na korištenje drugih statistika, nedvojbeno, komplicira algoritme segmentacije, ali omogućuje bolju segmentaciju složenih slika. Za odabir malih objekata izgleda obećavajuće odabrati prag izravno iz lokalnih svojstava točaka slike.

Metoda maksimalnog prosječnog kontrasta. Metoda se temelji na jednostavnom heurističkom određivanju optimalnog praga: optimalnim pragom za segmentaciju slike smatra se prag koji razlikuje više visokog kontrasta i manje niskokontrastnih razlika u svjetlini od bilo kojeg drugog praga. Kvantitativni izraz kriterija je prosječni kontrast svih razlika svjetline dodijeljenih ovim pragom. Prag koji odgovara maksimalnom prosječnom kontrastu je optimalan. Ako dvije susjedne točke x 1=(x 1,y 1) i x 2=(x 2,y 2) imaju vrijednosti svjetline f(x 1) i f(x 2) (bez gubitka općenitosti f(x 1) £ f(x 2)), zatim broj kapi dodijeljen pragom t, jednako:

gdje

Potpuni kontrast koji odgovara pragu t, jednako je:

gdje je DIV_ADBLOCK169 ">

. (3)

Na temelju matrica susjednih vrijednosti svjetline koje je predložio Haralik, razmatra se sljedeća metoda segmentacije. Za sliku, matrice zajedničkog izgleda razina svjetline parova susjednih točaka u horizontali P 1.0 i okomito P 1,90 smjerova, kao i ukupna prijelazna matrica veličine ( L+1) ´ ( L+1):

Pvh=P 1,0 +P 1,90.

Proizvoljni prag t dijeli točke slike u dvije klase S 0 i S 1, a prijelazna matrica - za 4 bloka.

Razmatraju se matematičke metode segmentacije slike Dicom standarda. Razvijaju se matematičke metode Dicom segmentacije slike za probleme prepoznavanja medicinskih slika. Dijagnoza bolesti ovisi o kvalifikacijama istraživača i zahtijeva od njega vizualnu segmentaciju, a alat za ovu dijagnozu su matematičke metode za obradu rasterskih slika. Obrada medicinskih slika dobivenih hardverom bez preliminarne obrade grafičkih podataka u većini slučajeva daje netočne rezultate. Provedeni su postupci za isticanje kontura objekata Canny metodom i dodatni algoritmi za obradu rasterskih slika. Rezultati istraživanja omogućuju izračunavanje morfometrijskih, geometrijskih i histogramskih svojstava formacija u ljudskom tijelu, potrebnih za daljnje liječenje bolesnika, te pružanje učinkovitog medicinskog liječenja. Razvijena načela računalne analize medicinskih slika učinkovito se koriste za operativne zadatke medicinske dijagnostike specijalizirane onkološke ustanove, kao i u obrazovne svrhe.

prepoznavanje uzorka

segmentacija objekata od interesa

medicinske slike

1. Vlasov A.V., Tsapko I.V. Modifikacija Cannyjevog algoritma primijenjena na obradu rendgenskih slika // Bulletin of Science of Siberia. - 2013. - Broj 4 (10). - S. 120-127.

2. Gonzales R., Woods R. Digitalna obrada slike. - M .: Tehnosfera, 2006 .-- S. 1072.

3. Kuljabičev Yu.P., Pivtoratskaya S.V. Strukturni pristup izboru značajki u sustavima za prepoznavanje uzoraka // Prirodne i tehničke znanosti. - 2011. - br. 4. - Str. 420–423.

4. Nikitin OR, Pasechnik A.S. Konturiranje i segmentacija u zadacima automatizirane dijagnostike patologija // Metode i uređaji za prijenos i obradu informacija. - 2009. - Broj 11. - Str. 300–309.

5. Canny J. Računalni pristup detekciji rubova // IEEE Transactions on pattern analysis and machine intelligence. - 1986. - br. 6. - P.679–698.

6. DICOM - Način pristupa: http://iachel.ru/ zob23tai-staihroe / DICOM

7. Doronicheva A.V., Sokolov A.A., Savin S.Z. Korištenje Sobel operatora za automatsko otkrivanje rubova u medicinskim slikama // Journal of Mathematics and System Science. - 2014. - God. 4, broj 4 - P. 257-260.

8. Jähne B., Scharr H., Körkel S. Principi dizajna filtera // Handbook of Computer Vision and Applications. Academic Press. - 1999.-- 584 str.

Jedan od prioritetnih smjerova u razvoju medicine u Rusiji je prijelaz na vlastite inovativne tehnologije za elektroničku registraciju, pohranu, obradu i analizu medicinskih slika organa i tkiva pacijenata. To je uzrokovano povećanjem količine informacija prikazanih u obliku slika u dijagnostici društveno značajnih bolesti, prvenstveno onkoloških, čije liječenje u većini slučajeva ima rezultat tek u ranim fazama.

Prilikom dijagnosticiranja slika standarda DICOM utvrđuje se patološko područje, a kada se potvrdi njegova patološka priroda, rješava se klasifikacijski problem: pripisivanje nekoj od poznatih vrsta ili identifikacija nove klase. Očigledna poteškoća su nedostaci rezultirajuće slike, kako zbog fizičkih ograničenja opreme tako i zbog dopuštenih granica opterećenja na ljudsko tijelo. Kao rezultat toga, softver je taj koji ima zadaću dodatne obrade slika kako bi se povećala njihova dijagnostička vrijednost za liječnika, kako bi se prikazala u prikladnijem obliku i kako bi se istakla glavna stvar iz velike količine dobivenih podataka. .

Svrha studije... Razvijaju se matematičke metode Dicom segmentacije slike za probleme prepoznavanja medicinskih slika. Dijagnoza bolesti ovisi o kvalifikacijama istraživača i zahtijeva od njega vizualnu segmentaciju, a alat za ovu dijagnozu su matematičke metode za obradu rasterskih slika. Obrada medicinskih slika dobivenih hardverom bez preliminarne obrade grafičkih podataka u većini slučajeva daje netočne rezultate. To je zbog činjenice da su u početku slike dobivene nezadovoljavajuće kvalitete.

Materijal i metode istraživanja

Kao materijal za istraživanje koriste se računalni tomogrami pacijenata specijalizirane kliničke ustanove. Prije analize stvarnih grafičkih podataka potrebno je pripremiti sliku ili izvršiti prethodnu obradu. Ova faza rješava problem poboljšanja vizualne kvalitete medicinskih slika. Korisno je cijeli proces obrade slike podijeliti u dvije široke kategorije: metode u kojima su i ulaz i izlaz slike; metode, gdje su ulazni podaci slike, a kao rezultat rada, izlazni podaci su znakovi i atributi identificirani na temelju ulaznih podataka. Ovaj algoritam ne podrazumijeva da se svaki od gore navedenih procesa primjenjuje na sliku. Zapisivanje podataka je prvi od procesa prikazanih na Sl. jedan.

Riža. 1. Glavne faze digitalne obrade grafičkih podataka

Registracija može biti prilično jednostavna, kao u primjeru kada je originalna slika digitalna. Tipično, korak registracije slike uključuje prethodnu obradu podataka, kao što je zumiranje slike. Poboljšanje slike jedno je od najjednostavnijih i najimpresivnijih područja predobrade. U pravilu, problem pronalaženja slabo prepoznatljivih piksela ili povećanja kontrasta u izvornoj slici određen je metodama poboljšanja informativnog sadržaja slika. Jedna od često korištenih metoda poboljšanja informativnog sadržaja slika je poboljšanje kontrasta slike, jer se povećavaju granice objekta od interesa. Treba imati na umu da je poboljšanje kvalitete slike u određenoj mjeri subjektivan zadatak u obradi slike. Obnova slike - ovaj zadatak se također odnosi na poboljšanje vizualne kvalitete podataka. Metode obnavljanja slike temelje se na matematičkim i vjerojatnosnim modelima deformacije grafičkih podataka. Obradu slike kao fazu treba odvojiti od koncepta obrade slike kao cjelovitog procesa promjene slike i dobivanja nekih podataka. Segmentacija, ili proces isticanja objekata od interesa, dijeli sliku na sastavne objekte ili dijelove. Automatizirani odabir objekata od interesa je u određenoj mjeri težak zadatak u digitalnoj obradi slike. Previše detaljna segmentacija otežava obradu slike ako trebate istaknuti objekte od interesa. Ali netočna ili nedovoljno detaljna segmentacija u većini zadataka dovodi do pogrešaka u završnoj fazi obrade slike. Prezentacija i opis grafičkih podataka, u pravilu, slijedi fazu isticanja objekata od interesa na slici, čiji izlaz u većini slučajeva sadrži neobrađene piksele koji tvore granice regije ili čine sve piksele slike. regije. S takvim opcijama potrebno je podatke transformirati u oblik koji je dostupan za računalnu analizu. Prepoznavanje uzoraka je proces koji dodjeljuje identifikator objektu (na primjer, "radijus") na temelju njegovih opisa. Definirajmo odnos između baze znanja i modula za obradu slika. Baza znanja (odnosno informacija o problemskom području) je na neki način šifrirana unutar samog sustava za obradu slike. To znanje može biti prilično jednostavno, kao što je detaljna indikacija objekata na slici, gdje se područje interesa treba nalaziti. Ovo znanje omogućuje ograničavanje područja pretraživanja. Baza znanja upravlja radom svakog modula za obradu i njihovom interakcijom, što je prikazano na Sl. 1 sa strelicama koje pokazuju u dva smjera između modula i baze znanja. Spremanje i ispis rezultata često također zahtijeva posebne tehnike obrade slika. Nedostatak ovih faza obrade slike u sustavu za obradu medicinske slike je u tome što greške nastale u prvim fazama obrade, na primjer, prilikom unosa ili isticanja objekata od interesa na slici, mogu dovesti do nemogućnosti ispravne klasifikacije. Obrada podataka se provodi strogo uzastopno, te u većini slučajeva ne postoji mogućnost povratka na prethodne faze obrade, čak i ako su prethodno dobiveni netočni rezultati. Metode u fazi predobrade prilično su raznolike - odabir objekata od interesa, njihovo skaliranje, korekcija boja, podešavanje prostorne rezolucije, promjena kontrasta itd. Jedna od prioritetnih radnji u fazi predobrade slike je podešavanje kontrasta i svjetline. Pri korištenju odgovarajućih maski moguće je kombinirati dvije faze (filtriranje i prethodnu obradu) kako bi se povećala brzina analize podataka. Konačni rezultat analize slike u većini slučajeva određen je razinom kvalitete segmentacije, a stupanj detaljnosti objekata od interesa ovisi o konkretnom zadatku. Iz tog razloga nije razvijena posebna metoda ili algoritam koji bi bio prikladan za rješavanje svih problema identificiranja objekata od interesa. Konturiranje područja namijenjeno je odabiru objekata sa određenim svojstvima na slikama. Ovi objekti u pravilu odgovaraju predmetima ili njihovim dijelovima koje dijagnostičari obilježavaju. Rezultat konturiranja je binarna ili hijerarhijska (višefazna) slika, gdje svaka razina slike odgovara određenoj klasi odabranih objekata. Segmentacija je teška faza u obradi i analizi medicinskih podataka bioloških tkiva, jer je potrebno razgraničiti područja koja odgovaraju različitim objektima ili strukturama na histološkim razinama: stanice, organele, artefakti itd. To je zbog velike varijabilnosti njihovih parametara, niske razine kontrasta analiziranih slika i složenog geometrijskog odnosa objekata. U većini slučajeva, da bi se dobio najučinkovitiji rezultat, potrebno je dosljedno koristiti različite metode segmentacije objekata od interesa na slici. Na primjer, za određivanje granica objekta od interesa koristi se metoda morfološkog gradijenta, nakon čega se provodi segmentacija praga za područja koja su prikladna za beznačajne razlike u karakteristikama svjetline. Za obradu slika kod kojih su nepovezana homogena područja različita po prosječnoj svjetlini odabrana je Cannyjeva metoda segmentacije, a istraživanja su provedena na kliničkom primjeru. Modeliranje je slabo primjenjivo za prepoznavanje stvarnih kliničkih slika. Praktično iskustvo i stručna mišljenja o ishodu analize slike su od velike važnosti. Za probnu sliku odabrana je slika kompjutorizirane tomografije na kojoj je eksplicitno prisutan objekt od interesa, prikazan na sl. 2.

Riža. 2. Slika kompjuterizirane tomografije s predmetom interesa

Za implementaciju dijeljenja koristimo Canny metodu. Ovaj pristup je otporan na buku i u većini slučajeva pokazuje bolje rezultate od drugih metoda. Canny metoda uključuje četiri koraka:

1) prethodna obrada - zamućenje slike (smanjujemo varijancu aditivnog šuma);

2) provođenje diferencijacije zamućene slike i naknadno izračunavanje vrijednosti gradijenta u smjeru x i y;

3) provedba ne maksimalnog potiskivanja na slici;

4) prag slike.

U prvoj fazi Cannyjevog algoritma, slika se izglađuje pomoću maske s Gaussovim filterom. Gaussova jednadžba raspodjele u N dimenzijama ima oblik

ili u konkretnom slučaju za dvije dimenzije

(2)

gdje je r polumjer zamućenja, r 2 = u 2 + v 2; σ je standardna devijacija Gaussove distribucije.

Ako koristimo 2 dimenzije, tada ova formula definira površinu koncentričnih kružnica koje imaju Gaussovu distribuciju od središnje točke. Pikseli s distribucijom različitom od nule koriste se za definiranje matrice konvolucije koja će se primijeniti na izvornu sliku. Vrijednost svakog piksela postaje ponderirani prosjek za susjedstvo. Početna vrijednost piksela poprima maksimalnu težinu (ima maksimalnu Gaussovu vrijednost), a susjedni pikseli poprimaju minimalnu težinu, ovisno o udaljenosti do njih. Teoretski, distribucija u svakoj točki na slici trebala bi biti različita od nule, što slijedi izračun težinskih koeficijenata za svaki piksel na slici. Ali u praksi, pri izračunu diskretne aproksimacije Gaussove funkcije, pikseli na udaljenosti > 3σ se ne uzimaju u obzir, jer je prilično mala. Stoga program koji obrađuje sliku treba izračunati matricu × kako bi osigurao da je aproksimacija Gaussove distribucije dovoljno točna.

Rezultati istraživanja i njihova rasprava

Rezultat Gaussovog filtera s podacima jednakim 5 za veličinu Gaussove maske i 1,9 za vrijednost parametra σ - standardna devijacija Gaussove distribucije, prikazan je na Sl. 3. Sljedeći korak je traženje gradijenta područja od interesa pomoću konvolucije zaglađene slike s derivacijom Gaussove funkcije u okomitom i horizontalnom smjeru vektora.

Za rješavanje ovog problema primijenimo Sobel operator. Proces se temelji na jednostavnom pomicanju filter maske s piksela na piksel na slici. Na svakom pikselu (x, y), odgovor filtra se izračunava iz unaprijed definiranih veza. Rezultat je početni odabir rubova. Sljedeći korak je usporedba svakog piksela sa svojim susjedima duž smjera gradijenta i izračunavanje lokalnog maksimuma. Informacija o smjeru gradijenta nužna je kako bi se uklonili pikseli u blizini granice bez prekidanja same granice u blizini lokalnih maksimuma gradijenta, što znači da pikseli obruba određuju točke u kojima je lokalni maksimum gradijenta dosegnut u smjeru vektora gradijenta. Ovaj pristup može značajno smanjiti detekciju lažnih rubova i osigurava debljinu granice objekta od jednog piksela, što je empirijski potvrđeno softverskom implementacijom algoritma za segmentiranje trbušnog reza na slici kompjuterizirane tomografije prikazanoj dolje na Sl. 4.

Sljedeći korak je korištenje praga za određivanje gdje je granica na svakom danom pikselu na slici. Što je prag niži, to će više granica biti u objektu od interesa, ali rezultat će biti osjetljiviji na šum i iscrtavanje nepotrebnih slikovnih podataka. Visoki prag može zanemariti slabe rubove područja ili dobiti granicu s više područja. Razgraničenje obruba primjenjuje dva praga filtriranja: ako je vrijednost piksela iznad gornje granice, uzima maksimalnu vrijednost (granica se smatra valjanom), ako je ispod, piksel je potisnut, uzimaju se točke s vrijednošću koja pada unutar raspona između pragova fiksnu prosječnu vrijednost. Piksel se pridružuje grupi ako je dodirne u jednom od osam smjerova. Jedna od prednosti Cannyjeve metode je da se tijekom obrade slike provodi prilagodba specifičnostima segmentacije. To se postiže uvođenjem praga za izrezivanje redundantnih podataka na dvije razine. Određene su dvije razine praga, gornja je p visoka, a donja p niska, pri čemu je p visoka > p niska. Vrijednosti piksela iznad visoke vrijednosti p označene su kao da odgovaraju granici (slika 5).

Riža. 3. Primjena Gaussovog filtera na CT snimku s predmetom od interesa

Riža. 4. Suzbijanje ne-maksima na segmentiranoj slici

Riža. 5. Primjena Cannyjevog algoritma segmentacije s različitim vrijednostima razina praga

Praksa pokazuje da postoji određeni interval na ljestvici razina praga osjetljivosti na kojem je vrijednost površine predmeta od interesa praktički nepromijenjena, ali istovremeno postoji određena razina praga, nakon čega se "razbijanje ” metode konturiranja, a rezultat identificiranja područja od interesa postaje neizvjestan. Ovaj nedostatak algoritma može se nadoknaditi kombiniranjem Cannyjevog algoritma s Houghovom transformacijom za pronalaženje krugova. Kombinacija algoritama omogućuje što jasnije isticanje predmeta proučavanja, kao i uklanjanje praznina u konturama.

zaključke

Time je riješen problem formuliranja tipičnih karakteristika patoloških objekata na medicinskim slikama, što će omogućiti provođenje operativne analize podataka o specifičnim patologijama u budućnosti. Važni parametri za određivanje ocjene kvalitete segmentacije su vjerojatnosti lažnih uzbuna i promašaja - odbijanja. Ovi parametri određuju primjenu automatizacije metode analize. Segmentacija u rješavanju problema klasifikacije i prepoznavanja objekata na slikama jedan je od najvažnijih. Metode konturiranja temeljene na segmentaciji granica regija - Sobel, Canny, Prewit, Laplassian - dobro su istražene i primijenjene. Ovaj pristup određen je činjenicom da je koncentracija pažnje osobe tijekom analize slike često usmjerena na granice između više ili manje homogenih zona u smislu svjetline. Na temelju toga konture često služe kao osnova za definiranje različitih karakteristika za interpretaciju slika i predmeta u njima. Glavni zadatak algoritama za segmentiranje zona interesa je izgradnja binarne slike koja sadrži zatvorena područja strukturnih podataka na slici. U odnosu na medicinske slike, ova područja su granice organa, vena, MCC-a, kao i tumora. Razvijena načela računalne analize medicinskih slika učinkovito se koriste i za operativne zadatke medicinske dijagnostike specijalizirane onkološke ustanove i u obrazovne svrhe.

Istraživan uz potporu programa "Daleki istok", grant broj 15-I-4-014o.

Recenzenti:

Kosykh N.E., doktor medicinskih znanosti, profesor, glavni istraživač, FGBUN "Računalni centar" FEB RAS, Khabarovsk;

Levkova EA, MD, DSc, profesor, Far Eastern State Transport University, Khabarovsk.

Bibliografska referenca

Doronicheva A.V., Savin S.Z. METODA SEGMENTACIJE MEDICINSKIH SLIKA // Fundamentalna istraživanja. - 2015. - Broj 5-2. - S. 294-298;
URL: http://fundamental-research.ru/ru/article/view?id=38210 (datum pristupa: 06.04.2019.). Predstavljamo Vam časopise koje izdaje "Akademija prirodnih znanosti"

Jedan od glavnih ciljeva računalnog vida u obradi slike je interpretacija sadržaja na slici. Da biste to učinili, potrebno je kvalitativno odvojiti pozadinu od objekata. Segmentacija dijeli sliku na njezine sastavne dijelove ili objekte. Odvaja objekt od pozadine tako da možete jednostavno obraditi slike i identificirati njegov sadržaj. U ovom slučaju, odabir kontura na slici je temeljni alat za kvalitetno segmentiranje slike. Ovaj članak pokušava proučiti izvedbu često korištenih algoritama za detekciju rubova za daljnju segmentaciju slike, kao i njihovu usporedbu pomoću softverskog alata MATLAB.

Uvod

Segmentacija slike veliki je korak za analizu slike. Dijeli sliku na njezine sastavne dijelove ili objekte. Razina detalja zajedničkih područja ovisi o problemu koji se rješava. Na primjer, kada objekti od interesa prestanu održavati cjelovitost, razbiju se na manje, sastavne dijelove, proces segmentacije treba zaustaviti. Algoritmi segmentacije slike najčešće se temelje na diskontinuitetu i sličnosti vrijednosti na slici. Pristup diskontinuiteta osvjetljenja temelji se na naglim promjenama vrijednosti intenziteta, dok se sličnost temelji na podjeli slike na slična područja prema nizu unaprijed određenih kriterija. Dakle, izbor algoritma za segmentaciju slike izravno ovisi o problemu koji treba riješiti. Detekcija rubova dio je segmentacije slike. Posljedično, učinkovitost rješavanja mnogih problema obrade slike i računalnog vida ovisi o kvaliteti odabranih granica. Njihovo isticanje na slici može se klasificirati kao algoritmi segmentacije na temelju diskontinuiteta svjetline.

Proces otkrivanja finih diskontinuiteta svjetline na slici naziva se proces poboljšanja ruba. Praznine su nagle promjene u skupini piksela koji su granice objekata. Klasični algoritam za detekciju rubova koristi konvoluciju slike pomoću operatora koji se temelji na osjetljivosti na velike razlike u svjetlini na slici i vraća nulu kada prolazi kroz homogena područja. Sada je dostupan ogroman broj algoritama za detekciju rubova, ali nijedan od njih nije univerzalan. Svaki od postojećih algoritama rješava svoju klasu problema (odnosno, kvalitativno razlikuje granice određene vrste). Da bi se odredio odgovarajući algoritam za detekciju rubova, potrebno je uzeti u obzir parametre kao što su orijentacija i struktura obrisa, kao i prisutnost i vrsta šuma na slici. Geometrija operatora postavlja karakteristični smjer u kojem je najosjetljivija na granice. Postojeći operatori služe za pronalaženje vertikalnih, horizontalnih ili dijagonalnih granica. Odabir granica objekata težak je zadatak u slučaju vrlo bučne slike, budući da je operater osjetljiv na promjene svjetline, pa će se stoga i šum smatrati nekim objektom na slici. Postoje algoritmi koji vam omogućuju da se u velikoj mjeri riješite buke, ali zauzvrat značajno oštećuju rubove slike, izobličujući ih. A budući da većina obrađenih slika sadrži šum, algoritmi za smanjenje šuma su vrlo popularni, ali to utječe na kvalitetu odabranih kontura.

Također, pri otkrivanju kontura objekta javljaju se problemi kao što su pronalaženje lažnih kontura, pozicioniranje kontura, nedostajuće prave konture, šum u obliku šuma, veliko vrijeme računanja itd. Stoga je cilj istražiti i usporediti mnoge obrađene slike i analizirati kvaliteta algoritama u raznim uvjetima.

Ovaj je članak pokušaj pregleda najpopularnijih algoritama za odabir kontura za segmentaciju, kao i njihovu implementaciju u softverskom okruženju MATLAB. Drugi dio uvodi temeljne definicije koje se koriste u literaturi. Treći daje teoretsko-matematički i objašnjava različite računalne pristupe konturiranju. Četvrti dio daje komparativnu analizu različitih algoritama, popraćenu slikama. Peti dio sadrži pregled dobivenih rezultata i zaključak.

Segmentacija slike

Segmentacija slike je proces dijeljenja digitalne slike na više regija ili skupova piksela. Zapravo, to je podjela na različite objekte koji imaju istu teksturu ili boju. Rezultat segmentacije je skup regija koje zajedno pokrivaju cijelu sliku i skup kontura izdvojenih iz slike. Svi pikseli iz istog područja slični su na neki način, kao što su boja, tekstura ili intenzitet. Susjedna područja se međusobno razlikuju po istim karakteristikama. Različiti pristupi pronalaženju granica između regija temelje se na nehomogenosti u razinama svjetline. Dakle, izbor metode segmentacije slike ovisi o problemu koji treba riješiti.

Metode temeljene na domeni temelje se na kontinuitetu. Ovi algoritmi dijele cijelu sliku na podpodručja ovisno o nekim pravilima, na primjer, svi pikseli određene grupe moraju imati određenu sivu vrijednost. Ovi se algoritmi oslanjaju na uobičajene obrasce vrijednosti intenziteta u skupinama susjednih piksela.

Segmentacija praga je najjednostavniji tip segmentacije. Na temelju toga područja se mogu klasificirati prema osnovnom rasponu vrijednosti koje ovise o intenzitetu piksela slike. Prag pretvara ulaznu sliku u binarnu.

Tehnike segmentacije temeljene na detekciji područja izravno pronalaze nagle promjene u vrijednostima intenziteta. Takve metode se nazivaju granične metode. Otkrivanje granica temeljni je problem u analizi slike. Tehnike isticanja granica obično se koriste za pronalaženje nepravilnosti na slici u sivim tonovima. Pronalaženje praznina u slikama u sivim tonovima najvažniji je pristup poboljšanju rubova.

Algoritmi za detekciju granica

Granice objekata na slici uvelike smanjuju količinu podataka koje je potrebno obraditi, a ujedno zadržava važne informacije o objektima na slici, njihovom obliku, veličini, količini. Glavna značajka tehnike otkrivanja granica je mogućnost izdvajanja točne linije s dobrom orijentacijom. U literaturi je opisano mnogo algoritama koji vam omogućuju otkrivanje granica objekata, ali nigdje nema opisa kako procijeniti rezultate obrade. Rezultati se ocjenjuju na čisto individualnoj osnovi i ovise o području njihove primjene.

Detekcija rubova temeljni je alat za segmentaciju slike. Takvi algoritmi pretvaraju ulaznu sliku u sliku s obrisima objekta, uglavnom u sivim tonovima. U obradi slike, posebice u sustavima računalnog vida, uz pomoć odabira konture, razmatraju se važne promjene u razini svjetline na slici, fizičkim i geometrijskim parametrima objekta na sceni. To je temeljni proces koji ocrtava objekte, čime se stječe određeno znanje o slici. Detekcija granica je najpopularniji pristup za otkrivanje značajnih diskontinuiteta.

Obrub je lokalna varijacija svjetline na slici. Obično se protežu uz rub između ta dva područja. Granice vam mogu pomoći da steknete osnovno razumijevanje slike. Njihove funkcije akvizicije koriste napredni algoritmi računalnog vida i polja kao što su medicinsko snimanje, biometrija i slično. Otkrivanje granica aktivno je područje istraživanja jer olakšava analizu slike na visokoj razini. Postoje tri vrste prijeloma slika u sivim tonovima: točka, linija i granica. Prostorne maske mogu se koristiti za otkrivanje sve tri vrste diskontinuiteta.

U tehničkoj literaturi dat je i opisan veliki broj algoritama za odabir kontura i granica. Ovaj rad govori o najpopularnijim metodama. To uključuje Roberts, Sobel, Prewitt, Kirsch, Robinson operator, Cannyjev algoritam i LoG algoritam.

Robertsov operater

Robertsov operator isticanja granica uveo je Lawrence Roberts 1964. godine. Obavlja jednostavne i brze 2D izračune prostornih dimenzija na slici. Ova tehnika naglašava područja visoke prostorne frekvencije koja često odgovaraju rubovima. Slika u sivim tonovima se dovodi na ulaz operatera. Vrijednost piksela izlazne slike u svakoj točki pretpostavlja određenu količinu prostornog gradijenta ulazne slike u istoj točki.

Sobel operater

Sobel operater je uveo Sobel 1970. godine. Ova metoda detekcije granica koristi aproksimaciju derivacije. To omogućuje otkrivanje ruba gdje je gradijent najveći. Ova metoda detektira broj gradijenata na slici, čime se ističu područja visoke prostorne frekvencije koja odgovaraju rubovima. Općenito, to je dovelo do pronalaženja procijenjene apsolutne vrijednosti gradijenta u svakoj točki na ulaznoj slici. Ovaj operator se sastoji od dvije matrice 3 × 3. Druga matrica razlikuje se od prve samo po tome što je zakrenuta za 90 stupnjeva. Ovo je vrlo slično Robertsovom operateru.

Detekcija granica ovom metodom je računski mnogo lakša nego Sobel metodom, ali dovodi do većeg šuma u rezultirajućoj slici.

Operater Prewitt

Detekciju granica od strane ovog operatera predložio je Prewitt 1970. godine. Ispravan smjer u ovom algoritmu bio je procijeniti veličinu i orijentaciju granice. Iako je ocrtavanje granica zamoran zadatak, ovaj pristup daje prilično dobre rezultate. Ovaj algoritam se temelji na korištenju maski 3x3, koje uzimaju u obzir 8 mogućih smjerova, ali ravni smjerovi daju najbolje rezultate. Izračunavaju se sve maske konvolucije.

Kirsch operater

Detekciju granica ovom metodom uveo je Kirsch 1971. godine. Algoritam se temelji na korištenju samo jedne maske, koja se rotira u osam glavnih smjerova: sjever, sjeverozapad, zapad, jugozapad, jug, jugoistok, istok i sjeveroistok. Maske su sljedeće:

Veličina obruba definirana je kao najveća vrijednost pronađena pomoću maske. Smjer određen maskom daje maksimalnu vrijednost. Na primjer, k 0 maska odgovara okomitom rubu, a k 5 maska odgovara dijagonalnoj. Također možete primijetiti da su zadnje četiri maske zapravo iste kao i prva, one su zrcalne slike oko središnje osi matrice.

Robinsonov operater

Robinsonova metoda, uvedena 1977., slična je Kirschevoj, ali jednostavnija za implementaciju zbog korištenja koeficijenata 0, 1 i 2. Maske ovog operatora su simetrične u odnosu na središnju os ispunjenu nulama. Dovoljno je dobiti rezultat obradom prve četiri maske, dok se ostale mogu dobiti invertiranjem prve.

Maksimalna vrijednost dobivena nakon primjene sve četiri maske na piksel i njegovu okolinu smatra se veličinom gradijenta, a kut gradijenta može se aproksimirati kao kut maskiranih nul linija koje daju maksimalan odgovor.

Odabir konture pomoću Marr-Hildreth metode

Marr-Hildreth (1980) metoda je tehnika detekcije rubova digitalne slike koja detektira kontinuirane krivulje gdje god su uočljive brze i nagle promjene svjetline skupine piksela. Ovo je prilično jednostavna metoda, radi pomoću konvolucije slike s funkcijom LoG ili kao brza aproksimacija s DoG-om. Nule u obrađenom rezultatu odgovaraju konturama. Algoritam detektora granica sastoji se od sljedećih koraka:

zamutiti sliku pomoću Gaussove metode;
primjena Laplaceovog operatora na mutnu sliku (često se prva dva koraka kombiniraju u jedan);
izvodimo proračunski ciklus i u rezultatu gledamo promjenu predznaka. Ako se predznak promijenio iz negativnog u pozitivan i vrijednost promjene vrijednosti je veća od određenog unaprijed određenog praga, tada definirajte ovu točku kao granicu;
Za najbolje rezultate, korak pomoću Laplaceovog operatora može se izvesti kroz histerezu kao što je implementirano u Cannyjevom algoritmu.

Odabir konture metodom LoG

Laplasov Gaussov algoritam za konturiranje predložen je 1982. godine. Ovaj algoritam je druga izvedenica, definirana kao:

Izvodi se u dva koraka. U prvom koraku izglađuje sliku, a zatim izračunava Laplaceovu funkciju, što rezultira stvaranjem dvostrukih kontura. Definiranje kontura svodi se na pronalaženje nula na sjecištu dvostrukih granica. Računalna implementacija Laplaceove funkcije obično se provodi kroz sljedeću masku:

Laplassian obično koristi pronalaženje piksela na tamnoj ili svijetloj strani granice.

Canny granični detektor

Canny Border Detector jedan je od najpopularnijih algoritama za detekciju rubova. Prvi ga je predložio John Canney u svom magistarskom radu 1983. godine, a još uvijek je superioran u odnosu na mnoge kasnije razvijene algoritme. Važan korak u ovom algoritmu je eliminacija šuma na konturama, što može značajno utjecati na rezultat, dok je potrebno sačuvati granice što je više moguće. To zahtijeva pažljiv odabir vrijednosti praga prilikom obrade ove metode.

Algoritam:

zamutiti izvornu sliku f (r, c) pomoću Gaussove funkcije f ^ (r, c). f ^ (r, c) = f (r, c) * G (r, c, 6);
tražiti gradijent. Obrube su ocrtane tamo gdje gradijent poprima najveću vrijednost;
suzbijanje ne-maksima. Samo su lokalni maksimumi označeni kao granice;
rezultirajuće granice određuju se potiskivanjem svih bridova koji nisu ograničeni određenom granicom.

Za razliku od Robertsovih i Sobelovih operatora, Cannyjev algoritam nije jako osjetljiv na šum slike.

Rezultati eksperimenta

Ovaj dio predstavlja rezultate prethodno opisanih algoritama za otkrivanje granica objekata na slici.

Svi opisani algoritmi implementirani su u softversko okruženje MATLAB R2009a i testirani na fotografiji sveučilišta. Cilj eksperimenta je dobiti obrađenu sliku savršeno definiranih kontura. Izvorna slika i rezultati njezine obrade prikazani su na slici 1.

Slika 1 - Izvorna slika i rezultat rada različitih algoritama za izdvajanje kontura

Analizom dobivenih rezultata otkrivene su sljedeće pravilnosti: operateri Robertsa, Sobela i Prewitta daju vrlo različite rezultate. Marr-Hildreth, LoG i Kanney pronašli su konture objekta na gotovo isti način, Kirsch i Robinson su dali isti rezultat. No, promatrajući dobivene rezultate, možemo zaključiti da Cannyjev algoritam radi red veličine bolje od ostalih.

zaključke

Obrada slike je područje koje se brzo razvija u disciplini računalnog vida. Svoj rast temelji na visokim dostignućima u digitalnoj obradi slike, razvoju računalnih procesora i uređaja za pohranu informacija.

U ovom se članku pokušalo u praksi proučiti metode isticanja kontura objekata na temelju diskontinuiteta svjetline slike u sivim tonovima. Istraživanje relativne učinkovitosti svake od metoda prikazanih u ovom članku provedeno je pomoću softverskog alata MATLAB. Analiza rezultata obrade slike pokazala je da metode kao što su Marr-Hildreth, LoG i Canny daju gotovo iste rezultate. No ipak, pri obradi ove testne slike najbolji rezultati se mogu uočiti nakon rada Cannyjevog algoritma, iako bi se u drugim uvjetima mogla pokazati boljom druga metoda.

Čak i uzimajući u obzir činjenicu da je pitanje otkrivanja granica na slici dovoljno dobro osvijetljeno u suvremenoj tehničkoj literaturi, to i dalje ostaje prilično naporan zadatak, budući da kvalitativni odabir granica uvijek ovisi o mnogim čimbenicima koji utječu na rezultat.

Popis korištene literature

1. Canny J.F. (1983) Pronalaženje rubova i linija na slikama, magistarski rad, MIT. AI Lab. TR-720.
2. Canny J.F. (1986.) Računalni pristup detekciji rubova, IEEE Transaction on Pattern Analysis and Machine Intelligence, 8. - P. 679-714.
3. Courtney P, Thacker N.A. (2001.) Karakterizacija performansi u računalnom vidu: Uloga statistike u testiranju i dizajnu, Poglavlje u: Sustavi slikanja i vida: teorija, procjena i primjena, Jacques Blanc-Talon i Dan Popescu (urednici), NOVA Science Books.
4. Hanzi Wang (2004.) Robusna statistika za računalni vid: prilagodba modela, segmentacija slike i analiza vizualnog kretanja, doktorska disertacija, Sveučilište Monash, Australija.
5. Huber P.J. (1981) Robust Statistics, Wiley New York.
6. Kirsch R. (1971) Računalno određivanje sastavne strukture bioloških slika, Računala i biomedicinska istraživanja, 4. - P. 315–328.
7. Lakshmi S, Sankaranarayanan V. (2010.) Studija tehnika detekcije rubova za pristupe segmentacijskog računanja, Računalno potpomognute meke računalne tehnike za slikovne i biomedicinske aplikacije. - str. 35-41.
8. Lee K., Meer P. (1998) Robust Adaptive Segmentation of Range Images, IEEE Trans. Analiza uzoraka i strojna inteligencija, 20 (2). - Str. 200-205.
9. Marr D, Hildreth E. (1980) Teorija detekcije rubova, Proc. Londonsko kraljevsko društvo, B, 207. - P. 187-217.
10. Marr D. (1982.) Vision, Freeman Publishers.
11. Marr P., Doron Mintz. (1991.) Robusna regresija za računalni vid: pregled, Međunarodni časopis za računalni vid, 6 (1). - str. 59-70.
12. Orlando J. Tobias, Rui Seara (2002) Segmentacija slike histogramskim pragom korištenjem nejasnih skupova, IEEE transakcije o obradi slike, Vol.11, No.12. - Str. 1457-1465.
13. Punam Thakare (2011.) Studija o segmentaciji slike i tehnikama detekcije rubova, Međunarodni časopis za računalnu znanost i inženjerstvo, Vol 3, br.2. - Str. 899-904.
14. Rafael C., Gonzalez, Richard E. Woods, Steven L. Eddins (2004) Digitalna obrada slike korištenjem MATLAB-a, Pearson Education Ptd. Ltd, Singapur.
15. Ramadevi Y. (2010) Segmentacija i prepoznavanje objekata korištenjem tehnika detekcije rubova, Međunarodni časopis za računalnu znanost i informacijsku tehnologiju, Vol 2, br.6. - Str. 153-161.
16. Roberts L. (1965.) Strojna percepcija 3-D čvrstih tijela, optička i elektrooptička obrada informacija, MIT Press.
17. Robinson G. (1977) Detekcija rubova pomoću maski gradijenta kompasa, Računalna grafika i obrada slika, 6. - P. 492-501.
18. Rousseeuw P. J., Leroy A. (1987.) Robusna regresija i otkrivanje izvanrednih vrijednosti, John Wiley & Sons, New York.
19. Senthilkumaran N., Rajesh R. (2009.) Tehnike detekcije rubova za segmentaciju slike - Pregled pristupa mekog računala, Međunarodni časopis za nedavne trendove u inženjerstvu, Vol. 1, br. 2. - Str. 250-254.
20. Sowmya B., Sheelarani B. (2009.) Segmentacija slike u boji korištenjem tehnika mekog računanja, Međunarodni časopis za aplikacije mekog računala, broj 4. - P. 69-80.
21. Umesh Sehgal (2011) Tehnike detekcije rubova u digitalnoj obradi slike korištenjem Fuzzy Logic, Međunarodni časopis za istraživanje u IT i menadžmentu, Vol.1, Broj 3. - P. 61-66.
22. Yu, X, Bui, T.D. & et al. (1994) Robust Estimation for Range Image Segmentation and Reconstruction, IEEE trans. Analiza uzoraka i strojna inteligencija, 16 (5). - Str. 530-538.

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Upotrijebite obrazac u nastavku

Studenti, diplomski studenti, mladi znanstvenici koji koriste bazu znanja u svom studiju i radu bit će vam jako zahvalni.

Objavljeno na http://www.allbest.ru/

Ministarstvo obrazovanja i znanosti Ruske Federacije

Rjazansko državno radiotehničko sveučilište

Odjel IIBMT

Tečajni rad

Metode obrade slike. Segmentacija

Završena čl. gr. 432M:

Aljošin S.I.

Provjerio izv. prof. odjelu IIBMT:

Kaplan M.B.

Ryazan 2014

Uvod

1. Predstavljanje slika

3. Formati slika

4. Vrste slika

5.1 Promjena kontrasta

5.2 Uglađivanje buke

5.3 Podcrtajte granice

5.4 Filtriranje medijana

5.5 Segmentacija slike

5.5.3 Odabir kontura

5.5.7 Metode rezanja grafikona

6. Opis funkcija

7. Testiranje algoritma

Zaključak

dodatak

Uvod

Još sredinom 20. stoljeća obrada slike bila je uglavnom analogna i obavljala se optičkim uređajima. Takve optičke tehnike i danas su važne u područjima kao što je holografija. Međutim, s dramatičnim povećanjem performansi računala, ove su tehnike sve više zamijenjene digitalnom obradom slike. Tehnike digitalne obrade slike općenito su točnije, pouzdanije, fleksibilnije i lakše za implementaciju od analognih tehnika. U digitalnoj obradi slike široko se koristi specijalizirana oprema kao što su cjevovodni procesori i višeprocesorski sustavi. To se posebno odnosi na sustave za obradu videa. Obrada slika se također izvodi pomoću računalnog matematičkog softvera, na primjer, MATLAB, Mathcad, Maple, Mathematica itd. Za to koriste i osnovne alate i pakete proširenja Image Processing.

Zanimanje za tehnike obrade digitalne slike raste iz dva glavna područja njihove primjene, a to su poboljšanje kvalitete slike kako bi se poboljšala njezina vizualna percepcija od strane ljudi i obrada slika za pohranu, prijenos i prezentaciju u autonomnim sustavima strojnog vida.

Jedna od najsloženijih tehnika digitalne obrade slike je segmentacija slike. Segmentacija je proces dijeljenja digitalne slike na nekoliko segmenata koji se međusobno razlikuju po elementarnim značajkama kao što su svjetlina, boja, tekstura, oblik. Svrha segmentacije je pojednostaviti i modificirati prikaz slike tako da je lakše i lakše analizirati. Pogrešan odabir segmenata na slici može u konačnici utjecati na kvalitetu prepoznavanja, pa čak i učiniti nemogućim. Stoga je zadatak segmentacije iznimno važan i vrlo hitan.

Postoje mnoge metode segmentacije slike. Krajnji rezultat često je određen točnošću segmentacije, pa pri odabiru jedne ili druge metode segmentacije veliku pozornost treba posvetiti pouzdanosti algoritma. Međutim, ne postoji jedinstveni, općeprihvaćeni pristup koji bi bio u osnovi većine algoritama. Također ne postoji niti jedan algoritam koji bi omogućio prihvatljivu segmentaciju za bilo koju sliku. To je jedna od složenosti segmentacije, a to je razlog velikog broja različitih pristupa rješavanju ovih problema obrade slike.

Unatoč važnosti ovog predmetnog područja, napisano je relativno malo knjiga u kojima bi se razmatrali i teorijske osnove i softverski aspekti rješavanja glavnih problema segmentacije slike.

Ovaj rad opisuje glavne metode obrade digitalnih slika. Posebna se pozornost posvećuje metodama segmentacije slike. Program za jednu od metoda segmentacije implementiran je pomoću MatLAB aplikacijskog paketa.

1. Predstavljanje slika

Temeljna pitanja u teoriji obrade slike su: formiranje, unos, računalna reprezentacija i vizualizacija. Oblik površine može se opisati kao funkcija udaljenosti F (x, y) od površine do točke slike s koordinatama x i y. S obzirom da svjetlina točke na slici ovisi isključivo o svjetlini odgovarajućeg područja površine, može se pretpostaviti da vizualne informacije s određenim stupnjem točnosti odražavaju stanje svjetline ili transparentnosti svake točke. Tada se slika shvaća kao ograničena funkcija dviju prostornih varijabli f (x, y), zadanih na ograničenoj pravokutnoj ravnini Oxy i koja ima određeni skup svojih vrijednosti. Na primjer, crno-bijela fotografija može se predstaviti kao f (x, y)? 0, gdje je 0? X? A, 0? Y? B, a f (x, y) je svjetlina (ponekad se naziva optička gustoća ili bjelina) slike u točki (x, y); a - širina okvira, b - visina okvira.

Zbog činjenice da je digitalna memorija računala sposobna pohranjivati samo nizove podataka, slika se prvo pretvara u neki numerički oblik (matrica). Slike se unose u memoriju računala pomoću video senzora. Video senzor pretvara optičku distribuciju svjetline slike u električne signale, a zatim u digitalne kodove. Budući da je slika funkcija dviju prostornih varijabli x i y, a električni signal funkcija jedne varijable t (vrijeme), tada se za transformaciju koristi sweep. Na primjer, kada se koristi televizijska kamera, slika se čita redak po red, dok se unutar svakog retka ovisnost svjetline o prostornoj koordinati x pretvara u proporcionalnu ovisnost amplitude električnog signala o vremenu t. Prijelaz s kraja prethodnog retka na početak sljedećeg događa se gotovo trenutno.

Unošenje slika u računalo neizbježno je povezano s uzorkovanjem slika u prostornim koordinatama x i y i kvantizacijom vrijednosti svjetline u svakoj diskretnoj točki. Diskretizacija se postiže korištenjem koordinatne mreže koju čine linije paralelne s x i y osi kartezijanskog koordinatnog sustava. Na svakom čvoru takve rešetke očitava se svjetlina ili prozirnost nositelja vizualno percipirane informacije, koja se zatim kvantizira i predstavlja u memoriji računala. Element slike dobiven u procesu uzorkovanja slike naziva se piksel. Za kvalitetan prikaz slike u polutonu dovoljno je 28 = 256 razina kvantizacije, t.j. 1 piksel slike je kodiran s 1 bajtom informacije.

Glavne karakteristike slika su:

1. Veličina slike;

2. Dubina boje;

3. Rezolucija.

2. Kodiranje slika u boji

Boja je pojava koja nastaje interakcijom svjetla, predmeta i uređaja (promatrača).

Eksperimentalno je utvrđeno da se svaka boja može predstaviti kao zbroj određenih količina tri linearno neovisne boje.

Tri linearno nezavisne boje nazivaju se primarne boje.

Oni definiraju koordinatni sustav boja (CFR) ili shemu boja, t.j. skup primarnih boja za dobivanje ostalih boja.

Postoje dvije vrste shema boja: sheme boja emitirane svjetlosti i sheme reflektovanog svjetla.

RGB sustav.

Njegove primarne boje su crvena na 700 nm, zelena na 546,1 nm i plava na 435,8 nm. RGB je aditivni.

U ovom slučaju, jedna ili druga boja se dobiva dodavanjem primarnih boja.

CMYK sustav.

Ovaj sustav se koristi za formiranje boja obojenih nesvjetlećih objekata, koji apsorbiraju dio spektra osvijetljene bijele svjetlosti i reflektiraju ostatak zračenja.

CMYK je osnova za tisak u boji.

Temelji se na subtraktivnom CMY modelu (cijan za cijan, magenta za magenta, žuta za žutu), modelu oduzimanja boja. Ovdje još uvijek postoje tri glavne boje.

Kako bi se poboljšala kvaliteta ispisane slike, u sustav je dodana crna boja.

HSB sustav.

Ovaj se sustav temelji na korištenju Hue ili Hue, Saturation i Lightness. Nijansa opisuje specifičnu nijansu boje, zasićenost - njen relativni intenzitet, svjetlinu boje - količinu crne nijanse za dobivanje tamnije slike.

Varijacija ovog sustava je HSL shema.

3. Formati slika

Trenutno se koristi veliki broj različitih formata grafičkih datoteka. Najrašireniji formati su TIFF, GIF, JPEG, PNG i BMP.

TIFF (Tagget Image Format) jedan je od najpouzdanijih i najsvestranijih formata za pohranu visokokvalitetnih skeniranih slika u boji. Može koristiti LZW kompresiju, t.j. pripada formatima za pohranu slika bez gubitaka.

GIF (Graphics Interchange Format) ima paletu od 256 boja i koristi LZW algoritam bez gubitaka za kompresiju. Ako je izvorni broj boja veći od 256, tada će se neke informacije o boji izgubiti.

JPEG (Join Photographers Expert Group) format temelji se na istoimenom algoritmu kompresije slike. Odnosi se na algoritme kompresije s gubitkom i dizajniran je za pohranjivanje slika u punoj boji s visokim omjerom kompresije. Kod korištenja formata moguće je kontrolirati parametar kvalitete od 0 (maksimalna kompresija) do 100 (maksimalna kvaliteta). Omjer kompresije, ovisno o kvaliteti, je od 10 do 1000. Ovaj format se najčešće koristi za pohranjivanje fotografskih slika u punoj boji koje nisu namijenjene daljnjoj obradi.

PNG format je rasterski format za pohranjivanje grafičkih informacija korištenjem kompresije bez gubitaka pomoću algoritma Deflate. PNG format je dizajniran da zamijeni stariji i jednostavniji GIF format, te donekle zamijeni mnogo složeniji TIFF format. PNG format prvenstveno je pozicioniran za korištenje na internetu i za uređivanje grafike. Ima sljedeće glavne prednosti u odnosu na GIF: praktički neograničen broj boja na slici; izborna podrška za alfa kanal; mogućnost gama korekcije; dvodimenzionalno isprepleteno skeniranje.

BMP (BitMaP) format odnosi se na izvorne bitmap formate operacijskog sustava Windows. Pogodan je za pohranjivanje slika kako u indeksiranom obliku s paletom do 256 boja, tako i u obliku RGB slika u punoj boji s dubinom boje od 24 bita. Može se koristiti RLE algoritam kompresije.

4. Vrste slika

4.1 Dvoslojna (ili jednobojna) slika

U tom slučaju svi pikseli mogu imati samo dvije vrijednosti, koje se obično nazivaju crna (binarna jedinica ili osnovna boja) i bijela (binarna nula ili boja pozadine).

Svaki piksel takve slike predstavljen je jednim bitom, tako da je ovo najjednostavniji tip slike.

1. Polutonska slika. Takva slika 2n-razine sastavljena je od n-bitnih slojeva.

2. Slika u boji. Takva je slika opisana u jednom od gore navedenih formata.

3. Slika s kontinuiranim tonom. Ova vrsta slike može imati mnogo sličnih boja (ili polutonova). Kada se susjedni pikseli razlikuju samo za jedan, oko je gotovo nemoguće razlikovati njihove boje. Kao rezultat toga, takve slike mogu sadržavati područja u kojima se oku čini da se boja neprestano mijenja. U ovom slučaju, piksel je predstavljen ili velikim brojem (u sivim tonovima) ili s tri komponente (u slučaju slike u boji). Neprekidne tonske slike su prirodne ili prirodne (za razliku od umjetnih, umjetnih); obično se dobivaju slikanjem digitalnim fotoaparatom ili skeniranjem fotografija ili crteža.

4. Slika diskretnog tona (također se naziva sintetičkom). Obično se ova slika dobiva umjetno. Može imati samo nekoliko boja ili mnogo boja, ali nema šum i mrlje prirodne slike. Primjeri takvih slika su fotografije umjetnih objekata, strojeva ili mehanizama, stranice teksta, karte, crteži ili slike na zaslonu računala. (Neće svaka umjetna slika nužno biti diskretno-tonalna. Računalno generirana slika, koja bi trebala izgledati prirodno, imat će neprekidne tonove, unatoč svom umjetnom podrijetlu.) Umjetni predmeti, tekstovi, nacrtane linije imaju oblik, dobro definirane granice. Snažno se razlikuju od ostatka slike (pozadine). Susjedni pikseli slike diskretnog tona često su pojedinačni ili se jako razlikuju. Takve su slike loše komprimirane metodama s gubitkom podataka, budući da izobličenje samo nekoliko piksela slova čini nečitkim, pretvara poznato lice u potpuno nerazlučivo. Slike diskretnih tonova obično nose mnogo suvišnosti. Mnogi njezini fragmenti ponavljaju se mnogo puta na različitim mjestima slike.

5. Slike poput crtića. To su slike u boji s velikim površinama iste boje. U tom slučaju kontaktna područja mogu se jako razlikovati u svojoj boji.

5. Metode obrade slike

Preliminarna analiza slika omogućuje nam da zaključimo da:

Prvo, na većinu slika, u procesu njihovog formiranja (fotografiranje skeniranje i sl.), utječu brojni negativni čimbenici (vibracije fotoaparata, neravnomjerno kretanje elementa za skeniranje, itd.), što dovodi do zamućenja, izgleda niskog kontrasta i bučnih područja itd.

Drugo, velika većina metoda temelji se na odabiru objekata na slici i njihovoj daljnjoj analizi.

Dakle, prije analize, slika mora proći kroz pripremnu fazu koja se sastoji u izvođenju operacija za poboljšanje vizualne kvalitete (povećanje kontrasta, uklanjanje zamućenja, podcrtavanje granica, filtriranje) i formiranje grafičke pripreme (segmentacija, isticanje obrisa) slika.

5.1 Promjena kontrasta

Slab kontrast obično je uzrokovan malim dinamičkim rasponom promjene svjetline ili jakom nelinearnošću u prijenosu razina svjetline. Najjednostavnija kontrastna metoda je funkcionalno preslikavanje gradacije svjetline fij do gij, odnosno gij = R (fij). U praksi se vrlo često koriste preslikavanja linearnih funkcija. Ako se, kao rezultat neravnomjernog osvjetljenja pri fotografiranju ili fotografiranju, pojavi situacija u kojoj različita područja slike imaju različit kontrast. U ovom slučaju se za promjenu kontrasta koriste adaptivni kontrastni algoritmi. Primjer je algoritam lokalnog poboljšanja kontrasta. Eksperimentalne studije potvrdile su visoku učinkovitost algoritma u slučaju da slika sadrži područja s jasno precijenjenim ili podcijenjenim kontrastima.

Bit algoritma je da se snimak smatra skupom određenog broja lokalnih područja, a ta se područja obrađuju uzimajući u obzir njihove karakteristike. Obrada se provodi u sljedećem redoslijedu: dobit rezova gustoće p izračunava se zasebno za svako lokalno područje slike. I vrši se obrada svakog piksela slike. Ako je p jednako jedan, tada se ne izvodi nikakva radnja na lokalnom području slike (ako je p različit od jedinice, tada se povećava kontrast lokalnog područja). U početku se kontrast izračunava na analiziranoj točki u odnosu na najbližu okolinu. Zatim se vrijednost relativnog kontrasta dodaje jedinici, a rezultirajuća vrijednost uzima se u algoritmu kao dobitak p, a zatim se izračunavanje izvodi pomoću formule:

kontrast programa za segmentaciju slike

gdje je nova vrijednost svjetline, je trenutna svjetlina obrađene slike, je potrebna maksimalna vrijednost svjetline obrađene slike.

5.2 Uglađivanje buke

U fazi digitalizacije slike su izložene aditivnom i impulsnom šumu. Aditivni šum je neki slučajni signal koji se dodaje korisnom na izlazu sustava; u ovom slučaju aditivni šum nastaje zbog zrnatosti filma. Impulsni šum, za razliku od aditivnog šuma, karakterizira djelovanje na korisni signal samo u odvojenim slučajnim točkama (vrijednost rezultirajućeg signala u tim točkama poprima slučajnu vrijednost). Impulsni šum uobičajen je u sustavima za prijenos i pohranu digitalne slike. Tako se u procesu pripreme slike javlja problem suzbijanja šuma.

Najjednostavniji način za izglađivanje šuma na slici je izglađivanje, t.j. zamjenjujući vrijednost svjetline svakog elementa prosječnom vrijednošću pronađenom u njegovoj blizini:

gdje je skup točaka koje pripadaju blizini točke (uključujući samu točku); - broj bodova u susjedstvu.

Razmatrana metoda učinkovito uklanja aditivni i impulsni šum u svakom elementu slike.

5.3 Podcrtajte granice

Tehnike izglađivanja slike mogu vrlo učinkovito ukloniti šum. Značajan nedostatak anti-aliasing algoritama je zamućenje slike (tj. smanjenje oštrine konturnih elemenata), dok je količina zamućenja proporcionalna veličini maske koja se koristi za izglađivanje. Za nedvosmislenu analizu slika, posebno kod izračunavanja geometrijskih karakteristika strukturnih elemenata, vrlo je važno ukloniti zamućenje s kontura objekata na slici, odnosno pojačati razliku između stupnjevanja svjetline elemenata konture objekta i susjedni elementi pozadine. U ovom slučaju, obrada slike koristi tehnike poboljšanja rubova.

Obično se poboljšanje rubova izvodi pomoću visokofrekventnog prostornog filtriranja. Karakteristike filtera postavljene su u obliku maske, u kojoj prosječna vrijednost mora biti jednaka nuli.

Druga metoda naglašavanja granica je takozvana statička diferencijacija. Kod ove metode vrijednost svjetline svakog elementa se dijeli sa statističkom procjenom standardne devijacije, odnosno (standardna devijacija se izračunava u određenom susjedstvu elementa).

5.4 Filtriranje medijana

Filtriranje medijana odnosi se na nelinearne metode obrade slike i ima sljedeće prednosti u odnosu na linearno filtriranje (klasični postupak zaglađivanja): zadržava oštre padove (granice); učinkovito izglađuje impulsnu buku; ne mijenja svjetlinu pozadine.

Filtriranje medijana provodi se pomicanjem određenog otvora (maske) duž diskretne slike i zamjenom vrijednosti središnjeg elementa maske srednjom vrijednošću (prosječnom vrijednošću uređenog niza) izvornih elemenata unutar otvora. Općenito, otvor može imati različite oblike, ali u praksi je najčešće korišteni otvor kvadrata

5.5 Segmentacija slike

Segmentacija slike shvaća se kao proces njezine cijepanja na sastavne dijelove koji imaju smisleno značenje: objekte, njihove granice ili druge informativne fragmente, karakteristične geometrijske značajke i sl. sliku, čija kvaliteta uvelike određuje uspješnost rješavanja problema prepoznavanja. i tumačenje objekata.

U općem slučaju, segmentacija je operacija dijeljenja konačnog skupa ravnine na kojoj je funkcija izvorne slike definirana na neprazne povezane podskupove u skladu s nekim predikatom definiranim na skupu i uzimajući prave vrijednosti kada je bilo koji par točaka iz svakog podskupa zadovoljava neki kriterij homogenosti (na primjer, kriterij homogenosti koji se temelji na procjeni maksimalne razlike između svjetline pojedinog piksela i prosječne vrijednosti svjetline izračunate na odgovarajućem području).

5.5.1 Metode segmentacije praga

Prag je jedna od glavnih metoda segmentacije slike zbog svojih intuitivnih svojstava. Ova je metoda usmjerena na obradu slike, čija pojedina homogena područja karakterizira srednja svjetlina. Najčešća metoda segmentacije praga je binarna segmentacija, odnosno kada na raspolaganju imamo dvije vrste homogenih područja.

U ovom slučaju, slika se obrađuje piksel po piksel i pretvaranje svakog piksela ulazne slike u izlaznu određuje se iz omjera:

gdje je parametar obrade, nazvan prag, i razine izlazne svjetline. Obrada po pikselima, čija pozicija na slici ne igra nikakvu ulogu, naziva se točkasta obrada. Razine i igraju ulogu oznaka. Po njima se određuje kojoj vrsti treba dodijeliti danu točku: H0 ili H1. Ili kažu da se H0 sastoji od pozadinskih točaka, a H1 od točaka interesa. Obično razine i odgovaraju bijeloj i crnoj razini. Klase H1 (aka klasa interesa) nazvat ćemo klasom objekta, a klasu H0 klasom pozadine.

Naravno, segmentacija može biti ne samo binarna, au ovom slučaju postoje više od dvije klase. Ova vrsta segmentacije naziva se višerazinski. Dobivena slika nije binarna, već se sastoji od segmenata različite svjetline. Formalno se ova operacija može napisati na sljedeći način:

gdje je broj razina, a su klase slika. U tom slučaju za svaku od klasa mora se postaviti odgovarajući prag koji bi te klase odvajao jednu od druge. Binarne slike lakše je pohraniti i njima manipulirati od slika koje imaju mnogo razina svjetline.

Najteži dio postavljanja praga je sam proces postavljanja praga. Prag se često piše kao funkcija oblika:

gdje je slika, i neka je karakteristika točke slike, na primjer, prosječna svjetlina u susjedstvu sa središtem u ovoj točki.

Ako vrijednost praga ovisi samo o, odnosno ista za sve točke slike, tada se takav prag naziva globalnim. Ako prag ovisi o prostornim koordinatama, tada se takav prag naziva lokalnim. Ako ovisi o karakteristici, tada se takav prag naziva adaptivan. Dakle, obrada se smatra globalnom ako se odnosi na cijelu sliku u cjelini, a lokalnom ako se odnosi na neko odabrano područje.

Osim gore navedenih razlika algoritama, postoji mnogo više metoda. Mnogi od njih su samo skup drugih, ali većina njih, na ovaj ili onaj način, temelji se na analizi histograma izvorne slike, međutim, postoje i bitno različiti pristupi koji ne utječu na analizu histograma. u izravnom obliku ili prijeći s njih na analizu nekih drugih funkcija.

5.5.2 Metode povećanja površine

Metode ove skupine temelje se na korištenju lokalnih značajki slike. Ideja metode izgradnje područja je analizirati prvo početnu točku, zatim njezine susjedne točke, itd. prema nekom kriteriju homogenosti, te u naknadnom upisu analiziranih točaka u jednu ili drugu skupinu (broj polaznih točaka treba biti jednak broju homogenih područja na slici). U učinkovitijim verzijama metode početna točka nisu pojedinačni pikseli, već podjela slike na niz malih područja. Zatim se svako područje provjerava ujednačenost, a ako je rezultat testa negativan, tada se odgovarajuće područje dijeli na manje dijelove. Proces se nastavlja sve dok sva odabrana područja ne prođu test uniformnosti. Nakon toga uz pomoć građenja počinje formiranje homogenih područja.

Segmentacija uniformnosti temeljena na pragu i osvjetljenju često ne daje željene rezultate. Takva segmentacija obično dovodi do pojave značajnog broja malih područja koja nemaju stvarne prototipove na slici. Najučinkovitiji rezultati dobivaju se segmentacijom prema kriteriju homogenosti na temelju teksture (ili teksturnih značajki).

5.5.3 Odabir kontura

Nerijetko se suočavamo s problemom pronalaženja opsega, zakrivljenosti, faktora oblika, specifične površine objekata itd. Svi ovi zadaci su na ovaj ili onaj način povezani s analizom konturnih elemenata objekata.

Metode za isticanje kontura (rubnica) na slici mogu se podijeliti u sljedeće glavne klase:

metode visokofrekventnog filtriranja;

metode prostorne diferencijacije;

metode funkcionalne aproksimacije.

Zajedničko za sve ove metode je tendencija da se granice razmatraju kao područje oštrog pada funkcije svjetline slike; ono što ih razlikuje je uvedeni matematički model koncepta granice i algoritam za pronalaženje graničnih točaka.

Sukladno postavljenim zadacima, algoritmima za identifikaciju kontura postavljaju se sljedeći zahtjevi: odabrane konture moraju biti stanjive, bez prekida i zatvorene. Stoga je proces izdvajanja kontura donekle kompliciran zbog potrebe primjene algoritama za stanjivanje i uklanjanje praznina. Međutim, to ne daje uvijek željeni rezultat - u većini slučajeva konture nisu zatvorene i kao rezultat toga nisu prikladne za brojne postupke analize.

Problem se može riješiti konturiranjem s algoritmom za praćenje granica metodom "buba" koja vam omogućuje odabir zatvorenih kontura objekata. Suština algoritma je sljedeća: na objektu se odabire određena početna granična točka, a zatim se vrši sekvencijalno praćenje konture sve dok se ne postigne početna točka. U slučaju praćenja konture u smjeru kazaljke na satu do početne točke, vrši se pomicanje piksela udesno, ako je piksel izvan objekta, i ulijevo, ako je na objektu.

Ovako odabrana kontura je kod zatvorenog lanca, t.j. niz koordinata graničnih točaka objekta, što je vrlo prikladno za rješavanje zadataka.

5.5.4 Metode temeljene na grupiranju

Metoda K-Means je iterativna metoda koja se koristi za podjelu slike u K klastera. Osnovni algoritam je prikazan u nastavku:

1. Odaberite K centara klastera, nasumično ili na temelju neke heurističke;

2. Postavite svaki piksel slike u klaster, čije je središte najbliže ovom pikselu;

3. Ponovno izračunajte središta klastera usrednjavanjem svih piksela u klasteru;

4. Ponovite korake 2 i 3 do konvergencije (na primjer, kada pikseli ostanu u istom klasteru).

Ovdje se udaljenost obično uzima kao zbroj kvadrata ili apsolutnih vrijednosti razlika između piksela i središta klastera. Razlika se obično temelji na boji, svjetlini, teksturi i lokaciji piksela ili ponderiranom zbroju tih čimbenika.

K se može odabrati ručno, nasumično ili heuristički.

Zajamčeno je da će ovaj algoritam konvergirati, ali možda neće dovesti do optimalnog rješenja.

Kvaliteta rješenja ovisi o početnom skupu klastera i vrijednosti K.

5.5.5 Metode koje koriste histogram

Tehnike histograma vrlo su učinkovite u usporedbi s drugim tehnikama segmentacije slike jer zahtijevaju samo jedan prolaz piksela. U ovoj metodi, histogram se izračunava preko svih piksela na slici, a njegovi minimumi i maksimumi se koriste za pronalaženje klastera na slici. Za usporedbu se može koristiti boja ili svjetlina.

Poboljšanje ove metode je rekurzivna primjena na klastere na slici kako bi se podijelili u manje skupine. Proces se ponavlja sa sve manjim i manjim grozdovima sve dok se novi grozdovi ne prestanu pojavljivati.

Jedan nedostatak ove metode je što joj može biti teško pronaći značajne uspone i padove na slici. U ovoj metodi klasifikacije slika, metrika udaljenosti i usporedba integriranih regija slični su.

Pristupi temeljeni na histogramu također se mogu brzo prilagoditi za više okvira uz zadržavanje prednosti u brzini u jednom prolazu. Histogram se može izgraditi na nekoliko načina kada se uzme u obzir nekoliko okvira. Isti pristup koji se koristi za jedan okvir može se primijeniti na nekoliko, a nakon što se rezultati kombiniraju, uočljiviji su minimumi i maksimumi koje je bilo teško izdvojiti. Histogram se također može primijeniti na svaki piksel, gdje se informacije koriste za određivanje najčešće boje za danu poziciju piksela. Ovaj pristup koristi segmentaciju temeljenu na pokretnim objektima i stacionarnom okruženju, što pruža drugačiju vrstu segmentacije koja je korisna u praćenju videa.

5.5.6 Tehnike širenja područja

Prva je bila metoda uzgoja površina iz sjemena. Ova metoda uzima sliku i skup sjemenki kao ulaz. Sjemenke označavaju objekte koje treba odabrati. Područja rastu postupno, uspoređujući sve nezauzete susjedne piksele s površinom. Razlika q između svjetline piksela i prosječne svjetline područja koristi se kao mjera sličnosti. Piksel s najmanjom takvom razlikom dodaje se odgovarajućem području. Proces se nastavlja sve dok se svi pikseli ne dodaju jednoj od regija.

Metoda zarastanja površina iz sjemena zahtijeva dodatni unos. Rezultat segmentacije ovisi o izboru sjemena. Šum slike može uzrokovati loše postavljanje sjemena. Metoda rasta površine bez sjemena je modificirani algoritam koji ne zahtijeva eksplicitno sjeme. Počinje s jednim područjem - ovdje odabrani piksel ima mali utjecaj na konačnu segmentaciju. Pri svakoj iteraciji tretira susjedne piksele na isti način kao i metodu uzgoja regija pomoću sjemena. Ali tu se razlikuje da ako minimum nije manji od zadanog praga, tada se dodaje odgovarajućem području. Inače, piksel se smatra vrlo različitim od svih trenutnih regija i stvara se nova regija koja sadrži ovaj piksel.

Jedna varijacija ove metode temelji se na korištenju svjetline piksela. Srednja vrijednost i varijanca površine i svjetlina kandidata piksela koriste se za konstruiranje statistike testa. Ako je testna statistika dovoljno mala, tada se piksel dodaje području, a srednja vrijednost i varijanca površine se ponovno izračunavaju. U suprotnom, piksel se zanemaruje i koristi za stvaranje novog područja.

5.5.7 Metode rezanja grafikona

Tehnike rezanja grafova mogu se učinkovito primijeniti na segmentaciju slike. U ovim metodama, slika je predstavljena kao ponderirani neusmjereni graf. Tipično, piksel ili skupina piksela povezana je s vrhom, a težine rubova određuju sličnost ili različitost susjednih piksela. Graf se zatim reže prema kriteriju dizajniranom za proizvodnju "dobrih" klastera. Svaki dio vrhova (piksela) dobiven ovim algoritmima smatra se objektom na slici.

5.5.8 Segmentacija sliva

U segmentaciji metodom vododjelnice, slika se smatra nekom vrstom karte područja, gdje vrijednosti svjetline predstavljaju vrijednosti visina u odnosu na određenu razinu. Ako je ovo područje ispunjeno vodom, tada se formiraju bazeni. Nakon daljnjeg punjenja vodom, ovi bazeni se spajaju. Spojevi ovih bazena označeni su kao razvodne linije.

U ovom tumačenju razmatraju se točke tri vrste:

1. lokalni minimum;

2. točke koje se nalaze na padini, t.j. iz kojeg se voda spušta do istog lokalnog minimuma;

3. točke lokalnog maksimuma, t.j. iz kojih se voda kotrlja u više od jednog minimuma.

Odvajanje dodirnih objekata na slici jedan je od važnih zadataka obrade slike. Za rješavanje ovog problema često se koristi tzv. Prilikom transformacije pomoću ove metode, morate odrediti "slivove" i "vododjelne linije" na slici obradom lokalnih područja ovisno o njihovim karakteristikama svjetline.

Metoda markera vododjelnice jedna je od najučinkovitijih metoda segmentacije slike.

Prilikom primjene ove metode provode se sljedeći osnovni postupci:

1. Izračunava se funkcija segmentacije. Primjenjuje se na slike na kojima se objekti nalaze u tamnim područjima i teško ih je vidjeti.

2. Izračun oznaka prednjeg plana slika. Izračunavaju se na temelju analize povezanosti piksela svakog objekta.

3. Izračun pozadinskih oznaka. To su pikseli koji nisu dio objekata.

4. Modifikacija funkcije segmentacije na temelju vrijednosti položaja oznaka pozadine i oznaka prednjeg plana.

Jedna od najvažnijih primjena segmentacije duž razvodnih područja je odabir objekata homogenih svjetline (u obliku mrlja) na pozadini slike. Područja s malim varijacijama svjetline imaju niske vrijednosti gradijenta. Stoga se u praksi često događa situacija kada se metoda segmentacije vododjelnice primjenjuje ne na samu sliku, već na njezin gradijent.

6. Opis funkcija

U ovom radu prikazan je algoritam segmentacije slike korištenjem markerske metode vododjelnice.

Glavne funkcije koje se koriste pri izradi programa:

Funkcija fspecial stvara dvodimenzionalni filtar navedenog tipa;

Funkcija imfiltra - morfološka operacija stvaranja slike gradijenta;

Funkcija vododjelnice pretvaranja vododjelnice iz slike;

Funkcija label2rgb pretvara izvornu sliku u sive nijanse;

Funkcija imregionalmax određuje sve lokalne maksimume slike;

Funkcija imextendedmin pronalazi "niske" točke na slici koje su dublje od određene unaprijed određene razine praga u usporedbi s njihovom neposrednom okolinom;

Funkcija imimposemin mijenja sliku u sivim tonovima tako da se lokalni minimumi postižu samo na označenim pozicijama; druge vrijednosti piksela se povećavaju kako bi nestale sve ostale točke lokalnog minimuma;

Imreconstruct i Implement funkcije su rekonstrukcija slike korištenjem morfoloških operacija otvaranja (zatvaranja).

7. Testiranje algoritma

Prilikom implementacije ove metode provedeni su sljedeći postupci:

1. Čitamo sliku i pretvaramo je u sive tonove (slika 1.);

Slika 1. Izvorne (lijevo) i slike u sivim tonovima (desno).

2. Koristite vrijednosti gradijenta kao funkciju segmentacije (slika 2);

Slika 2. Vrijednosti gradijenta.

3. Izvodimo morfološke operacije na slici (slika 3);

Slika 3. Rezultat primjene morfoloških operacija otvaranja - zatvaranja kroz rekonstrukciju slike.

4. Izračunajte oznake prednjeg plana i pozadine slike (slika 4);

Slika 4. Markeri prednjeg plana (lijevo) i pozadine (desno) slike.

5. Gradimo granice razvodnih područja (slika 5.);

Slika 5. Granice razvodnih područja.

6. Prikaži oznake i granice objekata na polutonskoj slici (slika 6);

Slika 6. Oznake i granice objekata.

7. Prikažite rezultat segmentacije pomoću slike u boji (lijevo) i pomoću poluprozirnog načina (desno).

Slika 7 Rezultati segmentacije.

Zaključak

U ovom radu razvijena je metoda razvodne markere za segmentaciju slike.

Izravna primjena algoritma segmentacije vododjelnice rezultira prekomjernom segmentacijom, pa se za upravljanje prekomjernom segmentacijom koristi pristup koji se temelji na biljegu.

Marker je povezana komponenta koja pripada slici. Također, prije segmentacije po slivovima, izvršena je potrebna preliminarna obrada slike.

Popis korištenih izvora

1. Gonzalez R., Woods R. Digitalna obrada slike. - M .: Tehnosfera, 2005. 1072 str.

2. Pratt W. Digitalna obrada slike. - M .: Mir, knjiga 1, 1982.312s.

3. Yaroslavsky L. P. Uvod u digitalnu sliku. - M: Sov. radio, 1979.312 str.

4. Pratt W. Digitalna obrada slike. - M: Mir, knj. 1, 1982. 480s.

5.http: //www.ict.edu.ru/lib/

6.http: //matlab.exponenta.ru/imageprocess/book2/76.php

7. Vizilter Yu.V. Obrada i analiza digitalnih slika s primjerima u LabVIEW i IMAQ VIsion. - M: DMK, 2011. 464 str.

8. Gonzalez R., Woods R., Eddins S. Digitalna obrada slike u MATLAB-u. - M: Tehnosfera, 2006.616 str.

9.http: //matlab.exponenta.ru/imageprocess/book2/48.php

10. Salomon D. Kompresija podataka, slika i zvuka. - M .: Tehnosfera, 2004.368 str.

dodatak

Brojimo sliku

rgb = imread ("C: \ Korisnici \ Ime \ Dokumenti \ MATLAB \ picture1.jpeg");

Predstavimo to kao sivu ton

I = rgb2siva (rgb); slika, prikazana (I);

Izračunajte vrijednost gradijenta

hy = fspecial ("sobel"); hx = hy";

Iy = imfilter (dvostruki (I), hy, "repliciranje");

Ix = imfilter (dvostruki (I), hx, "repliciranje");

gradmag = sqrt (Ix. ^ 2 + Iy. ^ 2);

Primijenite metodu vododjelnice

L = vododjelnica (gradmag);Lrgb = oznaka2rgb (L);

Morfološke operacije

se = strel ("disk", 15);

Ie = imerode (I, se); Iobr = nerekonstruirati (Ie, I);

Iobrd = imdilirati (Iobr, se);

Iobrcbr = imrekonstruirati (imkomplement (Iobrd), dopuniti (Iobr));

Iobrcbr = dopuna (Iobrcbr);

Izračunavamo lokalne maksimume

fgm = imregionalmax (Iobrcbr);

Postavite markere na sliku

I2 = I; I2 (fgm) = 255;

Uklanjanje pojedinačnih izoliranih piksela

se2 = strel (jedinice (3,3)); fgm2 = zatvoreno (fgm, se2); fgm3 = imerode (fgm2, se2);

Brisanje određenog broja piksela

fgm4 = bwareaopen (fgm3, 20);

Preklapanje na izvornu sliku

I3 = I; I3 (fgm4) = 255;

Izračunajte oznake pozadine

bw = im2bw (Iobrcbr, sivi treš (Iobrcbr));

Mjerenje udaljenosti do razvodne linije

D = bwdist (bw); DL = vododjelnica (D); bgm = DL == 0;

slika, imshow (bgm), naslov ("bgm");

Podešavanje vrijednosti gradijenta

gradmag2 = imimposemin (gradmag, bgm | fgm4);

L = vododjelnica (gradmag2);

Dodajte oznake i obrube objekata izvornoj slici

I4 = I; I4 (imdilat (L == 0, jedinice (3, 3)) | bgm | fgm4) = 255;

Prikaz rezultata pomoću slike u boji

Lrgb = label2rgb (L, "mlaz", "w", "promiješaj");

Dodajte oznake i granice objekata na poluprozirnu sliku

lik, pokazati (I), držati se

himage = imshow (Lrgb);

skup (himage, "AlphaData", 0,3);

naslov ("Lrgb2");

Objavljeno na Allbest.ru

...

Slični dokumenti

Digitalni radiografski sustavi. Metode automatske analize slika u MatLab okruženju. Analiza rendgenske slike. Filtriranje, segmentacija, poboljšanje slike. Hardverske mogućnosti preliminarne normalizacije slike.

seminarski rad, dodan 07.12.2013

Izbor metoda obrade i segmentacije slika. Matematičke osnove primijenjenih filtara. Histogram svjetline slike. Softverska implementacija integrirane metode obrade slike. Testiranje razvijenog softvera.

seminarski rad dodan 18.01.2017

Proučavanje i implementacija softvera u Matlab okruženju metoda za obradu, analizu, filtriranje, segmentaciju i poboljšanje kvalitete rendgenskih medicinskih slika. Digitalni radiografski sustavi. Razvoj statički baziranih algoritama.

seminarski rad dodan 20.01.2016

Suvremeni sustavi za analizu teksture slika. Primjeri segmentacije teksture jednopojasnih slika. Korištenje značajki dobivenih na temelju histograma svjetline drugog reda za klasifikaciju spektrozonskih zračnih fotografija.

sažetak, dodan 15.01.2017

Računalna grafika i obrada slika elektroničkim računalima najvažniji su aspekt korištenja računala u svim sferama ljudskog djelovanja. Razvoj "podsustava linearne segmentacije", opis algoritma i logike.

rad, dodan 23.06.2008

Problemi obrade digitalne slike. Metode segmentacije praga. Izrada programa za predstavljanje slike u obliku matrice i primjenu praga na nju. Razvoj sučelja programa za učitavanje i filtriranje slika s odabranim pragom.

seminarski rad, dodan 12.11.2012

Opis matematičkih metoda prikaza i obrade grafičkih slika. Opis razvijenog softverskog dodatka. Opis funkcija i njihovih atributa. Prikaz i obrada grafičkih slika. Rezultati testiranja programa.

seminarski rad dodan 27.01.2015

Problem prostorno-vremenske obrade slike u prisutnosti šuma i smetnji. Metode optimizacije za prostorno-vremensku obradu slike. Struktura specijaliziranog programa, opis njegovog korisničkog sučelja. Procjena troškova.

rad, dodan 10.06.2013

Detekcija detalja i njihovih granica slike. Primjena algoritama rangiranja. Korištenje algoritama za adaptivnu kvantizaciju modova u načinu obrade fragment-po-fragment. Generalizirano linearno filtriranje slika. Obnova nedostajućih područja.

seminarski rad, dodan 17.06.2013

Pregled postojećeg softvera za automatizaciju odabira obruba na slici. Razvoj matematičkog modela za obradu slike i detekciju rubova u sivim tonovima i softvera za algoritme obrade slike.

Uređivanje slika i stvaranje kolaža bilo bi prilično uzbudljivo da većinu svog vremena ne morate trošiti na mukotrpno obilježavanje objekata. Zadatak postaje još teži kada su granice objekata zamagljene ili postoji transparentnost. Alati Photoshopa kao što su magnetski laso i čarobni štapić nisu baš pametni jer se fokusiraju samo na značajke slike niske razine. Vraćaju tvrde (tvrde) granice, koje je potrebno ručno ispraviti. Adobeov pristup semantičke meke segmentacije pomaže riješiti ovaj zastrašujući zadatak rezanjem slike na slojeve koji odgovaraju semantički značajnim područjima i dodavanjem glatkih prijelaza na rubovima.

"Meka" segmentacija

Tim istraživača iz laboratorija CSAIL na MIT-u i švicarskog sveučilišta ETH Zürich, koji rade pod vodstvom Yagyza Aksoya, predložio je pristup ovom problemu koji se temelji na spektralnoj segmentaciji, dodajući mu suvremeni napredak u dubokom učenju. Uz pomoć informacija o teksturi i boji, kao i ekstrahiranih semantičkih značajki visoke razine, iz slike se gradi graf posebne vrste. Tada se iz ovog grafa gradi Kirchhoffova matrica (Laplacian matrica). Koristeći spektralnu dekompoziciju ove matrice, algoritam generira meke konture objekata. Slika izrezana na slojeve dobivena korištenjem vlastitih vektora može se zatim koristiti za uređivanje.

Pregled predloženog pristupa

Opis modela

Razmotrimo metodu stvaranja semantički značajnih slojeva korak po korak:

1. Spektralna maska. Predloženi pristup nastavlja rad Levina i njegovih kolega, koji su prvi upotrijebili Kirchhoffovu matricu u problemu automatske konstrukcije maske. Izgradili su matricu L, koja definira parnu sličnost između piksela u nekom lokalnom području. Koristeći ovu matricu, oni minimiziraju kvadratni funkcionalni αᵀLα s korisničkim ograničenjima, gdje α specificira vektor vrijednosti transparentnosti za sve piksele danog sloja. Svaka meka kontura je linearna kombinacija K vlastitih vektora koji odgovaraju najmanjim svojstvenim vrijednostima L, što maksimizira takozvanu rijetkost maske.

2. Afinitet boja. Kako bi izračunali znakove ne-lokalne blizine boja, istraživači generiraju 2500 superpiksela i procjenjuju blizinu između svakog superpiksela i svih superpiksela u susjedstvu s radijusom od 20% veličine slike. Korištenje ne-lokalne blizine osigurava da područja s vrlo sličnim bojama ostanu koherentna u složenim scenama poput onog ispod.

Ne-lokalna blizina boja

3. Semantička srodnost. Ova faza vam omogućuje odabir semantički povezanih područja slike. Semantička blizina potiče spajanje piksela koji pripadaju istom objektu scene i kažnjava spajanje piksela različitih objekata. Ovdje istraživači iskorištavaju prethodni napredak u prepoznavanju uzoraka i izračunavaju, za svaki piksel, vektor značajke koji je u korelaciji s objektom piksela. Vektori značajki izračunavaju se pomoću neuronske mreže, o čemu ćemo detaljnije raspravljati u nastavku. Semantički afinitet, kao i boja, definiran je u terminima superpiksela. Međutim, za razliku od afiniteta boja, semantički afinitet povezuje samo najbliže superpiksele, potičući stvaranje koherentnih objekata. Kombinacija nelokalne blizine boja i lokalne semantičke blizine omogućuje stvaranje slojeva koji pokrivaju slike fragmenta jednog semantički povezanog objekta (na primjer, vegetacija, nebo, druge vrste pozadine) koje su nepovezane u prostoru.

Semantička srodnost

4. Stvaranje slojeva. U ovom koraku, koristeći prethodno izračunatu blizinu, konstruira se matrica L. Iz ove matrice se izdvajaju svojstveni vektori koji odgovaraju 100 najmanjih vlastitih vrijednosti, a zatim se primjenjuje algoritam rijetkosti koji iz njih izdvaja 40 vektora duž kojih se slojevi su izgrađeni. Zatim se broj slojeva ponovno smanjuje korištenjem k-means algoritma grupiranja na k = 5. Ovo radi bolje od jednostavnog razrjeđivanja 100 vlastitih vektora na pet, budući da tako drastično smanjenje dimenzije čini problem poništenim. Istraživači su odabrali konačan broj kontura na 5 i tvrde da je to razuman broj za većinu slika. Međutim, ovaj se broj može ručno promijeniti ovisno o slici koja se obrađuje.

Meke konture prije i poslije grupiranja

5. Vektori semantičkih značajki. Za izračunavanje semantičke blizine korišteni su vektori značajki, izračunati pomoću neuronske mreže. Neuralna mreža temelji se na DeepLab-ResNet-101, obučenoj za problem metričkog predviđanja. Tijekom treninga poticalo se maksimiziranje L2-udaljenosti između obilježja različitih objekata. Dakle, neuronska mreža minimizira udaljenost između značajki koje odgovaraju jednoj klasi i maksimizira udaljenost u drugom slučaju.

Kvalitativna usporedba sa sličnim metodama

Slike u nastavku prikazuju rezultate predloženog pristupa (označenog s "Naš rezultat") u usporedbi s rezultatima najbližeg pristupa meke segmentacije - metode spektralnog maskiranja - i dvije najsuvremenije metode semantičke segmentacije: PSPNet scena metoda obrade i metoda segmentacije objekata Mask R-CNN.

Kvalitativne usporedbe meke semantičke segmentacije s drugim pristupima

Može se zamijeniti da su PSPNet i Mask R-CNN skloni greškama na granicama objekata, a meke konture konstruirane spektralnom metodom često nadilaze granice objekata. Istodobno, opisana metoda u potpunosti pokriva objekt, ne kombinirajući ga s ostalima, te postiže visoku točnost na rubovima, dodajući mekane prijelaze gdje je to potrebno. Međutim, treba napomenuti da semantičke značajke korištene u ovoj metodi ne razlikuju dva različita objekta koji pripadaju istoj klasi. Kao rezultat toga, na jednom sloju je predstavljeno više objekata, što se može vidjeti na primjeru slika žirafa i krava.

Uređivanje slika s mekim semantičkim obrisima

U nastavku je nekoliko primjera kako koristiti meke putove za uređivanje slika i stvaranje kolaža. Meke staze se mogu koristiti za primjenu određenih uređivanja na različite slojeve: dodavanje zamućenja pokreta (2), zasebne prilagodbe boja za osobe i pozadine (5, 6), zasebno oblikovanje za balon, nebo, krajolik i osobu (8) ... Naravno, isto se može učiniti i korištenjem ručno kreiranih maski ili klasičnih algoritama za odabir konture, ali s automatskim odabirom semantički značajnih objekata takvo uređivanje postaje puno lakše.

Korištenje meke semantičke segmentacije za uređivanje slika

Zaključak

Ova metoda automatski stvara meke konture koje odgovaraju semantički značajnim područjima slike koristeći mješavinu informacija visoke razine iz neuronske mreže i značajki niske razine. Međutim, ova metoda ima nekoliko ograničenja. Prvo, relativno je spor: vrijeme obrade slike od 640 x 480 je 3-4 minute. Drugo, ova metoda ne stvara zasebne slojeve za različite objekte iste klase. I treće, kao što je prikazano u nastavku, ova metoda može pogriješiti u početnim fazama obrade u slučajevima kada su boje objekata vrlo slične (primjer na vrhu), ili kada se kombiniraju meke staze u blizini velikih prijelaznih područja (donji primjer).

Slučajevi pogrešaka algoritma

Međutim, meki putovi stvoreni opisanom metodom pružaju prikladan srednji prikaz slike, omogućujući vam da potrošite manje vremena i truda prilikom uređivanja slika.