Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ
  • në shtëpi
  • Programet
  • Kutia e mjeteve të përpunimit të imazhit. Kurs i shkurtër në teorinë e përpunimit të imazhit

Kutia e mjeteve të përpunimit të imazhit. Kurs i shkurtër në teorinë e përpunimit të imazhit

Segmentimi i imazhit

Segmentimi vendos nëngrupe karakteristike të pikselëve, ose ndarjen e një imazhi në rajone koherente, secila prej të cilave është në një farë kuptimi "homogjene". Proceset e segmentimit dhe nxjerrjes së veçorive mund të shihen si caktimin e etiketave për pikselët që përcaktojnë klasat speciale të cilave u përkasin këto pikselë. Kështu, dalja e procesit të segmentimit është një imazh i karakterit në të cilin vlerat e pikselit janë etiketa, jo nivelet e shkëlqimit.

Klasifikimi i modeleve të imazhit

Për segmentimin e imazhit, përdoret një ose një model tjetër që ofron një përshkrim pak a shumë adekuat të imazheve reale. Ekzistojnë dy klasa kryesore të modeleve të imazhit: statistikore dhe hapësinore. Modelet statistikore përshkruajnë një grup elementësh pikash të një imazhi ose zonës së tij. Modelet hapësinore përshkruajnë zbërthimin e një imazhi në pjesë përbërëse ose rajone.

Modelet statistikore të rendit të parë përshkruajnë një grup elementësh pikash të figurës pa marrë parasysh vendndodhjen e tyre në hapësirë. Përshkrimi më i thjeshtë i këtij lloji është densiteti i probabilitetit të shpërndarjes së vlerave të shkëlqimit, i cili llogaritet duke përdorur një histogram të vlerave të shkëlqimit. Shpesh besohet se densiteti i probabilitetit të shpërndarjes së vlerave reale të imazhit përafrohet me disa standarde, për shembull, një funksion i densitetit të probabilitetit Gaussian ose një përzierje e funksioneve të tilla.

Modelet e rendit të parë nuk marrin parasysh që imazhi përbëhet nga ndonjë pjesë konsistente (elemente teksture, objekte, etj.). Rregullimi i ndërsjellë i elementeve në hapësirë ​​merret parasysh nga modelet e grupeve të elementeve të imazhit të pikës të një rendi më të lartë. Një model është matrica e ngjitjes së shkëlqimit, elementët e së cilës përfaqësojnë frekuencat e çifteve të vlerave të shkëlqimit në kompensimin e zgjedhur. Në praktikë, vlera e zhvendosjes zgjidhet të jetë mjaft e vogël, sepse me një zhvendosje të madhe, vlerat e shkëlqimit bëhen të pavarura nga njëra-tjetra.

Një metodë tjetër për përshkrimin e marrëdhënieve hapësinore midis elementeve pika të një imazhi është të merret në konsideratë shpërndarja e densitetit të probabilitetit të vlerave lokale të veçorive, e cila shpesh është më efikase sesa përdorimi i shpërndarjes së densitetit të probabilitetit të vlerave të shkëlqimit të rendit më të lartë. Kur segmentoni një imazh, veçoritë lokale për shkak të pranisë së skajeve janë veçanërisht të dobishme, për shembull, vlerat e operatorëve të ndryshëm diferencialë për matjen e gradientit të shkëlqimit.

Modelet statistikore të imazhit përfshijnë gjithashtu modele të rastësishme të fushave dhe serive kohore, të cilat përdoren kryesisht në modelimin e teksturave.

Modelet hapësinore përshkruajnë një imazh për sa i përket zonave. Një imazh mund të përfaqësohet si një koleksion objektesh kundër një sfondi, si i ndarë në zona në një mënyrë të rregullt ose të rastësishme, si një model i formës së zonave. Modelet hapësinore lejojnë, në përgjithësi, të nxjerrin më shumë informacion nga një imazh sesa modelet e statistikave të shpërndarjes së shkëlqimit. Megjithatë, deri më tani janë përdorur vetëm modele mjaft të thjeshta dhe aparati i tyre matematikor kërkon zhvillim të mëtejshëm.

Segmentimi i imazhit sipas metodave të pragut

Pragu është metoda më e thjeshtë dhe më e përdorur e segmentimit të imazhit. Në një numër metodash standarde për nxjerrjen e pjesëve të një imazhi me anë të pragut, vlerat e pragjeve përcaktohen drejtpërdrejt nga histogramet e figurës (modeli statistikor i rendit të parë i imazhit). Historikisht, metoda e parë e këtij grupi metodash është metoda e modalitetit. Metoda rrjedh nga supozimi se imazhi përmban një numër të njohur klasash pikash që janë uniforme në shkëlqim. Për më tepër, besohet se zonat kufitare midis zonave të mbyllura zënë një zonë relativisht të vogël të imazhit. Prandaj, në histogram, ato duhet të korrespondojnë me kufijtë intermode, brenda të cilave vendosen pragjet e segmentimit.

Megjithatë, imazhet reale nuk përshtaten mirë me supozimet e parashtruara. Si rregull, kufijtë midis rajoneve janë të paqarta dhe struktura modale e histogramit nuk shprehet mjaftueshëm. Gjithashtu, edhe kur histogrami ka modalitete të dallueshme, gropat e tij mund të jenë aq të gjera dhe të sheshta sa është e vështirë të gjendet fundi i lugit.

Nëse imazhi real nuk i plotëson kushtet e metodës mod, zbatohen katër qasjet e mëposhtme. Së pari, përmirësimi i histogramit, duke përfshirë, bazuar në vetitë lokale të imazhit duke përdorur informacionin e gradientit, statistikat e rendit të dytë, analizën e lakimit të funksionit të shpërndarjes integrale. Së dyti, përshtatja e histogramit me një përzierje shpërndarjesh normale dhe aplikimi i metodave statistikore për të ndarë në mënyrë optimale këtë përzierje. Disavantazhi i kësaj qasjeje është kompleksiteti i lartë llogaritës, përveç kësaj, Gaussoidet shpesh përafrojnë dobët mënyrat reale. Së treti, futja e një mase empirike të cilësisë së një imazhi të segmentuar dhe maksimizimi i funksionit të kriterit përkatës - qasja diskriminuese, qasja e entropisë, qasja momentale, etj. Së katërti, kalimi në përdorimin e statistikave të tjera për zgjedhjen e një pragu , në veçanti, duke zgjedhur një prag drejtpërdrejt në veçoritë lokale. Përdorimi i veçorive lokale bën të mundur segmentimin e imazheve reale komplekse me cilësi më të mirë.

Analiza e histogramit siguron një cilësi të kënaqshme të segmentimit të atyre imazheve që përbëhen nga zona me shkëlqim uniform. Sidoqoftë, kur zgjidhni objekte me përmasa të vogla kundër një sfondi kompleks, pikat e objekteve nuk tregojnë maja të dukshme në histogramin e shkëlqimit. Prandaj, përdoret përpunimi me një prag të ndryshueshëm: për fragmente të vogla të figurës, ndërtohen histograme, të cilat kontrollohen për bimodalitet, dhe pragjet e gjetura lokale ndërthuren në pjesën tjetër të figurës.

Në veprat e Ost. Le G={0,1,...,L) - vlerat e mundshme të shkëlqimit të imazhit. Pragu ndan shpërndarjen e vlerave të ndriçimit të imazhit në dy klasa C 0={0,1,...,t) dhe C 1={t+1,t+2,...,L}, tÎ G. Pragu optimal t* përcaktuar si

ku është varianca e shpërndarjes së vlerave të shkëlqimit të imazhit në tërësi, w0 është probabiliteti që një pikë e marrë në mënyrë të rastësishme t'i përkasë sfondit, https://pandia.ru/text/80/299/images /image004_46.gif" width="21" height="24" >- niveli mesatar i ndriçimit të sfondit (klasa C 0).

Nëse zonat e objektit dhe sfondi ndryshojnë ndjeshëm nga njëra-tjetra, histogrami i funksionit të kriterit mund të jetë multimodal. Prandaj, është e nevojshme të përcaktohen të gjitha majat lokale, gjë që redukton seriozisht konkurrencën e metodës.

Kriteri i entropisë për zgjedhjen e pragut optimal. Duke përdorur përkufizimet e prezantuara më herët, histogrami i vlerave të shkëlqimit mund të konsiderohet si L-burimi simbolik i informacionit me entropi

,

ku piështë probabiliteti i shkëlqimit me vlerën i.

Entropia e burimit është shuma e entropisë së objektit H 0 dhe entropia e sfondit H 1, dhe pragu optimal duhet të japë vlerën maksimale të kësaj shume:

, (2)

ku .

Meqenëse secili prej termave H 0 dhe H 1 karakterizon uniformitetin e shpërndarjes së shkëlqimit në intervalet përkatëse dhe zvogëlohet ndjeshëm kur një fragment "i huaj" i histogramit bie në këtë interval, maksimumi i kriterit të entropisë do të korrespondojë me variantin më të mirë të segmentimit. Disavantazhi i kësaj metode është se funksioni i kriterit mund të ketë disa maksimum të afërt në vlerë.

Në ndryshim nga qasja diskriminuese, metoda e ruajtjes së momentit prezanton të gjitha momentet e imazhit deri në (2 k+1) porosia përfshirëse:

.

Pragu optimal konsiderohet të sigurojë barazinë e momenteve përkatëse të imazheve të segmentuara dhe origjinale. Megjithatë, nëse k>3, atëherë lindin vështirësi për shkak të mungesës së një zgjidhjeje analitike të problemit.

Kalimi nga zgjedhja e një pragu bazuar në histogramin e shkëlqimit në përdorimin e statistikave të tjera padyshim që ndërlikon algoritmet e segmentimit, por siguron segmentim më të mirë të imazheve komplekse. Për të zgjedhur objekte me përmasa të vogla, duket premtuese të zgjedhësh një prag drejtpërdrejt bazuar në vetitë lokale të pikave të imazhit.

Metoda e kontrastit mesatar maksimal. Metoda bazohet në një përcaktim të thjeshtë heuristik të pragut optimal: pragu optimal për segmentimin e imazhit është pragu që nxjerr në pah më shumë dallime të ndriçimit me kontrast të lartë dhe më pak kontrast të ulët se çdo prag tjetër. Shprehja sasiore e kriterit është kontrasti mesatar i të gjitha dallimeve të ndriçimit të identifikuara nga një prag i caktuar. Pragu që korrespondon me kontrastin maksimal mesatar është optimal. Nëse dy pika ngjitur X 1=(X 1,y 1) dhe X 2=(x 2,y 2) kanë vlera të ndriçimit f(X 1) dhe f(X 2) (pa humbur përgjithësinë f(X 1) £ f(X 2)), pastaj numri i rënieve të identifikuara nga pragu t, e barabartë me:

ku

Kontrasti i plotë i pragut t, është e barabartë me:

ku DIV_ADBLOCK169">

. (3)

Bazuar në matricat e afërsisë së vlerave të shkëlqimit të propozuara nga Haralik, konsiderohet metoda e mëposhtme e segmentimit. Për imazhin, matricat janë ndërtuar për paraqitjen e përbashkët të niveleve të ndriçimit të çifteve të pikave ngjitur në horizontale. P 1.0 dhe drejt P drejtimet 1.90, si dhe matrica totale e tranzicionit, madhësia ( L+1)'( L+1):

Pvh=P 1,0 +P 1,90.

Pragu arbitrar t ndan pikat e imazhit në dy klasa ME 0 dhe ME 1, dhe matrica e tranzicionit - me 4 blloqe.

1

Janë konsideruar metodat matematikore të segmentimit të imazhit të standardit Dicom. Metodat matematikore të segmentimit të imazheve të standardit Dicom janë zhvilluar për detyrat e njohjes së imazheve mjekësore. Diagnoza e sëmundjeve varet nga kualifikimet e studiuesit dhe kërkon që ai të kryejë vizualisht segmentimin, dhe metodat matematikore për përpunimin e imazheve raster janë një mjet për këtë diagnozë. Përpunimi i imazheve mjekësore të fituara nga hardueri pa përpunuar paraprakisht të dhënat e imazhit në shumicën e rasteve jep rezultate të pasakta. U kryen procedurat për zgjedhjen e kontureve të objekteve duke përdorur metodën Canny dhe algoritme shtesë për përpunimin e imazheve raster. Rezultatet e hulumtimit na lejojnë të llogarisim vetitë morfometrike, gjeometrike dhe histograme të formacioneve në trupin e njeriut të nevojshme për trajtimin e mëtejshëm të pacientit dhe të ofrojmë trajtim mjekësor efektiv. Parimet e zhvilluara të analizës së automatizuar kompjuterike të imazheve mjekësore përdoren në mënyrë efektive për detyrat operative të diagnostikimit mjekësor të një institucioni të specializuar onkologjik dhe për qëllime edukative.

njohja e modelit

segmentimi i objekteve me interes

imazhe mjekësore

1. Vlasov A.V., Tsapko I.V. Modifikimi i algoritmit Canny në lidhje me përpunimin e imazheve radiografike Vestnik nauki Sibiri. - 2013. - Nr.4 (10). - S. 120-127.

2. Gonzales R., Woods R. Përpunimi dixhital i imazhit. - M.: Technosfera, 2006. - S. 1072.

3. Kulyabichev Yu.P., Pivtoratskaya S.V. Qasja strukturore për përzgjedhjen e veçorive në sistemet e njohjes së modeleve // ​​Shkenca natyrore dhe teknike. - 2011. - Nr 4. - F. 420-423.

4. Nikitin O.R., Pasechnik A.S. Përvijimi dhe segmentimi në detyrat e diagnostikimit të automatizuar të patologjive // ​​Metodat dhe pajisjet për transmetimin dhe përpunimin e informacionit. - 2009. - Nr 11. - F. 300-309.

5. Canny J. Një qasje llogaritëse për zbulimin e skajeve // ​​Transaksionet IEEE mbi analizën e modelit dhe inteligjencën e makinës. - 1986. - Nr 6. - F.679-698.

6. DICOM – Mënyra e aksesit: http://iachel.ru/zob23tai-staihroe/ DICOM

7. Doronicheva A.V., Sokolov A.A., Savin S.Z. Përdorimi i operatorit Sobel për zbulimin automatik të skajeve në imazhet mjekësore // Journal of Mathematics and System Science. - 2014. - Vëll. 4, nr 4 - F. 257-260.

8. Jähne B., Scharr H., Körkel S. Parimet e dizajnit të filtrit // Manual i Vizionit Kompjuterik dhe Aplikacioneve. Shtypi Akademik. - 1999. - 584 f.

Një nga fushat prioritare për zhvillimin e mjekësisë në Rusi është kalimi në teknologjitë tona inovative për regjistrimin elektronik, ruajtjen, përpunimin dhe analizën e imazheve mjekësore të organeve dhe indeve të pacientëve. Kjo për shkak të rritjes së sasisë së informacionit të paraqitur në formë imazhi në diagnostikimin e sëmundjeve të rëndësishme shoqërore, në radhë të parë të kancerit, trajtimi i të cilit në shumicën e rasteve ka rezultat vetëm në fazat e hershme.

Gjatë diagnostikimit të imazheve të standardit DICOM, përcaktohet një zonë patologjike dhe kur konfirmohet natyra e saj patologjike, problemi i klasifikimit zgjidhet: caktimi i tij në ndonjë nga speciet e njohura ose identifikimi i një klase të re. Një vështirësi e dukshme janë defektet në imazhin që rezulton, për shkak të kufizimeve fizike të pajisjeve dhe kufijve të lejuar të ngarkesës në trupin e njeriut. Si rezultat, detyra e përpunimit shtesë të imazhit bie mbi mjetet softuerike për të rritur vlerën e tyre diagnostikuese për mjekun, për t'i paraqitur ato në një formë më të përshtatshme dhe për të nxjerrë në pah gjënë kryesore nga vëllimet e mëdha të të dhënave të marra.

Qëllimi i studimit. Metodat matematikore të segmentimit të imazheve të standardit Dicom janë zhvilluar për detyrat e njohjes së imazheve mjekësore. Diagnoza e sëmundjeve varet nga kualifikimet e studiuesit dhe kërkon që ai të kryejë vizualisht segmentimin, dhe metodat matematikore për përpunimin e imazheve raster janë një mjet për këtë diagnozë. Përpunimi i imazheve mjekësore të fituara nga hardueri pa përpunuar paraprakisht të dhënat e imazhit në shumicën e rasteve jep rezultate të pasakta. Kjo për faktin se fillimisht imazhet e marra janë të një cilësie të pakënaqshme.

Materiali dhe metodat e kërkimit

Si material kërkimor përdoren tomogramet e llogaritura të pacientëve të një institucioni të specializuar klinik. Përpara se të analizoni të dhënat reale grafike, është e nevojshme të përgatitni një imazh ose ta përpunoni paraprakisht atë. Kjo fazë zgjidh problemin e përmirësimit të cilësisë vizuale të imazheve mjekësore. Është e dobishme të ndahet i gjithë procesi i përpunimit të imazhit në dy kategori të gjera: metodat në të cilat imazhet janë si hyrëse ashtu edhe dalëse; metodat, ku të dhënat hyrëse janë imazhe, dhe si rezultat i punës, të dhënat dalëse janë veçoritë dhe atributet e identifikuara në bazë të të dhënave hyrëse. Ky algoritëm nuk supozon se secili nga proceset e mësipërme zbatohet në imazh. Regjistrimi i të dhënave është i pari nga proceset e paraqitur në Fig. një.

Oriz. 1. Fazat kryesore të përpunimit dixhital të të dhënave grafike

Regjistrimi mund të jetë mjaft i thjeshtë, si në shembullin ku imazhi origjinal është dixhital. Në mënyrë tipike, hapi i regjistrimit të imazhit përfshin përpunimin paraprak të të dhënave, siç është zmadhimi i imazhit. Përmirësimi i imazhit është një nga fushat më të thjeshta dhe më mbresëlënëse të përpunimit paraprak. Si rregull, pas metodave të përmirësimit të përmbajtjes së informacionit të imazheve, përcaktohet detyra për të gjetur pikselë të dallueshëm dobët ose për të rritur kontrastin në imazhin origjinal. Një nga metodat e përdorura shpesh për përmirësimin e përmbajtjes së informacionit të imazheve është rritja e kontrastit të imazhit, pasi kufijtë e objektit të interesit janë zgjeruar. Duhet të kihet parasysh se përmirësimi i cilësisë së imazhit është një detyrë disi subjektive në përpunimin e imazhit. Rivendosja e imazhit është një detyrë që lidhet gjithashtu me përmirësimin e cilësisë vizuale të të dhënave. Metodat e restaurimit të imazhit bazohen në modele matematikore dhe probabiliste të deformimit të të dhënave grafike. Përpunimi i imazhit si fazë duhet të ndahet nga koncepti i përpunimit të imazhit si i gjithë procesi i ndryshimit të imazhit dhe marrjes së disa të dhënave. Segmentimi, ose procesi i nxjerrjes së objekteve me interes, ndan një imazh në objekte ose pjesë përbërëse. Përzgjedhja e automatizuar e objekteve me interes është, deri diku, një detyrë komplekse e përpunimit dixhital të imazhit. Segmentimi shumë i detajuar e bën të vështirë përpunimin e imazhit nëse është e nevojshme të theksohen objektet me interes. Por segmentimi i pasaktë ose i detajuar i pamjaftueshëm në shumicën e detyrave çon në gabime në fazën përfundimtare të përpunimit të imazhit. Paraqitja dhe përshkrimi i të dhënave grafike, si rregull, ndjek fazën e përzgjedhjes së objekteve me interes në imazh, prodhimi i të cilave në shumicën e rasteve ka pikselë të papërpunuar që formojnë kufijtë e rajonit ose formojnë të gjitha pikselat e rajoneve. Me opsione të tilla, kërkohet konvertimi i të dhënave në një formë të aksesueshme për analiza kompjuterike. Njohja e modelit është një proces që i cakton një identifikues një objekti (për shembull, "rrezja") bazuar në përshkrimet e tij. Le të përcaktojmë marrëdhënien midis bazës së njohurive dhe moduleve të përpunimit të imazhit. Baza e njohurive (d.m.th., informacioni për zonën e problemit) është disi i koduar brenda vetë sistemit të përpunimit të imazhit. Kjo njohuri mund të jetë mjaft e thjeshtë, siç është një tregues i detajuar i objekteve të imazhit ku duhet të jetë zona e interesit. Një njohuri e tillë bën të mundur kufizimin e fushës së kërkimit. Baza e njohurive menaxhon funksionimin e çdo moduli të përpunimit dhe ndërveprimin e tyre, i cili tregohet në Fig. 1 shigjeta që tregojnë në dy drejtime ndërmjet moduleve dhe bazës së njohurive. Ruajtja dhe printimi i rezultateve shpesh kërkon gjithashtu përdorimin e teknikave të veçanta të përpunimit të imazhit. Një disavantazh i këtyre hapave të përpunimit të imazhit në një sistem të imazhit mjekësor është se gabimet e krijuara në hapat e parë të përpunimit, për shembull kur futni ose nënvizoni objektet me interes në një imazh, mund të çojnë në pamundësinë për të klasifikuar saktë. Përpunimi i të dhënave kryhet në mënyrë strikte në mënyrë sekuenciale, dhe në shumicën e rasteve nuk ka mundësi të ktheheni në fazat e mëparshme të përpunimit, edhe nëse më herët janë marrë rezultate të pasakta. Metodat në fazën e para-përpunimit janë mjaft të ndryshme - përzgjedhja e objekteve me interes, shkallëzimi i tyre, korrigjimi i ngjyrave, rregullimi i rezolucionit hapësinor, ndryshimi i kontrastit, etj. Një nga veprimet prioritare në fazën e përpunimit paraprak të imazhit është rregullimi i kontrastit dhe shkëlqimit. Duke përdorur maska ​​të përshtatshme, është e mundur të kombinohen dy hapat (filtrimi dhe para-përpunimi) për të rritur shpejtësinë e analizës së të dhënave. Rezultati përfundimtar i analizës së imazhit në shumicën e rasteve përcaktohet nga niveli i cilësisë së segmentimit, dhe shkalla e detajeve të objekteve me interes varet nga detyra specifike. Për këtë arsye, nuk është zhvilluar një metodë ose algoritëm i veçantë që është i përshtatshëm për zgjidhjen e të gjitha problemeve të përzgjedhjes së objekteve me interes. Konturimi i zonës është projektuar për të nxjerrë në pah objektet me vetitë e specifikuara në imazhe. Këto objekte, si rregull, korrespondojnë me objekte ose pjesë të tyre, të cilat shënohen nga diagnostikuesit. Rezultati i konturimit është një imazh binar ose hierarkik (shumëfazor), ku çdo nivel i imazhit korrespondon me një klasë të caktuar të objekteve të zgjedhura. Segmentimi është një fazë komplekse në përpunimin dhe analizën e të dhënave mjekësore të indeve biologjike, pasi është e nevojshme të përcaktohen zonat që korrespondojnë me objekte ose struktura të ndryshme në nivele histologjike: qeliza, organoidë, artefakte, etj. Kjo është për shkak të ndryshueshmërisë së lartë të parametrave të tyre, nivelit të ulët të kontrastit të imazheve të analizuara dhe marrëdhënies komplekse gjeometrike të objekteve. Në shumicën e rasteve, për të marrë rezultatin më efektiv, është e nevojshme të përdoren vazhdimisht metoda të ndryshme të segmentimit të objekteve me interes në imazh. Për shembull, për të përcaktuar kufijtë e një objekti me interes, përdoret metoda e gradientit morfologjik, pas së cilës kryhet segmentimi i pragut për zonat që janë të përshtatshme për dallime të vogla në karakteristikat e shkëlqimit. Për përpunimin e imazhit, në të cilin zonat homogjene të palidhura janë të ndryshme në ndriçimin mesatar, u zgjodh metoda e segmentimit Canny, studimet kryhen në një shembull klinik. Kur njihen imazhet klinike reale, modelimi është i dobët i zbatueshëm. Përvoja praktike dhe mendimet e ekspertëve në lidhje me rezultatin e analizës së imazhit janë të një rëndësie të madhe. Për imazhin e testit, u zgjodh një imazh i tomografisë së kompjuterizuar, ku objekti i interesit i paraqitur në figurën 1 është qartë i pranishëm. 2.

Oriz. 2. Imazhi i tomografisë së kompjuterizuar me një objekt interesi

Për të zbatuar segmentimin, ne përdorim metodën Canny. Kjo qasje është tolerante ndaj zhurmës dhe funksionon më mirë se metodat e tjera në shumicën e rasteve. Metoda Canny përfshin katër hapa:

1) para-përpunimi - turbullimi i imazhit (ne zvogëlojmë shpërndarjen e zhurmës shtesë);

2) diferencimi i imazhit të turbullt dhe më pas llogaritja e vlerave të gradientit përgjatë drejtimeve x dhe y;

3) zbatimi i shtypjes jo maksimale në imazh;

4) përpunimi i imazhit në prag.

Në fazën e parë të algoritmit Canny, imazhi zbutet duke përdorur një maskë me një filtër Gaussian. Ekuacioni i shpërndarjes Gaussian në dimensione N ka formën

ose në rastin e veçantë për dy dimensione

(2)

ku r është rrezja e turbullimit, r 2 = u 2 + v 2 ; σ është devijimi standard i shpërndarjes Gaussian.

Nëse përdorim 2 dimensione, atëherë kjo formulë përcakton sipërfaqen e rrathëve koncentrikë që kanë një shpërndarje Gaussian nga pika qendrore. Piksele me një shpërndarje të ndryshme nga zero përdoren për të specifikuar matricën e konvolucionit të aplikuar në imazhin origjinal. Vlera e çdo piksel bëhet një mesatare e ponderuar për lagjen. Vlera fillestare e një piksel merr peshën maksimale (ka vlerën maksimale Gaussian), dhe pikselët fqinjë marrin peshën minimale, në varësi të distancës së tyre. Teorikisht, shpërndarja në çdo pikë të imazhit duhet të jetë jo zero, e cila pason llogaritjen e koeficientëve të peshës për çdo piksel imazhi. Por në praktikë, kur llogaritet përafrimi diskret i funksionit Gaussian, pikselët në një distancë > 3σ nuk merren parasysh, pasi është mjaft i vogël. Kështu, programi i përpunimit të imazhit duhet të llogarisë matricën x për të siguruar që përafrimi i shpërndarjes Gaussian është mjaft i saktë.

Rezultatet e hulumtimit dhe diskutimi

Rezultati i funksionimit të filtrit Gaussian me të dhëna të barabarta me 5 për madhësinë e maskës Gaussian dhe 1.9 për vlerën e parametrit σ - devijimi standard i shpërndarjes Gaussian, është paraqitur në fig. 3. Hapi tjetër është gjetja e gradientit të rajonit të interesit duke e bashkuar imazhin e zbutur me derivatin e funksionit Gaussian në drejtimet vertikale dhe horizontale të vektorit.

Ne aplikojmë operatorin Sobel për të zgjidhur këtë problem. Procesi bazohet në lëvizjen e thjeshtë të maskës së filtrit nga piksel në piksel në imazh. Në çdo piksel (x, y), përgjigja e filtrit llogaritet nga lidhjet e paracaktuara. Si rezultat, bëhet zgjedhja fillestare e skajeve. Hapi tjetër është të krahasoni çdo piksel me fqinjët e tij përgjatë drejtimit të gradientit dhe të llogaritni maksimumin lokal. Informacioni në lidhje me drejtimin e gradientit është i nevojshëm për të hequr pikselët pranë kufirit pa thyer vetë kufirin pranë maksimumit lokal të gradientit, që do të thotë se pikselët e kufirit përcaktojnë pikat në të cilat arrihet maksimumi lokal i gradientit në drejtimi i vektorit të gradientit. Kjo qasje ju lejon të zvogëloni ndjeshëm zbulimin e skajeve të rreme dhe siguron trashësinë e kufirit të objektit prej një piksel, gjë që konfirmohet në mënyrë empirike nga zbatimi i softuerit të algoritmit të segmentimit për seksionin e barkut në imazhin CT të paraqitur në Fig. 4.

Hapi tjetër është përdorimi i një pragu për të përcaktuar nëse skaji është në çdo piksel të dhënë në imazh. Sa më i vogël të jetë pragu, aq më shumë skaje do të jenë në objektin e interesit, por aq më i ndjeshëm do të jetë rezultati ndaj zhurmës dhe konturimit të të dhënave të tepërta të imazhit. Një prag i lartë mund të injorojë skajet e dobëta të një zone ose të marrë një kufi nga disa zona. Konturimi i skajit zbaton dy pragje filtrimi: nëse vlera e pikselit është mbi kufirin e sipërm, ajo merr vlerën maksimale (kufiri konsiderohet i besueshëm), nëse është më i ulët, pikeli shtypet, pikat me një vlerë që bie midis pragjeve marrin një vlerë mesatare fikse. Një piksel bashkohet me një grup nëse e prek atë në një nga tetë drejtimet. Ndër avantazhet e metodës Canny, mund të konsiderojmë se gjatë përpunimit të imazhit, kryhet përshtatja me veçoritë e segmentimit. Kjo arrihet duke futur një prag të ndërprerjes së të dhënave të tepërta me dy nivele. Janë përcaktuar dy nivele pragu, ai i sipërm është p i lartë dhe ai i poshtëm është p i ulët, ku p i lartë > p i ulët. Vlerat e pikselit mbi vlerën e lartë p përcaktohen si korresponduese me kufirin (Fig. 5).

Oriz. 3. Aplikimi i një filtri Gaussian në një skanim CT me një objekt interesi

Oriz. 4. Shtypja e jo-maksimave në një imazh të segmentuar

Oriz. 5. Zbatimi i algoritmit të segmentimit Canny me nivele të ndryshme pragu

Praktika tregon se ekziston një interval i caktuar në shkallën e niveleve të pragut të ndjeshmërisë në të cilin vlera e zonës së objektit të interesit është praktikisht e pandryshuar, por ekziston një nivel i caktuar pragu, pas së cilës ka një "dështim" të metoda e konturimit dhe rezultati i përzgjedhjes së zonave me interes bëhet i pasigurt. Kjo është një mangësi e algoritmit, e cila mund të kompensohet duke kombinuar algoritmin Canny me transformimin Hough për të gjetur rrathë. Kombinimi i algoritmeve ju lejon të nënvizoni më qartë objektet e studimit, si dhe të eliminoni boshllëqet në konturet.

konkluzionet

Kështu, është zgjidhur problemi i formulimit të karakteristikave tipike të objekteve patologjike në imazhet mjekësore, gjë që do të bëjë të mundur kryerjen e mëtejshme të një analize operacionale të të dhënave për patologji specifike. Parametrat e rëndësishëm për përcaktimin e vlerësimit të cilësisë së segmentimit janë alarmi i rremë dhe probabiliteti i dështimit të anashkalimit. Këto parametra përcaktojnë nëse zbatohet automatizimi i metodës së analizës. Segmentimi në zgjidhjen e problemit të klasifikimit dhe njohjes së objekteve në imazhe është një nga ato kryesore. Metodat e konturimit të bazuara në segmentimin e kufijve të rajoneve janë hulumtuar dhe aplikuar mirë - Sobel, Canny, Prewit, Laplassian. Kjo qasje përcaktohet nga fakti se përqendrimi i vëmendjes njerëzore në analizën e imazheve shpesh përqendrohet në kufijtë midis zonave pak a shumë uniforme për sa i përket shkëlqimit. Bazuar në këtë, konturet shpesh kryejnë detyrën e përcaktimit të karakteristikave të ndryshme për interpretimin e imazheve dhe objekteve mbi to. Detyra kryesore e algoritmeve për segmentimin e zonave me interes është ndërtimi i një imazhi binar që përmban zona të mbyllura të të dhënave strukturore në imazh. Në lidhje me imazhet mjekësore, këto zona janë kufijtë e organeve, venave, MCC dhe tumoreve. Parimet e zhvilluara të analizës së automatizuar kompjuterike të imazheve mjekësore përdoren në mënyrë efektive si për detyrat operative të diagnostikimit mjekësor të një institucioni të specializuar onkologjik, ashtu edhe për qëllime edukative.

Hetuar me mbështetjen e programit të Lindjes së Largët, granti Nr. 15-I-4-014o.

Rishikuesit:

Kosykh N.E., Doktor i Shkencave Mjekësore, Profesor, Kërkues Kryesor, Qendra Informatike, Dega e Lindjes së Largët të Akademisë së Shkencave Ruse, Khabarovsk;

Levkova E.A., Doktor i Shkencave Mjekësore, Profesor, Universiteti Shtetëror i Komunikimeve të Lindjes së Largët, Khabarovsk.

Lidhje bibliografike

Doronicheva A.V., Savin S.Z. METODA E SEGMENTIMIT TË IMAZHVE MJEKËSORE // Kërkime Fundamentale. - 2015. - Nr.5-2. – Fq. 294-298;
URL: http://fundamental-research.ru/ru/article/view?id=38210 (data e hyrjes: 04/06/2019). Ne sjellim në vëmendjen tuaj revistat e botuara nga shtëpia botuese "Academy of Natural History"

Një nga qëllimet kryesore të vizionit kompjuterik në përpunimin e imazhit është interpretimi i përmbajtjes në një imazh. Për ta bërë këtë, është e nevojshme të ndani në mënyrë cilësore sfondin nga objektet. Segmentimi ndan një imazh në pjesët përbërëse ose objektet e tij. Ai e ndan subjektin nga sfondi në mënyrë që imazhet të mund të përpunohen lehtësisht dhe të identifikohet përmbajtja e tij. Në këtë rast, zgjedhja e kontureve në imazh është një mjet themelor për segmentimin e imazhit me cilësi të lartë. Ky artikull përpiqet të studiojë performancën e algoritmeve të zbulimit të skajeve të përdorura zakonisht për segmentimin e mëtejshëm të imazhit, si dhe krahasimin e tyre duke përdorur mjetin softuer MATLAB.

Prezantimi

Segmentimi i imazhit është një hap i madh për analizën e imazhit. Ai ndan një imazh në pjesët përbërëse ose objektet e tij. Niveli i detajeve të zonave që do të ndahen varet nga problemi që zgjidhet. Për shembull, kur objektet e interesit pushojnë së ruajturi integritetin, ndahen në pjesë përbërëse më të vogla, procesi i segmentimit duhet të ndalet. Algoritmet e segmentimit të imazhit bazohen më shpesh në mosvazhdimësi dhe ngjashmëri të vlerave në një imazh. Qasja e ndërprerjes së shkëlqimit bazohet në ndryshime të mprehta në vlerat e intensitetit, ndërsa ngjashmëria bazohet në ndarjen e një imazhi në rajone të ngjashme sipas një grupi kriteresh të paracaktuara. Kështu, zgjedhja e një algoritmi të segmentimit të imazhit varet drejtpërdrejt nga problemi që duhet zgjidhur. Zbulimi i skajeve është pjesë e segmentimit të imazhit. Prandaj, efikasiteti i zgjidhjes së shumë problemeve të përpunimit të imazhit dhe vizionit kompjuterik varet nga cilësia e kufijve të zgjedhur. Zgjedhja e tyre në imazh mund të klasifikohet si algoritme segmentimi, të cilat bazohen në ndërprerjet e shkëlqimit.

Procesi i zbulimit të ndërprerjeve të sakta të shkëlqimit në një imazh quhet procesi i zbulimit të skajeve. Lotët janë ndryshime të papritura në një grup pikselësh që janë kufijtë e objekteve. Algoritmi klasik i zbulimit të skajeve përdor konvolucionin e imazhit duke përdorur një operator që bazohet në ndjeshmërinë ndaj ndryshimeve të mëdha të ndriçimit në imazh dhe kthen zero kur kalon zona homogjene. Një numër i madh i algoritmeve të zbulimit të skajeve janë tani në dispozicion, por asnjëri prej tyre nuk është universal. Secili nga algoritmet ekzistuese zgjidh klasën e vet të problemeve (d.m.th., ai identifikon në mënyrë cilësore kufijtë e një lloji të caktuar). Për të përcaktuar algoritmin e duhur të zbulimit të skajeve, është e nevojshme të merren parasysh parametra të tillë si orientimi dhe struktura e skajit, si dhe prania dhe lloji i zhurmës në imazh. Gjeometria e një operatori vendos një drejtim karakteristik në të cilin është më i ndjeshëm ndaj kufijve. Operatorët ekzistues janë krijuar për të gjetur kufij vertikal, horizontal ose diagonal. Përzgjedhja e kufijve të objekteve është një detyrë e vështirë në rastin e një imazhi shumë të zhurmshëm, pasi operatori është i ndjeshëm ndaj ndryshimeve të ndriçimit dhe, për rrjedhojë, zhurma do të konsiderohet gjithashtu si një objekt në imazh. Ka algoritme që ju lejojnë të heqni qafe në masë të madhe zhurmën, por nga ana tjetër, ato dëmtojnë ndjeshëm skajet e imazhit, duke i shtrembëruar ato. Dhe meqenëse shumica e imazheve të përpunuara përmbajnë zhurmë, algoritmet e reduktimit të zhurmës janë shumë të njohura, por kjo ndikon në cilësinë e kontureve të zgjedhura.

Gjithashtu, gjatë zbulimit të kontureve të objekteve, ka probleme të tilla si gjetja e kontureve të rreme, vendndodhja e kontureve, anashkalimi i kontureve të vërteta, interferenca e zhurmës, koha e lartë e llogaritjes, etj. Prandaj, qëllimi është të eksploroni dhe krahasoni një sërë imazhesh të përpunuara dhe analizoni cilësinë e algoritmeve në kushte të ndryshme.

Në këtë artikull, është bërë një përpjekje për të rishikuar algoritmet më të njohura të zbulimit të kontureve për segmentimin, si dhe zbatimin e tyre në mjedisin softuer MATLAB. Seksioni i dytë prezanton përkufizimet themelore që përdoren në literaturë. Së treti - ofron teorike dhe matematikore dhe shpjegon qasjet e ndryshme kompjuterike për zbulimin e skajeve. Seksioni katër ofron një analizë krahasuese të algoritmeve të ndryshme, të shoqëruar me foto. Seksioni i pestë përmban një rishikim të rezultateve të marra dhe një përfundim.

Segmentimi i imazhit

Segmentimi i imazhit është procesi i ndarjes së një imazhi dixhital në shumë rajone ose grupe pikselësh. Në fakt, kjo është një ndarje në objekte të ndryshme që kanë të njëjtën strukturë ose ngjyrë. Rezultati i segmentimit është një grup rajonesh që së bashku mbulojnë të gjithë imazhin dhe një grup konturesh të nxjerra nga imazhi. Të gjithë pikselët nga e njëjta zonë janë të ngjashme në një farë mënyre, si ngjyra, cilësi ose intensiteti. Zonat ngjitur ndryshojnë nga njëra-tjetra në të njëjtat karakteristika. Qasje të ndryshme për gjetjen e kufijve midis rajoneve bazohen në johomogjenitetet e niveleve të intensitetit të ndriçimit. Kështu, zgjedhja e metodës së segmentimit të imazhit varet nga problemi që duhet zgjidhur.

Metodat e bazuara në zonë bazohen në vazhdimësi. Këto algoritme e ndajnë të gjithë imazhin në nënrajone në varësi të disa rregullave, për shembull, të gjithë pikselët në një grup të caktuar duhet të kenë një vlerë të caktuar gri. Këto algoritme mbështeten në modelet e zakonshme të intensitetit të vlerave në grupimet e pikselëve fqinjë.

Segmentimi i pragut është lloji më i thjeshtë i segmentimit. Në bazë të tij, zonat mund të klasifikohen sipas diapazonit bazë të vlerave, të cilat varen nga intensiteti i pikselëve në imazh. Pragu konverton imazhin e hyrjes në binar.

Metodat e segmentimit të bazuara në zbulimin e zonës gjejnë ndryshime të drejtpërdrejta të mprehta në vlerat e intensitetit. Metoda të tilla quhen metoda kufitare. Zbulimi i skajeve është një problem themelor në analizën e imazhit. Teknikat e zbulimit të skajeve përdoren zakonisht për të gjetur parregullsi në një imazh në shkallë gri. Zbulimi i ndërprerjeve në një imazh në shkallë gri është qasja më e rëndësishme në zbulimin e skajeve.

Algoritmet e zbulimit të kufirit

Kufijtë e objekteve në imazh zvogëlojnë shumë sasinë e të dhënave që duhen përpunuar, dhe në të njëjtën kohë ruajnë informacione të rëndësishme për objektet në imazh, formën, madhësinë, numrin e tyre. Tipari kryesor i teknikës së zbulimit të skajeve është aftësia për të nxjerrë një vijë të saktë me orientim të mirë. Literatura përshkruan shumë algoritme që ju lejojnë të zbuloni kufijtë e objekteve, por askund nuk ka një përshkrim se si të vlerësoni rezultatet e përpunimit. Rezultatet vlerësohen thjesht individualisht dhe varen nga fusha e aplikimit të tyre.

Zbulimi i skajeve është një mjet themelor për segmentimin e imazhit. Algoritme të tilla konvertojnë imazhin hyrës në një imazh me konturet e objektit, kryesisht në tonet gri. Në përpunimin e imazhit, veçanërisht në sistemet e vizionit kompjuterik, ndryshime të rëndësishme në nivelin e ndriçimit në imazh, parametrat fizikë dhe gjeometrikë të objektit në skenë konsiderohen duke përdorur nxjerrjen e konturit. Ky është një proces themelor që përshkruan objektet, duke fituar kështu disa njohuri për imazhin. Zbulimi i skajeve është qasja më popullore për zbulimin e inhomogjeniteteve të rëndësishme.

Një kufi është një ndryshim lokal në ndriçimin në një imazh. Ata priren të kalojnë përgjatë skajit midis dy zonave. Me ndihmën e kufijve, mund të merrni njohuri themelore për imazhin. Funksionet e tyre të marrjes përdoren nga algoritme të avancuara të vizionit kompjuterik dhe fusha të tilla si imazhet mjekësore, biometria dhe të ngjashme. Zbulimi i skajeve është një zonë aktive e kërkimit pasi lehtëson analizën e imazhit të nivelit të lartë. Ekzistojnë tre lloje të ndërprerjeve në imazhet gjysmëtonike: pika, vija dhe kufiri. Maskat hapësinore mund të përdoren për të zbuluar të tre llojet e inhomogjeniteteve.

Literatura teknike ofron dhe përshkruan një numër të madh algoritmesh për nxjerrjen e kontureve dhe kufijve. Në këtë artikull, trajtohen metodat më të njohura. Këtu përfshihen: operatori Roberts, Sobel, Prewitt, Kirsch, Robinson, algoritmi Canny dhe algoritmi LoG.

Operatori Roberts

Operatori i përzgjedhjes së kufijve Roberts u prezantua nga Lawrence Roberts në 1964. Kryen llogaritje të thjeshta dhe të shpejta të dimensionit hapësinor 2D në një imazh. Kjo metodë thekson zonat me frekuencë të lartë hapësinore, të cilat shpesh korrespondojnë me skajet. Një imazh në shkallë gri futet në hyrjen e operatorit. Vlera e pikselit e imazhit dalës në çdo pikë supozon një vlerë të caktuar të gradientit hapësinor të imazhit hyrës në të njëjtën pikë.

Operatori Sobel

Operatori Sobel u prezantua nga Sobel në 1970. Kjo metodë e zbulimit të skajeve përdor përafrimin e derivateve. Kjo lejon zbulimin e skajeve ku gradienti është më i lartë. Kjo metodë zbulon numrin e gradientëve në një imazh, duke nxjerrë në këtë mënyrë zona me frekuencë të lartë hapësinore që korrespondojnë me skajet. Në përgjithësi, kjo çoi në gjetjen e vlerës së vlerësuar absolute të gradientit në çdo pikë në imazhin hyrës. Ky operator përbëhet nga dy matrica, me përmasa 3×3. Matrica e dytë ndryshon nga e para vetëm në atë që rrotullohet me 90 gradë. Kjo është shumë e ngjashme me operatorin Roberts.

Zbulimi i skajeve me këtë metodë është llogaritës shumë më i thjeshtë se metoda Sobel, por çon në zhurmë më të madhe në imazhin që rezulton.

Operatori prewitt

Zbulimi i skajeve nga ky operator u propozua nga Prewitt në 1970. Drejtimi i saktë në këtë algoritëm ishte vlerësimi i madhësisë dhe orientimit të kufirit. Edhe pse zbulimi i kufijve është një detyrë shumë e mundimshme, kjo qasje jep rezultate mjaft të mira. Ky algoritëm bazohet në përdorimin e maskave 3 me 3, të cilat marrin parasysh 8 drejtime të mundshme, por drejtimet e drejtpërdrejta japin rezultatet më të mira. Të gjitha maskat e konvolucionit janë llogaritur.

Operatori Kirsch

Zbulimi i skajeve me këtë metodë u prezantua nga Kirsch në 1971. Algoritmi bazohet në përdorimin e vetëm një maske, e cila rrotullohet në tetë drejtime kryesore: veri, veriperëndim, perëndim, jugperëndim, jug, juglindje, lindje dhe verilindje. Maskat duken kështu:

Vlera e kufirit përcaktohet si vlera maksimale e gjetur duke përdorur maskën. Drejtimi i specifikuar nga maska ​​prodhon vlerën maksimale. Për shembull, maska ​​k 0 korrespondon me një kufi vertikal, dhe maska ​​k 5 korrespondon me një diagonale. Ju gjithashtu mund të vini re se katër maskat e fundit janë në fakt të njëjta me ato të parat, ato janë një imazh pasqyrë rreth boshtit qendror të matricës.

Operatori Robinson

Metoda Robinson, e prezantuar në 1977, është e ngjashme me metodën Kirsch, por është më e thjeshtë për t'u zbatuar për shkak të përdorimit të koeficientëve 0, 1 dhe 2. Maskat e këtij operatori janë simetrike rreth një boshti qendror të mbushur me zero. Mjafton të merrni rezultatin nga përpunimi i katër maskave të para, ndërsa pjesa tjetër mund të merret duke përmbysur të parat.

Vlera maksimale e përftuar pas aplikimit të të katër maskave në piksel dhe rrethinat e tij konsiderohet madhësia e gradientit, dhe këndi i gradientit mund të përafrohet si këndi i vijave të zeros në maskë që japin përgjigjen maksimale.

Zgjedhja e konturit me metodën Marr-Hildreth

Marr-Hildreth (1980) është një metodë e zbulimit të skajeve në imazhet dixhitale që zbulon kthesa të vazhdueshme kudo ku vërehen ndryshime të shpejta dhe të papritura në shkëlqimin e një grupi pikselësh. Kjo është një metodë mjaft e thjeshtë, funksionon si një ndërthurje imazhi me një funksion LoG ose si një përafrim i shpejtë me DoG. Zerot në rezultatin e përpunuar korrespondojnë me konturet. Algoritmi i detektorit të kufirit përbëhet nga hapat e mëposhtëm:

  • turbullimi i imazhit me metodën Gaussian;
  • aplikimi i operatorit laplasian në një imazh të paqartë (shpesh dy hapat e parë kombinohen në një);
  • kryejmë një cikël llogaritjesh dhe si rezultat shikojmë ndryshimin e shenjës. Nëse shenja ka ndryshuar nga negative në pozitive dhe vlera e ndryshimit të vlerës është më shumë se një prag i caktuar, atëherë përcaktojeni këtë pikë si kufi;
  • Për rezultate më të mira, hapi duke përdorur operatorin Laplacian mund të kryhet përmes histerezës siç zbatohet në algoritmin Canny.

Zgjedhja e konturit duke përdorur metodën LoG

Algoritmi Laplasian Gaussian i zbulimit të konturit u propozua në 1982. Ky algoritëm është derivati ​​i dytë i përcaktuar si:

Ajo kryhet në dy hapa. Në hapin e parë, ai zbut imazhin dhe më pas llogarit funksionin Laplacian, i cili rezulton në formimin e kontureve të dyfishta. Përkufizimi i kontureve është reduktuar në gjetjen e zerave në kryqëzimin e kufijve të dyfishtë. Zbatimi kompjuterik i funksionit Laplacian zakonisht bëhet përmes maskës së mëposhtme:

Laplacian zakonisht përdor vendndodhjen e një piksel në anën e errët ose të lehtë të kufirit.

Detektor kufitar Canni

Detektori i skajeve Canny është një nga algoritmet më të njohura të zbulimit të skajeve. Ai u propozua për herë të parë nga John Canny në tezën e tij të masterit në vitin 1983, dhe është akoma më i mirë se shumë algoritme të zhvilluara më vonë. Një hap i rëndësishëm në këtë algoritëm është eliminimi i zhurmës në konturet, i cili mund të ndikojë ndjeshëm në rezultat, ndërkohë që është e nevojshme të ruhen sa më shumë kufijtë. Kjo kërkon zgjedhje të kujdesshme të vlerës së pragut kur përpunohet me këtë metodë.

Algoritmi:

  • mjegullimi i imazhit origjinal f(r, c) duke përdorur funksionin Gaussian f^(r, c). f^(r, c)=f(r,c)*G(r,c,6);
  • kërkoni për gradientin. Kufijtë vizatohen aty ku gradienti merr një vlerë maksimale;
  • shtypja e jo-maksimumeve. Vetëm maksimumet lokale janë shënuar si kufij;
  • kufijtë që rezultojnë përcaktohen duke shtypur të gjitha skajet që nuk lidhen me kufijtë e përcaktuar.

Ndryshe nga operatorët Roberts dhe Sobel, algoritmi Canny nuk është shumë i ndjeshëm ndaj zhurmës së imazhit.

Rezultatet eksperimentale

Ky seksion paraqet rezultatet e algoritmeve të përshkruara më parë për zbulimin e kufijve të objekteve në një imazh.

Të gjithë algoritmet e përshkruara u zbatuan në mjedisin e softuerit MATLAB R2009a dhe u testuan në një fotografi të universitetit. Qëllimi i eksperimentit është të marrë një imazh të përpunuar me konturet e zgjedhura në mënyrë ideale. Imazhi origjinal dhe rezultatet e përpunimit të tij janë paraqitur në Figurën 1.

Figura 1 - Imazhi origjinal dhe rezultati i punës së algoritmeve të ndryshme të nxjerrjes së konturit


Gjatë analizimit të rezultateve të marra, u zbuluan rregullsitë e mëposhtme: operatorët Roberts, Sobel dhe Prewitt japin rezultate shumë të ndryshme. Marr-Hildreth, LoG dhe Kanny gjetën konturet e objektit pothuajse identike, Kirsch dhe Robinson dhanë të njëjtin rezultat. Por duke vëzhguar rezultatet e marra, mund të konkludojmë se algoritmi i Canny-it e bën një renditje të madhësisë më mirë se të tjerët.

konkluzionet

Përpunimi i imazhit është një fushë me zhvillim të shpejtë në disiplinën e vizionit kompjuterik. Rritja e saj bazohet në arritjet e larta në përpunimin e imazheve dixhitale, zhvillimin e përpunuesve kompjuterikë dhe pajisjeve të ruajtjes së informacionit.

Në këtë artikull, u bë një përpjekje për të studiuar në praktikë metodat për zgjedhjen e kontureve të objekteve bazuar në prishjet në shkëlqimin e një imazhi gjysmëton. Studimi i performancës relative të secilës prej metodave të paraqitura në këtë artikull u krye duke përdorur mjetin softuer MATLAB. Një analizë e rezultateve të përpunimit të imazhit tregoi se metoda të tilla si Marr-Hildreth, LoG dhe Canny japin pothuajse të njëjtat rezultate. Por megjithatë, gjatë përpunimit të këtij imazhi testues, rezultatet më të mira mund të vërehen pas funksionimit të algoritmit Canny, megjithëse në kushte të tjera, një metodë tjetër mund të jetë më e mirë.

Edhe duke marrë parasysh faktin se çështja e zbulimit të skajeve në imazh është sqaruar mjaft mirë në literaturën teknike moderne, ajo ende mbetet një detyrë mjaft e mundimshme, pasi zbulimi cilësor i skajeve varet gjithmonë nga shumë faktorë që ndikojnë në rezultat.

Lista e literaturës së përdorur

1. Canny J.F. (1983) Gjetja e skajeve dhe linjave në imazhe, Teza e Masterit, MIT. AI Lab.TR-720.
2. Canny J.F. (1986) Një qasje llogaritëse për zbulimin e skajeve, Transaksioni IEEE mbi analizën e modelit dhe inteligjencën e makinerisë, 8. - F. 679-714.
3. Courtney P, Thacker N.A. (2001) Karakterizimi i performancës në vizionin kompjuterik: Roli i statistikave në testim dhe dizajn, Kapitulli në: Sistemet e imazhit dhe vizionit: Teoria, vlerësimi dhe aplikimet, Jacques Blanc-Talon dhe Dan Popescu (Eds.), NOVA Science Books.
4. Hanzi Wang (2004) Statistikat e fuqishme për vizionin kompjuterik: Përshtatja e modelit, segmentimi i imazhit dhe analiza e lëvizjes vizuale, teza e doktoraturës, Universiteti Monash, Australi.
5. Huber P.J. (1981) Statistikat e fuqishme, Wiley New York.
6. Kirsch R. (1971) Përcaktimi kompjuterik i strukturës përbërëse të imazheve biologjike, Kompjuterët dhe Kërkimet Biomjekësore, 4, fq. 315-328.
7. Lakshmi S, Sankaranarayanan V. (2010) Një Studim i teknikave të zbulimit të skajeve për qasjet e llogaritjes së segmentimit, Teknikat e Kompjuterit të Soft Aided Computing for Imaging and Biomedical Applications. - F. 35-41.
8. Lee K., Meer P. (1998) Segmentimi i fuqishëm adaptiv i imazheve të gamës, IEEE Trans. Analiza e modelit dhe inteligjenca e makinerisë, 20(2). - F. 200-205.
9. Marr D, Hildreth E. (1980) Teoria e zbulimit të skajeve, Proc. Royal Society of London, B, 207.—F. 187–217.
10. Marr D. (1982) Vision, Freeman Publishers.
11. Marr P., Doron Mintz. (1991) Regresioni i fortë për vizionin kompjuterik: Një përmbledhje, Gazeta Ndërkombëtare e Vizionit Kompjuterik, 6 (1). - F. 59-70.
12. Orlando J. Tobias, Rui Seara (2002) Segmentimi i Imazhit sipas Pragut të Histogramit Using Fuzzy Sets, Transaksionet IEEE në Përpunimin e Imazheve, Vëll.11, Nr.12. - F. 1457-1465.
13. Punam Thakare (2011) Një Studim i Teknikave të Segmentimit të Imazhit dhe Zbulimit të skajeve, Revista Ndërkombëtare për Shkencën dhe Inxhinierinë Kompjuterike, Vëllimi 3, Nr.2. - F. 899-904.
14. Rafael C., Gonzalez, Richard E. Woods, Steven L. Eddins (2004) Digital Image Processing Using MATLAB, Pearson Education Ptd. Ltd, Singapor.
15. Ramadevi Y. (2010) Segmentimi dhe njohja e objekteve duke përdorur teknikat e zbulimit të skajeve, International Journal of Computer Science and Information Technology, Vol 2, Nr.6. - F. 153-161.
16. Roberts L. (1965) Perceptimi i makinerisë së lëndëve të ngurta 3-D, Përpunimi optik dhe elektro-optik i informacionit, MIT Press.
17. Robinson G. (1977) Zbulimi i skajeve nga maskat e gradientit të busullës, Grafika kompjuterike dhe përpunimi i imazhit, 6. - F. 492-501.
18. Rousseeuw P. J., Leroy A. (1987) Regresioni i fuqishëm dhe zbulimi i jashtëzakonshëm, John Wiley & Sons, Nju Jork.
19. Senthilkumaran N., Rajesh R. (2009) Edge Detection Techniques for Image Segmentation - A Survey of Soft Computing Approaches, International Journal of Recent Trends in Engineering, Vol. 1, nr. 2. - F. 250-254.
20. Sowmya B., Sheelarani B. (2009) Segmentimi i imazhit me ngjyra duke përdorur teknika kompjuterike të buta, Revista Ndërkombëtare e Aplikacioneve të Llogaritjes së Soft, Numri 4. - F. 69-80.
21. Umesh Sehgal (2011) Teknikat e zbulimit të skajeve në përpunimin dixhital të imazhit duke përdorur Fuzzy Logic, International Journal of Research in IT and Management, Vol.1, Issue 3. — F. 61-66.
22. Yu, X, Bui, T.D. & et al. (1994) Vlerësimi i fortë për segmentimin dhe rindërtimin e imazhit të diapazonit, IEEE trans. Analiza e modelit dhe inteligjenca e makinerisë, 16 (5). - F. 530-538.

Dërgoni punën tuaj të mirë në bazën e njohurive është e thjeshtë. Përdorni formularin e mëposhtëm

Studentët, studentët e diplomuar, shkencëtarët e rinj që përdorin bazën e njohurive në studimet dhe punën e tyre do t'ju jenë shumë mirënjohës.

Pritur në http://www.allbest.ru/

Ministria e Arsimit dhe Shkencës e Federatës Ruse

Universiteti Shtetëror i Inxhinierisë së Radios Ryazan

Departamenti i IIBMT

Puna e kursit

Metodat e përpunimit të imazhit. Segmentimi

Arti i përmbushur. gr. 432 milion:

Alyoshin S.I.

Kontrolluar nga Assoc. kafene IIBMT:

Kaplan M.B.

Ryazan 2014

Prezantimi

1. Prezantimi i imazheve

3. Formatet e imazhit

4. Llojet e imazheve

5.1 Ndryshimi i kontrastit

5.2 Zbutja e zhurmës

5.3 Theksimi i kufijve

5.4 Filtrimi mesatar

5.5 Segmentimi i imazhit

5.5.3 Përzgjedhja e përvijimit

5.5.7 Metodat e prerjes së grafikëve

6. Përshkrimi i funksioneve

7. Testimi i algoritmit

konkluzioni

Shtojca

Prezantimi

Në mesin e shekullit të 20-të, përpunimi i imazhit ishte kryesisht analog dhe kryhet nga pajisje optike. Teknika të tilla optike janë ende të rëndësishme sot, në fusha të tilla si holografia. Megjithatë, me rritjen dramatike të performancës së kompjuterit, këto metoda janë zëvendësuar gjithnjë e më shumë nga metodat e përpunimit të imazhit dixhital. Metodat e imazhit dixhital janë përgjithësisht më të sakta, më të besueshme, fleksibël dhe më të lehta për t'u zbatuar sesa metodat analoge. Përpunimi dixhital i imazhit përdor gjerësisht harduerin e specializuar si procesorët e linjës së udhëzimeve dhe sistemet me shumë procesorë. Kjo është veçanërisht e vërtetë për sistemet e përpunimit të videos. Përpunimi i imazhit kryhet edhe duke përdorur mjetet softuerike të matematikës kompjuterike, si MATLAB, Mathcad, Maple, Mathematica, etj. Për këtë ata përdorin si mjetet bazë ashtu edhe paketat shtesë të Përpunimit të Imazheve.

Interesi në teknikat e imazhit dixhital buron nga dy fusha kryesore të aplikimit, të cilat janë përmirësimi i imazhit për të përmirësuar perceptimin vizual të njeriut dhe përpunimi i imazhit për ruajtjen, transmetimin dhe prezantimin në sistemet e pavarura të vizionit të makinës.

Një nga metodat më komplekse të përpunimit dixhital të imazhit është segmentimi i imazhit. Segmentimi është procesi i ndarjes së një imazhi dixhital në disa segmente që ndryshojnë nga njëri-tjetri në veçoritë elementare, si shkëlqimi, ngjyra, tekstura, forma. Qëllimi i segmentimit është të thjeshtojë dhe ndryshojë paraqitjen e një imazhi në mënyrë që të jetë më e thjeshtë dhe më e lehtë për t'u analizuar. Zgjedhja e gabuar e segmenteve në imazh mund të ndikojë përfundimisht në cilësinë e njohjes dhe madje ta bëjë të pamundur. Prandaj, detyra e segmentimit është jashtëzakonisht e rëndësishme dhe shumë e rëndësishme.

Ka shumë metoda për ndarjen e imazhit. Rezultati përfundimtar shpesh përcaktohet nga saktësia e segmentimit, kështu që kur zgjidhni një ose një metodë tjetër segmentimi, vëmendje e madhe duhet t'i kushtohet besueshmërisë së algoritmit. Megjithatë, nuk ka asnjë qasje të vetme, përgjithësisht të pranuar, që do të ishte në themel të shumicës së algoritmeve. Nuk ka gjithashtu asnjë algoritëm të vetëm që do të lejonte segmentimin e pranueshëm për çdo imazh. Kjo është një nga vështirësitë e segmentimit dhe kjo është arsyeja e numrit të madh të qasjeve të ndryshme për zgjidhjen e këtyre problemeve të përpunimit të imazhit.

Pavarësisht nga rëndësia e kësaj fushe lëndore, janë shkruar relativisht pak libra që do të konsideronin njëkohësisht bazat teorike dhe aspektet programore të zgjidhjes së problemeve kryesore të segmentimit të imazhit.

Ky punim përshkruan metodat kryesore të përpunimit të imazhit dixhital. Vëmendje e veçantë i kushtohet metodave të ndarjes së imazhit. Një program për një nga metodat e segmentimit u zbatua duke përdorur paketën e aplikacionit MatLAB.

1. Prezantimi i imazheve

Çështjet themelore në teorinë e përpunimit të imazhit janë pyetjet: formimi, futja, përfaqësimi në kompjuter dhe vizualizimi. Forma e sipërfaqes mund të përshkruhet si funksion i distancës F(x, y) nga sipërfaqja në pikën e imazhit me koordinatat x dhe y. Duke marrë parasysh që shkëlqimi i një pike në një imazh varet vetëm nga shkëlqimi i sipërfaqes përkatëse, mund të supozojmë se informacioni vizual pasqyron gjendjen e shkëlqimit ose transparencës së secilës pikë me një shkallë të caktuar saktësie. Atëherë një imazh kuptohet si një funksion i kufizuar i dy ndryshoreve hapësinore f(x, y) të përcaktuara në një plan drejtkëndor të kufizuar Oxy dhe që kanë një grup të caktuar vlerash. Për shembull, një fotografi bardh e zi mund të përfaqësohet si f(x, y)?0, ku 0?x?a, 0?y?b dhe f(x, y) janë shkëlqimi (ndonjëherë quhet densitet optik ose bardhësi ) e imazhit në pikën (x, y); a - gjerësia e kornizës, b - lartësia e kornizës.

Për shkak të faktit se memoria dixhitale e një kompjuteri është e aftë të ruajë vetëm grupe të dhënash, imazhi fillimisht shndërrohet në një formë të caktuar numerike (matricë). Futja e imazheve në kujtesën e kompjuterit kryhet duke përdorur sensorë video. Sensori i videos përkthen shpërndarjen optike të ndriçimit të imazhit në sinjale elektrike dhe më tej në kode dixhitale. Meqenëse imazhi është një funksion i dy ndryshoreve hapësinore x dhe y, dhe sinjali elektrik është një funksion i një ndryshoreje t (koha), një fshirje përdoret për transformimin. Për shembull, kur përdoret një aparat televiziv, imazhi lexohet rresht pas rreshti, ndërsa brenda çdo rreshti varësia e ndriçimit nga koordinata hapësinore x shndërrohet në një varësi proporcionale të amplitudës së sinjalit elektrik në kohën t. Kalimi nga fundi i rreshtit të mëparshëm në fillim të rreshtit tjetër është pothuajse i menjëhershëm.

Futja e imazheve në një kompjuter shoqërohet në mënyrë të pashmangshme me diskretizimin e imazheve në koordinatat hapësinore x dhe y dhe kuantizimin e vlerës së shkëlqimit në çdo pikë diskrete. Diskretizimi arrihet duke përdorur një rrjet koordinativ të formuar nga vija paralele me boshtet x dhe y të sistemit të koordinatave karteziane. Në çdo nyje të një rrjete të tillë, matet shkëlqimi ose transparenca e bartësit të informacionit të perceptuar vizualisht, i cili më pas kuantizohet dhe paraqitet në kujtesën e kompjuterit. Elementi i imazhit të marrë në procesin e kampionimit të një imazhi quhet piksel. Për një paraqitje cilësore të një imazhi gjysmëtonik, mjaftojnë 28 = 256 nivele kuantizimi, d.m.th. 1 piksel i imazhit është i koduar nga 1 bajt informacioni.

Karakteristikat kryesore të imazheve janë:

1. Madhësia e imazhit;

2. Thellësia e ngjyrës;

3. Leja.

2. Kodimi i imazhit me ngjyra

Ngjyra është një fenomen që është rezultat i bashkëveprimit të dritës, një objekti dhe një instrumenti (vëzhguesi).

Është vërtetuar eksperimentalisht se çdo ngjyrë mund të përfaqësohet si shuma e sasive të caktuara të tre ngjyrave linearisht të pavarura.

Tre ngjyra të pavarura në mënyrë lineare quhen ngjyra kryesore.

Ato përcaktojnë një sistem të koordinatave të ngjyrave (CCS) ose një skemë ngjyrash, d.m.th. një grup ngjyrash primare për të marrë pjesën tjetër të ngjyrave.

Skemat e ngjyrave ndahen në dy lloje: skemat e ngjyrave nga drita e emetuar dhe nga drita e reflektuar.

Sistemi RGB.

Ngjyrat e tij kryesore janë e kuqe (E kuqe) në 700 nm, jeshile (E gjelbër) në 546.1 nm dhe blu (Blu) në 435.8 nm. Sistemi RGB është shtesë.

Në këtë rast, një ose një ngjyrë tjetër fitohet duke shtuar ngjyrat kryesore.

Sistemi CMYK.

Ky sistem përdoret për të formuar ngjyrat e objekteve me ngjyrë jo të ndritshme që thithin një pjesë të spektrit të dritës së bardhë të ndriçuar dhe reflektojnë pjesën tjetër të rrezatimit.

Sistemi CMYK është baza për printimin me ngjyra.

Ai bazohet në modelin e zbritjes së ngjyrave CMY zbritëse (Cyan - Cyan, Magenta - Magenta, Yellow - Yellow). Ka ende tre ngjyra kryesore këtu.

Për të përmirësuar cilësinë e imazhit të printuar, sistemit i është shtuar ngjyra e zezë.

Sistemi HSB.

Ky sistem bazohet në përdorimin e Hue ose Hue, Saturation dhe Lightness. Ngjyra karakterizon një nuancë specifike të një ngjyre, ngopja karakterizon intensitetin e saj relativ, shkëlqimi i ngjyrës karakterizon sasinë e nuancës së zezë për të marrë një imazh më të errët.

Një variant i këtij sistemi është skema HSL.

3. Formatet e imazhit

Një numër i madh i formateve të ndryshme të skedarëve grafikë janë aktualisht në përdorim. Formatet më të përdorura janë TIFF, GIF, JPEG, PNG dhe BMP.

Formati TIFF (Tagget Image Format) është një nga formatet më të besueshme dhe më të gjithanshme për ruajtjen e imazheve me ngjyra të skanuara me cilësi të lartë. Mund të përdorë kompresimin LZW, d.m.th. i referohet formateve të ruajtjes së imazheve pa humbje.

Formati GIF (Graphics Interchange Format) ka një gamë ngjyrash prej 256 ngjyrash dhe përdor algoritmin LZW pa humbje për kompresim. Nëse numri origjinal i ngjyrave është më i madh se 256, atëherë disa nga informacionet e ngjyrave do të humbasin.

Formati JPEG (Join Photographers Expert Group) bazohet në një algoritëm me të njëjtin emër për kompresimin e imazheve. Ai i referohet algoritmeve të kompresimit me humbje dhe është krijuar për të ruajtur imazhe me ngjyra të plota me një raport të lartë kompresimi. Kur përdorni formatin, mund të kontrolloni parametrin e cilësisë nga 0 (ngjeshja maksimale) në 100 (cilësia maksimale). Raporti i kompresimit, në varësi të cilësisë, është nga 10 në 1000. Ky format përdoret më shpesh për të ruajtur imazhe fotografike me ngjyra të plota që nuk janë të destinuara për përpunim të mëtejshëm.

Formati PNG është një format raster për ruajtjen e informacionit grafik që përdor kompresim pa humbje duke përdorur algoritmin Deflate. Formati PNG është krijuar për të zëvendësuar formatin GIF të vjetëruar dhe më të thjeshtë, si dhe, në një farë mase, për të zëvendësuar formatin shumë më kompleks TIFF. Formati PNG është i pozicionuar kryesisht për përdorim në internet dhe redaktim grafike. Ka këto përparësi kryesore ndaj GIF: një numër pothuajse i pakufizuar ngjyrash në një imazh; mbështetje opsionale për kanalin alfa; mundësia e korrigjimit të gama; ndërthurja dydimensionale.

Formati BMP (BitMaP) i referohet formateve origjinale të bitmap-ve të sistemit operativ Windows. Është i përshtatshëm për ruajtjen e imazheve si në formë të indeksuar me një gamë deri në 256 ngjyra, ashtu edhe si imazhe RGB me ngjyra të plota me një thellësi ngjyrash 24 bit. Është e mundur të përdoret algoritmi i kompresimit RLE.

4. Llojet e imazheve

4.1 Imazhi në dy nivele (ose monokromatike).

Në këtë rast, të gjithë pikselët mund të kenë vetëm dy vlera, të cilat zakonisht quhen të zeza (binare, ose ngjyra bazë) dhe e bardhë (zero binare ose ngjyra e sfondit).

Çdo piksel i një imazhi të tillë përfaqësohet nga një bit, kështu që ky është lloji më i thjeshtë i imazhit.

1. Imazhi gjysmëton. Një imazh i tillë me një shkallë prej 2n nivelesh është i përbërë nga shtresa n-bit.

2. Imazhi me ngjyra. Një imazh i tillë përshkruhet në një nga formatet e paraqitura më sipër.

3. Imazhi me ton të vazhdueshëm. Ky lloj imazhi mund të ketë shumë ngjyra të ngjashme (ose tone të mesme). Kur pikselët fqinjë ndryshojnë vetëm me një, është pothuajse e pamundur që syri të dallojë ngjyrat e tyre. Si rezultat, imazhe të tilla mund të përmbajnë zona në të cilat ngjyra duket se ndryshon vazhdimisht në sy. Në këtë rast, një piksel përfaqësohet ose nga një numër i madh (në rastin e shkallës gri) ose nga tre komponentë (në rastin e një imazhi me ngjyra). Imazhet me një ton të vazhdueshëm janë të natyrshme ose të natyrshme (në krahasim me të krijuara nga njeriu, artificiale); ato zakonisht merren kur shkrepni me aparat fotografik dixhital ose kur skanoni fotografi ose vizatime.

4. Imazhi me tone diskrete (quhet edhe sintetik). Zakonisht, ky imazh merret artificialisht. Mund të ketë vetëm disa ngjyra ose shumë ngjyra, por nuk ka zhurmën dhe njollat ​​e një imazhi natyral. Shembuj të imazheve të tilla janë fotografitë e objekteve artificiale, makinerive ose mekanizmave, faqet e tekstit, hartat, vizatimet ose imazhet në një ekran kompjuteri. (Jo çdo imazh artificial do të jetë domosdoshmërisht me tone diskrete. Një imazh i krijuar nga kompjuteri, i cili duhet të duket i natyrshëm, do të ketë tone të vazhdueshme, pavarësisht origjinës së tij artificiale.) Objektet artificiale, teksti, linjat e vizatuara kanë formë, kufij të përcaktuar mirë. Ata kontrast të fortë me pjesën tjetër të imazhit (sfondi). Piksele ngjitur në një imazh të toneve diskrete janë shpesh të vetme ose ndryshojnë shumë në vlerë. Imazhe të tilla janë të ngjeshura dobët nga metodat me humbje, pasi shtrembërimi i vetëm disa pikselave të një shkronje e bën atë të palexueshëm, duke e shndërruar stilin e njohur në krejtësisht të padallueshëm. Imazhet me tone diskrete zakonisht përmbajnë shumë tepricë. Shumë nga fragmentet e tij përsëriten shumë herë në vende të ndryshme të imazhit.

5. Imazhe të ngjashme me filmat vizatimorë. Këto janë imazhe me ngjyra që përmbajnë zona të mëdha me të njëjtën ngjyrë. Në këtë rast, zonat ngjitur mund të ndryshojnë shumë në ngjyrë.

5. Metodat e përpunimit të imazhit

Një analizë paraprake e imazheve na lejon të konkludojmë se:

Së pari, shumica e imazheve, në procesin e formimit të tyre (skanime fotografike, etj.), Ndikohen nga një sërë faktorësh negativë (dridhje e kamerës, lëvizje e pabarabartë e elementit të skanimit, etj.), duke çuar në turbullim, shfaqje të ulët - zona me kontrast dhe zhurmë etj.

Së dyti, shumica dërrmuese e metodave bazohen në përzgjedhjen e objekteve në imazh dhe analizën e tyre të mëtejshme.

Kështu, përpara se të analizohet, imazhi duhet të kalojë në fazën e përgatitjes, që konsiston në kryerjen e operacioneve të përmirësimit të cilësisë vizuale (përmirësimi i kontrastit, heqja e turbullimit, përmirësimi i kufirit, filtrimi) dhe operacionet e përgatitjes së imazhit (segmentimi, konturimi) i imazhit.

5.1 Ndryshimi i kontrastit

Kontrasti i dobët zakonisht shkaktohet nga një gamë e vogël dinamike e ndryshimeve të shkëlqimit, ose një jolinearitet i fortë në transmetimin e niveleve të shkëlqimit. Metoda më e thjeshtë e kontrastit është hartëzimi funksional i gradimit të shkëlqimit fij në gij, pra gij = R(fij). Në praktikë, shpesh përdoren hartografitë funksionale lineare. Nëse si rezultat i ndriçimit të pabarabartë kur fotografoni ose bëni fotografi, lind një situatë ku pjesë të ndryshme të imazhit kanë kontrast të ndryshëm. Në këtë rast, algoritmet adaptive të kontrastit përdoren për të ndryshuar kontrastin. Një shembull është algoritmi lokal i përmirësimit të kontrastit. Studimet eksperimentale kanë konfirmuar efikasitetin e lartë të algoritmit në rast se imazhi përmban zona me kontraste qartësisht të mbivlerësuara ose të nënvlerësuara.

Thelbi i algoritmit është se imazhi konsiderohet si një grup i një numri të caktuar zonash lokale, dhe këto zona përpunohen duke marrë parasysh karakteristikat e tyre. Përpunimi kryhet në sekuencën e mëposhtme: koeficienti i fitimit të fetave të densitetit p llogaritet veçmas për secilën zonë lokale të figurës. Dhe çdo piksel i imazhit përpunohet. Nëse p është e barabartë me një, atëherë nuk kryhet asnjë veprim në zonën lokale të imazhit (nëse p është i ndryshëm nga uniteti, atëherë kontrasti i zonës lokale rritet). Fillimisht, kontrasti llogaritet në pikën e analizuar në lidhje me lagjen më të afërt. Pastaj vlera e kontrastit relativ i shtohet unitetit, dhe vlera që rezulton pranohet në algoritëm si fitimi p, dhe më pas llogaritja bëhet sipas formulës:

Kontrasti i programit të segmentimit të imazhit

ku është vlera e re e ndriçimit, është shkëlqimi aktual i imazhit të përpunuar, është vlera maksimale e kërkuar e ndriçimit të imazhit të përpunuar.

5.2 Zbutja e zhurmës

Imazhet gjatë fazës së dixhitalizimit janë të ekspozuara ndaj zhurmës shtuese dhe impulsive. Zhurma shtesë është një sinjal i rastësishëm që i shtohet atij të dobishëm në daljen e sistemit; në rastin në shqyrtim, zhurma shtesë lind për shkak të kokrrizimit të filmit. Zhurma e impulsit, ndryshe nga zhurma shtesë, karakterizohet nga efekti në sinjalin e dobishëm vetëm në pika të veçanta të rastësishme (vlera e sinjalit që rezulton në këto pika merr një vlerë të rastësishme). Zhurma e impulsit është tipike për transmetimin dixhital dhe sistemet e ruajtjes së imazhit. Kështu, në procesin e përgatitjes së imazhit, lind problemi i shtypjes së zhurmës.

Metoda më e thjeshtë për zbutjen e zhurmës në një imazh është zbutja, d.m.th. duke zëvendësuar vlerën e ndriçimit të çdo elementi me vlerën mesatare të gjetur në lagjen e tij:

ku është grupi i pikave që i përkasin fqinjësisë së pikës (përfshirë vetë pikën); është numri i pikëve në lagje.

Metoda e konsideruar eliminon në mënyrë efektive zhurmën shtesë dhe impulse në çdo element imazhi.

5.3 Theksimi i kufijve

Teknikat e zbutjes së imazhit mund të heqin zhurmën në mënyrë shumë efektive. Një disavantazh i rëndësishëm i algoritmeve anti-aliasing është turbullimi i imazhit (dmth. mprehtësia e reduktuar e elementeve të konturit), ndërsa sasia e turbullimit është proporcionale me madhësinë e maskës së përdorur për zbutjen. Për një analizë të qartë të imazheve, veçanërisht kur llogaritni karakteristikat gjeometrike të elementeve strukturorë, është shumë e rëndësishme të hiqni turbullimin nga konturet e objekteve në imazh, domethënë të rritet diferenca midis shkallëzimeve të shkëlqimit të elementeve konturore të objektit. dhe elementet fqinje të sfondit. Në këtë rast, gjatë përpunimit të imazheve, përdoren metoda të theksimit të kontureve.

Zakonisht, kufijtë theksohen me metodën e filtrimit hapësinor me frekuencë të lartë. Karakteristikat e filtrave specifikohen si një maskë, në të cilën vlera mesatare duhet të jetë e barabartë me zero.

Një metodë tjetër e theksimit të kufijve është i ashtuquajturi diferencim statik. Në këtë metodë, vlera e shkëlqimit të secilit element ndahet me vlerësimin statistikor të devijimit standard, d.m.th. (devijimi standard llogaritet në disa lagje të elementit).

5.4 Filtrimi mesatar

Filtrimi mesatar i referohet metodave jolineare të përpunimit të imazhit dhe ka përparësitë e mëposhtme mbi filtrimin linear (procedura klasike e zbutjes): ruan ndryshime të mprehta (kufijtë); zbut në mënyrë efektive zhurmën e impulsit; nuk ndryshon ndriçimin e sfondit.

Filtrimi mesatar kryhet duke lëvizur disa hapje (maskë) përgjatë imazhit diskret dhe duke zëvendësuar vlerën e elementit qendror të maskës me vlerën mesatare (vlera mesatare e sekuencës së renditur) të elementeve origjinale brenda aperturës. Në përgjithësi, hapja mund të ketë një larmi formash, por në praktikë, një hapje katrore me madhësi

5.5 Segmentimi i imazhit

Segmentimi i imazhit kuptohet si procesi i ndarjes së tij në pjesë përbërëse që kanë një kuptim kuptimplotë: objektet, kufijtë e tyre ose fragmente të tjera informative, tipare karakteristike gjeometrike, etj. Në rastin e automatizimit të metodave të përvetësimit të imazhit, segmentimi duhet të konsiderohet si Faza kryesore fillestare e analizës, e cila konsiston në ndërtimin e një imazhi përshkrim zyrtar, cilësia e të cilit përcakton në masë të madhe suksesin e zgjidhjes së problemit të njohjes dhe interpretimit të objekteve.

Në rastin e përgjithshëm, segmentimi është një operacion i ndarjes së një grupi të fundëm të një plani në të cilin funksioni i imazhit origjinal përcaktohet në nënbashkësi të lidhura jo bosh në përputhje me disa kallëzues të përcaktuar në grup dhe duke marrë vlera të vërteta kur ndonjë çifti i pikave nga çdo nëngrup plotëson disa kritere homogjeniteti (për shembull, kriteri i homogjenitetit i bazuar në një vlerësim të diferencës maksimale midis shkëlqimit të një piksel individual dhe vlerës mesatare të shkëlqimit të llogaritur në zonën përkatëse).

5.5.1 Metodat e segmentimit të pragut

Pragu është një nga metodat kryesore të segmentimit të imazhit për shkak të vetive të tij intuitive. Kjo metodë përqendrohet në përpunimin e imazheve, zona individuale homogjene të të cilave ndryshojnë në ndriçimin mesatar. Metoda më e zakonshme e segmentimit me prag është segmentimi binar, domethënë kur kemi në dispozicion dy lloje zonash homogjene.

Në këtë rast, imazhi përpunohet me piksel, dhe shndërrimi i secilit piksel të figurës hyrëse në imazhin dalës përcaktohet nga relacioni:

ku është një parametër i përpunimit i quajtur pragu dhe janë nivelet e ndriçimit të daljes. Përpunimi me pikselë, pozicioni i të cilave në imazh nuk luan ndonjë rol, quhet pikë. Nivelet dhe luajnë rolin e etiketave. Sipas tyre, përcaktohet se çfarë lloji t'i atribuohet pika e dhënë: H0 ose H1. Ose ata thonë se H0 përbëhet nga pikat e sfondit, dhe H1 nga pikat e interesit. Si rregull, nivelet dhe korrespondojnë me nivelet e bardhë dhe të zezë. Klasat H1 (të njohura edhe si klasa e interesit) do t'i quajmë klasën e objektit dhe klasën H0 klasën e sfondit.

Natyrisht, segmentimi mund të jetë jo vetëm binar, dhe në këtë rast ka më shumë se dy klasa ekzistuese. Ky lloj segmentimi quhet shumënivelësh. Imazhi që rezulton nuk është binar, por përbëhet nga segmente me ndriçim të ndryshëm. Formalisht, ky operacion mund të shkruhet si më poshtë:

ku është numri i niveleve dhe janë klasat e imazhit. Në këtë rast, për secilën nga klasat, duhet të vendoset një prag i përshtatshëm, i cili do t'i ndante këto klasa nga njëra-tjetra. Imazhet binare janë më të lehta për t'u ruajtur dhe përpunuar sesa imazhet që kanë shumë nivele ndriçimi.

Pjesa më e vështirë e përcaktimit të pragut është vetë procesi i pragut. Pragu shpesh shkruhet si funksion i formës:

ku është imazhi dhe është disa karakteristikë e pikës së imazhit, për shembull, ndriçimi mesatar në lagjen e përqendruar në këtë pikë.

Nëse vlera e pragut varet vetëm nga, domethënë e njëjtë për të gjitha pikat e figurës, atëherë një prag i tillë quhet global. Nëse pragu varet nga koordinatat hapësinore, atëherë një prag i tillë quhet lokal. Nëse varet nga karakteristika, atëherë një prag i tillë quhet adaptues. Kështu, përpunimi konsiderohet global nëse i referohet të gjithë imazhit në tërësi, dhe lokal nëse i referohet një zone të zgjedhur.

Përveç dallimeve të mësipërme midis algoritmeve, ka shumë më tepër metoda. Shumë prej tyre janë thjesht një kombinim i të tjerëve, por shumica e tyre, në një mënyrë apo tjetër, bazohen në analizën e histogramit të imazhit origjinal, megjithatë, ka edhe qasje thelbësisht të ndryshme që nuk ndikojnë drejtpërdrejt në analizën e histogrameve ose kalojmë prej tyre në analizën e disa funksioneve të tjera.

5.5.2 Metodat e rritjes në rajon

Metodat e këtij grupi bazohen në përdorimin e veçorive të imazhit lokal. Ideja e metodës së rritjes së rajonit është që fillimisht të analizohet pika e fillimit, pastaj pikat fqinje, e kështu me radhë. në përputhje me disa kritere homogjeniteti, dhe më pas caktimi i pikave të analizuara për një grup ose një tjetër (numri i pikave fillestare duhet të jetë i barabartë me numrin e zonave homogjene në imazh). Versionet më efikase të metodës nuk përdorin piksele individuale si pikënisje, por në vend të kësaj e ndajnë imazhin në një seri zonash të vogla. Pastaj çdo zonë kontrollohet për homogjenitet, dhe nëse rezultati i testit është negativ, atëherë zona përkatëse ndahet në seksione më të vogla. Procesi vazhdon derisa të gjitha zonat e përzgjedhura të kalojnë testin për uniformitet. Pas kësaj, formimi i rajoneve homogjene fillon me ndihmën e shtrirjes.

Segmentimi i pragut dhe segmentimi i homogjenitetit bazuar në ndriçimin mesatar shpesh nuk japin rezultatet e dëshiruara. Një segmentim i tillë zakonisht çon në shfaqjen e një numri të konsiderueshëm zonash të vogla që nuk kanë prototipe reale në imazh. Rezultatet më efektive fitohen nga segmentimi sipas kriterit të uniformitetit në bazë të teksturës (ose veçorive të teksturës).

5.5.3 Përzgjedhja e përvijimit

Nuk është e pazakontë të hasësh problemin e gjetjes së perimetrit, lakimit, faktorëve të formës, sipërfaqes specifike të objekteve, etj. Të gjitha këto detyra lidhen disi me analizën e elementeve konturore të objekteve.

Metodat për zgjedhjen e kontureve (kufijve) në një imazh mund të ndahen në klasat kryesore të mëposhtme:

metodat e filtrimit me frekuencë të lartë;

metodat e diferencimit hapësinor;

metodat e përafrimit funksional.

E zakonshme për të gjitha këto metoda është dëshira për të konsideruar kufijtë si një rajon i një rënie të mprehtë në funksionin e ndriçimit të imazhit; ajo që i dallon është modeli i prezantuar matematik i konceptit të kufirit dhe algoritmi për gjetjen e pikave kufitare.

Në përputhje me detyrat e vendosura, kërkesat e mëposhtme u imponohen algoritmeve për nxjerrjen e kontureve: konturet e zgjedhura duhet të hollohen, pa thyerje dhe të mbyllen. Kështu, procesi i zgjedhjes së kontureve është disi i ndërlikuar për shkak të nevojës për të aplikuar algoritme për rrallimin dhe eliminimin e boshllëqeve. Sidoqoftë, kjo nuk jep gjithmonë rezultatin e dëshiruar - në shumicën e rasteve, konturet nuk janë të mbyllura dhe, si rezultat, të papërshtatshme për një numër procedurash analize.

Problemi mund të zgjidhet duke konturuar me metodën "beetle" të gjurmimit të kufijve, e cila ju lejon të zgjidhni konturet e mbyllura të objekteve. Thelbi i algoritmit është si vijon: një pikë e caktuar kufitare fillestare zgjidhet në objekt dhe më pas kontura gjurmohet në mënyrë sekuenciale derisa të arrihet pika e fillimit. Në rastin e gjurmimit të konturit në drejtim të akrepave të orës, për të arritur në pikën fillestare, kryhet një lëvizje piksel pas piksel djathtas nëse piksel është jashtë objektit dhe në të majtë nëse është në objekt.

Kontura e zgjedhur në këtë mënyrë është një kod zinxhir i mbyllur, d.m.th. sekuenca e koordinatave të pikave kufitare të objektit, e cila është shumë e përshtatshme për zgjidhjen e detyrave.

5.5.4 Metodat e bazuara në grupim

Metoda K-means është një metodë përsëritëse që përdoret për të ndarë një imazh në grupe K. Algoritmi bazë është paraqitur më poshtë:

1. Zgjidhni qendrat e grupimit K, rastësisht ose bazuar në ndonjë heuristik;

2. Vendosni çdo piksel imazhi në një grup, qendra e të cilit është më afër këtij piksel;

3. Rillogaritni qendrat e grupimeve duke llogaritur mesatarisht të gjithë pikselët në grup;

4. Përsëritni hapat 2 dhe 3 deri në konvergjencë (për shembull, kur pikselët mbeten në të njëjtin grup).

Këtu, shuma e katrorëve ose vlerat absolute të dallimeve midis pikselit dhe qendrës së grupit zakonisht merret si distancë. Dallimi zakonisht bazohet në ngjyrën, shkëlqimin, strukturën dhe vendndodhjen e pikselit, ose një shumë të ponderuar të këtyre faktorëve.

K mund të zgjidhet manualisht, rastësisht ose heuristike.

Ky algoritëm është i garantuar të konvergojë, por mund të mos çojë në një zgjidhje optimale.

Cilësia e zgjidhjes varet nga grupi fillestar i grupimeve dhe vlera e K.

5.5.5 Metodat e histogramit

Metodat e histogramit janë shumë efikase kur krahasohen me metodat e tjera të segmentimit të imazhit, sepse ato kërkojnë vetëm një kalim piksel. Në këtë metodë, histogrami llogaritet mbi të gjitha pikselët në imazh dhe minimalet dhe maksimalet e tij përdoren për të gjetur grupime në imazh. Ngjyra ose shkëlqimi mund të përdoren në krahasim.

Një përmirësim i kësaj metode është aplikimi i saj në mënyrë rekursive në grupimet në imazh në mënyrë që t'i ndani ato në grupime më të vogla. Procesi përsëritet me grupe gjithnjë e më të vogla derisa të mos shfaqen më grupime.

Një nga disavantazhet e kësaj metode është se mund të jetë e vështirë të gjesh minimume dhe maksimum të rëndësishëm në një imazh. Në këtë metodë të klasifikimit të imazheve, metrika e distancës dhe përputhja e rajonit të integruar janë të ngjashme.

Qasjet e bazuara në histogram gjithashtu mund të përshtaten shpejt në korniza të shumta duke ruajtur avantazhin e tyre të shpejtësisë së një kalimi. Histogrami mund të ndërtohet në disa mënyra kur merren parasysh korniza të shumta. E njëjta qasje që përdoret për një kornizë të vetme mund të zbatohet për korniza të shumta dhe pasi të kombinohen rezultatet, nivelet e ulëta dhe të larta që ishin të vështira për t'u dalluar bëhen më të dukshme. Një histogram mund të aplikohet gjithashtu në bazë për piksel, ku informacioni përdoret për të përcaktuar ngjyrën më të shpeshtë për një pozicion të caktuar piksel. Kjo qasje përdor segmentimin e bazuar në objektet në lëvizje dhe mjediset e palëvizshme, gjë që jep një lloj tjetër segmentimi të dobishëm në ndjekjen e videos.

5.5.6 Metodat e rritjes së rajonit

E para ishte metoda e rritjes së sipërfaqeve nga farat. Kjo metodë merr imazhe dhe një grup farash si hyrje. Farat shënojnë objektet që do të zgjidhen. Rajonet rriten në mënyrë progresive, duke krahasuar të gjithë pikselët ngjitur të papushtuar me rajonin. Diferenca q midis shkëlqimit të një piksel dhe ndriçimit mesatar të një zone përdoret si një masë ngjashmërie. Pikseli me diferencën më të vogël të tillë i shtohet zonës përkatëse. Procesi vazhdon derisa të gjithë pikselët të shtohen në një nga rajonet.

Metoda e rritjes së sipërfaqeve nga farat kërkon të dhëna shtesë. Rezultati i segmentimit varet nga zgjedhja e farave. Zhurma në imazh mund të bëjë që farat të vendosen keq. Metoda e rritjes së zonës pa farë është një algoritëm i modifikuar që nuk kërkon fara të qarta. Fillon nga një zonë - piksel i zgjedhur këtu ka pak efekt në segmentimin përfundimtar. Në çdo përsëritje, ai merr në konsideratë pikselët fqinjë në të njëjtën mënyrë si metoda e rritjes së rajonit duke përdorur farat. Por aty ndryshon, që nëse minimumi nuk është më i vogël se pragu i dhënë, atëherë i shtohet zonës përkatëse. Përndryshe, piksel konsiderohet të jetë shumë i ndryshëm nga të gjitha rajonet aktuale dhe krijohet një rajon i ri që përmban këtë piksel.

Një variant i kësaj metode bazohet në përdorimin e ndriçimit të pikselit. Mesatarja dhe varianca e zonës dhe shkëlqimi i pikselit kandidat përdoren për të ndërtuar statistika testimi. Nëse statistika e testit është mjaft e vogël, atëherë një piksel i shtohet rajonit dhe mesatarja dhe varianca e rajonit rillogariten. Përndryshe, piksel injorohet dhe përdoret për të krijuar një zonë të re.

5.5.7 Metodat e prerjes së grafikëve

Teknikat e prerjes së grafikut mund të zbatohen në mënyrë efektive për ndarjen e imazhit. Në këto metoda, imazhi përfaqësohet si një grafik i padrejtuar i peshuar. Zakonisht, një piksel ose grup pikselësh shoqërohet me një kulm, dhe peshat e skajeve përcaktojnë ngjashmërinë ose mosngjashmërinë e pikselëve fqinjë. Më pas, grafiku pritet sipas kritereve të krijuara për të marrë grupime "të mira". Çdo pjesë e kulmeve (pikselave) të marra nga këto algoritme konsiderohet objekt në imazh.

5.5.8 Segmentimi i pellgut ujëmbledhës

Në segmentimin e pellgut ujëmbledhës, imazhi trajtohet si një lloj harte e zonës, ku vlerat e shkëlqimit janë vlerat e lartësisë në lidhje me një nivel. Nëse kjo zonë është e mbushur me ujë, atëherë formohen pishina. Me mbushje të mëtejshme me ujë, këto pishina kombinohen. Vendet ku bashkohen këto pellgje janë shënuar si vija ujëmbledhëse.

Në këtë interpretim, merren parasysh tre lloje pikash:

1. Minimumi lokal;

2. pika të vendosura në një pjerrësi, d.m.th. nga e cila uji rrëshqet në të njëjtin minimum lokal;

3. pikët maksimale lokale, d.m.th. nga e cila uji rrotullohet në më shumë se një minimum.

Ndarja e objekteve në kontakt në një imazh është një nga detyrat e rëndësishme të përpunimit të imazhit. Shpesh, për zgjidhjen e këtij problemi përdoret e ashtuquajtura metodë e pellgut ujëmbledhës shënues. Kur transformoheni me këtë metodë, duhet të përcaktoni "pellgjet ujëmbledhëse" dhe "vijat e pellgut ujëmbledhës" në imazh duke përpunuar zonat lokale në varësi të karakteristikave të tyre të ndriçimit.

Metoda e pellgut ujëmbledhës të markerit është një nga metodat më efikase të segmentimit të imazhit.

Gjatë zbatimit të kësaj metode, kryhen procedurat e mëposhtme themelore:

1. Llogaritet funksioni i segmentimit. Bëhet fjalë për imazhet ku objektet janë vendosur në zona të errëta dhe janë të vështira për t'u parë.

2. Llogaritja e shënuesve në plan të parë të imazheve. Ato llogariten në bazë të analizës së lidhjes së pikselëve të çdo objekti.

3. Llogaritja e shënuesve të sfondit. Ato janë pikselë që nuk janë pjesë e objekteve.

4. Modifikimi i funksionit të segmentimit bazuar në vlerat e vendndodhjes së shënuesve të sfondit dhe shënuesve të planit të parë.

Një nga aplikimet më të rëndësishme të segmentimit sipas pellgjeve ujëmbledhëse është zgjedhja e objekteve që janë uniforme në shkëlqim (në formën e pikave) në sfondin e një imazhi. Zonat e karakterizuara nga ndryshime të vogla të ndriçimit kanë vlera të vogla gradienti. Prandaj, në praktikë, shpesh ndodh një situatë kur metoda e segmentimit të pellgut ujëmbledhës zbatohet jo për vetë imazhin, por për gradientin e tij.

6. Përshkrimi i funksioneve

Ky punim paraqet një algoritëm për segmentimin e imazhit duke përdorur metodën e pellgut ujëmbledhës shënues.

Funksionet kryesore të përdorura gjatë krijimit të një programi:

Funksioni fspecial krijon një filtër dydimensional të llojit të specifikuar;

Funksioni i imfilterit është një operacion morfologjik për krijimin e një imazhi gradient;

Funksioni i shndërrimit të pellgut ujëmbledhës nga imazhi;

Funksioni label2rgb konverton imazhin origjinal në shkallë gri;

Funksioni imregionalmax përcakton të gjitha maksimat lokale të një imazhi;

Funksioni imextendedmin gjen pika "të ulëta" në një imazh që janë më të thella se një nivel i caktuar pragu në krahasim me mjedisin e tyre të afërt;

Funksioni imimposemin modifikon imazhin në shkallë gri në mënyrë që minimumet lokale të arrihen vetëm në pozicionet e shënuara; vlerat e tjera të pikselit rriten për të zhdukur të gjitha pikat e tjera minimale lokale;

Funksionet i rindërtojnë dhe plotësojnë - rindërtimi i imazhit duke përdorur operacionet morfologjike të hapjes (mbylljes).

7. Testimi i algoritmit

Gjatë zbatimit të kësaj metode, u kryen procedurat e mëposhtme:

1. Lexojmë figurën dhe e kthejmë në gjysmëton (Figura 1);

Figura 1. Imazhe origjinale (majtas) dhe gri (djathtas).

2. Përdorni vlerat e gradientit si funksion segmentimi (Figura 2);

Figura 2. Vlerat e gradientit.

3. Kryejmë operacione morfologjike në imazh (Figura 3);

Figura 3. Rezultati i aplikimit të operacioneve morfologjike të hapjes - mbylljes përmes rindërtimit të imazhit.

4. Ne llogarisim shënuesit e planit të parë dhe të sfondit të imazhit (Figura 4);

Figura 4. Shenjat e imazhit në plan të parë (majtas) dhe sfond (djathtas).

5. Ndërtojmë kufijtë e pellgjeve ujëmbledhëse (Figura 5);

Figura 5. Kufijtë e pellgut ujëmbledhës.

6. Ne shfaqim shënuesit dhe kufijtë e objekteve në një imazh gjysmëton (Figura 6);

Figura 6. Shënjuesit dhe kufijtë e objekteve.

7. Shfaqja e rezultatit të segmentimit me një imazh me ngjyra (majtas) dhe duke përdorur modalitetin e tejdukshëm (djathtas).

Figura 7 Rezultatet e segmentimit.

konkluzioni

Në këtë punim, është zhvilluar një metodë e pellgut ujëmbledhës shënues për segmentimin e imazhit.

Zbatimi i drejtpërdrejtë i algoritmit të segmentimit të pellgut ujëmbledhës rezulton në mbisegmentim, kështu që një qasje e bazuar në idenë e shënuesve u përdor për të menaxhuar mbisegmentimin.

Një shënues është një komponent i lidhur që i përket një imazhi. Gjithashtu, para ndarjes sipas pellgjeve ujëmbledhëse është kryer parapërpunimi i nevojshëm i imazhit.

Lista e burimeve të përdorura

1. Gonzalez R., Woods R. Përpunimi dixhital i imazhit. - M.: Technosfera, 2005. 1072 f.

2. Pratt W. Përpunimi dixhital i imazhit. - M.: Mir, libri 1, 1982. 312s.

3. Yaroslavsky L.P. Hyrje në përpunimin dixhital të imazhit. - M: Bufat. radio, 1979. 312 f.

4. Pratt W. Përpunimi dixhital i imazhit. - M: Botë, libër. 1, 1982. 480.

5. http://www.ict.edu.ru/lib/

6. http://matlab.exponenta.ru/imageprocess/book2/76.php

7. Vizilter Yu.V. Përpunimi dhe analiza e imazheve dixhitale me shembuj në LabVIEW dhe IMAQ Vision. - M: DMK, 2011. 464 f.

8. Gonzalez R., Woods R., Eddins S. Përpunimi dixhital i imazhit në MATLAB. - M: Teknosferë, 2006. 616 f.

9. http://matlab.exponenta.ru/imageprocess/book2/48.php

10. Salomon D. Kompresimi i të dhënave, imazheve dhe zërit. - M.: Technosfera, 2004. 368 f.

Shtojca

Ne e konsiderojmë imazhin

rgb=imread("C:\Users\Name\Documents\MATLAB\picture1.jpeg");

Le ta paraqesim atë si një gjysmëton

I=rgb2gray(rgb);figura,imshow(I);

Llogaritni vlerën e gradientit

hy=fspecial("sobel"); hx=hy";

Iy=imfilter(dyfishtë(I), hy, "përsërit");

Ix=imfilter(double(I), hx, "replicate");

gradmag=sqrt(Ix.^2+Iy.^2);

Zbatoni metodën e pellgut ujëmbledhës

L=pellgu ujëmbledhës(gradmag);Lrgb=label2rgb(L);

Operacionet morfologjike

se = strel("disk",15);

Ie = imerode(I, se);Iobr = imreconstruct(dmth, I);

Iobrd = imdilate(Iobr, se);

Iobrcbr = rindërtoj(përfundoj(Iobrd), plotësoj(Iobr));

Iobrcbr = plotësoj(Iobrcbr);

Llogaritni maksimat lokale

fgm = imregionalmax(Iobrcbr);

Le të vendosim shënues në imazh

I2 = I;I2(fgm) = 255;

Heqja e pikselëve individualë të izoluar

se2 = strel(ones(3,3));fgm2 = imclose(fgm, se2);fgm3 = imerode(fgm2, se2);

Heqja e një numri të caktuar pikselësh

fgm4 = bwareaopen(fgm3, 20);

Mbivendosja në imazhin origjinal

I3 = I;I3(fgm4) = 255;

Llogaritni shënuesit e sfondit

bw = im2bw(Iobrcbr, graythresh(Iobrcbr));

Ne matim distancën në vijën e pellgut ujëmbledhës

D = bwdist(bw);DL = pellgu ujëmbledhës(D);bgm = DL == 0;

figura, imshow (bgm), titull ("bgm");

Rregullimi i vlerës së gradientit

gradmag2 = imimposemin(gradmag, bgm | fgm4);

L = pellgu ujëmbledhës(gradmag2);

Le të mbivendosim shënuesit dhe kufijtë e objekteve në imazhin origjinal

I4 = I;I4(përmirësohem(L == 0, ato (3, 3)) | bgm | fgm4) = 255;

Shfaqja e rezultatit me një imazh me ngjyra

Lrgb = label2rgb(L, "jet", "w", "përzierje");

Mbivendosja e shënuesve dhe kufijve të objekteve në një imazh gjysmë transparent

figura, tregoj(unë), mbaj

himage = imshow(Lgb);

set(image, "AlphaData", 0.3);

titulli ("Lgb2");

Organizuar në Allbest.ru

...

Dokumente të ngjashme

    Sistemet radiografike dixhitale. Metodat për analizën automatike të imazhit në mjedisin MatLab. Analiza e imazhit me rreze X. Filtrimi, segmentimi, përmirësimi i imazhit. Aftësitë e harduerit për para-normalizimin e imazheve.

    punim afatshkurtër, shtuar 12/07/2013

    Zgjedhja e metodave të përpunimit dhe segmentimit të imazheve. Bazat matematikore të filtrave të aplikuar. Histogrami i ndriçimit të imazhit. Zbatimi i softuerit të një metode komplekse të përpunimit të imazhit. Testimi i softuerit të zhvilluar.

    punim afatshkurtër, shtuar 18.01.2017

    Studimi dhe zbatimi i softuerit në mjedisin Matlab të metodave për përpunimin, analizimin, filtrimin, segmentimin dhe përmirësimin e cilësisë së imazheve mjekësore me rreze X. Sistemet radiografike dixhitale. Zhvillimi i algoritmeve të justifikuara statikisht.

    punim afatshkurtër, shtuar 20.01.2016

    Sistemet moderne të analizës së teksturës së imazheve. Shembuj të segmentimit të teksturës së imazheve me një kanal. Përdorimi i veçorive të marra nga histogrami i ndriçimit të rendit të dytë për klasifikimin e fotografive ajrore spektra-zonale.

    abstrakt, shtuar 15.01.2017

    Grafika kompjuterike dhe përpunimi i imazheve nga kompjuterët elektronikë janë aspekti më i rëndësishëm i përdorimit të kompjuterëve në të gjitha sferat e veprimtarisë njerëzore. Zhvillimi i një "nënsistem segmentimi linear", përshkrim i algoritmit dhe logjikës.

    tezë, shtuar 23.06.2008

    Problemet e përpunimit dixhital të imazhit. Metodat e segmentimit të pragut. Krijimi i një programi për paraqitjen e një fotografie në formën e një matrice dhe aplikimin e kufirit në të. Zhvillimi i një ndërfaqeje për një program për ngarkimin dhe filtrimin e një imazhi me një prag të zgjedhur.

    punim afatshkurtër, shtuar 11/12/2012

    Përshkrimi i metodave matematikore të paraqitjes dhe përpunimit të imazheve grafike. Përshkrimi i shtesës së softuerit të zhvilluar. Përshkrimi i funksioneve dhe atributet e tyre. Paraqitja dhe përpunimi i imazheve grafike. Rezultatet e testimit të programit.

    punim termi shtuar 27.01.2015

    Problemi i përpunimit të imazhit hapësirë-kohë në prani të zhurmës dhe ndërhyrjes. Metodat e optimizimit për përpunimin e imazhit në hapësirë-kohë. Struktura e një programi të specializuar, përshkrimi i ndërfaqes së tij të përdoruesit. Vlerësimi i kostos.

    tezë, shtuar 06/10/2013

    Zbulimi i detajeve dhe kufijve të tyre të imazhit. Zbatimi i algoritmeve të renditjes. Përdorimi i algoritmeve të kuantizimit të modalitetit adaptiv në mënyrën e përpunimit të fragmenteve. Filtrim i përgjithshëm linear i imazhit. Restaurimi i zonave të munguara.

    punim afatshkurtër, shtuar 17.06.2013

    Rishikimi i softuerit ekzistues për automatizimin e zgjedhjes së kufijve në imazh. Zhvillimi i një modeli matematikor për përpunimin e imazhit dhe konturimin në shkallë gri dhe softuerin për algoritmet e përpunimit të imazhit.

Redaktimi i imazheve dhe krijimi i kolazheve do të ishte një proces mjaft emocionues nëse nuk do të duhej të kalonit pjesën më të madhe të kohës duke shënuar me kujdes objektet. Detyra bëhet edhe më e vështirë kur kufijtë e objekteve janë të paqarta ose kur ka transparencë. Mjetet e Photoshop-it, të tilla si laso magnetike dhe shkopi magjik, nuk janë shumë të zgjuar, sepse ato shikojnë vetëm veçoritë e nivelit të ulët në një imazh. Ata kthejnë kufijtë e fortë (Hard), të cilët më pas duhet të korrigjohen manualisht. Qasja Semantic Soft Segmentation nga studiuesit e Adobe ndihmon në zgjidhjen e kësaj detyre të frikshme duke e ndarë imazhin në shtresa që korrespondojnë me zona kuptimplote semantike dhe duke shtuar tranzicion të qetë në skajet.

Segmentimi "i butë".

Një grup studiuesish nga laboratori CSAIL në MIT dhe universiteti zviceran ETH Zürich, duke punuar nën udhëheqjen e Yagiz Aksoy, propozuan t'i qasen këtij problemi bazuar në segmentimin spektral, duke i shtuar atij përparime moderne në të mësuarit e thellë. Me ndihmën e informacionit për teksturën dhe ngjyrën, si dhe veçoritë semantike të nivelit të lartë të nxjerra, nga imazhi ndërtohet një grafik i një lloji të veçantë. Më pas mbi këtë grafik ndërtohet matrica Kirchhoff (matrica Laplaciane). Duke përdorur zbërthimin spektral të kësaj matrice, algoritmi gjeneron konturet e buta të objekteve. Ndarja e imazhit në shtresa të marra duke përdorur eigenvectors mund të përdoret më pas për redaktim.

Pasqyrë e qasjes së propozuar

Përshkrimi i modelit

Konsideroni metodën e krijimit të shtresave kuptimplote hap pas hapi:

1. Maska spektrale. Qasja e propozuar vazhdon punën e Levin dhe kolegëve të tij, të cilët fillimisht përdorën matricën Kirchhoff në problemin e ndërtimit të maskave automatike. Ata ndërtuan një matricë L, e cila specifikon ngjashmërinë në çift midis pikselëve në një zonë lokale. Duke përdorur këtë matricë, ata minimizojnë aᵀLα funksional kuadratik me kufizime të specifikuara nga përdoruesi, ku α specifikon një vektor të vlerave të transparencës për të gjithë pikselët në shtresën e dhënë. Çdo kontur i butë është një kombinim linear i vektorëve vetjakë K që korrespondojnë me vlerat më të vogla eigen L, gjë që maksimizon të ashtuquajturën rrallësi të maskës.

2. afërsia e ngjyrave. Për të llogaritur veçoritë jo-lokale të afërsisë së ngjyrave, studiuesit gjenerojnë 2500 superpikselë dhe vlerësojnë afërsinë midis secilit superpiksel dhe të gjithë superpikselëve brenda një lagjeje me rreze 20% të madhësisë së imazhit. Përdorimi i afërsisë jo lokale siguron që zonat me ngjyra shumë të ngjashme të mbeten të lidhura në skena komplekse si kjo më poshtë.

Afinitet jo-lokal i ngjyrave

3. afërsia semantike. Kjo fazë ju lejon të zgjidhni zonat e lidhura semantikisht të imazhit. Afërsia semantike inkurajon kombinimin e pikselëve që i përkasin të njëjtit objekt skene dhe penalizon kombinimin e pikselëve nga objekte të ndryshme. Këtu, studiuesit përdorin përparimet e mëparshme në njohjen e modelit dhe llogaritin, për çdo piksel, një vektor tipari që lidhet me objektin që i përket pikselit. Vektorët e veçorive llogariten duke përdorur një rrjet nervor, të cilin do ta diskutojmë më në detaje më poshtë. Afërsia semantike, si afërsia e ngjyrave, përcaktohet në superpikselë. Megjithatë, ndryshe nga afiniteti i ngjyrave, afiniteti semantik lidh vetëm superpikselët e afërt, duke inkurajuar krijimin e objekteve të lidhura. Kombinimi i afërsisë së ngjyrave jo-lokale dhe afërsisë semantike lokale ju lejon të krijoni shtresa që mbulojnë imazhe të shkëputura nga hapësira të një fragmenti të një objekti të vetëm të lidhur semantikisht (për shembull, bimësia, qielli, lloje të tjera sfondi).

Afërsia semantike

4. Krijimi i shtresave. Në këtë hap, matrica L ndërtohet duke përdorur afërsinë e llogaritur më parë. Nga kjo matricë nxirren eigenvektorët që u korrespondojnë 100 vlerave vetjake më të vogla dhe më pas aplikohet algoritmi i rrallë, i cili nxjerr prej tyre 40 vektorë, nga të cilët ndërtohen shtresa. Më pas, numri i shtresave zvogëlohet përsëri duke përdorur algoritmin e grupimit k-means në k = 5. Kjo funksionon më mirë sesa thjesht të holloni 100 eigenvektorët në pesë, sepse një reduktim kaq i madh në dimension e bën problemin të mbipërcaktuar. Studiuesit zgjodhën gjithsej 5 skica dhe pretendojnë se ky është një numër i arsyeshëm për shumicën e imazheve. Megjithatë, ky numër mund të ndryshohet manualisht në varësi të imazhit që përpunohet.


Konturet e buta para dhe pas grupimit

5. Vektorët e veçorive semantike. Për të llogaritur afërsinë semantike, ne përdorëm vektorët e veçorive të llogaritura duke përdorur një rrjet nervor. Baza e rrjetit nervor ishte DeepLab-ResNet-101, i trajnuar për detyrën e parashikimit të metrikës. Gjatë stërvitjes, u inkurajua maksimizimi i distancës L2 midis veçorive të objekteve të ndryshme. Kështu, rrjeti nervor minimizon distancën midis veçorive që korrespondojnë me një klasë dhe maksimizon distancën në një rast tjetër.

Krahasimi cilësor me metoda të ngjashme

Imazhet më poshtë tregojnë rezultatet e qasjes së propozuar (etiketuar "Rezultati ynë") në krahasim me rezultatet e metodës më të afërt të segmentimit të butë - metoda e maskimit spektral -  dhe dy metodave më të fundit të segmentimit semantik: përpunimi i skenës PSPNet metodën dhe metodën e segmentimit të objekteve Mask R-CNN.


Krahasimet cilësore të segmentimit të butë semantik me qasje të tjera

Mund të zëvendësohet se PSPNet dhe Mask R-CNN tentojnë të bëjnë gabime në kufijtë e objekteve, dhe konturet e buta të ndërtuara me metodën spektrale shpesh shkojnë përtej kufijve të objekteve. Në të njëjtën kohë, metoda e përshkruar mbulon plotësisht objektin pa e bashkuar atë me të tjerët dhe arrin saktësi të lartë në skajet, duke shtuar tranzicione të buta aty ku është e nevojshme. Megjithatë, vlen të theksohet se tiparet semantike të përdorura në këtë metodë nuk bëjnë dallimin midis dy objekteve të ndryshme që i përkasin të njëjtës klasë. Si rezultat, objekte të shumta janë paraqitur në të njëjtën shtresë, siç mund të shihet në imazhet e gjirafave dhe lopëve.

Redaktimi i imazhit me skica të buta semantike

Më poshtë janë disa shembuj se si skicat e buta mund të aplikohen për redaktimin e imazhit dhe krijimin e kolazhit. Skicat e buta mund të përdoren për të aplikuar ndryshime specifike në shtresa të ndryshme: shtimi i një turbullimi që përfaqëson lëvizjen e një treni (2), korrigjimi i veçantë i ngjyrave për njerëzit dhe për sfondin (5, 6), stilim i veçantë për balonën, qiellin, peizazhin dhe personi (8) . Natyrisht, e njëjta gjë mund të bëhet me maskat e punuara me dorë ose me algoritmet klasike të përzgjedhjes së kontureve, por me përzgjedhjen automatike të objekteve kuptimplotë semantikisht, një redaktim i tillë bëhet shumë më i lehtë.

Përdorimi i Segmentimit të butë semantik për modifikimin e imazhit

konkluzioni

Kjo metodë krijon automatikisht konturet e buta që korrespondojnë me zona kuptimplote semantike të një imazhi duke përdorur një përzierje të informacionit të rrjetit nervor të nivelit të lartë dhe veçorive të nivelit të ulët. Megjithatë, kjo metodë ka disa kufizime. Së pari, është relativisht i ngadaltë: koha e përpunimit për një imazh me dimensione 640 x 480 është 3-4 minuta. Së dyti, kjo metodë nuk krijon shtresa të veçanta për objekte të ndryshme të së njëjtës klasë. Dhe së treti, siç tregohet më poshtë, kjo metodë mund të dështojë herët në përpunim kur ngjyrat e objekteve janë shumë të ngjashme (shembulli i sipërm), ose kur bashkohen skajet e buta pranë zonave të mëdha të tranzicionit (shembulli i poshtëm).

Rastet e gabimeve të algoritmit

Megjithatë, skicat e buta të krijuara duke përdorur këtë metodë ofrojnë një paraqitje të përshtatshme të ndërmjetme të imazhit, duke ju lejuar të shpenzoni më pak kohë dhe përpjekje gjatë redaktimit të imazheve.

Artikujt kryesorë të lidhur