Kako podesiti pametne telefone i računare. Informativni portal
  • Dom
  • Windows 10
  • Da li je moguće uređivati ​​skenirani dokument. Program za uređivanje skeniranih dokumenata: koji je bolji

Da li je moguće uređivati ​​skenirani dokument. Program za uređivanje skeniranih dokumenata: koji je bolji

OCR softver vam omogućava da konvertujete fotografisane ili skenirane dokumente direktno u rečenice.

Činjenica je da je tekst na slici predstavljen kao raster, skup tačaka. Pomenuti softver konvertuje skup tačaka u potpuni tekst, dostupan za uređivanje i čuvanje.

Prepoznavanje slova je dizajnirano da optimizira proces digitalizacije papirnih štampanih ili rukom pisanih knjiga i dokumenata.

Ova metoda digitalizacije je za redove veličine brža od brzine ručnog kucanja sa slike. Široko se koristi u digitalizaciji biblioteka i arhiva. Zatim razmotrite pet najboljih predstavnika porodice sličnih programa.

ABBYY Fine Reader 10

FineReader je neprikosnoveni lider među svim programima koji prepoznaju tekst na slici. Konkretno, ne postoji softver koji jasnije obrađuje ćirilicu. Generalno, FineReader ima 179 jezika, čiji se tekst izuzetno uspješno prepoznaje.

Jedina okolnost koja može razočarati korisnike je da je program plaćen. Samo probna verzija je besplatna 15 dana. Tokom ovog perioda dozvoljeno je skeniranje 50 stranica.

Tada ćete morati platiti korištenje programa. FineReader lako "pojede" svaku više ili manje kvalitetnu sliku. Izvor je potpuno nebitan. Bilo da se radi o fotografiji, skeniranju stranice ili bilo kojoj slici sa slovima.

Prednosti:

  • tačno prepoznavanje;
  • veliki broj jezika za čitanje;
  • tolerancija na kvalitetu izvorne slike.

mana:

  • probna verzija 15 dana.

OCR CuneiForm

Besplatan program za čitanje tekstualnih informacija sa slika. Preciznost prepoznavanja je za red veličine niža od one prethodnog programa koji se razmatra. Ali što se tiče besplatnog uslužnog programa, funkcionalnost je i dalje na vrhu.

Zanimljivo! CuneiForm prepoznaje blokove teksta, grafike, pa čak i razne tabele. Štaviše, čak i tabele bez linija mogu se čitati.

Da bi se osigurala tačnost, u proces prepoznavanja su povezani posebni rječnici koji popunjavaju vokabular iz skeniranih dokumenata.

Prednosti:

  • besplatna distribucija;
  • korištenje rječnika za provjeru ispravnosti teksta;
  • skeniranje teksta sa fotokopija lošeg kvaliteta.

Nedostaci:

  • relativno niska preciznost;
  • mali broj podržanih jezika.

WinScan2PDF

Ovo čak nije ni punopravni program, već uslužni program. Instalacija nije potrebna, a izvršni fajl teži samo nekoliko kilobajta. Proces prepoznavanja je izuzetno brz, međutim, rezultirajući dokumenti se pohranjuju isključivo u PDF formatu.

Zapravo, cijeli proces se izvodi pritiskom na tri gumba: odabirom izvora, odredišta i, zapravo, pokretanjem programa.

Uslužni program je dizajniran za brzu grupnu obradu više datoteka. Za praktičnost korisnika, obezbeđen je veliki jezički paket interfejsa.

Prednosti:

  • prenosivost;
  • brz rad;
  • jednostavnost upotrebe.

Nedostaci:

  • minimalna veličina;
  • jedini format izlazne datoteke.

simpleocr

Odličan mali program za OCR sa slika. Podržava čak i čitanje rukopisa. Nevolja je u tome što ruski nije uključen ni u jezički paket interfejsa niti u listu jezika koji su podržani za prepoznavanje.

Međutim, ako trebate skenirati engleski, danski ili francuski, onda nema bolje besplatne opcije.

U svom polju, program omogućava precizno dekodiranje fonta, uklanjanje šuma i ekstrakciju grafičkih slika. Osim toga, u programski interfejs je ugrađen uređivač teksta, gotovo identičan WordPadu, što uvelike povećava upotrebljivost programa.

Prednosti:

  • precizno prepoznavanje teksta;
  • pogodan uređivač teksta;
  • uklanjanje šuma sa slike.

Nedostaci:

  • potpuno odsustvo ruskog jezika.

Freemore OCR

Program vam omogućava brzo izdvajanje teksta i grafike iz slika. Softver podržava više skenera bez gubitka performansi. Izdvojeni tekst se može sačuvati kao tekstualni dokument ili MS Office dokument.

Dodatno, omogućena je funkcija prepoznavanja više stranica.

Freemore OCR se distribuira besplatno, međutim, sučelje je samo na engleskom jeziku. Ali ova okolnost ni na koji način ne utiče na upotrebljivost, jer su kontrole organizovane na intuitivan način.

Prednosti:

  • besplatna distribucija;
  • mogućnost rada sa više skenera;
  • pristojna tačnost prepoznavanja.

nedostatke

  • Nedostatak ruskog jezika u interfejsu;
  • Potreba za preuzimanjem ruskog jezičkog paketa za prepoznavanje.

Scan Corrector A4 je program za praktično, jednostavno i brzo skeniranje dokumenata i slika, njihovu korekciju radi poboljšanja vizualne percepcije (kontrast, svjetlina, boja), ispis i spremanje. Dizajniran za širok spektar korisnika, ne zahtijeva posebna znanja - samo vještine u radu sa uobičajenim programima opće namjene.

Mnogi korisnici, posebno oni koji moraju često da prave elektronske kopije dokumenata u uobičajenom formatu običnog pejzažnog lista (A4), upoznati su sa situacijom kada je kvalitet originala, a još više dobijene kopije, nizak i njen sadržaj je teško prepoznati, tj dokument zahtijeva ispravku (obrada nakon skeniranja). Upotreba specijalizovanih grafičkih uređivača (npr. Adobe Photoshop) može biti nedostupna, ili neopravdana zbog vremena i snage računarske opreme, ili jednostavno nemoguće za korisnika u smislu poznavanja softvera u ovom trenutku. Izlaz iz ove situacije je korištenje programa ScanCorrect A4.

Prednost programa je mala zapremina njegovog kompletnog paketa (samo oko 1Mb) i nema potrebe za instaliranjem u sistem, što vam omogućava da ga uvek imate sa sobom na fleš disku ili drugom prenosivom mediju i da ga brzo koristite. To vrijedi, na primjer, za advokate, dizajnere, građevinare itd.

Program pruža:

1. Korak po korak skeniranje A4 dokumenata

2. Pogodno, jednostavno i brzo podešavanje skeniranih slika (ili prethodno spremljenih grafičkih datoteka) za poboljšanje vizualne percepcije i ispisa

3. Štampanje i čuvanje skeniranih slika (ili prethodno sačuvanih grafičkih datoteka)

Program ima sljedeće dodatne mogućnosti:

1. Odabir skenera (grafički ulazni uređaj)

2. Mogućnost uzastopnog snimanja više slika

3. Izbor načina boje (prirodne boje ili sivi tonovi)

4. Podešavanja slike (nekoliko tipičnih fiksnih postavki i ručno podešavanje kontrasta i svjetline)

5. Mogućnost memorisanja do 10 uzastopno unesenih slika direktno u samom programu bez potrebe da ih pohranjujete i birate željenu sliku

6. Podešavanje štampanja pozivanjem standardnog sistemskog interfejsa

PAŽNJA! Karakteristika programa je potreba za postavljanjem granice područja skeniranja prilikom pozivanja interfejsa skenera na punu veličinu A4 formata! U suprotnom, proporcije slike će biti izobličene!

Program je dizajniran za rad pod Windows 9x/NT/XP operativnim sistemima.

Uputstvo

Instalirajte OCR aplikaciju. Takvi programi mogu biti u paketu sa skenerom ili distribuirani zasebno. Međutim, oni imaju isti princip rada. Pokrenite OCR aplikaciju, stavite željeni dokument u tekst skenera prema dolje i skenirajte. Kliknite na dugme "Prepoznaj", sačekajte dok program ne konvertuje grafiku u tekst, izvezite datoteku u tekstualni format, sačuvajte dokument. Zatim ga otvorite u uređivaču teksta i izvršite potrebne promjene.

Ako nemate aplikaciju koja vam je potrebna, koristite drugu metodu. Kreativniji je od prvog. Skenirajte dokument koristeći postavke za oštru sliku bez tamnih ili preeksponiranih područja. Što je kvalitet vaše slike veći, manje ćete morati da čistite sliku. Sačuvajte skenirani dokument.

Otvorite sliku u bilo kojem grafičkom uređivaču. Bolje je koristiti uređivač koji podržava rad sa slojevima. Ako pogriješite prilikom uređivanja, bit će lakše na zasebnom sloju nego u cijelom dokumentu. Izgladite pozadinu gumicom ili četkom. Podesite svjetlinu i kontrast slike ako je potrebno.

Izbrišite ili obojite dio dokumenta na koji će se postaviti novi tekst i kreirajte novi sloj. Odaberite alat "Text" (označen u grafičkim uređivačima slovom "T"), unesite tekst na novokreirani sloj. Ako radite u Adobe Photoshopu, ne morate kreirati dodatni sloj. Odaberite odgovarajući stil i veličinu fonta. Koristeći alat za premještanje, uparite stari tekst s novim, pazeći da su linije i margine ujednačene i da je razmak između redova isti. Spojite slojeve, sačuvajte ili odštampajte dokument.

Izvori:

  • kako skenirati dokument

Bilješka

Koristite usluge za prepoznavanje teksta na mreži ako trebate prepoznati mali broj stranica. Ako se stalno bavite skeniranjem i OCR-om - nabavite moćan plaćeni program.

Često se dešava da trebate urediti tekst koji se nalazi samo u papirnoj verziji. Za prepoznavanje, a trenutno postoji mnogo programa koji se razlikuju ne samo po kvaliteti rezultata, već i po naprednoj funkcionalnosti. Fine Reader je jedna od najboljih aplikacija za ovu svrhu.

Trebaće ti

  • - uređivač teksta;
  • - Fine Reader program.

Uputstvo

Preuzmite i instalirajte program za prepoznavanje kao što je Fine Reader. Upoznajte se s funkcionalnošću programa - mnoge moderne verzije podržavaju integraciju skeniranog teksta direktno u Word, ako je takva funkcija dostupna u vašoj kopiji programa, izvršite operaciju preskakanjem sljedećih koraka.

Ako imate starije verzije programa, skenirajte dokument koji želite da uredite standardnim programom vašeg fotokopir aparata koji inače koristite i sačuvajte ga u .jpg formatu na e.

Kliknite jednom desnom tipkom miša na sačuvanu sliku, odaberite "Otvori sa..." i na listi programa koja se pojavi odaberite Fine Reader koji ste nedavno instalirali. Ako je potrebno, označite polje za potvrdu Koristi za sve podatke za datoteke ove vrste. Možete i jednostavno skenirati sliku koristeći već otvoren program odabirom stavke „Skeniraj i čitaj“, dok se slika sa uređaja uvozi direktno u radni prostor. Da biste to učinili, prvo odredite parametre skenera u programskom modu Fine Reader u postavkama.

U prozoru programa koji se otvori odaberite stavku "Prepoznaj tekst". Pričekajte dok program pročita dokument. Ako rezultati operacije ne odgovaraju vašim zahtjevima, promijenite postavke skeniranja i prepoznavanja i ponovite postupak ponovo.

Sačuvajte dobijeni dokument u bilo kom formatu koji podržava Microsoft Office Word. Zatvorite Fine Reader, idite u fasciklu u kojoj je sačuvan vaš dokument.

Zgodno je i bezbedno čuvati skenirane dokumente na čvrstom disku računara ili spoljnom mediju. Međutim, kako napraviti promjene na stranicama koje se obično prikazuju kao slike? Trebat će nam posebni programi o čijoj instalaciji i upravljanju ćemo govoriti u nastavku.

Kako skenirati dokument prije uređivanja?

Kako biste u budućnosti uspješno manipulirali datotekom, važno je pravilno je pretvoriti u format "slika", kao i uzeti u obzir nekoliko jednostavnih, ali korisnih nijansi u samom procesu. Za ovo:

  • Izgladite sve nabore i nabore tako da se ne pojavljuju na skeniranju i ne dovode do poteškoća u prepoznavanju slova.
  • Radi lakšeg snalaženja, sačuvajte datoteku kao PDF, JPG ili TIFF.
  • PDF dokument može otvoriti i uređivati ​​Adobe Acrobat (ili bilo koji drugi program dizajniran za slične svrhe).
  • Idite na web stranicu kompanije skenera ili potražite vlasnički program na isporučenom disku (često poznati brendovi imaju svoje aplikacije za modifikaciju skeniranih stranica).
  • Da biste kasnije koristili datoteku u MS Office 2003 ili 2007, instalirajte uslužni program Microsoft Office za skeniranje dokumenata. Automatski konvertuje skeniranu datoteku, prevodeći je direktno u tekst (program ne radi sa novijim verzijama sistema Office).
  • Preporučuje se skeniranje crno-bijelo umjesto u boji kako bi se olakšala analiza teksta.
  • TIFF format se najbolje koristi za OCR pretvarače, odnosno programe koji proizvode optičko prepoznavanje.

Kako urediti skenirani dokument - rad sa OCR uslužnim programima

Princip metode optičkog prepoznavanja karaktera je čitanje znakova dostupnih na papiru, njihovo naknadno poređenje sa elementima iz sopstvene baze podataka. Tako se čvrsta slika pretvara u tekst koji se može uređivati. Živopisni primjeri programa koji se nose s ovim zadatkom su Adobe Acrobat i Evernote. Da biste izvršili ispravke postojećeg skeniranja, jednostavno ga otvorite jednom od ovih aplikacija, cijeli naredni proces će se dogoditi automatski. Kada program završi prepoznavanje, od korisnika će zatražiti da snimi dokument u jednom od dostupnih formata.


Kako urediti skenirani PDF dokument

Ako je skenirani dokument sačuvan kao PDF fajl, možemo ga lako urediti u Acrobat DC. Za ovo:

  • otvorite meni “Alati” -> “Uredi PDF”;
  • program započinje proces uređivanja, prikazujući meni sa savjetima u gornjem desnom uglu;
  • klikom na njega i odabirom “Opcije” možete odrediti jezik prepoznavanja;
  • da izvršite izmene, samo kliknite na bilo koji red dokumenta;
  • dokument otvoren za uređivanje putem OCR-a prati posebna ploča za podešavanja koja se nalazi na desnoj strani ekrana;
  • u odjeljku "Postavke", osim jezika, zgodno je odabrati i prikazani font, označiti stranice koje je potrebno urediti (sve ili jednu po jednu).


Postoji pristupačna alternativa instaliranim programima pretvarača na svjetskoj mreži. Ovo su onlajn OCR-ovi koji će lako konvertovati rezultirajuću sliku u bilo koji tekstualni format. Na primjer, stranica pdfonline.com će vam omogućiti da skenirani PDF dokument pretvorite u običnu MS Word datoteku za nekoliko minuta.

Pozdrav svim čitaocima blog stranice! Prije šest mjeseci govorio sam o programima za uređivanje PDF dokumenata, a danas ćemo o programima za uređivanje skeniranih dokumenata. Ljudi koji puno rade sa štampanim materijalima često se susreću sa situacijama kada treba da prenesu tekst ili sliku sa štampanog medija na digitalni medij – iz knjige u računar. Ako imate skener, ovaj problem se može vrlo jednostavno riješiti, ali osim skeniranja potrebno je i prepoznati tekst ili promijeniti sliku. Program za uređivanje skeniranih dokumenata pomoći će vam da izvršite ovaj zadatak - o takvim programima ću govoriti u ovom članku.

Zbog specifičnosti svog rada, skener prenosi tekst iz knjige, časopisa, novina na kompjuter u obliku slike - moglo bi se reći, "fotografira". Shodno tome, izmjena takvog teksta odmah nakon skeniranja nije moguća - uređivač teksta neće moći prepoznati znakove (ovaj problem sam razmatrao u članku Besplatni programi za skeniranje dokumenata). Riješite problem kako urediti tekst nakon skeniranja , posebne OCR aplikacije će moći. Najfunkcionalniji i najrašireniji uslužni program za ovaj zadatak je ABBYY FineReader, ali ima značajan nedostatak - prilično visoku cijenu. Razmotrit ćemo besplatni analog.

OCR CuneiForm

OCR CuneiForm je program za uređivanje skeniranih dokumenata koji prepoznaje znakove i uvozi tekst u uređivače teksta. Ovaj uslužni program može raditi sa svim fontovima za štampanje i kucanje, ali ne radi baš najbolje sa rukom pisanim tekstovima. CuneiForm OCR program će biti najuspješnija opcija za prevodioce i lingviste - podržava prepoznavanje sa više od 20 jezika, uključujući ruski, engleski, poljski, ukrajinski i druge.
Da biste prepoznali tekst pomoću OCR CuneiForm-a, trebate pokrenuti program, otvoriti skeniranu tekstualnu datoteku i odabrati operaciju prepoznavanja. Nakon toga, korisnik može sačuvati rezultat u željenom formatu, urediti ga prema svojim potrebama.
Zanimljiva karakteristika uslužnog programa je tehnologija samoučenja zasnovana na adaptivnom prepoznavanju karaktera. Prema rezultatima testiranja, CuneiForm OCR program za uređivanje skeniranih dokumenata više puta je prepoznat kao najbolji među konkurentima. Najvažnija prednost ovog programa je mogućnost prepoznavanja teksta sa gotovo svake slike!

simpleocr

SimpleOCR je funkcionalni uslužni program pomoću kojeg možete prepoznati i uređivati ​​skenirani tekst. Korisnik može promijeniti prepoznati tekst direktno u prozoru programa ili ga izvesti u format bilo kojeg popularnog uređivača teksta.
Rječnik aplikacije SimpleOCR sadrži ogroman broj riječi, dok se može ručno dopuniti novim riječima pomoću ugrađenog uređivača teksta. Ako želite, možete prepoznati ne cijeli tekst, već odabrano područje, također je moguće sačuvati formatiranje izvorne datoteke - ostaviti font, odabir znakova, slike i tako dalje. Još jedna korisna karakteristika programa za uređivanje skeniranih dokumenata SimpleOCR je mogućnost grupnog prepoznavanja - korisnik može učitati nekoliko datoteka odjednom kako bi radili.

Korištenje uslužnog programa je prilično jednostavno - trebate ga pokrenuti i učitati datoteku koja sadrži tekst. Ova datoteka će biti prikazana u gornjem dijelu prozora, a program će prikazati rezultat prepoznavanja u donjem dijelu. Ovdje također možete urediti tekst po želji, odštampati ga ili izvesti u drugi format.
Kada prvi put koristite ovaj program, mogu se pojaviti poteškoće, jer njegovo sučelje ima određene karakteristike.

Gore navedene aplikacije se koriste za rad s tekstom, ali ponekad korisnici moraju uređivati ​​ne tekst, već sliku. U ovom slučaju, grafički uređivači, na primjer, Paint.NET, doći će u pomoć. Ovaj program za uređivanje skeniranih dokumenata na ruskom pružit će veliki izbor alata za rad sa slikama - izrezivanje, rotiranje, zrcaljenje, primjena raznih efekata, izobličenje, kreiranje uzoraka i tako dalje. Paint.NET podržava dodatke, pa čak i ako korisnik ne pronađe željenu opciju, alat ili efekt u osnovnoj verziji programa, uvijek ga može pronaći i preuzeti na Internetu.
Uslužni program prepoznaje većinu formata slika, pa je dovoljno pri skeniranju sačuvati dokument sa ekstenzijom .bmp, .jpg, .tiff kako bi se ispravno otvorio u Paint.NET-u.

Prepoznavanje teksta ili promjena slike prilikom prijenosa iz štampanog u digitalni format neće predstavljati ozbiljan problem ako korisnik ima program za uređivanje skeniranih dokumenata. Veliki izbor besplatnih aplikacija omogućava rad sa dokumentima bez ikakvih materijalnih troškova.

Top Related Articles