Optičko prepoznavanje znakova (OCR) odnosi se na softver koji stvara digitalnu verziju ispisanog, tipkanog ili rukom pisanog dokumenta koji računala mogu čitati bez potrebe za ručnim tipkanjem ili unosom teksta. OCR se općenito koristi na skeniranim dokumentima u PDF formatu, ali također može stvoriti računalno čitljivu verziju teksta unutar slikovne datoteke.
Što je OCR
OCR, koji se naziva i prepoznavanje teksta, softverska je tehnologija koja transformira znakove poput brojeva, slova i interpunkcijskih znakova (koji se nazivaju i glifovi) iz tiskanih ili pisanih dokumenata u elektronički oblik koji lakše prepoznaju i čitaju računala i drugi softverski programi. Neki OCR programi to čine dok se dokument skenira ili fotografira digitalnom kamerom, a drugi mogu primijeniti ovaj postupak na dokumente koji su prethodno skenirani ili fotografirani bez OCR-a. OCR omogućuje korisnicima pretraživanje unutar PDF dokumenata, uređivanje teksta i ponovno formatiranje dokumenata.
Getty Images
Za što se koristi OCR?
Za brze, svakodnevne potrebe skeniranja, OCR možda neće biti velika stvar. Ako radite veliku količinu skeniranja, mogućnost pretraživanja unutar PDF-ova kako biste pronašli točno onaj koji vam je potreban može uštedjeti dosta vremena i učiniti OCR funkciju u vašem programu za skener važnijom. Evo nekih drugih stvari kod kojih OCR pomaže:
- Automatska obrada podataka i unos podataka (Primjer: Sustavi za praćenje kandidata za posao za životopise).
- Omogućivanje pretraživanja skeniranih knjiga.
- Pretvaranje rukom pisanih skenova u računalno čitljiv tekst.
- Učiniti dokumente upotrebljivijim programima za čitanje koji pomažu korisnicima oštećena vida.
- Očuvanje povijesnih dokumenata i novina, dok ih također čini pretraživima.
- Izdvajanje podataka i prijenos u računovodstvene programe (Primjer: Potvrde i fakture).
- Indeksiranje dokumenata za korištenje u tražilicama.
- Prepoznavanje vozačkih registarskih pločica softverom za radnu brzinu i kameru za crveno svjetlo.
- Sintetizatori govora za ljude koji ne mogu govoriti – teorijski fizičar, Stephen Hawking, možda je najpoznatiji korisnik programa za sintetiziranje govora.
Donja crta
Zašto ne biste jednostavno slikali, zar ne? Jer ne biste mogli ništa uređivati niti pretraživati tekst jer bi to bila samo slika. Skeniranje dokumenta i pokretanje OCR softvera može tu datoteku pretvoriti u nešto što možete uređivati i pretraživati.
Povijest OCR-a
Iako najranije korištenje prepoznavanja teksta datira iz 1914. godine, raširen razvoj i upotreba tehnologija povezanih s OCR-om ozbiljno su započeli 1950-ih, posebno stvaranjem vrlo pojednostavljenih fontova koje je bilo lakše pretvoriti u digitalne- čitljiv tekst. Prvi od ovih pojednostavljenih fontova stvorio je David Shepard i poznat je kao OCR-7B. OCR-7B se i danas koristi u financijskoj industriji za standardni font koji se koristi na kreditnim i debitnim karticama. U 1960-ima, poštanske službe u nekoliko zemalja počele su koristiti OCR tehnologiju kako bi uvelike ubrzale sortiranje pošte, uključujući Sjedinjene Države, Veliku Britaniju, Kanadu i Njemačku. OCR je još uvijek temeljna tehnologija koja se koristi za sortiranje pošte za poštanske usluge diljem svijeta. Godine 2000. ključno znanje o ograničenjima i mogućnostima OCR tehnologije korišteno je za razvoj CAPTCHA programa koji se koriste za zaustavljanje robota i spamera.
Tijekom desetljeća, OCR je postao točniji i sofisticiraniji zbog napretka u srodnim tehnološkim područjima kao što su umjetna inteligencija, strojno učenje i računalni vid. Danas OCR softver koristi prepoznavanje uzoraka, otkrivanje značajki i rudarenje teksta za transformaciju dokumenata brže i točnije nego ikad prije.
FAQ
Kako mogu skenirati dokumente telefonom ili tabletom?
Na iOS-u otvorite aplikaciju Notes i stvorite novu bilješku. Otvorite kameru, a zatim dodirnite Skeniraj dokumente. Na Androidu otvorite Google Drive i odaberite Plus (+), zatim dodirnite Skeniraj za skeniranje dokument sa svojim telefonom.
Kako mogu koristiti OCR u Adobe Acrobatu?
Otvorite PDF datoteku koja sadrži skeniranu sliku, zatim odaberite Alati > Uredi PDF. Acrobat će automatski primijeniti OCR tako da možete uređivati tekst. Samo odaberite gdje želite unijeti izmjene i počnite tipkati.
Koja je razlika između OCR i OMR?
Optical Mark Recognition (OMR) je softver koji detektira oznake na papiru, obično na papiru s mjehurićima. OMR se koristi za obradu rezultata ispita, anketa, upitnika, pa čak i izbora. Za razliku od OCR-a, OMR ne može dešifrirati oznake na stranici, već samo potvrđuje da oznake postoje.