Technologia OCR – rozpoznawanie tekstu

Technologia OCR – rozpoznawanie tekstu

Zacznijmy od tego co na ten temat podaje  Wikipedia  – technologia OCR czyli Optyczne rozpoznawanie znaków,(od ang.optical character recognition) – zestaw technik lub oprogramowanie służące do rozpoznawania znaków i całych tekstów w pliku graficznym o postaci rastrowej. Zadaniem OCR jest zwykle rozpoznanie tekstu w zeskanowanym dokumencie.

Jak to działa?

Pliki graficzne, zdjęcia, czy zapisane na dysku twardym skany – to obrazki. Komputery nie są w stanie powiedzieć co się znajduje w tym pliku. Jeśli sfotografujemy jakiś tekst, to nie będziemy mogli go zaznaczyć, skopiować ani poprawić wybranych słów. Oprogramowanie OCR przetwarza taki dokument w tekst czytelny dla komputera – możliwy do skopiowania, formatowania czy poprawy. W skrócie: OCR potrafi zmienić zdjęcie tekstu na plik który otworzymy w programie takim jak Word lub Notatnik z możliwością edycji. Świetnie obrazuje to film dostawcy jednego z najpopularniejszych systemów – Abbyy:

Dla kogo oprogramowanie z technologią OCR?

Do niedawna systemy do rozpoznawania tekstu były dedykowane większym przedsiębiorstwom, głównie ze względu na wysoką cenę. 
W ostatnim czasie oprogramowanie OCR coraz częściej jest też wykorzystywane w mniejszych i średnich firmach. Świetnie sprawdza się tam, gdzie pracownik przepisuje ręcznie pisane pisma, lub już wydrukowane dokumenty. Grupą użytkowników będą więc głównie księgowi, notariusze, archiwiści, pracownicy urzędów czy ludzie odpowiedzialni za cyfryzację dokumentów.

Warto tutaj wspomnieć, że oprogramowanie OCR jest też wykorzystywane jako „półśrodek” w większych systemach IT. Istnieją zaawansowane systemy ERP czy inne oprogramowanie do cyfrowego obiegu dokumentów, które ułatwiają pracę w większych przedsiębiorstwach. Tego typu systemy skanują i księgują faktury, rozdzielają dokumenty do odpowiednich działów itp. 

Kiedy to się opłaca?

Nie przedstawię tutaj szczegółowych wyliczeń, wystarczy prosty przykład:

Przepisanie jednej strony A4 na klawiaturze komputera może zająć ok 30 minut, program zrobi to w kilka sekund. Zatem w przypadku systemu SmartScan – inwestycja zwraca się jeśli w ciągu miesiąca przepisujemy 3-5 stron A4! 

Darmowy OCR 

Ok, opisujemy zasadę działania i opłacalność, ale skoro są darmowe programy, które rozpoznają tekst to dlaczego za to płacić? Czy za darmo dostępna jest taka sama technologia OCR?

Darmowy OCR często dodawany jest gratis do urządzeń wielofunkcyjnych, różne narzędzia tego typu można też pobrać w sieci z darmową licencją. Większość z nich można używać tylko do celów niekomercyjnych, a reszta i tak nie sprawdza się w praktyce. Dlaczego?

Bezpłatne oprogramowanie OCR rozpoznaje tekst używając przestarzałych algorytmów, często nie potrafi rozpoznać tekstu w kilku językach, ani znaków specjalnych. Plik który zostaje zapisany będzie źle sformatowany, często jest to ciąg znaków zapisanych w pliku .txt w jednej linii. 

Komercyjne rozwiązania takie jak SmartScan czy Umango radzą sobie z tym bardzo dobrze. Pliki są sformatowane tak jak oryginalny dokument, zdjęcia, odręczne podpisy, tabele czy inne grafiki ozdobne również znajdują się w dokumencie który możemy edytować. Programy integrują się z kserokopiarkami w firmie, więc ich obsługa ogranicza się tylko do wyboru programu w którym chcemy otworzyć nasz dokument i po chwili mamy go już na swoim komputerze.