OCR-Gewohnheiten und best-practises
#11

Als kleiner Hinweis:
CamScanner kann man auch als CamScanner Pro für einmalig ein paar Euro für die App kaufen. Das deckt dann schon einen gewissen Teil der Abo-Features ab.
OCR gibt es wahlweise entweder lokal auf dem Handy oder in der Cloud - wobei die Cloud deutlich bessere Ergebnisse liefert.

Gesendet von meinem HTC U11 life mit Tapatalk
Zitieren
#12

Zur Erkennungsqualität: Habe gestern einen Schwung Steuerunterlagen aus Vorjahren durch den iX500 geschickt. Scan mit 300 dpi, Farbe, Vollduplex, Texterkennung mit der mitgelieferten SW, direkten EN-Upload. Sensibilisiert von unserer Diskussion habe ich mir die OCR-Qualität danach etwas genauer angeschaut.

Generell bleibe ich bei meiner Bewertung „sensationell“, insbesondere wenn man sieht, dass selbst über hundert Seiten gemischte Belege in ca. 2-3 min durch die OCR-Mühle laufen. Der OCR-Schritt erfolgt in einem getrennten Ablauf nachdem der Scan erledigt ist.

Schwächen zeigt der OCR bei einem typischen Steuer-Dokumententyp. Das sind diese schicken Angry Formulare der Finanzverwaltung, bei denen der Formulartext auf einer grau hinterlegten Fläche steht. Hier bricht die OCR-Erkennung teilweise dramatisch ein. Es steht dann viel Kauderwelsch in den erzeugten Texten. Das betrifft wie gesagt nur die Formular-Textpassagen auf den grauen Flächen. Der Rest ist wieder tiptop.

Das ist nicht zu beobachten, wenn der Text auf farbigem Papier steht, oder auf einem Farbverlauf, wie bei manchen Belegen meiner Handwerkerschaft. Da scheint der Farbkontrast zu helfen.

Habe da noch etwas vor mir (seufz) und werde das Thema jetzt etwas variieren: Ablegen als pdf, selbst nach EN uploaden und dort OCRen lassen. Vielleicht teste ich auch mal eine der o.g. OCR-Alternativen, und werde auch meinen ScannerPro-OCR mal auf so ein Formular los lassen.

Demnächst mehr in diesem Kino ... und jetzt erst mal die Frühlingssonne genießen  Cool
Zitieren


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste