Diese Notiz löschen
Hinweis zur Löschung inaktiver Anmeldungen: *klick*

Diese Notiz löschen
Keine Bestätigungsmail für die Registrierung erhalten? *klick*


OCR-Gewohnheiten und best-practises
#11

Als kleiner Hinweis:
CamScanner kann man auch als CamScanner Pro für einmalig ein paar Euro für die App kaufen. Das deckt dann schon einen gewissen Teil der Abo-Features ab.
OCR gibt es wahlweise entweder lokal auf dem Handy oder in der Cloud - wobei die Cloud deutlich bessere Ergebnisse liefert.

Gesendet von meinem HTC U11 life mit Tapatalk
Zitieren
#12

Zur Erkennungsqualität: Habe gestern einen Schwung Steuerunterlagen aus Vorjahren durch den iX500 geschickt. Scan mit 300 dpi, Farbe, Vollduplex, Texterkennung mit der mitgelieferten SW, direkten EN-Upload. Sensibilisiert von unserer Diskussion habe ich mir die OCR-Qualität danach etwas genauer angeschaut.

Generell bleibe ich bei meiner Bewertung „sensationell“, insbesondere wenn man sieht, dass selbst über hundert Seiten gemischte Belege in ca. 2-3 min durch die OCR-Mühle laufen. Der OCR-Schritt erfolgt in einem getrennten Ablauf nachdem der Scan erledigt ist.

Schwächen zeigt der OCR bei einem typischen Steuer-Dokumententyp. Das sind diese schicken Angry Formulare der Finanzverwaltung, bei denen der Formulartext auf einer grau hinterlegten Fläche steht. Hier bricht die OCR-Erkennung teilweise dramatisch ein. Es steht dann viel Kauderwelsch in den erzeugten Texten. Das betrifft wie gesagt nur die Formular-Textpassagen auf den grauen Flächen. Der Rest ist wieder tiptop.

Das ist nicht zu beobachten, wenn der Text auf farbigem Papier steht, oder auf einem Farbverlauf, wie bei manchen Belegen meiner Handwerkerschaft. Da scheint der Farbkontrast zu helfen.

Habe da noch etwas vor mir (seufz) und werde das Thema jetzt etwas variieren: Ablegen als pdf, selbst nach EN uploaden und dort OCRen lassen. Vielleicht teste ich auch mal eine der o.g. OCR-Alternativen, und werde auch meinen ScannerPro-OCR mal auf so ein Formular los lassen.

Demnächst mehr in diesem Kino ... und jetzt erst mal die Frühlingssonne genießen  Cool
Zitieren
#13

Ist nun einige Zeit her, dass ich diese Thread gestartet habe.

Ich habe mir Eure Beiträge angeschaut und für mich inzwischen auch die hier zuletzt von Rosa Elefant gepriesene ScanSnap-Routine vom iX500 direkt als OCR-bearbeitetes PDF in das gerade offene Evernote-Notizbuch Scannen länger getestet.

Und ich muss mich revidieren und Rosa Elefant anschließen: Geschwindigkeit und Erkennungsrate sind so gut, dass sich manuelle Bearbeitung in Einzelschritten (Scannen in Eingangsordner auf Rechner/Laufwerk, nicht lohnt. Nachbearbeitung und OCR-Behandlung mit ADOBE-Vollversion) nicht lohnt.
OCR-Behandlung mit ADOBE-Vollversion mache ich inzwischen deswegen fast nur noch, wenn ich teilen, beschneiden, zusammenfügen, sortieren oder bereinigen muss (oder wenn sich dies beim Lesen / Bearbeiten nebenbei in den Arbeitsablauf integriert). 

Dateigröße (kann nicht wirklich sagen, dass ADOBE-behandelte Dateien tatsächlich größer sind...) ist auch kein Argument. Wie Herbert zu Recht ausführte, machen etwaige Unterschiede bei modernen Speicherpreisen und -größen eh kaum etwas aus.

Was sich in meiner Routine nun geändert hat, ist dass beim Scannen nun Evernote mein neuer zweiter "Eingangsordner" geworden ist, aus dem danach manches wieder in das Filesystem herausgespeichert wird, was ich nicht in Evernote brauche oder lieber nur wo anders wissen möchte...
Zitieren
#14

Ist vielleicht diese Testseite ("Testseite für OCR-Erkennung.pdf") sinnvoll um Dateigrößen mit den verschiedenen Werkzeugen zu ermitteln?
Oder wäre eine Textseite wie "test-dokument-1_01.pdf" besser geeignet? Oder "Druckertest.pdf"?

Versuchsweise habe ich "Testseite für OCR-Erkennung.pdf" mit verschiedenen PDF24-Einstellungen (https://de.pdf24.org/) OCR-gescannt:
Testseite für OCR-Erkennung.pdf ohne OCR = 1692 kB
Testseite für OCR-Erkennung-300dpi_Gute_Qualitaet.pdf = 476 kB
Testseite für OCR-Erkennung-300dpi_Hohe_Qualitaet.pdf = 1800 kB
Testseite für OCR-Erkennung-300dpi_Beste_Qualitaet.pdf = 1800 kB


Angehängte Dateien
.pdf Testseite für OCR-Erkennung.pdf Größe: 1,65 MB  Downloads: 2
.pdf test-dokument-1_01.pdf Größe: 203,6 KB  Downloads: 5
.pdf Druckertest.pdf Größe: 98,56 KB  Downloads: 3

Beste Grüße
Horst
--
Meine Evernote-Blogbeiträge https://www.hsw2.de/category/evernote/
Windows 10 1909 / HUAWEI P20 lite EMUI 9.1.0 ANE-LX1 9.1.0.246/C432E6R1P7)/Android 9
Zitieren


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste