I.D.O. - Information digital organisieren
Frage: OCR für EN Desktop (WIN) - Druckversion

+- I.D.O. - Information digital organisieren (https://digital-cleaning.de/forum)
+-- Forum: Evernote & Co. (https://digital-cleaning.de/forum/forumdisplay.php?fid=4)
+--- Forum: EvernoteDE (https://digital-cleaning.de/forum/forumdisplay.php?fid=5)
+--- Thema: Frage: OCR für EN Desktop (WIN) (/showthread.php?tid=200)



OCR für EN Desktop (WIN) - Birgit - 22.04.2019

Hallo zusammen,

ich habe aus diversen Quellen abschnittsweise Textpassagen als JPGs in eine EN-Notiz eingefügt.
Diese JPGs enthalten durchwegs Text (nicht handgeschrieben).

Kann ich diese Notiz, bestehend aus vielen einzelnen "Text-JPGs" in normalen editierbaren Text umwandeln ->OCR - und das unter EN Desktop + WIN 10?

Habt ihr Ideen oder Alternativen oder Workarounds?
Danke.


RE: OCR für EN Desktop (WIN) - JohnL - 22.04.2019

Versuch macht klug  Wink

aber, warum Textpassagen nicht über Druckfunktion z.B. als pdf speichern und über M$ Word in editierbaren Text umwandeln? Klappt bei mir zu 90 % ohne manuelle Korrektur.


OCR für EN Desktop (WIN) - Norbert - 22.04.2019

@Birgit
Mit EN Bordmitteln ist eine Ausgabe als Text leider nicht möglich. Das EN interne OCR dient nur zur Indizierung für die Suche.

Einen Workaround könnte ich mir allerdings vorstellen:
Du konvertierst das JPG mit dem Text in ein PDF. Dieses PDF legst Du in EN ab.
Nach dem OCR und der Indizierung (für gewöhnlich nach 2-3 Sync-Vorgängen) kannst Du das PDF in EN mit der rechten Maustaste anklicken und den Menüpunkt “PDF mit erkanntem Text speichern“ (oder so ähnlich) wählen.
Das resultierende PDF in einem PDF Viewer öffnen und den Text mit Copy/Paste heraus kopieren.


RE: OCR für EN Desktop (WIN) - Birgit - 22.04.2019

danke, schade, ich dachte, dass das mit und in EN selber gehen könnte.

Für Bild- oder besser Text-Ausschnitte, die ich mit dem Android-Smartphone abfotografiere, habe ich nun "Text Fairy" gefunden, mit denen ich die gedruckten Texte abfotografiere; die App wandelt es dann gleich in erstaunlich gutes OCR um.

Nur die Screenshots, die ich am Desktop vom Browser in die EN-Notiz kopiere, fehlt mir nur noch eine Lösung ... ich gucke mal, wie ich mit deiner PDF-Lösung weiter komme ...


OCR für EN Desktop (WIN) - Norbert - 22.04.2019

Für das Erfassen von Text (inkl. OCR) mittels Abdroid Smartphone verwende ich vorwiegend (Abbyy)TextGrabber bzw. CamScanner.
Beide sind in der Vollversion für ein paar Euro zu haben und bieten aus meiner Sicht ganz hervorragendes OCR.
(Es gibt dann natürlich jeweils auch noch Abo-Modelle, die aber nicht notwendig sind.)

https://play.google.com/store/apps/details?id=com.abbyy.mobile.textgrabber.full

https://play.google.com/store/apps/details?id=com.intsig.camscanner


OCR für EN Desktop (WIN) - Herbert - 22.04.2019

(22.04.2019, 19:23)Norbert schrieb:  Für das Erfassen von Text (inkl. OCR) mittels Abdroid Smartphone verwende ich vorwiegend (Abbyy)TextGrabber bzw. CamScanner.
Beide sind in der Vollversion für ein paar Euro zu haben und bieten aus meiner Sicht ganz hervorragendes OCR.

Ja, TextGrabber ist auch unter iOS super-schnell:

https://www.dropbox.com/s/9gap3hpiha5vgad/Video%2022.04.19%2C%2022%2007%2024.mp4?dl=0


RE: OCR für EN Desktop (WIN) - Grobi - 22.04.2019

Innerhalb von Evernote geht da nichts, soweit ich weiß.

Da hilft m.E. nur der Weg über das Erzeugen von PDFs.

Der schon beschriebene Weg über Word funktioniert dann recht gut. Hier ist der Link zu dem Support-Artikel von Microsoft:
https://support.office.com/de-de/article/bearbeiten-einer-pdf-datei-b2d1d729-6b79-499a-bcdb-233379c2f63a

Alternativ: Adobe Acrobat (setze ich ein, lohnt sich aber nur, wenn viel mit PDF-Dateien hantiert wird; muss Acrobat sein, mit dem Reader geht das natürlich nicht) oder Nuance Power PDF. Letzteres ist nicht ganz so leistungsfähig wie „das Original“, erfüllt aber i.d.R. seinen Zweck gut (ebenfalls von mir und einigen Mitarbeitern verwendet). Für Wenig-Nutzer sicher das bessere Preis-Leistungs-Verhältnis.
Zusätzlicher Vorteil dieser Programme: Du kannst recht einfach mehrere PDFs zu einer Datei zusammensetzen, einzelne Seiten löschen oder Seiten umstellen. Wenn du diesen Schritt voranstellst und danach die so erzeugte Datei in Word öffnest/umwandelst, kannst du es dir etwas leichter machen, z.B. bei dem Ändern in eine einheitliche Schriftart/-größe.
Was nicht so gut funktioniert, ist die Konvertierung von tabellenähnlichen Inhalten wie z.B. bei einem Kontoauszug (habe ich gerade mal aus Interesse getestet). Da wird versucht, die Tabellenstruktur beizubehalten, was zu etwas merkwürdigen Effekten führt.


RE: OCR für EN Desktop (WIN) - msone - 23.04.2019

(22.04.2019, 17:37)Birgit schrieb:  Nur die Screenshots, die ich am Desktop vom Browser in die EN-Notiz kopiere, fehlt mir nur noch eine Lösung ...
Kannst ja mal FreeOCR probieren. Das funktioniert recht gut, weil es Googles Tesseract Engine nutzt. Wichtig ist nur, nach dem Installieren die OCR-Sprache rechts oben auf deutsch zu setzen, sonst kommt nur Mist raus.