Papra – der kleine Bruder von Paperless-ngx

In der Artikelserie zu Paperless-ngx (bisher 20 Teile) habe ich gezeigt, dass dieses System zur Dokumentenverwaltung sehr viele Möglichkeiten hat – aber auch, dass es mit einem gewissen Einarbeitungs- und Pflegeaufwand verbunden ist. Papra verfolgt einen ähnlichen Ansatz, ist aber deutlich reduzierter. Das Programm ist noch jung, wird aber intensiv entwickelt. Die Erfahrungen mit der aktuellen Beta-Version 0.6.3 sind gut, das Programm lief stabil und flott.

Was unterscheidet Papra von Paperless-ngx?

Paperless-ngx ist ein typisches DMS (Dokumentenmanagementsystem), das zur systematischen Verwaltung von wichtigen Dokumenten dient. Dafür stehen zahlreiche Meta-Felder zur Verfügung, komplexe Suchvorgänge können durchgeführt werden, Abläufe mit Wenn-Dann-Bedingungen kombiniert werden usw. Papra ist – absichtlich – bescheidener. Einfach gesagt: Man nimmt Dokumente auf und erhält auch bei großen Datenmengen eine außerordentlich flotte Volltextsuche. Organisieren kann man via Tags und durch getrennte Verwaltung unterschiedlicher Dokumentenarchive. Das ist – fast – schon. Damit würde ich Papra eher als Literaturverwaltung denn als DMS bezeichnen.

Warum dann nicht einfach bei der Suche via Dateimanager bleiben?

Der wichtigste Unterschied zu den Suchmöglichkeiten der Betriebssysteme: Papra ist eine Anwendung für den Homeserver (ich habe das System auf einem Raspberry Pi 4 installiert). Damit kann man Papra von jedem Gerät in der Familie aufrufen und nach Dokumenten suchen – egal, ob Notebooks, Tablets oder Smartphones. Und durch die 1-Klick-Wireguard-Möglichkeiten von Fritzbox & Co. steht mir der gesamte Datenbestand via VPN auch unterwegs in Zug und Hotel zur Verfügung.

Abgesehen davon: Je nach Betriebssystem und Hardware kann eine Volltextsuche in großen Datenbeständen quälend langsam sein – bei Windows war ich damit nie zufrieden.

Besonders leichte Installation

Die Installation von Paperless-ngx ist zwar auch nicht besonders schwierig, aber bei Papra genügt eine Zeile, sofern man Docker auf seinem System bereits eingerichtet hat:

docker run -d --name papra -p 1221:1221 ghcr.io/papra-hq/papra:latest

Nach wenigen Sekunden kann so Papra von jedem Gerät aus erreicht werden, indem man die IP seines Homeservers einträgt und um Port 1221 ergänzt – z. B. „192.168.178.182:1221“. Fertig.

Aufnahme von Dokumenten

Dokumente können via Drag-and-Drop oder per Import-Button hinzugefügt werden. Es ist aber auch möglich, Ordner von Papra überwachen zu lassen. Alle Dokumente, die sich in diesen Ordnern befinden oder später – z. B. via Scanner – hinzugefügt werden, werden automatisch ins Dokumentenarchiv aufgenommen.

Arten von Dokumenten und Texterkennung

Noch ist bei Papra nicht alles implementiert, aber problemlos verarbeitet werden PDF-Dateien, die bereits über einen Textlayer verfügen. Papra hat zwar bereits die OCR-Funktion für Bilder (PNG, JPG) eingebaut, für PDF-Dokumente soll die Erkennung in einer der nächsten Versionen kommen.

Für mich ist dieser Punkt nicht besonders wichtig, da ich auch bei Paperless-ngx auf die OCR-Funktion via Anwendung verzichte – Dokumentenscanner und Smartphone integrieren bereits bei der Erfassung Textlayer perfekt, bei digitalen Anhängen ist das meist ohnehin der Fall. Alle Test-PDFs wurden vollständig in den Index von Papra übernommen.

Die Texterkennung in Bildern ist solala. Mit Umlauten gibt es wohl noch ein Problem, liegt aber vielleicht auch nur an der Konfiguration.

Die Erkennung von MS-Office-Dokumenten und EPUBs soll in einer der nächsten Versionen kommen.

Prinzipiell können auch E-Mails bzw. deren Anhänge eingelesen werden können, das habe ich aber nicht ausprobiert.

Organisationen = Sammlungen

Der Begriff „Organisationen“ klingt etwas merkwürdig, da man zuerst an Firmen usw. denkt. Gemeint ist damit, dass man beliebig viele getrennte Dokumentensammlungen erstellen kann.

Auf diese Weise werden z. B. beim einem Suchvorgang nur die Dokumente der aktuellen Organisation einbezogen.

Suchergebnisse

Dazu gibt es nicht viel zu sagen: Man beginnt, in das Suchfeld zu tippen, die Suche beginnt sofort, mit jedem neuen Buchstaben verändert sich die Liste:

Tag-Filterung

Alle Dokumente, die einen bestimmten Tag aufweisen, kann man per Klick auf einen Tag auswählen. Entweder direkt beim aktuellen Dokument – oder über die Seitenleiste. Die Tags können Beschreibungen und Farben erhalten:

Automatisierungen für Tags

Tags spielen bei Papra eine wichtige Rolle. Daher gibt es die Möglichkeit, automatisch Tags vom System zuweisen zu lassen. Dazu definiert man Tagging-Regeln nach dem Prinzip: „Wenn im Dateinamen oder im Text die folgenden Stichwörter vorkommen – dann vergib den Tag XYZ.“

Überwachte Ordner

Für jede Sammlung/Organisation lassen sich Dateiverzeichnisse konfigurieren. Die Dateien, die sich in diesem Verzeichnis befinden, werden automatisch ins Archiv übernommen. Werden neue Dateien dort gespeichert, so erkennt das Papra und „saugt“ auch diese auf. Konfiguriert werden kann, ob die Dateien im ursprünglichen Verzeichnis erhalten bleiben oder dort gelöscht werden sollen.

Für die Einrichtung trägt man in die YML-Textdatei Ordner und Organisations-ID ein. Klingt ein wenig kompliziert, hat bei meinen Tests aber problemlos geklappt. Eine ausführliche Anleitung dazu gibt es in der Dokumentation von Papra.

Fazit

Es gibt noch eine Reihe weiterer kleiner Funktionen, die ich für diesen Überblick übersprungen habe. Wie gesagt: Die Anwendung befindet sich eigentlich noch im Beta-Stadium, ist aber schon jetzt recht brauchbar. Auf meinem Raspberry Pi 4 (mit 4 GB) läuft Papra sehr flott. Wer nicht die umfangreichen Funktionen von Paperless-ngx benötigt, erhält mit Papra ein System mit einem deutlich geringeren Pflegeaufwand. Zudem: Ich habe es durch Paperless-ngx sehr zu schätzen gelernt, dass ich von jedem Gerät und insbesondere auch absolut problemlos von unterwegs sicher auf meine Dokumente zugreifen kann. Wenn man mal eine Versicherungsnummer nicht zur Hand hat – kurz das Smartphone zücken, Stichwort eingeben – und kawumm! – das Dokument ist da. Das funktioniert genauso gut mit Papra. Also: Einfach mal testen – ist ja mit einer Code-Zeile installiert.

Eine Antwort schreiben

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert