Erstgespräch buchen
Tool im Einsatz

Paperless-ngx

Das Dokumenten-Archiv für Handwerksbetriebe und . auf eigenem Server, Volltextsuche, automatische Erkennung von Korrespondent und Dokument-Typ — eine konkrete Alternative zu DocuWare und ELO für Betriebe mit 5–50 Mitarbeitenden.

Projekt-Profil

Paperless-ngx

Document management system with OCR and full-text search

Stand: 1. Juni 2026

GitHub-Sterne

42k

Forks

2.8k

Offene Issues

7

Lizenz

GPL-3.0

Aktuelle Version

v2.20.15

Sprache

Python

Erstveröffentlichung
12. Februar 2022
Letzter Commit
1. Juni 2026

Drittquelle · Wikidata (CC0)

Wikidata-Profil

Paperless-ngx

Q134589265

Lizenz

GNU General Public License, Version 3

Was ist Paperless-ngx?

Paperless-ngx ist ein DMS (Document Management System) für Self-Hosting: Dokumente landen via Mail, Mobile-Scan oder Upload im System, werden via (Tesseract) durchsuchbar gemacht, automatisch nach Korrespondent (Lieferant, Behörde) und Dokument-Typ (Rechnung, Bescheid, Vertrag) klassifiziert.

Die Software ist GPL-3.0-lizenziert — vollwertig Open Source. Sie ist die aktive Community-Fork von Paperless-ng (das selbst Fork des ursprünglichen 'paperless' war). Die ursprünglichen Projekte sind eingeschlafen — paperless-ngx hat eine sehr aktive Maintainer-Community und ein produktionsreifes Setup für .

Warum ein Handwerksbetrieb Paperless-ngx nutzt

Ein typischer SHK-Betrieb (Sanitär, Heizung, Klima) bekommt pro Monat 200–400 Lieferscheine, 50–80 Eingangsrechnungen, 30–60 Wartungsverträge, dazu BAFA-Förderbescheide, F-Gase-Bescheinigungen, Dichtigkeitsprüfungs-Protokolle. Über die Jahre sammeln sich 5.000–15.000 PDFs.

Ohne DMS bedeutet das: Aktenordner-Wand, jeder sucht 20 Minuten, wenn der Betriebsprüfer eine Rechnung aus 2023 will. Mit Paperless-ngx: Volltextsuche über alle PDFs, Treffer in unter einer Sekunde, GoBD-konforme Aufbewahrung. Die Aktenordner-Wand wird zur Akzent-Wand.

Mandantenfall

Schäfer Haustechnik

Familienbetrieb in Niedersachsen, 12 Personen — Meister Schäfer (Sen. + Jun.), 8 Gesellen, 2 Azubis, 1 Büro. Ca. 280 Lieferscheine pro Monat, 70 Eingangsrechnungen, 5 BAFA-Wärmepumpen-Anträge im Quartal. Seit 18 Monaten mit Paperless-ngx auf eigenem Server — die letzten 7.400 Dokumente sind im Archiv.

Volltextsuche über alle Belege

Betriebsprüfer fragt: 'Wo ist die Rechnung von der Viessmann-Lieferung im März 2023?' Antwort in 30 Sekunden statt 30 Minuten — alle Lieferscheine sind OCR-erfasst und durchsuchbar.

GoBD-konforme Archivierung

Rechnungen, Bescheide, Verträge müssen 6–10 Jahre revisionssicher aufbewahrt werden. Paperless-ngx erfüllt mit , Versionierung und unveränderlichen Originalen die GoBD-Anforderungen.

Auto-Tagging nach Korrespondent

Lieferschein von einem Sanitärgroßhandel wird automatisch dem Korrespondent zugeordnet, Tag 'Lieferschein' bekommt das Dokument-Typ-Feld. Der Mitarbeiter muss das System einmal lehren — danach lernt es selbst.

Datenhoheit (Wettbewerb + Prüfung)

Eingangsrechnungen verraten Einkaufspreise. Wartungsverträge nennen Mandanten. Das gehört nicht in einen US-Cloud-Anbieter, der die Daten für Trainings nutzen oder bei einer Subpoena herausgeben muss.

Mobile-Scan auf der Baustelle

Lieferschein-Übergabe auf Baustelle: Mitarbeiter scannt mit dem Smartphone (App Paperless Mobile oder Scanbot), das PDF landet im Consume-Ordner, + Tagging laufen automatisch. Original bleibt beim Lieferanten.

10-Jahres-Aufbewahrung automatisch

Steuerliche Aufbewahrungsfristen werden pro Dokument-Typ konfiguriert. Nach Ablauf erinnert das System an Löschung (oder behält dauerhaft, je nach Policy). Kein Excel mehr mit 'das kann jetzt weg'.

Was der Betrieb konkret damit macht

Acht produktive Nutzungsmuster aus 18 Monaten Paperless-ngx im SHK-Alltag. Jedes ersetzt eine Aktivität, die früher entweder Stunden gekostet hat oder gar nicht ging.

Eingangs-Postfach automatisch konsumieren

belege@schaefer-haustechnik.de wird minütlich von Paperless-ngx abgefragt. Lieferscheine, Rechnungen, Bescheide kommen oft als PDF-Anhang — der landet automatisch im System, wird 'd und nach Korrespondent klassifiziert. Manuelles Sortieren entfällt komplett.

Mobile-Scan via App

Geselle bekommt auf der Baustelle einen Lieferschein in Papierform. App-Aufnahme (Paperless Mobile via Browser, oder Scanbot mit ), PDF landet im Consume-Ordner. Innerhalb von 30 Sekunden ist das Dokument durchsuchbar.

Volltextsuche in unter 1 Sekunde

Frage: 'Wo ist die Wartungsbescheinigung für Mandant Müller, Anlage Nr. 2024-007?' Suchfeld → 'Müller 2024-007' → drei Treffer mit Vorschau. Vorher: 20 Minuten im Aktenordner blättern.

Tags + Korrespondent + Dokument-Typ

Drei orthogonale Klassifikations-Achsen: Tag (frei wählbar — z. B. '', 'Wartung', 'Garantie'), Korrespondent (Lieferant, Mandant, Behörde), Dokument-Typ (Rechnung, Lieferschein, Bescheid). Filter-Kombination liefert exakt die richtigen Treffer.

Automatische Klassifikation lernt mit

Nach 30–50 Beispieldokumenten pro Korrespondent erkennt das System neue Lieferscheine vom selben Lieferanten selbständig. Ähnlich für Dokument-Typen — Eingangsrechnungen werden ohne Eingriff korrekt zugeordnet.

Custom Fields für SHK-Spezifika

Rechnungsbetrag, Mandantennummer, Anlagenkennung als Custom Fields am Dokument. Reports: 'Alle Rechnungen über 5.000 € im Q1 2026' — Filter setzen, CSV-Export für die Buchhaltung, fertig.

n8n-Workflow: Eingangsrechnung an DATEV

Neue Eingangsrechnung im DMS → n8n-Webhook → PDF + Custom-Field-Daten an DATEV-Cloud. Buchhalterin bekommt die Rechnung im DATEV-Posteingang, Original bleibt im Paperless. Zwei Systeme, eine Wahrheit.

Backup-Routine mit Restore-Test

Wöchentliches Volume-Backup der drei Container, Restore-Test einmal pro Quartal. GoBD verlangt Wiederherstellbarkeit — Paperless macht das einfach, weil alle Daten in zwei klar abgegrenzten Volumes liegen (media + db).

Kern-Funktionen von Paperless-ngx

Was Paperless-ngx technisch leistet — und welche Funktionen im KMU-Alltag tatsächlich tragen.

OCR mit Tesseract (lokal)

Tesseract-OCR läuft im Container, kein Cloud-API. Deutsche + englische Spracherkennung gleichzeitig. Auch handschriftliche Notizen werden zumindest teilweise erkannt — wichtig für Lieferscheine mit Geselle-Anmerkungen.

Volltext-Suche (PostgreSQL FTS)

PostgreSQL-Volltextsuche über alle OCR-Texte. Treffer in unter einer Sekunde auch bei 10.000 Dokumenten. Suchoperatoren: AND, OR, NOT, Fuzzy-Matching, Phrase-Suche.

Auto-Tagging via Machine Learning

Klassifikator lernt aus den ersten 30–50 Beispielen pro Klasse. Nach kurzer Trainingsphase werden neue Dokumente automatisch nach Korrespondent, Dokument-Typ und sogar Tags klassifiziert.

REST-API für Workflows

Vollständige für alle Operationen — Upload, Suche, Tagging, Custom-Field-Updates. Integration in n8n-Workflows, DATEV-Bridges, Eigenentwicklungen problemlos.

Mobile-Apps (Drittanbieter)

Paperless Mobile (kostenlose PWA), Scanbot (kostenpflichtig, sehr gute Auto-Crop und Mehrseiten-Scan), Genius Scan via . Keine offizielle App vom Paperless-Team, aber funktionierende Ökosystem-Lösungen.

GPL-3.0 — Copyleft Open Source

Vollwertige GPL-3.0-Lizenz: Quellcode öffentlich, Modifikationen müssen unter gleicher Lizenz veröffentlicht werden, wenn man die Software weiterverteilt. Für KMU-Eigenbetrieb völlig unproblematisch — Daten bleiben Eigentum des Betriebs.

Alternativen ehrlich verglichen

Wenn Paperless-ngx nicht passt — was sonst?

Drei Alternativen mit unterschiedlichen Stärken. Der DMS-Markt ist breit — wir zeigen die häufigsten Vergleiche aus echten Beratungsgesprächen.

SaaS-Marktführer DACH

DocuWare

DocuWare GmbH, proprietär

  • + Sehr ausgereiftes Produkt, DACH-Marktführer
  • + Tiefe DATEV- und SAP-Integration
  • − Ab ca. 50 €/Nutzer/Monat, kumulativ
  • − Cloud-Anteil, oder On-Premise mit hohem Aufwand

Enterprise-DMS

ELO ECM

ELO Digital Office, proprietär

  • + Sehr mächtig, vollständiges ECM-Spektrum
  • + Office-Integration, Workflows, Reporting
  • − Vierstellige Lizenzkosten pro Jahr
  • − Für KMU unter 50 Personen überdimensioniert

Analog

Aktenordner-Wand

Leitz, Edding, etc.

  • + Funktioniert ohne Strom und ohne Konfiguration
  • + Niemand kann das System hacken
  • − Nicht durchsuchbar, kein Volltext
  • − Nicht GoBD-konform für digitale Belege

Faustregel: Ein SHK- oder Handwerksbetrieb mit 5–30 Personen ist mit Paperless-ngx am pragmatischsten unterwegs — GoBD-tauglich, lokal, GPL-3.0. Wer ohnehin Microsoft-Stack hat, kann SharePoint-DMS überlegen. DocuWare ist die kommerzielle Referenz, aber sehr preisintensiv. Aktenordner-Wand ist auch eine Lösung — nur eben nicht durchsuchbar.

Pricing

GPL-3.0. GoBD-tauglich. Lokal.

Lizenz

GPL-3.0 — klassische Copyleft OSI-Open-Source-Lizenz. Quellcode öffentlich, Modifikationen bei Weiterverteilung wieder unter GPL. Für KMU-Eigenbetrieb keinerlei Auflagen. Keine Per-Nutzer-Lizenz, keine Mengen-Beschränkung.

Laufende Kosten

Vier Container auf eigenem Server: Paperless-App, Redis, PostgreSQL, optional Tika für Office-Dateien. RAM-Bedarf ca. 500 MB für 5.000 Dokumente. Speicher: ca. 1 GB pro 1.000 Dokumente (PDFs mit OCR-Layer). Keine externen Kosten.

Aufwand

Docker-Compose-Setup: 30 Minuten. Initial-Konfiguration (Mail-Account, erste Korrespondenten, Dokument-Typen): 1–2 Stunden. Komplettes Handwerksbetrieb-Setup mit Trainingsbatch, n8n-DATEV-Bridge und Mitarbeiter-Schulung: 2–4 Beratungstage.

Anders als bei Vaultwarden (AGPL-3.0) oder (fair-code) gibt es bei Paperless-ngx keinen kommerziellen Anbieter im Hintergrund — keine Business Edition, keine Enterprise-Variante. Was es gibt, ist eine sehr aktive Maintainer-Community mit regelmäßigen Releases und eine professionelle Doku.

Mail-Eingang automatisch konsumieren

# Paperless Mail-Account (im Web-UI angelegt)
host: mail.shk-betrieb.de
port: 993
username: belege@shk-betrieb.de
password: ${MAIL_PASS}

# Mail-Rule
folder: INBOX
filter_subject: "Rechnung|Lieferschein|Bescheid"
filter_body: ""
filter_from: ""
maximum_age: 7  # Tage

# Aktionen
action: move
action_parameter: "INBOX/Verarbeitet"
consumption_scope: attachments_only
assign_correspondent_from: from
assign_document_type_from: subject
assign_tags: ["E-Mail-Eingang", "Auto-Import"]
IMAP-Postfach belege@shk-betrieb.de wird minütlich abgefragt. Anhänge landen im Consume-Ordner und werden automatisch verarbeitet — OCR, Klassifikation, Tagging. Quelle: docs.paperless-ngx.com.

Paperless-ngx-Stack als Docker-Compose

services:
  paperless:
    image: ghcr.io/paperless-ngx/paperless-ngx:2.20.15
    restart: unless-stopped
    depends_on: [db, redis]
    environment:
      - PAPERLESS_URL=https://paperless.shk-betrieb.de
      - PAPERLESS_DBHOST=db
      - PAPERLESS_REDIS=redis://redis:6379
      - PAPERLESS_OCR_LANGUAGE=deu+eng
      - PAPERLESS_TIME_ZONE=Europe/Berlin
      - PAPERLESS_CONSUMPTION_DIR=/usr/src/paperless/consume
    volumes:
      - ./data:/usr/src/paperless/data
      - ./media:/usr/src/paperless/media
      - ./consume:/usr/src/paperless/consume
    networks: [frontend, paperless-net]

  db:
    image: postgres:16
    restart: unless-stopped
    environment:
      - POSTGRES_DB=paperless
      - POSTGRES_USER=paperless
      - POSTGRES_PASSWORD=${PAPERLESS_DB_PASS}
    volumes:
      - ./db:/var/lib/postgresql/data
    networks: [paperless-net]

  redis:
    image: redis:7-alpine
    restart: unless-stopped
    networks: [paperless-net]

networks:
  frontend:
    external: true
  paperless-net:
Vier Container für ein produktives DMS: App + Redis-Queue + PostgreSQL + Tesseract-OCR-Worker. Alle Volumes lokal, kein Cloud-Anteil. Quelle: docs.paperless-ngx.com, GPL-3.0.

Verwandte Themen

Paperless-ngx braucht Plattform und Workflows

als Plattform, Caddy als HTTPS-Layer davor, für DATEV-Brücke oder Mail-Trigger:

Bereit für den nächsten Schritt?

Kostenloses Erstgespräch. Unverbindlich. In 30 Minuten wissen Sie, ob und wie KI Ihrem Unternehmen helfen kann.

Erstgespräch buchenBAFA-Förderung