Skip to content
  • Preise

Ihr Zeitungsarchiv – vollständig durchsuchbar.

Millionen historischer Zeitungsseiten lagern in Archiven – gescannt, aber nicht durchsuchbar. Transkribus liest den Text, versteht das Layout und verwandelt jeden Artikel, jede Überschrift und jede Kleinanzeige in strukturierte, durchsuchbare Daten. Von einem einzelnen Titel bis zu einer ganzen Nationalbibliothek.

Historische Zeitungslayoutsegmentierung
30M+verarbeitete Zeitungsseiten
15M+Seiten allein bei Zeitpunkt.NRW
100+öffentliche Druck- und Frakturmodelle

Die Ausgabe

Was Sie nach der Verarbeitung Ihrer Zeitungssammlung erhalten.

Volltextsuche in Zeitungsartikeln

Durchsuchbarer Volltext

Jeder Artikel, jede Überschrift, jede Anzeige und jede Kleinanzeige auf jeder Seite – erkannt und indiziert. Nach Name, Datum, Stichwort oder Phrase in der gesamten Sammlung suchen.

Automatische Layoutsegmentierung von Zeitungen

Strukturierte Layoutdaten

Die KI segmentiert mehrspältige Seiten in einzelne Inhaltsbereiche – Artikel, Überschriften, Anzeigen, Bildunterschriften. Jeder Bereich wird getaggt und separat exportiert, sodass nachgelagerte Systeme mit Artikeln und nicht mit rohen Seitendumps arbeiten können.

Veröffentlichte Zeitungssammlung als Transkribus-Site

Eine durchblätterbare Online-Sammlung

Verarbeitete Zeitungen können als Transkribus-Site veröffentlicht werden – eine gehostete, durchsuchbare Oberfläche für Ihre Sammlung. Keine Entwicklung erforderlich. Mit dem Branding Ihrer Institution.

Fallstudie

Zeitpunkt.NRW: 20 Millionen Zeitungsseiten für Nordrhein-Westfalen

Das Zeitpunkt.NRW-Projekt digitalisiert den gesamten historischen Zeitungsbestand Nordrhein-Westfalens – 20 Millionen Seiten, die Jahrhunderte regionaler Geschichte umfassen. Transkribus verarbeitet die Volltexterkennung im großen Maßstab und wandelt gescannte Seiten in durchsuchbaren Text um, der über das digitale Zeitungsportal des Landes veröffentlicht wird.
20 Millionen Zeitungsseiten mit Transkribus verarbeitet
Jahrhunderte regionaler Zeitungen aus NRW-Bibliotheken
Volltextsuche über das Zeitpunkt.NRW-Portal verfügbar
Zeitpunkt.NRW – 20 Millionen digitalisierte Zeitungsseiten

Fallstudie

NewsEye: Verbesserung der Zeitungstexterkennung mit der Nationalbibliothek Finnlands

Das EU-geförderte NewsEye-Projekt (Horizon 2020) brachte die Nationalbibliothek Finnlands mit Informatikern und Digital-Humanities-Forschenden zusammen, um die Texterkennung historischer Zeitungen zu verbessern. Mit 2,5 Millionen Seiten aus 10 finnischen Zeitungstiteln – die Hälfte davon auf Schwedisch, viele in gotischen Schrifttypen – nutzte das Team Transkribus, um benutzerdefinierte Modelle zu trainieren, die die Erkennungsgenauigkeit im Vergleich zu herkömmlichen OCR-Methoden um durchschnittlich 10 Prozentpunkte verbesserten.
2,5 Millionen Zeitungsseiten (1771–1914), 10 Titel
Gotische Schrifterkennungsgenauigkeit um durchschnittlich 10 Prozentpunkte verbessert
Verbesserte Suche in Finnlands nationaler Digitalbibliothek
NewsEye-Projekt – historische Zeitungsdigitalisierung

Der Ansatz

Von Scans zu strukturiertem Text – so digitalisieren Institutionen Zeitungen im großen Maßstab

Die Zeitungsdigitalisierung folgt einem bewährten Workflow: Scans hochladen, aus 100+ vortrainierten Druck- und Frakturmodellen auswählen (oder eigene auf Ihre spezifischen Schrifttypen trainieren), Stapelverarbeitung mit automatischer Layoutanalyse starten und strukturierte Ergebnisse exportieren. Die KI bewältigt mehrspältige Layouts, gemischte Inhaltstypen und historische Schrifttypen – einschließlich Fraktur, Schwarzdruck und frühneuzeitlichem Druck.
100+ öffentliche Modelle für Fraktur, Schwarzdruck und historischen Druck
Automatische Layoutsegmentierung für mehrspältige Zeitungsseiten
Stapelverarbeitung für Tausende von Seiten – ohne manuellen Eingriff
Export als durchsuchbares PDF, reiner Text oder strukturiertes XML (ALTO, PAGE)
Zeitungslayoutanalyse und Texterkennung

Anleitungen und Modelle

Tutorials, KI-Modelle und verwandte Anwendungsfälle für die Zeitungsdigitalisierung.

Wie man Zeitungen mit Transkribus digitalisiert

Schritt-für-Schritt-Anleitung: Scannen, Layoutsegmentierung, Modellauswahl und Texterkennung für historische Zeitungen.

Anleitung

KI-Modelle für Fraktur, Kurrent & Sütterlin

Die häufigsten historischen deutschen Druck- und Handschrifttypen – und die öffentlichen Modelle, die sie lesen können.

Modelle

Reduzierung archivarischer Rückstände

Wie Archive KI einsetzen, um Millionen nicht durchsuchbarer Seiten zu verarbeiten – derselbe Ansatz, der auf Zeitungssammlungen angewendet werden kann.

Anwendungsfall

Bereit, Ihr Zeitungsarchiv durchsuchbar zu machen?

Sprechen Sie mit unserem Team über Ihre Sammlung. Wir helfen Ihnen, die richtigen Modelle zu finden, den Workflow zu planen und den Umfang abzuschätzen.

30M+verarbeitete Zeitungsseiten
100+öffentliche Druckmodelle
EU-gehostetDSGVO-konform