Ihr Zeitungsarchiv – vollständig durchsuchbar.

Millionen historischer Zeitungsseiten lagern in Archiven – gescannt, aber nicht durchsuchbar. Transkribus liest den Text, versteht das Layout und verwandelt jeden Artikel, jede Überschrift und jede Kleinanzeige in strukturierte, durchsuchbare Daten. Von einem einzelnen Titel bis zu einer ganzen Nationalbibliothek.

Beratungsgespräch buchen Anleitung lesen

30M+verarbeitete Zeitungsseiten

15M+Seiten allein bei Zeitpunkt.NRW

100+öffentliche Druck- und Frakturmodelle

Durchsuchbarer Volltext

Jeder Artikel, jede Überschrift, jede Anzeige und jede Kleinanzeige auf jeder Seite – erkannt und indiziert. Nach Name, Datum, Stichwort oder Phrase in der gesamten Sammlung suchen.

Automatische Layoutsegmentierung von Zeitungen

Strukturierte Layoutdaten

Die KI segmentiert mehrspältige Seiten in einzelne Inhaltsbereiche – Artikel, Überschriften, Anzeigen, Bildunterschriften. Jeder Bereich wird getaggt und separat exportiert, sodass nachgelagerte Systeme mit Artikeln und nicht mit rohen Seitendumps arbeiten können.

Veröffentlichte Zeitungssammlung als Transkribus-Site

Eine durchblätterbare Online-Sammlung

Verarbeitete Zeitungen können als Transkribus-Site veröffentlicht werden – eine gehostete, durchsuchbare Oberfläche für Ihre Sammlung. Keine Entwicklung erforderlich. Mit dem Branding Ihrer Institution.

Fallstudie

Zeitpunkt.NRW: 20 Millionen Zeitungsseiten für Nordrhein-Westfalen

Das Zeitpunkt.NRW-Projekt digitalisiert den gesamten historischen Zeitungsbestand Nordrhein-Westfalens – 20 Millionen Seiten, die Jahrhunderte regionaler Geschichte umfassen. Transkribus verarbeitet die Volltexterkennung im großen Maßstab und wandelt gescannte Seiten in durchsuchbaren Text um, der über das digitale Zeitungsportal des Landes veröffentlicht wird.

20 Millionen Zeitungsseiten mit Transkribus verarbeitet

Jahrhunderte regionaler Zeitungen aus NRW-Bibliotheken

Volltextsuche über das Zeitpunkt.NRW-Portal verfügbar

Zeitpunkt.NRW besuchen

Zeitpunkt.NRW – 20 Millionen digitalisierte Zeitungsseiten

Fallstudie

NewsEye: Verbesserung der Zeitungstexterkennung mit der Nationalbibliothek Finnlands

Das EU-geförderte NewsEye-Projekt (Horizon 2020) brachte die Nationalbibliothek Finnlands mit Informatikern und Digital-Humanities-Forschenden zusammen, um die Texterkennung historischer Zeitungen zu verbessern. Mit 2,5 Millionen Seiten aus 10 finnischen Zeitungstiteln – die Hälfte davon auf Schwedisch, viele in gotischen Schrifttypen – nutzte das Team Transkribus, um benutzerdefinierte Modelle zu trainieren, die die Erkennungsgenauigkeit im Vergleich zu herkömmlichen OCR-Methoden um durchschnittlich 10 Prozentpunkte verbesserten.

2,5 Millionen Zeitungsseiten (1771–1914), 10 Titel

Gotische Schrifterkennungsgenauigkeit um durchschnittlich 10 Prozentpunkte verbessert

Verbesserte Suche in Finnlands nationaler Digitalbibliothek

Mehr über das NewsEye-Projekt erfahren

NewsEye-Projekt – historische Zeitungsdigitalisierung

Der Ansatz

Von Scans zu strukturiertem Text – so digitalisieren Institutionen Zeitungen im großen Maßstab

Die Zeitungsdigitalisierung folgt einem bewährten Workflow: Scans hochladen, aus 100+ vortrainierten Druck- und Frakturmodellen auswählen (oder eigene auf Ihre spezifischen Schrifttypen trainieren), Stapelverarbeitung mit automatischer Layoutanalyse starten und strukturierte Ergebnisse exportieren. Die KI bewältigt mehrspältige Layouts, gemischte Inhaltstypen und historische Schrifttypen – einschließlich Fraktur, Schwarzdruck und frühneuzeitlichem Druck.

100+ öffentliche Modelle für Fraktur, Schwarzdruck und historischen Druck

Automatische Layoutsegmentierung für mehrspältige Zeitungsseiten

Stapelverarbeitung für Tausende von Seiten – ohne manuellen Eingriff

Export als durchsuchbares PDF, reiner Text oder strukturiertes XML (ALTO, PAGE)

Wie man Zeitungen mit Transkribus digitalisiert

Wie man Zeitungen mit Transkribus digitalisiert

Schritt-für-Schritt-Anleitung: Scannen, Layoutsegmentierung, Modellauswahl und Texterkennung für historische Zeitungen.

Anleitung

Anleitung lesen

KI-Modelle für Fraktur, Kurrent & Sütterlin

Die häufigsten historischen deutschen Druck- und Handschrifttypen – und die öffentlichen Modelle, die sie lesen können.

Modelle

Modelle ansehen

Reduzierung archivarischer Rückstände

Wie Archive KI einsetzen, um Millionen nicht durchsuchbarer Seiten zu verarbeiten – derselbe Ansatz, der auf Zeitungssammlungen angewendet werden kann.

Anwendungsfall

Mehr erfahren

Bereit, Ihr Zeitungsarchiv durchsuchbar zu machen?

Sprechen Sie mit unserem Team über Ihre Sammlung. Wir helfen Ihnen, die richtigen Modelle zu finden, den Workflow zu planen und den Umfang abzuschätzen.

Beratungsgespräch buchen Kostenlos starten

30M+verarbeitete Zeitungsseiten

100+öffentliche Druckmodelle

EU-gehostetDSGVO-konform

Ihr Zeitungsarchiv – vollständig durchsuchbar.

Die Ausgabe

Durchsuchbarer Volltext

Strukturierte Layoutdaten

Eine durchblätterbare Online-Sammlung

Zeitpunkt.NRW: 20 Millionen Zeitungsseiten für Nordrhein-Westfalen

NewsEye: Verbesserung der Zeitungstexterkennung mit der Nationalbibliothek Finnlands

Von Scans zu strukturiertem Text – so digitalisieren Institutionen Zeitungen im großen Maßstab

Anleitungen und Modelle

Wie man Zeitungen mit Transkribus digitalisiert

KI-Modelle für Fraktur, Kurrent & Sütterlin

Reduzierung archivarischer Rückstände

Bereit, Ihr Zeitungsarchiv durchsuchbar zu machen?