Das Problem
Die Krise der verborgenen Bestände: Digitalisierungsrückstände in Archiven wachsen weiter

Die Lösung
Archiv-Rückstau mit KI abbauen: Von unbearbeiteten Kartons zu durchsuchbaren Aufzeichnungen

Vergleich
KI-gestützte Verarbeitung vs. manuelle Transkription für Archive
Archive stehen vor einem grundlegenden Durchsatzproblem: Millionen von Seiten warten darauf, katalogisiert, durchsuchbar und zugänglich gemacht zu werden. So schneidet KI-gestützte Verarbeitung im Vergleich zu traditionellen manuellen Arbeitsabläufen ab.
| Feature | Transkribus KI-Verarbeitung | Manuelle Transkription |
|---|---|---|
| Durchsatz | Tausende Seiten pro Tag mit Stapelverarbeitung – skaliert mit der Größe der Sammlung | Ein erfahrener Transkribierer bearbeitet je nach Schwierigkeitsgrad 5–15 Seiten pro Tag |
| Kosten pro Seite | Bruchteil eines Cents pro Seite mit kreditbasierter Abrechnung | Arbeitsintensiv – die Kosten steigen linear mit jeder Seite |
| Konsistenz | Dasselbe Modell liefert konsistente Ergebnisse über Tausende von Seiten hinweg | Qualität schwankt je nach Transkribierer, Ermüdung und unterschiedlicher Interpretation |
| Durchsuchbarkeit | Jede verarbeitete Seite wird sofort volltextdurchsuchbar | Nur transkribierte Seiten sind durchsuchbar – der Rückstand bleibt im Dunkeln |
| Umgang mit historischen Schriften | Über 300 öffentliche Modelle für Schriften vom 9. Jahrhundert bis heute | Erfordert paläographische Spezialkenntnisse – nur wenige Mitarbeiter verfügen darüber |
| Zeit bis zur Bereitstellung | Sammlungen werden innerhalb von Tagen oder Wochen nach der Digitalisierung zugänglich | Rückstände von Jahren oder Jahrzehnten sind in großen Institutionen üblich |
| Qualitätsprüfung | Konfidenzwerte markieren unsichere Zeilen für gezielte manuelle Überprüfung | Erfordert vollständiges Korrekturlesen jeder Transkription |
Der Vergleich bezieht sich auf typische institutionelle Arbeitsabläufe. KI-gestützte Verarbeitung funktioniert am besten als Ergänzung menschlicher Expertise – automatisierter erster Durchgang mit gezielter manueller Nachprüfung.
So verarbeiten Sie einen Archivbestand in 4 Schritten
Gescannte Bestände hochladen
Laden Sie ganze Serien oder Bestände als mehrseitige PDFs, TIFFs oder Bild-Batches hoch. Transkribus übernimmt die Layouterkennung — Spalten, Tabellen, Marginalien — automatisch.
KI-Modell auswählen
Wählen Sie aus 300+ öffentlichen Modellen, gefiltert nach Sprache, Jahrhundert und Schriftart. Bei gemischten Beständen können Sie verschiedene Modelle für unterschiedliche Dokumentgruppen innerhalb desselben Projekts verwenden.
Batch-Erkennung starten
Reihen Sie Tausende von Seiten zur Verarbeitung ein. Transkribus führt die Texterkennung im Hintergrund durch — kein manueller Eingriff erforderlich. Überwachen Sie den Fortschritt über das Dashboard.
Exportieren und integrieren
Exportieren Sie Ergebnisse als PAGE XML, ALTO XML, TEI-XML, Reintext oder durchsuchbares PDF. Importieren Sie direkt in ArchivesSpace, AtoM oder veröffentlichen Sie über Transkribus Sites.
Im großen Maßstab
Automatisierte Archivverarbeitung mit der Metagrapho-API
import requests
API = "https://transkribus.eu/processing/v1"
TOKEN = "your-api-token"
# 1. Upload collection
upload = requests.post(f"{API}/uploads",
headers={"Authorization": f"Bearer {TOKEN}"},
json={"collectionId": 12345}
)
# 2. Start recognition on all pages
job = requests.post(f"{API}/processes",
headers={"Authorization": f"Bearer {TOKEN}"},
json={
"docId": upload.json()["docId"],
"htrId": 53042, # model ID
"pages": "all"
}
)
# 3. Poll for completion
status = requests.get(
f"{API}/processes/{job.json()['processId']}",
headers={"Authorization": f"Bearer {TOKEN}"}
).json()
print(f"Status: {status['state']}")Häufig gestellte Fragen
Weiterführende Ressourcen
Mehr für Archive und Institutionen

Bereit, Ihren Archiv-Rückstau anzugehen?
Sprechen Sie mit unserem Team über institutionelle Pläne für die Verarbeitung großer Bestände, oder erstellen Sie ein kostenloses Konto zur Evaluierung.
Genutzt von über 2.000 Archiven und Bibliotheken weltweit