Die KI-Plattform, entwickelt für die geisteswissenschaftliche Forschung.
Transkribus bietet Ihnen eine vollständige Pipeline vom Dokumentbild zu strukturiertem, durchsuchbarem Text – mit Modelltraining, Layoutanalyse, Entitäts-Tagging und TEI-XML-Export. Kein Coding erforderlich. Entstanden aus EU-geförderter Forschung, von einer Genossenschaft aus 250+ Institutionen getragen und an 40+ Universitäten genutzt.

Die Forschungspipeline
Vom Dokumentbild zu strukturierten Forschungsdaten – was Transkribus Ihnen in jeder Phase bietet.

Maschinenlesbarer Text aus jeder Schrift
Handschrifterkennung (HTR) wandelt Dokumentbilder in bearbeitbaren, durchsuchbaren Text um. Über 300 öffentliche Modelle decken Schriften von mittelalterlichem Latein bis zum Kurrent des 20. Jahrhunderts ab. Trainieren Sie Ihr eigenes Modell auf 50 Seiten Ground Truth, wenn nichts passt.

Strukturierte Daten, nicht nur Rohtext
Tabellenerkennung, Feldextraktion und Entitäts-Tagging verwandeln unstrukturierte Dokumente in strukturierte Datensätze. Namen, Daten, Orte und Beziehungen extrahieren – bereit für Datenbanken, Tabellenkalkulationen oder computergestützte Analysen.

Veröffentlichte und zitierbare Editionen
Export als TEI-XML für wissenschaftliche Editionen oder direkte Veröffentlichung als durchsuchbare Transkribus-Site. Ihre Transkriptionen werden zu einem zitierbaren, zugänglichen Forschungsoutput – kein bloßes Arbeitsdokument auf Ihrem Laptop.
Für rigorose Forschung
Reproduzierbar, versioniert, dokumentiert

Kein Coding erforderlich
Benutzerdefinierte KI-Modelle in einer visuellen Oberfläche trainieren

Ressourcen für DH-Forschende
Anleitungen, Methodik und Tools zur Integration von Transkribus in Ihre Forschung.
Wie Sie HTR in Ihren Förderantrag integrieren
Beispielmethodiktext, CER-Benchmarks und Datenmanagement-Hinweise für DFG, ERC, NEH, AHRC und andere Förderinstitutionen.
Zeichenfehlerrate (CER) erklärt
Die Standardgenauigkeitsmetrik für HTR – wie sie berechnet wird, welche Benchmarks zu erwarten sind und wie sie berichtet wird.
Öffentliche Modelle durchsuchen
300+ von der Community trainierte Modelle für Schriften von mittelalterlichem Latein bis zum Kurrent des 20. Jahrhunderts. Finden Sie einen Ausgangspunkt für Ihre Dokumente.
Starten Sie Ihr Forschungsprojekt mit Transkribus
Starten Sie kostenlos mit 50 Credits pro Monat – genug, um Hunderte von Seiten zu verarbeiten. Für größere Projekte sprechen Sie mit unserem Team über institutionelle Tarife und Forschungspartnerschaften.