Skip to content
  • Preise

Was ist Handschrifterkennung (HTR)?

Handschrifterkennung nutzt Deep Learning, um handschriftliche Dokumente in maschinenlesbaren Text umzuwandeln. Im Gegensatz zu Standard-OCR wird HTR auf echten Handschriftproben trainiert und kann historische Schriften, Kursivschrift und verbundene Buchstabenformen entziffern.

HTR erklärtSo funktioniert esHTR vs. OCRAnwendungen

Ziehen Sie hier ein Bild rein

Datei auswählen...

PNG oder JPG bis zu 10 Mb

Wolpi
AI Assistant

Mit dem Hochladen eines Bildes akzeptieren Sie unsere AGB und unsere Datenschutzrichtlinie.

Probieren Sie es aus — laden Sie ein handschriftliches Dokument hoch und erleben Sie HTR in Aktion. Genutzt an 500+ Universitäten weltweit.

500.000+
Nutzer weltweit
200 Mio.+
Verarbeitete Seiten
300+
Öffentliche HTR-Modelle
100+
Sprachen und Schriften

Das Problem

Warum Standard-OCR an Handschrift scheitert

Optische Zeichenerkennung (OCR) wurde für gedruckten Text entwickelt — einheitliche Schriftarten mit gleichmäßigem Buchstabenabstand und vorhersehbaren Layouts. Bei handschriftlichen Dokumenten liefert Standard-OCR unbrauchbare Ergebnisse. Handschrift ist von Natur aus variabel: Buchstabenformen unterscheiden sich zwischen Schreibern, Zeichen verbinden sich auf unvorhersehbare Weise, und historische Schriften wie Kurrent, Sütterlin oder Kanzleischrift haben wenig Ähnlichkeit mit modernem Druck. Dies ist das Kernproblem, für dessen Lösung die Handschrifterkennung (HTR) entwickelt wurde.
Standard-OCR-Engines erwarten einheitliche Zeichenformen — Handschrift variiert zwischen jedem Schreiber und sogar innerhalb einer einzelnen Seite
Verbundene und kursive Schriften können nicht in einzelne Zeichen segmentiert werden wie gedruckter Text
Historische Schriften (Kurrent, Sütterlin, Kanzleischrift) verwenden Buchstabenformen, die in modernen OCR-Trainingsdaten nicht vorkommen
Abkürzungen, Ligaturen und Hochstellungskonventionen in historischen Handschriften haben kein Äquivalent im Druck
Dokumentendegradation — verblasste Tinte, Durchschlagen, Stockflecken — verschärft die Herausforderung über das hinaus, was regelbasierte Systeme bewältigen
Vergleich: OCR-Ausgabe versus HTR-Ausgabe bei einem handschriftlichen Dokument

Die Lösung

Wie funktioniert HTR? KI-Handschrifterkennung erklärt

Handschrifterkennung verwendet tiefe neuronale Netze — typischerweise eine Kombination aus Convolutional Neural Networks (CNNs) und Recurrent Neural Networks (RNNs) — um die visuellen Muster von Handschrift direkt aus annotierten Beispielen zu lernen. Statt auf vordefinierte Regeln über das Aussehen von Buchstaben zu setzen, wird ein HTR-Modell auf Tausenden von Bildern trainiert, die mit ihren korrekten Transkriptionen gepaart sind (genannt Ground Truth). Durch dieses Training lernt das Modell nicht nur einzelne Zeichen zu erkennen, sondern auch Sequenzen verbundener Striche, kontextuelle Buchstabenformen und die räumlichen Beziehungen zwischen Textelementen auf einer Seite.
Layoutanalyse erkennt Textregionen, Zeilen und Strukturelemente (Spalten, Tabellen, Marginalien) auf der Seite
Zeilensegmentierung isoliert einzelne Textzeilen aus dem erkannten Layout
Das neuronale Netz verarbeitet jedes Zeilenbild und sagt eine Zeichensequenz vorher, unter Berücksichtigung des Kontexts umgebender Striche
Sprachmodellierung und Nachverarbeitung verfeinern die Ausgabe und lösen mehrdeutige Zeichen anhand statistischer Muster auf
Konfidenzwerte werden jedem vorhergesagten Zeichen und jeder Zeile zugewiesen, was gezielte Qualitätskontrolle ermöglicht
Document
Addres to dear Isabella on the Authors
recovery
O Isa pain did visit me
I was at the last extremity
How often did I think of you
I wished your graceful form to view
To clasp you in my weak embrace
Indeed I thought Id run my race
Good Care Im sure was of me taken
But indeed I was much shaken
At last I daily strength did gain

HTR vs OCR

Handschrifterkennung (HTR) vs. Optische Zeichenerkennung (OCR)

HTR und OCR sind verwandte Technologien, adressieren aber grundlegend unterschiedliche Herausforderungen. Das Verständnis dieses Unterschieds ist wichtig bei der Bewertung von Werkzeugen für die historische Dokumentenverarbeitung.

FeatureHTR (Handschrifterkennung)Standard-OCR
Konzipiert fürHandschriftlichen und kursiven TextGedruckten und maschinengeschriebenen Text
ZeichensegmentierungNicht erforderlich — verarbeitet verbundene Striche als SequenzenErfordert Isolierung einzelner Zeichen
Historische SchriftenKurrent, Sütterlin, Kanzleischrift, Copperplate und 100+ weitereEingeschränkte oder keine Unterstützung
TrainingsansatzDeep Learning auf annotierten Handschriftproben (Ground Truth)Regelbasierter Musterabgleich oder auf Drucktext trainierte Modelle
AnpassungsfähigkeitEigene Modelle können für bestimmte Hände oder Schriften trainiert werdenGenerell festgelegt — kann sich nicht an neue Handschriftstile anpassen
Genauigkeit bei HandschriftTypischerweise 90–98 % Zeichengenauigkeit mit trainierten ModellenOft unter 50 % bei Kursiv- oder historischer Handschrift
LayoutanalyseVerarbeitet komplexe Layouts: Spalten, Tabellen, MarginalienEinfach — nimmt simplen Links-nach-rechts-Textfluss an
Verbundene SchriftenJa — Arabisch, Hebräisch, kursive lateinische SchriftenEingeschränkt oder nicht unterstützt
Beschädigte DokumenteRobust — trainiert auf echten historischen Dokumenten mit BeschädigungenLeistung verschlechtert sich erheblich
KonfidenzwerteKonfidenzwerte pro Zeichen und pro ZeileVariiert — oft fehlend oder unzuverlässig

Vergleich spiegelt allgemeine Fähigkeiten von HTR-Systemen (einschließlich Transkribus) gegenüber Standard-OCR-Engines wider. Spezifische Ergebnisse hängen von Dokumenttyp, Modellauswahl und Dokumentenzustand ab.

Abdeckung

Welche Schriften, Sprachen und Jahrhunderte unterstützt HTR?

Moderne HTR-Plattformen — insbesondere Transkribus — unterstützen ein bemerkenswert breites Spektrum an Schriften, Sprachen und historischen Epochen. Der Schlüssel liegt in der Verfügbarkeit trainierter Modelle. Da HTR-Modelle aus Beispielen statt aus Regeln lernen, kann jede Schrift unterstützt werden, für die ausreichende Trainingsdaten existieren. Transkribus bietet über 300 öffentliche Modelle, die von Forschern und Institutionen weltweit beigesteuert wurden — darunter zahlreiche Modelle für deutschsprachige historische Dokumente vom 9. Jahrhundert bis heute.
Lateinische Schriften: moderne und historische Varianten einschließlich Kurrent, Sütterlin, Kanzleischrift, Copperplate, Humanistische und Gotische Kursive
Nicht-lateinische Schriften: Arabisch, Hebräisch, Griechisch, Kyrillisch, Devanagari, Chinesisch, Japanisch und mehr — mit verfügbaren oder trainierbaren Modellen
100+ Sprachen im öffentlichen Modellkatalog vertreten, von Deutsch und Englisch bis Finnisch, Ungarisch und Osmanisch-Türkisch
Zeitspanne von mittelalterlichen Handschriften (9. Jahrhundert) über frühneuzeitliche Verwaltungsakten bis zur Korrespondenz des 20. Jahrhunderts
Dokumente mit gemischten Schriften: Modelle können Seiten mit mehreren Schriften verarbeiten (z. B. lateinische Überschriften mit Kurrent-Fließtext)
Beispiele von HTR unterstützter Handschriften: Kurrent, Arabisch, Kanzleischrift und mehr

Genutzt an führenden Forschungseinrichtungen weltweit

Wer nutzt HTR

Handschrifterkennung in der Praxis

HTR hat die experimentelle Phase hinter sich gelassen und ist heute ein produktives Werkzeug in den Geisteswissenschaften, im Kulturerbe und in der Informationswissenschaft. Forschende nutzen es, um durchsuchbare Korpora aus Handschriftensammlungen aufzubauen. Archive verarbeiten damit Rückstände unerschlossener Bestände. Bibliotheken machen Sondersammlungen auffindbar. Besonders dort, wo das schiere Volumen handschriftlichen Materials eine manuelle Transkription wirtschaftlich unmöglich macht, entfaltet die Technologie ihre transformative Wirkung.
Digital-Humanities-Forschende, die Korrespondenz, Tagebücher und literarische Handschriften für wissenschaftliche Editionen transkribieren
National- und Kommunalarchive, die Verwaltungsakten, Gerichtsdokumente und Standesamtsregister im großen Maßstab verarbeiten
Bibliotheken und Sondersammlungen, die Findmittel und Katalogeinträge durchsuchbar und auffindbar machen
Genealogen, die Kirchenbücher, Volkszählungsunterlagen und Standesamtsurkunden in historischen Schriften lesen
Kulturerbeprojekte, die bedrohte Handschriftensammlungen vor dem physischen Verfall digitalisieren
Historical notarial document — one of many document types HTR handles in practice

Über die Erkennung hinaus

Die gesamte Pipeline: Vom handschriftlichen Dokument zu strukturierten Daten

Handschrifterkennung ist ein Schritt in einer umfassenderen Dokumentenverarbeitungs-Pipeline. Ein vollständiger Workflow beginnt mit der Digitalisierung (Scannen oder Fotografieren), setzt sich mit Layoutanalyse und Texterkennung fort und mündet in die Nachbearbeitung: Entitätenerkennung, Metadatenextraktion, strukturierter Export und Publikation. Transkribus integriert all diese Schritte in einer einzigen Plattform, sodass Forschende nicht separate Werkzeuge für jeden einzelnen Arbeitsschritt zusammenführen müssen.
Layoutanalyse: automatische Erkennung von Textbereichen, Spalten, Tabellen, Überschriften und Marginalien
Texterkennung: HTR wandelt erkannte Textzeilen in maschinenlesbare Zeichen um
Eigene Modelle trainieren: Feinabstimmung auf Ihren spezifischen Handschriftentyp für höhere Genauigkeit
Entitätenerkennung und Tagging: Personen, Orte, Daten und andere benannte Entitäten im transkribierten Text identifizieren
Export als TEI-XML, PAGE XML, ALTO XML, durchsuchbares PDF oder Klartext — bereit für Analyse, Publikation oder Archivübernahme
Die vollständige Dokumentenverarbeitungs-Pipeline: Vom Scan zu strukturierten Daten

Häufig gestellte Fragen zur Handschrifterkennung

OCR (Optische Zeichenerkennung) wurde für gedruckten Text entwickelt und funktioniert durch den Abgleich einzelner Zeichenformen mit bekannten Schriftarten. HTR (Handschrifterkennung) nutzt Deep Learning, um verbundene, variable Handschrift als Strichsequenzen statt als isolierte Zeichen zu verarbeiten. HTR kann Kursivschriften, historische Schreiberhände und die natürliche Variation von Handschrift bewältigen — Aufgaben, an denen Standard-OCR typischerweise scheitert. Kurz gesagt: OCR liest Drucktext, HTR liest Handschrift.
HTR-Modelle werden auf gepaarten Datensätzen namens Ground Truth trainiert: Bilder von handschriftlichem Text, die mit ihren korrekten Transkriptionen verknüpft sind. Das neuronale Netz lernt, visuelle Muster in der Handschrift auf Zeichensequenzen abzubilden. Für ein eigenes Modell werden typischerweise 50–100 transkribierte Seiten benötigt, wobei größere Datensätze die Genauigkeit verbessern. Das Modell lernt nicht nur Buchstabenformen, sondern kontextuelle Muster — wie Zeichen verbunden werden, häufige Abkürzungen und schriftspezifische Konventionen.
Die Genauigkeit wird anhand der Zeichenfehlerrate (CER) gemessen — dem Prozentsatz der Zeichen, die zwischen der HTR-Ausgabe und dem korrekten Text abweichen. Gut trainierte Modelle auf leserlichen Schriften erreichen routinemäßig eine CER unter 5 % (über 95 % Zeichengenauigkeit). Anspruchsvolle Dokumente — stark beschädigt, verblasst oder in ungewöhnlichen Schriften — können vor dem eigenen Training eine CER von 10–15 % ergeben. Nach der Feinabstimmung eines Modells auf Ihren spezifischen Dokumenttyp verbessert sich die Genauigkeit typischerweise erheblich.
HTR funktioniert bei praktisch jedem handschriftlichen Dokument, für das ein trainiertes Modell existiert oder erstellt werden kann: Briefe, Tagebücher, Kirchenbücher, Gerichtsakten, Verwaltungsakten, Volkszählungsunterlagen, wissenschaftliche Notizbücher, literarische Handschriften, Grundbuchauszüge und mehr. Es verarbeitet auch gemischte Dokumente mit sowohl Druck als auch Handschrift. Die Hauptanforderung ist ein Modell, das auf eine ähnliche Schrift und einen ähnlichen Dokumenttyp trainiert wurde.
Transkribus, die führende HTR-Plattform, bietet jeden Monat 50 kostenlose Credits — ausreichend für die Verarbeitung von etwa 50 Seiten. Keine Kreditkarte erforderlich. Bezahlte Pläne sind für Forscher und Institutionen verfügbar, die größere Volumina verarbeiten. Details unter Pläne und Preise.
Eine einzelne Seite benötigt typischerweise 15–30 Sekunden Verarbeitungszeit, abhängig von der Dokumentenkomplexität und dem verwendeten Modell. Batch-Verarbeitung ermöglicht es, Hunderte oder Tausende von Seiten automatisch in die Warteschlange einzureihen und zu verarbeiten. Eine 500-seitige Handschrift kann in unter einer Stunde transkribiert werden — Arbeit, die von Hand Wochen oder Monate dauern würde.
Transkribus bietet über 300 öffentliche HTR-Modelle für 100+ Sprachen und Schriften. Dazu gehören Sprachen mit lateinischer Schrift (Deutsch, Englisch, Französisch, Spanisch, Niederländisch, Schwedisch und viele weitere) sowie Arabisch, Hebräisch, Griechisch, Kyrillisch und andere Schriftsysteme. Historische Schriften wie Kurrent, Sütterlin, Kanzleischrift und Copperplate sind gut vertreten. Falls kein Modell für Ihre spezifische Schrift existiert, können Sie ein eigenes Modell trainieren.
EUAT

Für die Forschung gebaut. In Europa gehostet. Offen und genossenschaftlich.

Transkribus wird von der READ-COOP SCE entwickelt und gehostet — einer europäischen Genossenschaft mit über 250 Mitgliedsinstitutionen. Ihre Daten bleiben Ihre Daten.

Ihre Daten bleiben bei Ihnen

Volles Eigentum. Jederzeit löschbar.

Gehostet in Österreich, EU

Verarbeitung auf unseren eigenen Servern. DSGVO-konform. Keine Cloud-Abhängigkeiten.

Genossenschaft, kein Startup

Tausende Archive, Bibliotheken und Universitäten als Miteigentümer. Gebaut für Jahrzehnte, nicht für einen VC-Exit.

HTR in Aktion erleben

Anwendungsbeispiele entdecken

HTR-Anwendungen in der Praxis

Bereit, Handschrifterkennung auszuprobieren?

Erstellen Sie ein kostenloses Konto und verarbeiten Sie Ihre ersten Dokumente mit Transkribus. 50 kostenlose Credits pro Monat — keine Kreditkarte nötig.

Genutzt an 500+ Universitäten und Forschungseinrichtungen

200 Mio.+Verarbeitete Seiten
500.000+Nutzer weltweit
300+Öffentliche HTR-Modelle