Character Error Rate (CER) — Die Standardmetrik für Transkriptionsgenauigkeit
Die CER (Zeichenfehlerrate) ist die meistverwendete Metrik zur Bewertung der Handschrifterkennung. Sie misst den Prozentsatz der Zeichen, die zwischen einer KI-Transkription und einer manuell verifizierten Referenz abweichen — und ist die Kennzahl, nach der Gutachter, Fördergeber und Kolleginnen und Kollegen fragen werden.
Wie die CER berechnet wird
Die Character Error Rate misst die Editierdistanz zwischen der KI-Transkription und dem Ground Truth, normalisiert durch die Länge des Referenztextes.
S = substitutions, D = deletions, I = insertions, N = total characters in the reference text. A CER of 20.0% means 5 out of 25 characters differ.
Ausgezeichnet
Publikationsreife Genauigkeit. Geeignet für kritische Editionen und wissenschaftliche Arbeiten mit minimalem manuellem Korrekturaufwand.
Gut
Geeignet für die meisten Forschungsabläufe. Stichprobenartige Überprüfung und Korrektur zentraler Passagen vor der Veröffentlichung.
Überprüfung nötig
Brauchbar für Stichwortsuche und Indexierung. Erwägen Sie das Training eines eigenen Modells für bessere Ergebnisse.
Wie viel Ground Truth benötigen Sie?
Die benötigte Menge an Trainingsdaten hängt von Ihrem Material, der angestrebten Genauigkeit und der Anzahl unterschiedlicher Schreiberhände ab.
Einzelhand-Sammlungen
Bei Dokumenten, die von einer einzigen Person in gleichmässiger Handschrift verfasst wurden, genügen in der Regel 15–30 Seiten Ground Truth für gute Ergebnisse (CER unter 5 %).
Mehrhand-Sammlungen
Register, Gerichtsprotokolle oder Korrespondenzen mit vielen Schreiberhänden erfordern mehr Diversität in den Trainingsdaten — in der Regel 50–100 Seiten über verschiedene Hände hinweg.
Mit einem öffentlichen Modell beginnen
Über 300 vortrainierte Modelle stehen zur Verfügung. Beginnen Sie mit einem bestehenden Modell, evaluieren Sie dessen CER an Ihrem Material und trainieren Sie nur bei Bedarf ein eigenes Modell.
Iterative Verbesserung
Sie brauchen nicht alle Ground-Truth-Daten vorab. Beginnen Sie mit 15 Seiten, trainieren Sie, evaluieren Sie, ergänzen Sie weitere Seiten dort, wo das Modell Schwächen zeigt, und trainieren Sie erneut.
Ziel-CER hängt vom Anwendungsfall ab
Volltextsuche funktioniert bereits bei 5–8 % CER gut. Wissenschaftliche Editionen erfordern unter 2 %. Keyword Spotting toleriert sogar 10–15 %.
Qualität vor Quantität
Akkurate Ground Truth ist wichtiger als Menge. 20 sorgfältig korrigierte Seiten übertreffen 100 Seiten mit Fehlern in der Referenz.
So funktioniert die CER — Transkriptionsqualität auf einen Blick vergleichen
Jedes Beispiel zeigt eine Ground-Truth-Zeile und den zugehörigen erkannten Text. Abweichende Zeichen sind hervorgehoben. Die CER wird automatisch aus der Levenshtein-Editierdistanz berechnet.
Vergleichswerte
CER-Vergleichswerte nach Dokumenttyp
Die CER hängt in der Praxis vom Dokumenttyp, der Schriftart und dem verwendeten Modell ab. Die folgende Tabelle vergleicht typische Ergebnisse von Transkribus-KI-Modellen mit Standard-OCR-Systemen.
| Feature | Transkribus HTR | Standard-OCR |
|---|---|---|
| Printed modern text (post-1950) | 0.5–1% CER | 1–3% CER |
| Typewritten documents (1920s–1960s) | 1–3% CER | 3–8% CER |
| Handwritten 19th century | 2–5% CER | 15–30% CER |
| Kurrent / Sütterlin (18th–19th c.) | 3–8% CER | Fails |
| Medieval manuscripts | 5–15% CER | Fails |
Die Werte sind Richtwerte auf Basis gut passender Modelle. Die tatsächliche CER hängt vom Zustand des Dokuments, der Konsistenz der Handschrift und den Trainingsdaten des Modells ab.
Was beeinflusst die CER
Sechs Faktoren, die bestimmen, wie genau Ihre Dokumente transkribiert werden können — und was Sie bei jedem einzelnen tun können.
Dokumentqualität
Verblasste Tinte, Flecken, Durchschlag und physische Beschädigungen erzeugen Rauschen, das die Zeichenerkennung erschwert. Hochwertige Scans gut erhaltener Originale liefern die beste CER.
Schrifttyp
Moderne Kursivschrift ist leichter zu erkennen als Kurrent, Sütterlin oder mittelalterliche Buchschriften. Je weiter die Schrift von modernen Buchstabenformen entfernt ist, desto mehr Trainingsdaten benötigt das Modell.
Trainingsdaten des Modells
Ein Modell, das auf ähnlichem Material trainiert wurde, übertrifft ein generisches Modell deutlich. Individuelle Modelle mit 50–100 Seiten Ground Truth können die CER um die Hälfte oder mehr senken.
Bildauflösung
Scans mit 300 DPI oder höher bewahren feine Details, die zur Unterscheidung ähnlicher Zeichen nötig sind. Niedrige Auflösung erhöht Substitutionsfehler erheblich.
Layout-Komplexität
Mehrspaltiges Layout, Marginalien, Tabellen und Interlinearglossen erfordern eine präzise Layoutanalyse. Fehler bei der Textregion-Erkennung verschlechtern die effektive CER direkt.
Sprache
Sprachen mit komplexen Diakritika, nicht-lateinischen Schriften oder umfangreichen Ligaturen stellen zusätzliche Herausforderungen dar. Spezielle sprachspezifische Modelle erzielen in der Regel die besten Ergebnisse.
Das passende Modell finden
Finden Sie das passende Modell für Ihre Dokumente

Testen Sie Transkribus mit Ihren eigenen Dokumenten
Erstellen Sie ein kostenloses Konto und testen Sie, welche CER Sie mit Ihrem Material erreichen. Starten Sie mit einem öffentlichen Modell oder trainieren Sie Ihr eigenes.
50 kostenlose Credits pro Monat · Keine Kreditkarte erforderlich