Referenz

Character Error Rate (CER) — Die Standardmetrik für Transkriptionsgenauigkeit

Die CER (Zeichenfehlerrate) ist die meistverwendete Metrik zur Bewertung der Handschrifterkennung. Sie misst den Prozentsatz der Zeichen, die zwischen einer KI-Transkription und einer manuell verifizierten Referenz abweichen — und ist die Kennzahl, nach der Gutachter, Fördergeber und Kolleginnen und Kollegen fragen werden.

6 Min. Lesezeit

Wie die CER berechnet wird

Die Character Error Rate misst die Editierdistanz zwischen der KI-Transkription und dem Ground Truth, normalisiert durch die Länge des Referenztextes.

CER=S+D+IN

S = substitutions, D = deletions, I = insertions, N = total characters in the reference text. A CER of 20.0% means 5 out of 25 characters differ.

< 2%

Ausgezeichnet

Publikationsreife Genauigkeit. Geeignet für kritische Editionen und wissenschaftliche Arbeiten mit minimalem manuellem Korrekturaufwand.

2–5%

Gut

Geeignet für die meisten Forschungsabläufe. Stichprobenartige Überprüfung und Korrektur zentraler Passagen vor der Veröffentlichung.

5–10%

Überprüfung nötig

Brauchbar für Stichwortsuche und Indexierung. Erwägen Sie das Training eines eigenen Modells für bessere Ergebnisse.

Einzelhand-Sammlungen

Bei Dokumenten, die von einer einzigen Person in gleichmässiger Handschrift verfasst wurden, genügen in der Regel 15–30 Seiten Ground Truth für gute Ergebnisse (CER unter 5 %).

Mehrhand-Sammlungen

Register, Gerichtsprotokolle oder Korrespondenzen mit vielen Schreiberhänden erfordern mehr Diversität in den Trainingsdaten — in der Regel 50–100 Seiten über verschiedene Hände hinweg.

Mit einem öffentlichen Modell beginnen

Über 300 vortrainierte Modelle stehen zur Verfügung. Beginnen Sie mit einem bestehenden Modell, evaluieren Sie dessen CER an Ihrem Material und trainieren Sie nur bei Bedarf ein eigenes Modell.

Iterative Verbesserung

Sie brauchen nicht alle Ground-Truth-Daten vorab. Beginnen Sie mit 15 Seiten, trainieren Sie, evaluieren Sie, ergänzen Sie weitere Seiten dort, wo das Modell Schwächen zeigt, und trainieren Sie erneut.

Ziel-CER hängt vom Anwendungsfall ab

Volltextsuche funktioniert bereits bei 5–8 % CER gut. Wissenschaftliche Editionen erfordern unter 2 %. Keyword Spotting toleriert sogar 10–15 %.

Qualität vor Quantität

Akkurate Ground Truth ist wichtiger als Menge. 20 sorgfältig korrigierte Seiten übertreffen 100 Seiten mit Fehlern in der Referenz.

So funktioniert die CER — Transkriptionsqualität auf einen Blick vergleichen

Jedes Beispiel zeigt eine Ground-Truth-Zeile und den zugehörigen erkannten Text. Abweichende Zeichen sind hervorgehoben. Die CER wird automatisch aus der Levenshtein-Editierdistanz berechnet.

Ground Truth

Am 15. März 1782 erschien vor dem Gericht der Bürger Johann Georg Müller

Recognised Text

Am 15. März 1782 erschien vor dem Gericht der Bürger Johann Georg Muller

Correct Substitution Insertion Deletion

72Total chars

71Correct

1Substitutions

0Insertions

0Deletions

CER = (1 + 0 + 0) / 72= 1.4%

Vergleichswerte

CER-Vergleichswerte nach Dokumenttyp

Die CER hängt in der Praxis vom Dokumenttyp, der Schriftart und dem verwendeten Modell ab. Die folgende Tabelle vergleicht typische Ergebnisse von Transkribus-KI-Modellen mit Standard-OCR-Systemen.

Feature	Transkribus HTR	Standard-OCR
Printed modern text (post-1950)	0.5–1% CER	1–3% CER
Typewritten documents (1920s–1960s)	1–3% CER	3–8% CER
Handwritten 19th century	2–5% CER	15–30% CER
Kurrent / Sütterlin (18th–19th c.)	3–8% CER	Fails
Medieval manuscripts	5–15% CER	Fails

Die Werte sind Richtwerte auf Basis gut passender Modelle. Die tatsächliche CER hängt vom Zustand des Dokuments, der Konsistenz der Handschrift und den Trainingsdaten des Modells ab.

Dokumentqualität

Verblasste Tinte, Flecken, Durchschlag und physische Beschädigungen erzeugen Rauschen, das die Zeichenerkennung erschwert. Hochwertige Scans gut erhaltener Originale liefern die beste CER.

Schrifttyp

Moderne Kursivschrift ist leichter zu erkennen als Kurrent, Sütterlin oder mittelalterliche Buchschriften. Je weiter die Schrift von modernen Buchstabenformen entfernt ist, desto mehr Trainingsdaten benötigt das Modell.

Trainingsdaten des Modells

Ein Modell, das auf ähnlichem Material trainiert wurde, übertrifft ein generisches Modell deutlich. Individuelle Modelle mit 50–100 Seiten Ground Truth können die CER um die Hälfte oder mehr senken.

Bildauflösung

Scans mit 300 DPI oder höher bewahren feine Details, die zur Unterscheidung ähnlicher Zeichen nötig sind. Niedrige Auflösung erhöht Substitutionsfehler erheblich.

Layout-Komplexität

Mehrspaltiges Layout, Marginalien, Tabellen und Interlinearglossen erfordern eine präzise Layoutanalyse. Fehler bei der Textregion-Erkennung verschlechtern die effektive CER direkt.

Sprache

Sprachen mit komplexen Diakritika, nicht-lateinischen Schriften oder umfangreichen Ligaturen stellen zusätzliche Herausforderungen dar. Spezielle sprachspezifische Modelle erzielen in der Regel die besten Ergebnisse.

Das passende Modell finden

Finden Sie das passende Modell für Ihre Dokumente

Durchsuchen Sie über 300 öffentliche KI-Modelle im Transkribus-Modellkatalog. Filtern Sie nach Sprache, Schrifttyp und Jahrhundert, um Modelle zu finden, die zu Ihrem Material passen — und prüfen Sie die veröffentlichten CER-Werte, bevor Sie starten.

Öffentliche Modelle durchsuchen

Mit Transkribus transkribiertes historisches Protokolldokument

Auf Vertrauen gebaut, von der Community getragen.

Transkribus wird in Europa von einer Genossenschaft aus Forschungseinrichtungen, Archiven und Bibliotheken entwickelt und gehostet. Ihre Daten bleiben unter Ihrer Kontrolle.

Ihre Daten gehören Ihnen

Volle Datenhoheit. Jederzeit löschbar.

Gehostet in Österreich, EU

Verarbeitung ausschließlich auf eigenen Servern. DSGVO-konform. Keine Abhängigkeit von Drittanbieter-Clouds.

Genossenschaft, kein Startup

Hunderte Universitäten, Archive und Bibliotheken als Miteigentümer. Auf Jahrzehnte gebaut, nicht auf einen VC-Exit.

Testen Sie Transkribus mit Ihren eigenen Dokumenten

Erstellen Sie ein kostenloses Konto und testen Sie, welche CER Sie mit Ihrem Material erreichen. Starten Sie mit einem öffentlichen Modell oder trainieren Sie Ihr eigenes.

Kostenlos starten Öffentliche Modelle durchsuchen

50 kostenlose Credits pro Monat · Keine Kreditkarte erforderlich

200 Mio.+Verarbeitete Seiten

500.000+Nutzer weltweit

300+Öffentliche KI-Modelle