Skip to content
  • Preise

Historische Tabellen in strukturierte Daten verwandeln

Transkribus Tabellenmodelle nutzen Instanzsegmentierung, um Zeilen und Spalten in Dokumentenbildern zu erkennen und tabellarische Daten mit unerreichter Genauigkeit in Tabellenkalkulationen zu extrahieren.

Eigenes Modell trainieren
Table document with detected grid

Sehen Sie die Extraktion in Aktion

Tabellenmodelle erkennen die Rasterstruktur Ihres Dokuments und extrahieren den Inhalt jeder Zelle in eine strukturierte Tabellenkalkulation, die Sie exportieren können.

Document example
Extracted Data
InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914, 5/18/16
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914, 8/7/16
Fessenden Acad. & Ind. SchoolFessenden, Fla.General12/22/16
Florida Baptist Academy (2)Jacksonville, Fla.General4/27/17
Fort Valley High & Ind. SchoolFort Valley, Ga.12,500Building12/15/17
Fisk UniversityNashville, Tenn.50,000General12/5/18
First Dist. State Normal SchoolKirksville, Mo.Library Building2/26/19Gen. 3/3/19

Für jede Art von tabellarischem Dokument entwickelt

Von Mitgliederlisten bis zu Volkszählungsunterlagen – Tabellenmodelle verarbeiten das gesamte Spektrum historischer Tabellen mit gleichbleibender Genauigkeit.

Mitgliederverzeichnisse & Kassenbücher

Handschriftliche Mitgliederlisten, Vereinsregister und Finanzbücher mit klar definierten Spalten. Tabellenmodelle sind besonders stark bei diesen gleichmäßigen Rasterstrukturen und erkennen Zeilen und Spalten präzise, selbst wenn die Handschrift zwischen den Einträgen stark variiert.

Columns detected:NumberYearNameOccupationResidenceNotes
Document example

Volkszählungs- & Statistiktabellen

Gedruckte Volkszählungsformulare, Bevölkerungserhebungen und statistische Tabellen mit komplexen Kopfzeilen. Selbst vorgedruckte Formulare mit feinen Rasterlinien werden zuverlässig verarbeitet und verwandeln Seiten voller demografischer Daten in nutzbare Tabellenkalkulationen für großangelegte Analysen.

Columns detected:DistrictsCountiesPopulationTotal DistrictsCounty Towns
Document example

Mehrzeilige Einträge & schiefe Zeilen

Antragsregister und ausführliche Aufzeichnungen, bei denen Zellen mehrere Textzeilen enthalten. Tabellenmodelle verarbeiten mehrzeilige Inhalte innerhalb von Zellen mühelos, und selbst schiefe oder gedrehte Zeilentrennlinien werden dank Instanzsegmentierung korrekt erkannt.

Columns detected:NameDateAgePlaceApplicationDecision
Document example

Verwaltungs- & Institutionstabellen

Schulunterlagen, Finanzberichte und Verwaltungstabellen mit vielen Spalten handschriftlicher Daten. Ob Ihre Tabelle 3 oder 30 Spalten hat – Tabellenmodelle erkennen die Struktur zuverlässig über Hunderte von Seiten hinweg.

Columns detected:InstitutionTownAmountObjectDateDisposition
Document example

Strukturierte Ausgabe, sofort einsatzbereit

Jede erkannte Zelle wird ihrer Zeilen- und Spaltenposition zugeordnet, sodass Sie saubere, strukturierte Daten erhalten, die Sie direkt exportieren können.

PAGE XML
<TableRegion id="t1">
  <Coords points="0,646 0,4014 6060,4013 6060,638"/>
  <TableCell row="0" col="0">
    <Coords points="0,646 0,822 1548,822 1548,644"/>
    <TextLine>
      <Unicode>Franklin College (6)</Unicode>
    </TextLine>
  </TableCell>
  <TableCell row="0" col="1">
    <Coords points="1548,644 1548,822 2241,822 2241,644"/>
    <TextLine>
      <Unicode>New Athen, O.</Unicode>
    </TextLine>
  </TableCell>
  <!-- ... -->
</TableRegion>
Tabellenexport
InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914
Fessenden Acad.Fessenden, Fla.General12/22/16

Exportieren Sie Ihre Tabellen in verschiedenen Formaten

XLSXCSVPAGE XMLTEIALTO

So funktionieren Tabellenmodelle

Eine dreistufige Pipeline verwandelt Ihre Dokumentenbilder in strukturierte tabellarische Daten.

1

Tabellenstrukturerkennung

Zwei Instanzsegmentierungsmodelle arbeiten parallel: Eines erkennt horizontale Zeilentrennlinien, das andere vertikale Spaltentrennlinien. Die Ergebnisse werden zu einer vollständigen Rasterstruktur zusammengeführt.

Table structure recognition
2

Textzeilenerkennung

Innerhalb jeder erkannten Zelle werden Textgrundlinien identifiziert. Dieser Schritt verarbeitet mehrzeilige Zellen mühelos und erkennt jede Textzeile unabhängig von der Zellhöhe.

Text line detection
3

Texterkennung

Ein HTR-Modell liest die erkannten Textzeilen und erstellt die endgültige Transkription. Das Ergebnis ist eine strukturierte Tabellenkalkulation, in der jeder Wert seiner Zeile und Spalte zugeordnet ist.

InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914

So trainieren Sie ein Table Model

Table Models sind keine fertigen Modelle — Sie trainieren sie auf Ihren spezifischen Dokumenten. So sieht der Prozess aus.

1

Tabellen annotieren

Öffnen Sie Ihre Dokumente in Transkribus und zeichnen Sie die Zeilen- und Spaltenstruktur auf jeder Seite ein. Markieren Sie jeden Zeilen- und Spaltentrenner, damit das Modell Ihr spezifisches Tabellenlayout lernen kann.

2

Trainieren

Sobald Sie etwa 20 Seiten annotiert haben (mehr bei komplexen Layouts), reichen Sie diese ein, um Ihr eigenes Table Model zu trainieren. Das Training dauert in der Regel einige Stunden.

~20 annotierte Seiten
3

Anwenden & iterieren

Wenden Sie Ihr trainiertes Modell auf neue Dokumente an — es erkennt automatisch Tabellenstrukturen und extrahiert Zellinhalte. Nutzen Sie die Ergebnisse, um Fehler zu korrigieren, weitere Trainingsseiten hinzuzufügen und für noch bessere Genauigkeit neu zu trainieren.

Auto

Trainieren Sie Ihr eigenes Tabellenmodell

Starten Sie mit nur 20 annotierten Seiten und verbessern Sie die Genauigkeit Ihres Modells iterativ.

0Seiten zum Starten

Für einfache, einheitliche Tabellen reichen 20 annotierte Seiten aus, um ein erstes funktionsfähiges Modell zu trainieren.

0%MAP für gute Ergebnisse

Eine Mean Average Precision von 35 % oder höher liefert in der Praxis bereits eine zuverlässige Tabellenerkennung.

Tipps von den Experten

  • Beginnen Sie mit einfachen, einheitlichen Tabellen und erweitern Sie später auf komplexere Layouts
  • Schließen Sie Kopfzeilen beim ersten Training aus, um die Struktur konsistent zu halten
  • Verwenden Sie 50–100 Seiten für komplexe oder gemischte Tabellenlayouts
  • Iterieren: trainieren, bewerten, Fehler korrigieren, erneut trainieren für beste Ergebnisse
  • Tabellenmodelle eignen sich am besten für strikte Rasterstrukturen – für Formulare und unregelmäßige Layouts verwenden Sie stattdessen Feldmodelle

Tabellenmodelle vs. Feldmodelle

Wählen Sie das richtige Werkzeug für Ihre Dokumentstruktur.

Tabellenmodelle

Ideal für einheitliche Rasterstrukturen, bei denen Daten in konsistenten Zeilen und Spalten organisiert sind.

  • Zeilen × Spalten Rastererkennung
  • Mehrzeiliger Text pro Zelle
  • Schiefe Zeilen und Spalten werden unterstützt
  • Export als XLSX, CSV, PAGE XML
  • Ideal für: Register, Kassenbücher, Volkszählungstabellen

Feldmodelle

Ideal für komplexe Layouts, Formulare und Dokumente, bei denen Bereiche unregelmäßige Formen haben.

  • Markierte Bereiche jeder Form
  • Unregelmäßige und überlappende Bereiche
  • Benutzerdefinierte Feldtypen und Bezeichnungen
  • Funktioniert für jede Dokumentstruktur
  • Ideal für: Formulare, Briefe, Karteikarten

Starten Sie noch heute mit der Extraktion tabellarischer Daten

Trainieren Sie ein individuelles Tabellenmodell auf Ihren Dokumenten und erschließen Sie strukturierte Daten aus Tausenden handschriftlicher Tabellen.