Skip to content
  • Tarifs

Transformez les tableaux historiques en données structurées

Les Table Models de Transkribus utilisent la segmentation d'instances pour détecter les lignes et les colonnes dans les images de documents, extrayant les données tabulaires dans des feuilles de calcul avec une précision inégalée.

Commencez à entraîner votre modèle
Table document with detected grid

Découvrez l'extraction en action

Les Table Models détectent la structure en grille de votre document et extraient le contenu de chaque cellule dans une feuille de calcul structurée que vous pouvez exporter.

Document example
Extracted Data
InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914, 5/18/16
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914, 8/7/16
Fessenden Acad. & Ind. SchoolFessenden, Fla.General12/22/16
Florida Baptist Academy (2)Jacksonville, Fla.General4/27/17
Fort Valley High & Ind. SchoolFort Valley, Ga.12,500Building12/15/17
Fisk UniversityNashville, Tenn.50,000General12/5/18
First Dist. State Normal SchoolKirksville, Mo.Library Building2/26/19Gen. 3/3/19

Conçu pour tous les types de documents tabulaires

Des registres d'adhésion aux recensements, les Table Models gèrent l'ensemble des tableaux historiques avec une précision constante.

Registres d'adhésion et livres comptables

Listes d'adhérents manuscrites, registres de sociétés et livres comptables avec des colonnes clairement définies. Les Table Models excellent dans ces structures de grille uniformes, détectant avec précision les lignes et les colonnes même lorsque l'écriture varie considérablement d'une entrée à l'autre.

Columns detected:NumberYearNameOccupationResidenceNotes
Document example

Tableaux de recensement et statistiques

Formulaires de recensement imprimés, enquêtes démographiques et tableaux statistiques avec des en-têtes complexes. Même les formulaires pré-imprimés avec des lignes de grille fines sont traités de manière fiable, transformant des pages de données démographiques en feuilles de calcul exploitables pour des analyses à grande échelle.

Columns detected:DistrictsCountiesPopulationTotal DistrictsCounty Towns
Document example

Entrées multilignes et lignes inclinées

Registres de demandes et dossiers détaillés où les cellules contiennent plusieurs lignes de texte. Les Table Models gèrent naturellement le contenu multiligne dans les cellules, et même les séparateurs de lignes inclinés ou tournés sont détectés correctement grâce à la segmentation d'instances.

Columns detected:NameDateAgePlaceApplicationDecision
Document example

Tableaux administratifs et institutionnels

Documents scolaires, états financiers et tableaux administratifs comportant de nombreuses colonnes de données manuscrites. Que votre tableau contienne 3 ou 30 colonnes, les Table Models s'adaptent pour reconnaître la structure avec précision sur des centaines de pages.

Columns detected:InstitutionTownAmountObjectDateDisposition
Document example

Sortie structurée, prête à l'emploi

Chaque cellule détectée est associée à sa position de ligne et de colonne, vous offrant des données structurées propres que vous pouvez exporter directement.

PAGE XML
<TableRegion id="t1">
  <Coords points="0,646 0,4014 6060,4013 6060,638"/>
  <TableCell row="0" col="0">
    <Coords points="0,646 0,822 1548,822 1548,644"/>
    <TextLine>
      <Unicode>Franklin College (6)</Unicode>
    </TextLine>
  </TableCell>
  <TableCell row="0" col="1">
    <Coords points="1548,644 1548,822 2241,822 2241,644"/>
    <TextLine>
      <Unicode>New Athen, O.</Unicode>
    </TextLine>
  </TableCell>
  <!-- ... -->
</TableRegion>
Export tableur
InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914
Fessenden Acad.Fessenden, Fla.General12/22/16

Exportez vos tableaux dans plusieurs formats

XLSXCSVPAGE XMLTEIALTO

Comment fonctionnent les Table Models

Un processus en trois étapes transforme vos images de documents en données tabulaires structurées.

1

Reconnaissance de la structure du tableau

Deux modèles de segmentation d'instances fonctionnent en parallèle : l'un détecte les séparateurs de lignes horizontaux, l'autre les séparateurs de colonnes verticaux. Les résultats sont fusionnés en une structure de grille complète.

Table structure recognition
2

Détection des lignes de texte

Au sein de chaque cellule détectée, les lignes de base du texte sont identifiées. Cette étape gère naturellement les cellules multilignes, détectant chaque ligne de texte quelle que soit la hauteur de la cellule.

Text line detection
3

Reconnaissance de texte

Un modèle HTR lit les lignes de texte détectées et produit la transcription finale. Le résultat est une feuille de calcul structurée avec chaque valeur associée à sa ligne et sa colonne.

InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914

Comment entraîner un Table Model

Les Table Models ne sont pas pré-construits — vous les entraînez sur vos documents spécifiques. Voici comment cela fonctionne.

1

Annoter vos tableaux

Ouvrez vos documents dans Transkribus et dessinez la structure des lignes et colonnes sur chaque page. Marquez chaque séparateur de ligne et de colonne pour que le modèle apprenne votre mise en page spécifique.

2

Entraîner

Une fois environ 20 pages annotées (davantage pour les mises en page complexes), soumettez-les pour entraîner votre Table Model personnalisé. L'entraînement prend généralement quelques heures.

~20 pages annotées
3

Appliquer & itérer

Appliquez votre modèle entraîné à de nouveaux documents — il détecte automatiquement les structures de tableaux et extrait le contenu des cellules. Utilisez les résultats pour corriger les erreurs, ajouter des pages et ré-entraîner.

Auto

Entraînez votre propre Table Model

Commencez avec seulement 20 pages annotées et améliorez progressivement la précision de votre modèle.

0pages pour commencer

Pour des tableaux simples et uniformes, 20 pages annotées suffisent pour entraîner un premier modèle fonctionnel.

0%MAP pour de bons résultats

Une Mean Average Precision de 35 % ou plus offre déjà une détection fiable des tableaux en pratique.

Conseils d'experts

  • Commencez par des tableaux simples et uniformes, puis passez à des mises en page plus complexes
  • Excluez les lignes d'en-tête lors de l'entraînement initial pour maintenir une structure cohérente
  • Utilisez 50 à 100 pages pour les mises en page de tableaux complexes ou mixtes
  • Itérez : entraînez, évaluez, corrigez les erreurs, ré-entraînez pour de meilleurs résultats
  • Les Table Models fonctionnent mieux pour les structures de grille strictes — pour les formulaires et les mises en page irrégulières, utilisez plutôt les Field Models

Table Models vs Field Models

Choisissez l'outil adapté à la structure de votre document.

Table Models

Idéal pour les structures de grille uniformes où les données sont organisées en lignes et colonnes cohérentes.

  • Détection de grille lignes x colonnes
  • Texte multiligne par cellule
  • Lignes et colonnes inclinées prises en charge
  • Export en XLSX, CSV, PAGE XML
  • Idéal pour : registres, livres comptables, tableaux de recensement

Field Models

Idéal pour les mises en page complexes, les formulaires et les documents dont les zones ont des formes irrégulières.

  • Zones balisées de toute forme
  • Zones irrégulières et chevauchantes
  • Types de champs et étiquettes personnalisés
  • Fonctionne pour toute structure de document
  • Idéal pour : formulaires, lettres, fiches

Commencez à extraire des données tabulaires dès aujourd'hui

Entraînez un Table Model personnalisé sur vos documents et exploitez les données structurées de milliers de tableaux manuscrits.