Transformez les tableaux historiques en données structurées
Les Table Models de Transkribus utilisent la segmentation d'instances pour détecter les lignes et les colonnes dans les images de documents, extrayant les données tabulaires dans des feuilles de calcul avec une précision inégalée.
Commencez à entraîner votre modèle
Découvrez l'extraction en action
Les Table Models détectent la structure en grille de votre document et extraient le contenu de chaque cellule dans une feuille de calcul structurée que vous pouvez exporter.

| Institution | Town | Amount | Object | Date | Disposition |
|---|---|---|---|---|---|
| Franklin College (6) | New Athen, O. | General | 3/23/16 | ||
| Fargo College (3) | Fargo, N.D. | 100,000 | Endowment | 4/27/16 | Gen 1914, 5/18/16 |
| Franklin Academy (2) | Franklin, Neb. | 5,000 | Library Building | 8/3/16 | Gen 1914, 8/7/16 |
| Fessenden Acad. & Ind. School | Fessenden, Fla. | General | 12/22/16 | ||
| Florida Baptist Academy (2) | Jacksonville, Fla. | General | 4/27/17 | ||
| Fort Valley High & Ind. School | Fort Valley, Ga. | 12,500 | Building | 12/15/17 | |
| Fisk University | Nashville, Tenn. | 50,000 | General | 12/5/18 | |
| First Dist. State Normal School | Kirksville, Mo. | Library Building | 2/26/19 | Gen. 3/3/19 |
Conçu pour tous les types de documents tabulaires
Des registres d'adhésion aux recensements, les Table Models gèrent l'ensemble des tableaux historiques avec une précision constante.
Registres d'adhésion et livres comptables
Listes d'adhérents manuscrites, registres de sociétés et livres comptables avec des colonnes clairement définies. Les Table Models excellent dans ces structures de grille uniformes, détectant avec précision les lignes et les colonnes même lorsque l'écriture varie considérablement d'une entrée à l'autre.

Tableaux de recensement et statistiques
Formulaires de recensement imprimés, enquêtes démographiques et tableaux statistiques avec des en-têtes complexes. Même les formulaires pré-imprimés avec des lignes de grille fines sont traités de manière fiable, transformant des pages de données démographiques en feuilles de calcul exploitables pour des analyses à grande échelle.

Entrées multilignes et lignes inclinées
Registres de demandes et dossiers détaillés où les cellules contiennent plusieurs lignes de texte. Les Table Models gèrent naturellement le contenu multiligne dans les cellules, et même les séparateurs de lignes inclinés ou tournés sont détectés correctement grâce à la segmentation d'instances.

Tableaux administratifs et institutionnels
Documents scolaires, états financiers et tableaux administratifs comportant de nombreuses colonnes de données manuscrites. Que votre tableau contienne 3 ou 30 colonnes, les Table Models s'adaptent pour reconnaître la structure avec précision sur des centaines de pages.

Sortie structurée, prête à l'emploi
Chaque cellule détectée est associée à sa position de ligne et de colonne, vous offrant des données structurées propres que vous pouvez exporter directement.
<TableRegion id="t1">
<Coords points="0,646 0,4014 6060,4013 6060,638"/>
<TableCell row="0" col="0">
<Coords points="0,646 0,822 1548,822 1548,644"/>
<TextLine>
<Unicode>Franklin College (6)</Unicode>
</TextLine>
</TableCell>
<TableCell row="0" col="1">
<Coords points="1548,644 1548,822 2241,822 2241,644"/>
<TextLine>
<Unicode>New Athen, O.</Unicode>
</TextLine>
</TableCell>
<!-- ... -->
</TableRegion>| Institution | Town | Amount | Object | Date | Disposition |
|---|---|---|---|---|---|
| Franklin College (6) | New Athen, O. | General | 3/23/16 | ||
| Fargo College (3) | Fargo, N.D. | 100,000 | Endowment | 4/27/16 | Gen 1914 |
| Franklin Academy (2) | Franklin, Neb. | 5,000 | Library Building | 8/3/16 | Gen 1914 |
| Fessenden Acad. | Fessenden, Fla. | General | 12/22/16 |
Exportez vos tableaux dans plusieurs formats
Comment fonctionnent les Table Models
Un processus en trois étapes transforme vos images de documents en données tabulaires structurées.
Reconnaissance de la structure du tableau
Deux modèles de segmentation d'instances fonctionnent en parallèle : l'un détecte les séparateurs de lignes horizontaux, l'autre les séparateurs de colonnes verticaux. Les résultats sont fusionnés en une structure de grille complète.

Détection des lignes de texte
Au sein de chaque cellule détectée, les lignes de base du texte sont identifiées. Cette étape gère naturellement les cellules multilignes, détectant chaque ligne de texte quelle que soit la hauteur de la cellule.

Reconnaissance de texte
Un modèle HTR lit les lignes de texte détectées et produit la transcription finale. Le résultat est une feuille de calcul structurée avec chaque valeur associée à sa ligne et sa colonne.
| Institution | Town | Amount | Object | Date | Disposition |
|---|---|---|---|---|---|
| Franklin College (6) | New Athen, O. | General | 3/23/16 | ||
| Fargo College (3) | Fargo, N.D. | 100,000 | Endowment | 4/27/16 | Gen 1914 |
| Franklin Academy (2) | Franklin, Neb. | 5,000 | Library Building | 8/3/16 | Gen 1914 |
Comment entraîner un Table Model
Les Table Models ne sont pas pré-construits — vous les entraînez sur vos documents spécifiques. Voici comment cela fonctionne.
Annoter vos tableaux
Ouvrez vos documents dans Transkribus et dessinez la structure des lignes et colonnes sur chaque page. Marquez chaque séparateur de ligne et de colonne pour que le modèle apprenne votre mise en page spécifique.
Entraîner
Une fois environ 20 pages annotées (davantage pour les mises en page complexes), soumettez-les pour entraîner votre Table Model personnalisé. L'entraînement prend généralement quelques heures.
Appliquer & itérer
Appliquez votre modèle entraîné à de nouveaux documents — il détecte automatiquement les structures de tableaux et extrait le contenu des cellules. Utilisez les résultats pour corriger les erreurs, ajouter des pages et ré-entraîner.
Entraînez votre propre Table Model
Commencez avec seulement 20 pages annotées et améliorez progressivement la précision de votre modèle.
Pour des tableaux simples et uniformes, 20 pages annotées suffisent pour entraîner un premier modèle fonctionnel.
Une Mean Average Precision de 35 % ou plus offre déjà une détection fiable des tableaux en pratique.
Conseils d'experts
- Commencez par des tableaux simples et uniformes, puis passez à des mises en page plus complexes
- Excluez les lignes d'en-tête lors de l'entraînement initial pour maintenir une structure cohérente
- Utilisez 50 à 100 pages pour les mises en page de tableaux complexes ou mixtes
- Itérez : entraînez, évaluez, corrigez les erreurs, ré-entraînez pour de meilleurs résultats
- Les Table Models fonctionnent mieux pour les structures de grille strictes — pour les formulaires et les mises en page irrégulières, utilisez plutôt les Field Models
Table Models vs Field Models
Choisissez l'outil adapté à la structure de votre document.
Table Models
Idéal pour les structures de grille uniformes où les données sont organisées en lignes et colonnes cohérentes.
- Détection de grille lignes x colonnes
- Texte multiligne par cellule
- Lignes et colonnes inclinées prises en charge
- Export en XLSX, CSV, PAGE XML
- Idéal pour : registres, livres comptables, tableaux de recensement
Field Models
Idéal pour les mises en page complexes, les formulaires et les documents dont les zones ont des formes irrégulières.
- Zones balisées de toute forme
- Zones irrégulières et chevauchantes
- Types de champs et étiquettes personnalisés
- Fonctionne pour toute structure de document
- Idéal pour : formulaires, lettres, fiches
Commencez à extraire des données tabulaires dès aujourd'hui
Entraînez un Table Model personnalisé sur vos documents et exploitez les données structurées de milliers de tableaux manuscrits.