Skip to content
  • Prezzi

Trasforma le tabelle storiche in dati strutturati

I Table Models di Transkribus utilizzano la segmentazione di istanza per rilevare righe e colonne nelle immagini dei documenti, estraendo i dati tabulari in fogli di calcolo con una precisione impareggiabile.

Inizia ad addestrare il tuo modello
Table document with detected grid

Guarda l'estrazione in azione

I Table Models rilevano la struttura a griglia del tuo documento ed estraggono il contenuto di ogni cella in un foglio di calcolo strutturato pronto per l'esportazione.

Document example
Extracted Data
InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914, 5/18/16
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914, 8/7/16
Fessenden Acad. & Ind. SchoolFessenden, Fla.General12/22/16
Florida Baptist Academy (2)Jacksonville, Fla.General4/27/17
Fort Valley High & Ind. SchoolFort Valley, Ga.12,500Building12/15/17
Fisk UniversityNashville, Tenn.50,000General12/5/18
First Dist. State Normal SchoolKirksville, Mo.Library Building2/26/19Gen. 3/3/19

Progettati per ogni tipo di documento tabulare

Dai registri dei soci ai documenti censuari, i Table Models gestiscono l'intero spettro delle tabelle storiche con una precisione costante.

Registri dei soci e libri contabili

Elenchi di soci manoscritti, registri di associazioni e libri contabili con colonne chiaramente definite. I Table Models eccellono con queste strutture a griglia uniformi, rilevando con precisione righe e colonne anche quando la grafia varia notevolmente tra le voci.

Columns detected:NumberYearNameOccupationResidenceNotes
Document example

Tabelle censuarie e statistiche

Moduli censuari stampati, indagini demografiche e tabelle statistiche con intestazioni complesse. Anche i moduli prestampati con linee di griglia sottili vengono gestiti in modo affidabile, trasformando pagine di dati demografici in fogli di calcolo utilizzabili per analisi su larga scala.

Columns detected:DistrictsCountiesPopulationTotal DistrictsCounty Towns
Document example

Voci multilinea e righe inclinate

Registri di domande e record dettagliati in cui le celle contengono più righe di testo. I Table Models gestiscono naturalmente i contenuti multilinea all'interno delle celle, e anche i separatori di riga inclinati o ruotati vengono rilevati correttamente grazie alla segmentazione di istanza.

Columns detected:NameDateAgePlaceApplicationDecision
Document example

Tabelle amministrative e istituzionali

Documenti scolastici, rendiconti finanziari e tabelle amministrative con numerose colonne di dati manoscritti. Che la tua tabella abbia 3 colonne o 30, i Table Models si adattano per riconoscere la struttura con precisione su centinaia di pagine.

Columns detected:InstitutionTownAmountObjectDateDisposition
Document example

Output strutturato, pronto all'uso

Ogni cella rilevata viene mappata alla sua posizione di riga e colonna, fornendoti dati strutturati e puliti che puoi esportare direttamente.

PAGE XML
<TableRegion id="t1">
  <Coords points="0,646 0,4014 6060,4013 6060,638"/>
  <TableCell row="0" col="0">
    <Coords points="0,646 0,822 1548,822 1548,644"/>
    <TextLine>
      <Unicode>Franklin College (6)</Unicode>
    </TextLine>
  </TableCell>
  <TableCell row="0" col="1">
    <Coords points="1548,644 1548,822 2241,822 2241,644"/>
    <TextLine>
      <Unicode>New Athen, O.</Unicode>
    </TextLine>
  </TableCell>
  <!-- ... -->
</TableRegion>
Esportazione foglio di calcolo
InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914
Fessenden Acad.Fessenden, Fla.General12/22/16

Esporta le tue tabelle in più formati

XLSXCSVPAGE XMLTEIALTO

Come funzionano i Table Models

Una pipeline in tre fasi trasforma le immagini dei tuoi documenti in dati tabulari strutturati.

1

Riconoscimento della struttura tabellare

Due modelli di segmentazione di istanza operano in parallelo: uno rileva i separatori orizzontali delle righe, l'altro rileva i separatori verticali delle colonne. I risultati vengono uniti in una struttura a griglia completa.

Table structure recognition
2

Rilevamento delle righe di testo

All'interno di ogni cella rilevata vengono identificate le linee di base del testo. Questa fase gestisce naturalmente le celle multilinea, rilevando ogni riga di testo indipendentemente dall'altezza della cella.

Text line detection
3

Riconoscimento del testo

Un modello HTR legge le righe di testo rilevate e produce la trascrizione finale. Il risultato è un foglio di calcolo strutturato con ogni valore mappato alla rispettiva riga e colonna.

InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914

Come addestrare un Table Model

I Table Model non sono preconfezionati — li addestri sui tuoi documenti specifici. Ecco come funziona.

1

Annotare le tabelle

Apri i tuoi documenti in Transkribus e disegna la struttura di righe e colonne su ogni pagina. Segna ogni separatore di riga e colonna in modo che il modello possa imparare il tuo layout specifico.

2

Addestrare

Una volta annotate circa 20 pagine (di più per layout complessi), inviale per addestrare il tuo Table Model personalizzato. L'addestramento richiede di solito alcune ore.

~20 pagine annotate
3

Applicare e iterare

Applica il tuo modello addestrato a nuovi documenti — rileva automaticamente le strutture delle tabelle ed estrae il contenuto delle celle. Usa i risultati per correggere errori, aggiungere pagine e riaddestrare.

Auto

Addestra il tuo Table Model personalizzato

Inizia con appena 20 pagine annotate e migliora iterativamente la precisione del tuo modello.

0pagine per iniziare

Per tabelle semplici e uniformi, 20 pagine annotate sono sufficienti per addestrare un primo modello funzionante.

0%MAP per buoni risultati

Una Mean Average Precision del 35% o superiore offre già un rilevamento affidabile delle tabelle nella pratica.

Consigli dagli esperti

  • Inizia con tabelle semplici e uniformi, poi passa a layout più complessi
  • Escludi le righe di intestazione durante l'addestramento iniziale per mantenere la struttura coerente
  • Usa 50–100 pagine per layout tabulari complessi o misti
  • Itera: addestra, valuta, correggi gli errori, riaddestra per i migliori risultati
  • I Table Models funzionano meglio con strutture a griglia rigide — per moduli e layout irregolari, usa invece i Field Models

Table Models vs Field Models

Scegli lo strumento giusto per la struttura del tuo documento.

Table Models

Ideali per strutture a griglia uniformi in cui i dati sono organizzati in righe e colonne coerenti.

  • Rilevamento griglia righe × colonne
  • Testo multilinea per cella
  • Supporto per righe e colonne inclinate
  • Esportazione in XLSX, CSV, PAGE XML
  • Ideali per: registri, libri contabili, tabelle censuarie

Field Models

Ideali per layout complessi, moduli e documenti in cui le aree hanno forme irregolari.

  • Aree etichettate di qualsiasi forma
  • Aree irregolari e sovrapposte
  • Tipi di campo ed etichette personalizzati
  • Funziona con qualsiasi struttura documentale
  • Ideali per: moduli, lettere, schede

Inizia a estrarre dati tabulari oggi stesso

Addestra un Table Model personalizzato sui tuoi documenti e ottieni dati strutturati da migliaia di tabelle manoscritte.