Skip to content
  • Precios

Convierta tablas históricas en datos estructurados

Los Table Models de Transkribus utilizan segmentación de instancias para detectar filas y columnas en imágenes de documentos, extrayendo datos tabulares en hojas de cálculo con una precisión inigualable.

Empiece a entrenar su modelo
Table document with detected grid

Vea la extracción en acción

Los Table Models detectan la estructura de cuadrícula de su documento y extraen el contenido de cada celda en una hoja de cálculo estructurada que puede exportar.

Document example
Extracted Data
InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914, 5/18/16
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914, 8/7/16
Fessenden Acad. & Ind. SchoolFessenden, Fla.General12/22/16
Florida Baptist Academy (2)Jacksonville, Fla.General4/27/17
Fort Valley High & Ind. SchoolFort Valley, Ga.12,500Building12/15/17
Fisk UniversityNashville, Tenn.50,000General12/5/18
First Dist. State Normal SchoolKirksville, Mo.Library Building2/26/19Gen. 3/3/19

Diseñado para todo tipo de documento tabular

Desde registros de miembros hasta censos, los Table Models abarcan todo el espectro de tablas históricas con una precisión constante.

Registros de miembros y libros contables

Listas de miembros manuscritas, registros de sociedades y libros contables con columnas claramente definidas. Los Table Models destacan en estas estructuras de cuadrícula uniformes, detectando filas y columnas con precisión incluso cuando la caligrafía varía significativamente entre las entradas.

Columns detected:NumberYearNameOccupationResidenceNotes
Document example

Tablas censales y estadísticas

Formularios censales impresos, encuestas de población y tablas estadísticas con encabezados complejos. Incluso los formularios preimpresos con líneas de cuadrícula finas se procesan de forma fiable, convirtiendo páginas de datos demográficos en hojas de cálculo utilizables para análisis a gran escala.

Columns detected:DistrictsCountiesPopulationTotal DistrictsCounty Towns
Document example

Entradas multilínea y filas inclinadas

Registros de solicitudes y registros detallados donde las celdas contienen múltiples líneas de texto. Los Table Models gestionan el contenido multilínea dentro de las celdas de forma natural, y los separadores de filas inclinados o rotados se detectan correctamente gracias a la segmentación de instancias.

Columns detected:NameDateAgePlaceApplicationDecision
Document example

Tablas administrativas e institucionales

Expedientes educativos, estados financieros y tablas administrativas con muchas columnas de datos manuscritos. Ya sea que su tabla tenga 3 columnas o 30, los Table Models escalan para reconocer la estructura con precisión a lo largo de cientos de páginas.

Columns detected:InstitutionTownAmountObjectDateDisposition
Document example

Salida estructurada, lista para usar

Cada celda detectada se asigna a su posición de fila y columna, proporcionando datos estructurados y limpios que puede exportar directamente.

PAGE XML
<TableRegion id="t1">
  <Coords points="0,646 0,4014 6060,4013 6060,638"/>
  <TableCell row="0" col="0">
    <Coords points="0,646 0,822 1548,822 1548,644"/>
    <TextLine>
      <Unicode>Franklin College (6)</Unicode>
    </TextLine>
  </TableCell>
  <TableCell row="0" col="1">
    <Coords points="1548,644 1548,822 2241,822 2241,644"/>
    <TextLine>
      <Unicode>New Athen, O.</Unicode>
    </TextLine>
  </TableCell>
  <!-- ... -->
</TableRegion>
Exportación a hoja de cálculo
InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914
Fessenden Acad.Fessenden, Fla.General12/22/16

Exporte sus tablas en múltiples formatos

XLSXCSVPAGE XMLTEIALTO

Cómo funcionan los Table Models

Un proceso de tres pasos transforma las imágenes de sus documentos en datos tabulares estructurados.

1

Reconocimiento de estructura de tabla

Dos modelos de segmentación de instancias se ejecutan en paralelo: uno detecta los separadores horizontales de filas y el otro detecta los separadores verticales de columnas. Los resultados se fusionan en una estructura de cuadrícula completa.

Table structure recognition
2

Detección de líneas de texto

Dentro de cada celda detectada, se identifican las líneas base del texto. Este paso gestiona las celdas multilínea de forma natural, detectando cada línea de texto independientemente de la altura de la celda.

Text line detection
3

Reconocimiento de texto

Un modelo HTR lee las líneas de texto detectadas y produce la transcripción final. El resultado es una hoja de cálculo estructurada con cada valor asignado a su fila y columna.

InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914

Cómo entrenar un Table Model

Los Table Models no vienen preconstruidos — los entrena usted con sus documentos específicos. Así es como funciona.

1

Anotar sus tablas

Abra sus documentos en Transkribus y dibuje la estructura de filas y columnas en cada página. Marque cada separador de fila y columna para que el modelo aprenda su diseño de tabla específico.

2

Entrenar

Una vez que haya anotado unas 20 páginas (más para diseños complejos), envíelas para entrenar su Table Model personalizado. El entrenamiento suele tardar unas horas.

~20 páginas anotadas
3

Aplicar e iterar

Aplique su modelo entrenado a nuevos documentos: detecta automáticamente las estructuras de tabla y extrae el contenido de las celdas. Use los resultados para corregir errores, añadir más páginas y reentrenar.

Auto

Entrene su propio Table Model

Comience con tan solo 20 páginas anotadas y mejore la precisión de su modelo de forma iterativa.

0páginas para empezar

Para tablas simples y uniformes, 20 páginas anotadas son suficientes para entrenar un primer modelo funcional.

0%MAP para buenos resultados

Una precisión media (MAP) del 35 % o superior ya ofrece una detección de tablas fiable en la práctica.

Consejos de los expertos

  • Comience con tablas simples y uniformes y amplíe a diseños más complejos después
  • Excluya las filas de encabezado durante el entrenamiento inicial para mantener la estructura consistente
  • Utilice entre 50 y 100 páginas para diseños de tablas complejos o mixtos
  • Itere: entrene, evalúe, corrija errores y reentrene para obtener los mejores resultados
  • Los Table Models funcionan mejor para estructuras de cuadrícula estrictas; para formularios y diseños irregulares, utilice Field Models

Table Models vs Field Models

Elija la herramienta adecuada para la estructura de su documento.

Table Models

Ideal para estructuras de cuadrícula uniformes donde los datos se organizan en filas y columnas consistentes.

  • Detección de cuadrícula de filas × columnas
  • Texto multilínea por celda
  • Filas y columnas inclinadas compatibles
  • Exportación en XLSX, CSV, PAGE XML
  • Ideal para: registros, libros contables, tablas censales

Field Models

Ideal para diseños complejos, formularios y documentos con regiones de formas irregulares.

  • Regiones etiquetadas de cualquier forma
  • Áreas irregulares y superpuestas
  • Tipos de campo y etiquetas personalizadas
  • Funciona con cualquier estructura de documento
  • Ideal para: formularios, cartas, fichas

Empiece a extraer datos tabulares hoy

Entrene un Table Model personalizado con sus documentos y desbloquee datos estructurados de miles de tablas manuscritas.