Extraiga datos estructurados de cualquier documento
Los proyectos de investigacion y digitalizacion necesitan mas que texto legible — necesitan datos estructurados. Nombres, fechas, lugares, cantidades, relaciones. Transkribus combina el reconocimiento de texto con IA con la extraccion de tablas, los Field Models y el etiquetado de entidades para convertir documentos manuscritos e impresos en conjuntos de datos estructurados listos para el analisis, bases de datos y hojas de calculo.

Tres formas de extraer datos de documentos
Diferentes tipos de documentos requieren diferentes metodos de extraccion. Transkribus ofrece los tres — y se pueden combinar.

Reconocimiento de tablas
Detecte filas, columnas y limites de celdas en documentos tabulares — registros parroquiales, censos, padrones fiscales, libros de cuentas. Cada celda se convierte en un dato. Exporte la tabla completa como hoja de calculo o XML.

Extraccion de campos
Entrene modelos para encontrar y extraer campos especificos de documentos estructurados — fechas, nombres, numeros de referencia, cantidades. Funciona con formularios, fichas, certificados y cualquier documento con estructura repetitiva.

Etiquetado de entidades
Etiquete personas, lugares, fechas y entidades personalizadas en texto corrido. Las etiquetas se convierten en metadatos consultables. Exporte como TEI-XML o filtre las entidades etiquetadas como datos estructurados para su base de investigacion.
Vea el reconocimiento de tablas en accion
Transkribus detecta la estructura de cuadricula de los registros tabulares y extrae cada celda en una hoja de calculo estructurada — lista para su base de datos, software genealogico o pipeline de investigacion.

| Institution | Town | Amount | Object | Date | Disposition |
|---|---|---|---|---|---|
| Franklin College (6) | New Athen, O. | General | 3/23/16 | ||
| Fargo College (3) | Fargo, N.D. | 100,000 | Endowment | 4/27/16 | Gen 1914, 5/18/16 |
| Franklin Academy (2) | Franklin, Neb. | 5,000 | Library Building | 8/3/16 | Gen 1914, 8/7/16 |
| Fessenden Acad. & Ind. School | Fessenden, Fla. | General | 12/22/16 | ||
| Ferris Institute (2) | Big Rapids, Mich. | 50,000 | Buildings | 2/12/17 | |
| Findlay College (2) | Findlay, O. | 100,000 | Endowment | 5/23/17 | Gen 1914, 5/28/17 |
| Fairmount College | Wichita, Kan. | 200,000 | Endowment | 6/7/17 | 6/14/17 |
| Franklin College | Franklin, Ind. | 50,000 | General | 9/13/17 | Gen 1914, 9/17/17 |
| Fisk University | Nashville, Tenn. | 1,000,000 | Endowment | 6/14/18 | |
| Friends University | Wichita, Kan. | 200,000 | Endowment | 6/20/18 | Gen 1914, 8/8/18 |
Vea la extraccion de campos en accion
Los Field Models detectan y extraen campos de datos especificos de los documentos — nombres, fechas, lugares, referencias — con precision y a gran escala. Entrene con sus propios disenos de formularios para obtener los mejores resultados.

Procesamiento inteligente de documentos
De imagenes de documentos a bases de datos de investigacion

Entrenable
Entrene modelos de extraccion para su tipo de documento especifico

Casos de uso
Lo que los investigadores extraen con Transkribus

Especialistas en escritura manuscrita
La unica plataforma IDP creada para la escritura manuscrita

Empiece a extraer datos de sus documentos
Cree una cuenta gratuita. Suba sus escaneos, ejecute el reconocimiento de texto y extraiga datos estructurados — sin programacion, sin conocimientos de ML.