Skip to content
  • Precios

Análisis de diseño que comprende cualquier página

Antes de que se pueda leer un solo carácter, la IA necesita comprender la estructura de la página — dónde están los bloques de texto, dónde se situa cada línea, dónde comienzan y terminan las tablas, columnas y marginalia. Transkribus lo hace automáticamente para cada documento, produciendo coordenadas con precisión de píxel para cada elemento detectado.

AutomaticSegmentación de página
Pixel-levelPrecisión de coordenadas
PAGE XMLFormato de exportación estándar
RegionesDetecta bloques de texto, imágenes, tablas
BaselinesCoordenadas precisas a nivel de línea
EstructuraEncabezados, párrafos, marginalia
ExportaciónPAGE XML, PDF con búsqueda, ALTO

Ve el análisis de diseño en acción

La IA escanea el documento y detecta cada elemento estructural — regiones de texto, baselines individuales y anotaciones. Activa y desactiva los tipos de elementos para explorar el diseño detectado.

Document with layout analysis overlay
Layout Elements

Segmentación de página

Detección automática de regiones para cualquier documento

Transkribus segmenta automáticamente cada página en regiones estructuradas — bloques de texto, imágenes, tablas, separadores y decoraciones. La IA gestiona diseños complejos que superan la simple detección de columnas: texto multicolumna con anchos variables, marginalia junto al texto principal, anotaciones interlineales y texto que rodea ilustraciones.
Detecta regiones de texto, imagen, tabla y separadores
Maneja diseños multicolumna, orientaciones mixtas y regiones anidadas
Funciona con documentos manuscritos, impresos y mixtos de cualquier siglo
Se ejecuta automáticamente durante el reconocimiento de texto — sin necesidad de zonificación manual
Las regiones estructurales se etiquetan como encabezado, párrafo, número de página o marginalia

Detección de baselines

Baselines con precisión de píxel para cada línea de texto

Las baselines son la base del reconocimiento de escritura en Transkribus. La IA traza el camino exacto que sigue cada línea de texto — incluyendo escritura curva, inclinada e irregular. Cada baseline almacena una polilínea de puntos de coordenadas que mapean con precisión el texto a la imagen original. Esto es lo que hace que la salida de Transkribus esté espacialmente vinculada a la fuente: siempre sabes exactamente dónde en la página se encontró cada palabra.
Las baselines polilínea siguen la curvatura exacta de la escritura
Cada baseline vincula el texto reconocido con sus coordenadas de píxel
Maneja escritura inclinada, líneas curvas y espaciado irregular
Coordenadas exportadas en PAGE XML y formato ALTO
Esencial para la generación de PDF con búsqueda y capas de texto alineadas

Detección de estructura de tablas

El análisis de diseño de tablas va más allá de las regiones de texto — detecta filas, columnas, encabezados y celdas individuales. Entrena modelos de tablas personalizados para tus diseños documentales específicos.

Document with detected table structure
Datos de tabla extraídos
InstitutionTownAmountObjectDateDisposition
Franklin College (6)New Athen, O.General3/23/16
Fargo College (3)Fargo, N.D.100,000Endowment4/27/16Gen 1914, 5/18/16
Franklin Academy (2)Franklin, Neb.5,000Library Building8/3/16Gen 1914, 8/7/16
Fessenden Acad. & Ind. SchoolFessenden, Fla.General12/22/16
Ferris Institute (2)Big Rapids, Mich.50,000Buildings2/12/17
Findlay College (2)Findlay, O.100,000Endowment5/23/17Gen 1914, 5/28/17
Fairmount CollegeWichita, Kan.200,000Endowment6/7/176/14/17
Franklin CollegeFranklin, Ind.50,000General9/13/17Gen 1914, 9/17/17
Fisk UniversityNashville, Tenn.1,000,000Endowment6/14/18
Friends UniversityWichita, Kan.200,000Endowment6/20/18Gen 1914, 8/8/18

Formatos de exportación

Coordenadas que puedes usar en todas partes

Cada elemento de diseño que Transkribus detecta incluye datos completos de coordenadas. Exporta en formatos estándar del sector para su uso en herramientas de humanidades digitales, sistemas bibliotecarios o tu propia cadena de procesamiento. Los PDF con búsqueda alinean la capa de texto reconocido con la imagen original usando estas coordenadas — haciendo cada palabra clicable y buscable.
PAGE XML — el estándar para diseño de documentos con coordenadas poligonales
ALTO XML — ampliamente utilizado en sistemas de bibliotecas y archivos
PDF con búsqueda — capa de texto alineada con las coordenadas de la imagen
TEI-XML — con enlaces de facsímil a las regiones de origen
Texto plano, DOCX y Excel para flujos de trabajo más simples

El editor

Edita y corrige el diseño en un editor visual

Transkribus incluye un editor visual completo para correcciones de diseño. Ajusta los límites de regiones, fusiona o divide líneas de texto, corrige las coordenadas de baselines, anota regiones estructurales como encabezados o marginalia, y corrige el orden de lectura. Todos los cambios se reflejan en las coordenadas exportadas.
Arrastra visualmente los límites de regiones y los puntos de baselines
Fusiona o divide regiones de texto y líneas
Asigna etiquetas estructurales: encabezado, párrafo, marginalia, número de página
Corrige el orden de lectura en diseños complejos de múltiples columnas
Los cambios se guardan y se reflejan en todas las exportaciones

Diseñado para escritura manuscrita

Análisis de diseño OCR que funciona con documentos históricos

La mayoría de las herramientas de análisis de diseño están diseñadas para documentos impresos modernos con maquetaciones limpias y predecibles. Transkribus se creó para los casos difíciles: escritura de siglos de antigüedad con interlineado irregular, papel degradado, tinta traspasada, orientaciones mixtas y estructura impredecible. Nuestros modelos de IA han sido entrenados con millones de páginas de documentos históricos.
Procesa documentos degradados, manchados y dañados
Funciona con todos los siglos y estilos de escritura
Gestiona el traspaso de tinta, transparencias y texto de bajo contraste
Detecta baselines en escritura inclinada, curva e irregular
Más de 500.000 usuarios procesan documentos históricos a diario

Prueba el análisis de diseño de documentos gratis

Sube tus documentos y observa cómo la IA detecta cada región, baseline y elemento estructural. Sin configuración, sin programación — solo sube y listo.

AutomaticSin zonificación manual
PAGE XMLCoordenadas estándar
Free50 créditos cada mes