Su hemeroteca, completamente buscable.
Millones de páginas de periódicos históricos permanecen en los archivos: escaneadas pero no buscables. Transkribus lee el texto, comprende la maquetación y convierte cada artículo, titular y clasificado en datos estructurados y buscables. Desde un único título hasta una colección nacional completa.

El resultado
El resultado final tras procesar su colección de periódicos.

Texto completo buscable
Cada artículo, titular, anuncio y clasificado de cada página: reconocido e indexado. Busque por nombre, fecha, palabra clave o frase en toda la colección.

Datos de maquetación estructurados
La IA segmenta las páginas de múltiples columnas en regiones de contenido individuales: artículos, titulares, anuncios y pies de foto. Cada región se etiqueta y se exporta por separado, para que los sistemas posteriores puedan trabajar con artículos y no con volcados de páginas en bruto.

Una colección navegable en línea
Los periódicos procesados pueden publicarse como un Transkribus Site: una interfaz alojada con búsqueda para su colección. Sin necesidad de desarrollo. Con la identidad corporativa de su institución.
Caso de estudio
Zeitpunkt.NRW: 20 millones de páginas de periódico para Renania del Norte-Westfalia

Caso de estudio
NewsEye: mejora del reconocimiento de texto en periódicos con la Biblioteca Nacional de Finlandia

El enfoque
De los escaneos al texto estructurado: cómo las instituciones digitalizan periódicos a escala

Guías y modelos
Tutoriales, modelos de IA y casos de uso relacionados para la digitalización de periódicos.
Cómo digitalizar periódicos con Transkribus
Guía paso a paso: digitalización, segmentación de maquetación, selección de modelos y reconocimiento de texto para periódicos históricos.
Modelos de IA para Fraktur, Kurrent y Sütterlin
Los tipos de letra de impresión y escritura manuscrita alemanes históricos más habituales, y los modelos públicos que pueden leerlos.
Reducción del retraso archivístico
Cómo los archivos utilizan la IA para procesar millones de páginas no buscables: el mismo enfoque que se aplica a las colecciones de periódicos.
¿Listo para hacer buscable su hemeroteca?
Hable con nuestro equipo sobre su colección. Le ayudaremos a encontrar los modelos adecuados, planificar el flujo de trabajo y estimar el alcance.