Skip to content
  • Precios

La plataforma de IA diseñada para la investigación en humanidades.

Transkribus le ofrece un flujo completo desde la imagen del documento hasta texto estructurado y buscable, con entrenamiento de modelos, análisis de maquetación, etiquetado de entidades y exportación TEI-XML. Sin necesidad de programar. Nacido de la investigación financiada por la UE, gestionado por una cooperativa de más de 250 instituciones y utilizado en más de 40 universidades.

Editor de Transkribus: interfaz de transcripción y anotación
40+universidades que utilizan Transkribus
300+modelos de IA entrenados por la comunidad
TEI-XMLexportación para ediciones académicas

El flujo de investigación

De la imagen del documento a los datos de investigación estructurados: lo que Transkribus le aporta en cada etapa.

Reconocimiento de texto con IA en un documento histórico

Texto legible por máquina en cualquier escritura

El reconocimiento de texto manuscrito (HTR) convierte imágenes de documentos en texto editable y buscable. Más de 300 modelos públicos cubren escrituras que van del latín medieval al Kurrent del siglo XX. Entrene su propio modelo con 50 páginas de datos de referencia si ninguno se ajusta.

Extracción de datos estructurados de documentos históricos

Datos estructurados, no solo texto sin procesar

El reconocimiento de tablas, la extracción de campos y el etiquetado de entidades convierten documentos no estructurados en conjuntos de datos estructurados. Extraiga nombres, fechas, lugares y relaciones, listos para bases de datos, hojas de cálculo o análisis computacional.

Edición académica digital publicada

Ediciones publicadas y citables

Exporte como TEI-XML para ediciones académicas, o publique directamente como un Transkribus Site con búsqueda. Sus transcripciones se convierten en un resultado de investigación citable y accesible, no en un simple archivo de trabajo en su portátil.

Para una investigación rigurosa

Reproducible, con versiones y documentado

Cada modelo en Transkribus tiene versiones. Sus datos de entrenamiento quedan preservados. La precisión se mide con la tasa de error de caracteres (CER) en conjuntos de prueba reservados. Esto significa que su flujo de trabajo de transcripción es reproducible, auditable y está listo para la revisión por pares: los mismos estándares que aplica al resto de su metodología de investigación.
Modelos con versiones con datos de entrenamiento documentados y métricas de precisión
Evaluación de la tasa de error de caracteres (CER) en conjuntos de prueba reservados
Exportación completa de datos de referencia, parámetros del modelo y resultados de reconocimiento
Cite la versión exacta del modelo utilizado en sus publicaciones
Evaluación de la precisión del modelo con métricas CER

Sin necesidad de programar

Entrene modelos de IA personalizados en una interfaz visual

No necesita escribir código, gestionar servidores ni entender arquitecturas de redes neuronales. Prepare sus datos de entrenamiento en el editor integrado, haga clic en entrenar y Transkribus creará un modelo optimizado para sus documentos específicos. La misma tecnología de aprendizaje profundo que se utiliza en la investigación computacional, accesible para cualquier investigador de humanidades.
Editor visual de datos de referencia: transcriba y corrija en contexto
Comience el entrenamiento con tan solo 50 páginas transcritas
Los modelos mejoran a medida que añade más datos de referencia
Comparta modelos con colaboradores o con toda la comunidad
Interfaz de entrenamiento de modelos personalizados en Transkribus

Recursos para investigadores de humanidades digitales

Guías, metodología y herramientas para integrar Transkribus en su investigación.

Cómo incluir HTR en su propuesta de subvención

Texto de metodología de muestra, referencias de CER y orientación sobre gestión de datos para DFG, ERC, NEH, AHRC y otros financiadores.

Metodología

Tasa de error de caracteres (CER) explicada

La métrica de precisión estándar para HTR: cómo se calcula, qué referencias esperar y cómo comunicarla.

Referencia

Explorar modelos públicos

Más de 300 modelos entrenados por la comunidad para escrituras que van del latín medieval al Kurrent del siglo XX. Encuentre un punto de partida para sus documentos.

Modelos

Comience su proyecto de investigación con Transkribus

Empiece gratis con 50 créditos al mes: suficiente para procesar cientos de páginas. Para proyectos más grandes, hable con nuestro equipo sobre planes institucionales y colaboraciones de investigación.

300+modelos de IA públicos
40+universidades
Alojado en la UEcumple con el RGPD