Skip to content
  • Precios
Guía metodológica

Cómo incluir el reconocimiento de texto manuscrito en su propuesta de proyecto

Una guía paso a paso para justificar el uso de HTR en su solicitud de financiación — desde la descripción metodológica y la justificación presupuestaria hasta las referencias y la planificación de la gestión de datos. Para DFG, ERC, NEH, AHRC, SNSF, FWF, CONICET, CONAHCyT, FONDECYT, Ministerio de Ciencia (España) y otros organismos financiadores.

10 min de lectura

1.Por qué incluir el HTR en su metodología

El reconocimiento de texto manuscrito (HTR) ha pasado de ser una técnica experimental a un método de investigación consolidado, utilizado en las humanidades y las ciencias sociales. Cientos de publicaciones revisadas por pares citan la transcripción asistida por inteligencia artificial como parte fundamental de su flujo de trabajo, y organismos de financiación destacados —entre ellos el ERC, la DFG, el NEH, el AHRC, el SNSF y el FWF— han concedido subvenciones a proyectos que la emplean.

La justificación metodológica del HTR se sustenta en tres pilares:

  • Eficiencia. La transcripción automatizada procesa páginas en segundos, frente a los 15-60 minutos que requiere la transcripción manual, lo que hace viable el trabajo con corpus a gran escala dentro de los plazos habituales de un proyecto financiado.
  • Reproducibilidad. Un modelo entrenado produce resultados idénticos con la misma entrada en cada ejecución. Este comportamiento determinista supone una ventaja significativa frente a la transcripción manual, donde la concordancia entre anotadores es imperfecta.
  • Mensurabilidad. La calidad del reconocimiento se cuantifica mediante la tasa de error de caracteres (CER), una métrica objetiva calculada sobre datos de prueba reservados. Esto proporciona a los evaluadores —y al equipo de investigación— un indicador de calidad concreto y verificable.

Incluir el HTR en su metodología indica que el proyecto aprovecha métodos digitales de vanguardia manteniendo un riguroso control de calidad. También demuestra conciencia de las limitaciones de escalabilidad que suelen preocupar a los evaluadores al valorar grandes corpus documentales.

2.Descripción del flujo de trabajo de Transkribus

Las propuestas de financiación requieren una descripción clara y técnicamente precisa de las herramientas y métodos empleados. Transkribus es una plataforma basada en inteligencia artificial para el reconocimiento de texto manuscrito e impreso, desarrollada y operada por READ-COOP SCE, una cooperativa europea con más de 250 miembros institucionales, entre ellos archivos, bibliotecas y universidades.

El flujo de trabajo estándar consta de cuatro fases:

  1. Carga. Las imágenes de los documentos (digitalizaciones, fotografías o PDF) se suben a la plataforma. Transkribus acepta todos los formatos de imagen habituales y gestiona cargas por lotes para colecciones de gran volumen.
  2. Reconocimiento de texto. Un modelo de IA —seleccionado de entre más de 300 modelos públicos disponibles o entrenado de forma personalizada con su material— realiza la transcripción automática. El análisis de diseño detecta regiones de texto, líneas base y elementos estructurales como tablas.
  3. Corrección manual. El equipo de investigación revisa y corrige la salida automatizada en un editor integrado. Este paso genera datos de Ground Truth que también pueden utilizarse para seguir entrenando y mejorando los modelos.
  4. Exportación. Las transcripciones corregidas se exportan en formatos estándar (PAGE XML, ALTO XML, TEI, texto plano, PDF con búsqueda) para su integración con bases de datos, repositorios o flujos de análisis posteriores.

Para proyectos que manejan material sensible o de acceso restringido, Transkribus ofrece despliegue en infraestructura propia (on-premises): la plataforma completa se ejecuta en la infraestructura de su institución, garantizando que los documentos nunca abandonen sus servidores. Esto es especialmente relevante para archivos con restricciones legales sobre la transferencia de datos.

3.Cálculo de tiempo y costes

Una planificación presupuestaria precisa es esencial para una propuesta de financiación creíble. Transkribus utiliza un sistema basado en créditos para el reconocimiento de texto, donde el número de créditos consumidos depende del número de páginas y del tipo de procesamiento aplicado.

Estimación de los costes de reconocimiento:

  • Los créditos se consumen por página para el reconocimiento de texto, el análisis de diseño y otras tareas de procesamiento relacionadas.
  • Existen planes individuales e institucionales en distintos niveles, lo que permite ajustar el plan a la escala del proyecto.
  • Se ofrecen descuentos por volumen para grandes proyectos institucionales; contacte con el equipo de Transkribus para un presupuesto personalizado.

Estimación del tiempo de corrección manual:

El tiempo necesario para la poscorrección depende de la dificultad del material y de la precisión deseada. Como orientación general:

  • Material bien reconocido (CER inferior al 5 %): de 2 a 5 minutos por página para verificación y corrección ligera.
  • Material complejo (CER del 5 al 10 %): de 5 a 15 minutos por página para una corrección más sustancial.
  • Material muy difícil (CER superior al 10 %): considere invertir en el entrenamiento de un modelo personalizado antes del procesamiento a gran escala, ya que esto suele reducir significativamente el tiempo de corrección por página.

Un estudio piloto sobre 50-100 páginas representativas proporcionará estimaciones concretas del tiempo de corrección para su material específico. Incluya estas cifras en su propuesta como datos preliminares.

4.Gestión de datos y estándares de archivo

La mayoría de los organismos de financiación exigen actualmente un plan de gestión de datos (PGD) como parte de la propuesta. Transkribus facilita el cumplimiento de los principios FAIR y los estándares de preservación a largo plazo.

Formatos de exportación:

  • PAGE XML: el estándar de facto para datos de diseño y transcripción en la investigación sobre análisis de documentos. Preserva las coordenadas de líneas base, los tipos de región y el orden de lectura.
  • ALTO XML: ampliamente utilizado en la infraestructura de bibliotecas digitales y compatible con flujos de trabajo METS/IIIF.
  • TEI-XML: el estándar de codificación para ediciones académicas digitales en las humanidades.
  • Texto plano y PDF con búsqueda: para análisis posteriores, búsqueda de texto completo y salida legible.

Cumplimiento FAIR:

  • Localizable (Findable): búsqueda de texto completo en las colecciones; metadatos estructurados en las exportaciones XML.
  • Accesible (Accessible): los datos pueden exportarse en cualquier momento en formatos abiertos; sin dependencia de formatos propietarios.
  • Interoperable (Interoperable): los esquemas XML estándar garantizan la compatibilidad con sistemas de bibliotecas digitales, herramientas de anotación y software de análisis de texto.
  • Reutilizable (Reusable): los formatos abiertos con metadatos integrados facilitan la reutilización y el reanálisis a largo plazo.

Preservación a largo plazo: exporte sus resultados para su depósito en repositorios institucionales, archivos de dominio específico o centros de datos. Los formatos abiertos y no propietarios garantizan que los datos permanezcan accesibles con independencia de cualquier plataforma concreta.

5.Entrenamiento de modelos y precisión

La precisión del reconocimiento es fundamental en cualquier sección metodológica sobre HTR. Transkribus mide la calidad mediante la tasa de error de caracteres (CER): la proporción de caracteres que difieren entre la salida del modelo y una transcripción de referencia verificada manualmente.

Qué deben esperar los evaluadores:

  • Modelos públicos sobre material adecuado: CER del 2-5 % (del 95 al 98 % de caracteres correctos).
  • Escrituras difíciles o material degradado con entrenamiento personalizado: CER del 5-10 %.
  • El CER se calcula siempre sobre un conjunto de prueba reservado (normalmente el 10-15 % de los datos de Ground Truth no utilizados durante el entrenamiento), lo que garantiza una estimación de precisión imparcial.

Entrenamiento de modelos personalizados: para material especializado —escrituras inusuales, ortografías históricas o documentos degradados— Transkribus permite entrenar un modelo personalizado con sus propios datos de Ground Truth. El entrenamiento requiere normalmente entre 25 y 75 páginas de material transcrito manualmente, según la complejidad de la escritura.

Para una explicación detallada del CER y cómo informar de él en su propuesta, consulte nuestra guía específica: Tasa de error de caracteres (CER) explicada.

6.Colaboración y escalabilidad

Los proyectos de investigación rara vez operan de forma aislada. Transkribus admite flujos de trabajo colaborativos a cualquier escala, desde pequeños equipos hasta grandes iniciativas interinstitucionales.

Contribución colectiva (crowdsourcing): para proyectos que involucran transcriptores voluntarios o ciencia ciudadana, Transkribus ofrece funcionalidades integradas de crowdsourcing. Los voluntarios aportan correcciones a través de una interfaz simplificada, generando datos de Ground Truth que mejoran la precisión del modelo con el tiempo. Consulte nuestra guía sobre plataforma de transcripción colaborativa para más detalles sobre cómo organizar campañas de transcripción colectiva.

Acceso mediante API: para proyectos que requieren flujos automatizados o integración con la infraestructura de investigación existente, la API de Transkribus proporciona acceso programático a todas las funciones de reconocimiento y procesamiento. Esto permite el procesamiento por lotes, flujos de trabajo personalizados y la integración con sistemas de bibliotecas digitales institucionales.

Escalado del piloto al proyecto completo:

  • Fase piloto (meses 1-3): procese 50-100 páginas representativas, mida el CER, estime el tiempo de corrección.
  • Refinamiento del modelo (meses 3-6): si es necesario, entrene un modelo personalizado con el Ground Truth del piloto para mejorar la precisión.
  • Procesamiento completo (mes 6 en adelante): aplique el modelo optimizado a todo el corpus. El procesamiento por lotes gestiona miles de páginas al día.

Este enfoque por fases es metodológicamente sólido y demuestra a los evaluadores que dispone de un plan realista, basado en evidencias, para escalar el proyecto.

7.Texto metodológico de ejemplo

El siguiente párrafo puede adaptarse para la sección metodológica de su propuesta de financiación. Sustituya los campos entre corchetes por los datos específicos de su proyecto.

El reconocimiento de texto manuscrito se realizará mediante Transkribus (transkribus.org), una plataforma basada en inteligencia artificial desarrollada y operada por la cooperativa europea READ-COOP SCE (más de 250 miembros institucionales). La plataforma emplea arquitecturas de aprendizaje profundo entrenadas con datos de Ground Truth en formato PAGE XML para reconocer escritura histórica con precisión mensurable. Un estudio piloto sobre [N] páginas representativas de [descripción del material] alcanzó una tasa de error de caracteres del [X] %, calculada sobre un conjunto de prueba reservado que comprende el [Y] % del corpus de Ground Truth, lo que confirma la viabilidad del reconocimiento automatizado para este material. Durante el proyecto se procesarán aproximadamente [N] páginas de material en [tipo de escritura] procedentes de [archivo/colección] utilizando [un modelo público / un modelo entrenado a medida]. La calidad del reconocimiento se validará de forma continua midiendo el CER sobre datos de prueba reservados. La poscorrección manual por parte de [miembros del equipo / asistentes] garantizará que la calidad de la transcripción cumpla los estándares del proyecto. Todas las salidas se exportarán en formato [PAGE XML / TEI-XML / ALTO XML] para su depósito en [nombre del repositorio] y su integración con [base de datos / flujo de análisis]. Los datos se almacenarán y procesarán en los servidores de Transkribus en Austria (UE), en cumplimiento del RGPD. [Para material sensible: el despliegue en infraestructura propia garantiza que los documentos permanezcan en la infraestructura institucional.]

8.Referencias y lecturas complementarias

Publicaciones clave:

  • Muehlberger, G. et al. (2019). 'Transforming scholarship in the archives through handwritten text recognition.' Journal of Documentation, 75(5), pp. 954–976.
  • Kahle, P. et al. (2017). 'Transkribus — A Service Platform for Transcription, Recognition and Retrieval of Historical Documents.' 14th IAPR International Conference on Document Analysis and Recognition (ICDAR), 2017.
  • 'Handwritten Text Recognition for Historical Documents.' Open Research Europe, 5:16 (2025). open-research-europe.ec.europa.eu/articles/5-16

Procedencia del proyecto:

  • Proyecto READ de Horizon 2020 de la UE (subvención n.º 674943, 2016-2019): el programa de investigación en el marco del cual se desarrolló Transkribus.
  • READ-COOP SCE: la cooperativa europea que actualmente opera y gobierna Transkribus, con más de 250 copropietarios institucionales.

Guías metodológicas relacionadas:

EUAT

Infraestructura que puede citar con confianza.

Transkribus es una infraestructura de investigación construida y gobernada por las instituciones que la utilizan — un sólido argumento de sostenibilidad para cualquier propuesta de proyecto.

Alojado en Austria, UE

Todo el procesamiento en nuestros propios servidores. Cumple con el RGPD. Sin dependencias de nubes de terceros.

Cooperativa, no una startup

Más de 250 archivos, bibliotecas y universidades como copropietarios. Construido para décadas, no para una salida de capital riesgo.

Sus datos le pertenecen

Propiedad total. Exporte y elimine en cualquier momento. Sin compartir datos con terceros.

Comience su estudio piloto hoy

Pruebe Transkribus con su material fuente antes de redactar la propuesta. Incluya datos reales de precisión como evidencia preliminar — el argumento más sólido que puede presentar a los evaluadores.

50 créditos gratuitos cada mes · Sin tarjeta de crédito

200 M+Páginas procesadas
500 K+Usuarios en todo el mundo
500+Universidades