1.Por qué incluir el HTR en su metodología
El reconocimiento de texto manuscrito (HTR) ha pasado de ser una técnica experimental a un método de investigación consolidado, utilizado en las humanidades y las ciencias sociales. Cientos de publicaciones revisadas por pares citan la transcripción asistida por inteligencia artificial como parte fundamental de su flujo de trabajo, y organismos de financiación destacados —entre ellos el ERC, la DFG, el NEH, el AHRC, el SNSF y el FWF— han concedido subvenciones a proyectos que la emplean.
La justificación metodológica del HTR se sustenta en tres pilares:
- Eficiencia. La transcripción automatizada procesa páginas en segundos, frente a los 15-60 minutos que requiere la transcripción manual, lo que hace viable el trabajo con corpus a gran escala dentro de los plazos habituales de un proyecto financiado.
- Reproducibilidad. Un modelo entrenado produce resultados idénticos con la misma entrada en cada ejecución. Este comportamiento determinista supone una ventaja significativa frente a la transcripción manual, donde la concordancia entre anotadores es imperfecta.
- Mensurabilidad. La calidad del reconocimiento se cuantifica mediante la tasa de error de caracteres (CER), una métrica objetiva calculada sobre datos de prueba reservados. Esto proporciona a los evaluadores —y al equipo de investigación— un indicador de calidad concreto y verificable.
Incluir el HTR en su metodología indica que el proyecto aprovecha métodos digitales de vanguardia manteniendo un riguroso control de calidad. También demuestra conciencia de las limitaciones de escalabilidad que suelen preocupar a los evaluadores al valorar grandes corpus documentales.