
Museum für Naturkunde Berlin
Alemania250.000 etiquetas de especímenes con metadatos manuscritos que abarcan dos siglos. El OCR estándar falló por completo — tinta descolorida, papel dañado, escrituras mixtas y diseños no estándar.
Desarrollo de un modelo Smart Extract — una IA que comprende contextualmente la estructura de las etiquetas. Añadido reconocimiento de entidades nombradas con enriquecimiento GeoNames para el etiquetado automático de especies y resolución de topónimos.
Primer despliegue real exitoso de un modelo Smart Extract. Conjunto de datos completo de 250.000 etiquetas transcritas y etiquetadas — un modelo replicable para colecciones de historia natural en todo el mundo.









