
Museum für Naturkunde Berlin
Duitsland250.000 specimenlabels met handgeschreven metadata uit twee eeuwen. Standaard OCR faalde volledig — vervaagde inkt, beschadigd papier, gemengde schriften en niet-standaard layouts.
Ontwikkeling van een Smart Extract-model — een AI die labelstructuren contextueel begrijpt. Aangevuld met Named Entity Recognition met GeoNames-verrijking voor automatisch taggen van soorten en oplossen van plaatsnamen.
Eerste succesvolle praktijkinzet van een Smart Extract-model. Complete machineleesbare dataset van 250.000 getranscribeerde en getagde labels — een repliceerbaar model voor natuurhistorische collecties wereldwijd.









