1.Perché includere l'HTR nella metodologia
Il riconoscimento automatico del testo manoscritto (HTR) è maturato da tecnica sperimentale a metodo di ricerca consolidato, impiegato nelle scienze umane e sociali. Centinaia di pubblicazioni peer-reviewed citano la trascrizione assistita dall'IA come componente centrale del proprio flusso di lavoro, e i principali enti finanziatori — tra cui ERC, DFG, NEH, AHRC, SNSF, FWF e MUR/PRIN — hanno assegnato finanziamenti a progetti che la adottano.
La motivazione metodologica dell'HTR poggia su tre pilastri:
- Efficienza. La trascrizione automatica elabora le pagine in pochi secondi, anziché i 15–60 minuti richiesti dalla trascrizione manuale, rendendo possibile il lavoro su corpora di grandi dimensioni entro le tempistiche tipiche di un progetto finanziato.
- Riproducibilità. Un modello addestrato produce un output identico sullo stesso input ogni volta. Questo comportamento deterministico rappresenta un vantaggio significativo rispetto alla trascrizione manuale, in cui l'accordo tra annotatori è imperfetto.
- Misurabilità. La qualità del riconoscimento è quantificata tramite il Character Error Rate (CER), una metrica oggettiva calcolata su dati di test non utilizzati nell'addestramento. Ciò fornisce ai valutatori — e al gruppo di ricerca — un indicatore di qualità concreto e verificabile.
Includere l'HTR nella propria metodologia segnala che il progetto impiega metodi digitali allo stato dell'arte mantenendo un rigoroso controllo qualità. Dimostra inoltre la consapevolezza dei vincoli di scalabilità che spesso preoccupano i valutatori nella valutazione di grandi corpora documentari.