Skip to content
  • Prezzi

Cos'è il riconoscimento del testo manoscritto (HTR)?

Il riconoscimento del testo manoscritto utilizza il deep learning per convertire documenti manoscritti in testo leggibile dalla macchina. A differenza dell'OCR standard, l'HTR è addestrato su campioni di scrittura reale e può decifrare scritture storiche, corsivo e forme di lettere connesse che i sistemi basati su regole non possono gestire.

HTR spiegatoCome funzionaHTR vs OCRApplicazioni

Trascina un'immagine qui

Seleziona un file...

PNG o JPG fino a 10 Mb

Wolpi
AI Assistant

Caricando un'immagine, accetti i nostri termini e la nostra informativa sulla privacy.

Provalo ora — carica un documento manoscritto e guarda l'HTR in azione. Utilizzato presso oltre 500 università in tutto il mondo.

500.000+
Utenti nel mondo
200 M+
Pagine elaborate
300+
Modelli HTR pubblici
100+
Lingue e scritture

Il problema

Perché l'OCR standard fallisce sulla scrittura a mano

Il riconoscimento ottico dei caratteri (OCR) è stato progettato per il testo stampato — font uniformi con spaziatura regolare dei caratteri e layout prevedibili. Quando applicato a documenti manoscritti, l'OCR standard produce risultati inutilizzabili. La scrittura è intrinsecamente variabile: le forme delle lettere differiscono tra gli scriventi, i caratteri si connettono in modi imprevedibili e le scritture storiche come Kurrent, Sütterlin o Secretary Hand hanno poca somiglianza con la stampa moderna. Questo è il problema fondamentale che la tecnologia di riconoscimento del testo manoscritto è stata sviluppata per risolvere.
I motori OCR standard si aspettano forme di caratteri uniformi — la scrittura varia tra ogni scrivente e persino all'interno di una singola pagina
Le scritture connesse e corsive non possono essere segmentate in singoli caratteri come il testo stampato
Le scritture storiche (Kurrent, Secretary Hand, Copperplate) usano forme di lettere assenti dai set di addestramento dell'OCR moderno
Abbreviazioni, legature e convenzioni di apice nei manoscritti storici non hanno equivalenti nella stampa
Il deterioramento del documento — inchiostro sbiadito, trasparenza, foxing — complica la sfida oltre le capacità dei sistemi basati su regole
Confronto: output OCR vs output HTR su un documento manoscritto

La soluzione

Come funziona l'HTR? Il riconoscimento IA della scrittura spiegato

Il riconoscimento del testo manoscritto utilizza reti neurali profonde — tipicamente una combinazione di reti neurali convoluzionali (CNN) e reti neurali ricorrenti (RNN) — per apprendere i modelli visivi della scrittura direttamente da esempi etichettati. Anziché basarsi su regole predefinite sull'aspetto delle lettere, un modello HTR viene addestrato su migliaia di immagini accoppiate con le loro trascrizioni corrette (chiamate "ground truth"). Attraverso questo addestramento, il modello impara a riconoscere non solo i singoli caratteri, ma sequenze di tratti connessi, forme contestuali delle lettere e le relazioni spaziali tra gli elementi testuali sulla pagina.
L'analisi del layout rileva regioni di testo, righe ed elementi strutturali (colonne, tabelle, annotazioni marginali) sulla pagina
La segmentazione delle righe isola le singole righe di testo dal layout rilevato
La rete neurale elabora ogni immagine di riga e predice una sequenza di caratteri, considerando il contesto dai tratti circostanti
La modellazione linguistica e il post-processing raffinano l'output, risolvendo caratteri ambigui usando modelli statistici
I punteggi di affidabilità vengono assegnati a ogni carattere e riga previsti, consentendo una revisione qualitativa mirata
Document
Addres to dear Isabella on the Authors
recovery
O Isa pain did visit me
I was at the last extremity
How often did I think of you
I wished your graceful form to view
To clasp you in my weak embrace
Indeed I thought Id run my race
Good Care Im sure was of me taken
But indeed I was much shaken
At last I daily strength did gain

HTR vs OCR

Riconoscimento del testo manoscritto vs. riconoscimento ottico dei caratteri

HTR e OCR sono tecnologie correlate ma affrontano sfide fondamentalmente diverse. Comprendere la distinzione è importante quando si valutano gli strumenti per l'elaborazione di documenti storici.

FeatureHTR (Riconoscimento del testo manoscritto)OCR standard
Progettato perTesto manoscritto e corsivoTesto stampato e dattiloscritto
Segmentazione dei caratteriNon richiesta — elabora tratti connessi come sequenzeRichiede l'isolamento dei singoli caratteri
Scritture storicheKurrent, Secretary Hand, Copperplate e oltre 100 altreSupporto limitato o assente
Approccio di addestramentoDeep learning su campioni di scrittura etichettati (ground truth)Corrispondenza di modelli basata su regole o modelli addestrati sulla stampa
AdattabilitàModelli personalizzati possono essere addestrati per calligrafie o scritture specificheGeneralmente fisso — non può adattarsi a nuovi stili di scrittura
Accuratezza sulla scritturaTipicamente 90-98% di accuratezza a livello di carattere con modelli addestratiSpesso inferiore al 50% su corsivo o scrittura storica
Analisi del layoutGestisce layout complessi: colonne, tabelle, annotazioni marginaliBasilare — presuppone un semplice flusso di testo da sinistra a destra
Scritture connesseSì — arabo, ebraico, scritture latine in corsivoSupporto limitato o assente
Documenti deterioratiRobusto — addestrato su documenti storici reali con danniLe prestazioni degradano significativamente
Punteggi di affidabilitàPunteggi di affidabilità per carattere e per rigaVariabile — spesso assente o inaffidabile

Il confronto riflette le capacità generali dei sistemi HTR (incluso Transkribus) rispetto ai motori OCR standard. I risultati specifici dipendono dal tipo di documento, dalla selezione del modello e dalle condizioni del documento.

Copertura

Quali scritture, lingue e secoli supporta l'HTR?

Le moderne piattaforme HTR — Transkribus in particolare — supportano una gamma straordinariamente ampia di scritture, lingue e periodi storici. La chiave è la disponibilità di modelli addestrati. Poiché i modelli HTR apprendono da esempi anziché da regole, qualsiasi scrittura per la quale esistano dati di addestramento sufficienti può essere supportata. Transkribus offre oltre 300 modelli pubblici contribuiti da ricercatori e istituzioni di tutto il mondo, coprendo documenti dal IX secolo ai giorni nostri.
Scritture latine: varianti moderne e storiche tra cui Kurrent, Sütterlin, Secretary Hand, Copperplate, umanistica e gotica corsiva
Scritture non latine: arabo, ebraico, greco, cirillico, devanagari, cinese, giapponese e altro — con modelli disponibili o addestrabili
Oltre 100 lingue rappresentate nel catalogo pubblico dei modelli, dal tedesco e inglese al finlandese, ungherese e turco ottomano
Arco temporale dai manoscritti medievali (IX secolo) attraverso i registri amministrativi della prima età moderna fino alla corrispondenza del XX secolo
Documenti multi-scrittura: i modelli possono gestire pagine contenenti più scritture (ad es., intestazioni in latino con testo in Kurrent)
Esempi di scritture supportate dall'HTR: Kurrent, arabo, Secretary Hand e altro

Utilizzato nelle principali istituzioni di ricerca di tutto il mondo

Chi usa l'HTR

La tecnologia di riconoscimento del testo manoscritto nella pratica

L'HTR ha superato la fase sperimentale. È ora uno strumento di produzione utilizzato nelle discipline umanistiche, nel patrimonio culturale e nelle scienze dell'informazione. I ricercatori lo usano per costruire corpora ricercabili da collezioni manoscritte. Gli archivi lo usano per elaborare arretrati di materiali non digitalizzati. Le biblioteche lo usano per rendere le collezioni speciali accessibili. La tecnologia è particolarmente trasformativa in contesti dove il volume di materiale manoscritto rende la trascrizione manuale economicamente impossibile.
Ricercatori in digital humanities che trascrivono corrispondenza, diari e manoscritti letterari per edizioni accademiche
Archivi nazionali e comunali che elaborano documenti amministrativi, atti giudiziari e registri civici su larga scala
Biblioteche e collezioni speciali che rendono inventari e voci di catalogo ricercabili e accessibili
Genealogisti che leggono registri parrocchiali, registri del censimento e documenti civili in scritture storiche
Progetti di patrimonio culturale che digitalizzano collezioni di manoscritti in pericolo prima del deterioramento fisico
Historical notarial document — one of many document types HTR handles in practice

Oltre il riconoscimento

La pipeline completa: dal documento manoscritto ai dati strutturati

Il riconoscimento del testo manoscritto è un passaggio di una pipeline più ampia di elaborazione dei documenti. Un flusso di lavoro completo inizia con la digitalizzazione (scansione o fotografia), procede attraverso l'analisi del layout e il riconoscimento del testo, e continua nel post-processing: riconoscimento delle entità, estrazione dei metadati, esportazione strutturata e pubblicazione. Transkribus integra tutte queste fasi in un'unica piattaforma, così i ricercatori non devono assemblare strumenti separati per ogni passaggio.
Analisi del layout: rilevamento automatico di regioni di testo, colonne, tabelle, intestazioni e annotazioni marginali
Riconoscimento del testo: l'HTR converte le righe di testo rilevate in caratteri leggibili dalla macchina
Addestramento di modelli personalizzati: perfeziona i modelli sul tuo specifico tipo di manoscritto per una maggiore accuratezza
Riconoscimento e tagging delle entità: identifica persone, luoghi, date e altre entità nel testo trascritto
Esportazione come TEI-XML, PAGE XML, ALTO XML, PDF ricercabile o testo semplice — pronto per l'analisi, la pubblicazione o l'importazione archivistica
La pipeline completa di elaborazione dei documenti: dalla scansione ai dati strutturati

Domande frequenti sul riconoscimento del testo manoscritto

L'OCR (Riconoscimento ottico dei caratteri) è stato progettato per il testo stampato e funziona abbinando le forme dei singoli caratteri a font noti. L'HTR (Riconoscimento del testo manoscritto) utilizza il deep learning per elaborare la scrittura connessa e variabile come sequenze di tratti anziché caratteri isolati. L'HTR può gestire scritture corsive, calligrafie storiche e la variazione naturale intrinseca della scrittura a mano — compiti in cui l'OCR standard tipicamente fallisce. In breve: l'OCR legge la stampa, l'HTR legge la scrittura.
I modelli HTR vengono addestrati su dataset accoppiati chiamati 'ground truth': immagini di testo manoscritto allineate con le loro trascrizioni corrette. La rete neurale impara a mappare i modelli visivi della scrittura su sequenze di caratteri. L'addestramento richiede tipicamente 50-100 pagine trascritte per un modello personalizzato, anche se dataset più ampi migliorano la precisione. Il modello impara non solo le forme delle lettere ma anche i modelli contestuali — come i caratteri si connettono, le abbreviazioni comuni e le convenzioni specifiche della scrittura.
La precisione viene misurata dal Character Error Rate (CER) — la percentuale di caratteri che differiscono tra l'output HTR e il testo corretto. Modelli ben addestrati su scritture leggibili raggiungono regolarmente un CER inferiore al 5% (oltre il 95% di accuratezza a livello di carattere). Documenti impegnativi — molto danneggiati, sbiaditi o in scritture insolite — possono dare un CER del 10-15% prima dell'addestramento personalizzato. Dopo il perfezionamento di un modello sul tipo specifico di documento, l'accuratezza migliora tipicamente in modo significativo.
L'HTR funziona praticamente su qualsiasi documento manoscritto per il quale esiste o può essere creato un modello addestrato: lettere, diari, registri parrocchiali, atti giudiziari, fascicoli amministrativi, registri del censimento, quaderni scientifici, manoscritti letterari, atti fondiari e altro. Gestisce anche documenti misti che contengono sia stampa sia scrittura. Il requisito chiave è un modello addestrato su una scrittura e un tipo di documento simili.
Transkribus, la piattaforma HTR leader, offre 50 crediti gratuiti ogni mese — sufficienti per elaborare circa 500 pagine. Non è richiesta alcuna carta di credito per iniziare. Piani a pagamento sono disponibili per ricercatori e istituzioni che elaborano volumi maggiori. Consulta piani e prezzi per i dettagli.
Una singola pagina richiede tipicamente 15-30 secondi per l'elaborazione, a seconda della complessità del documento e del modello utilizzato. L'elaborazione in blocco consente di mettere in coda e elaborare automaticamente centinaia o migliaia di pagine. Un manoscritto di 500 pagine può essere trascritto in meno di un'ora — un lavoro che richiederebbe settimane o mesi a mano.
Transkribus offre oltre 300 modelli HTR pubblici che coprono oltre 100 lingue e scritture. Questi includono lingue in alfabeto latino (inglese, tedesco, francese, spagnolo, olandese, svedese e molte altre), nonché arabo, ebraico, greco, cirillico e altri sistemi di scrittura. Scritture storiche come Kurrent, Sütterlin, Secretary Hand e Copperplate sono ben rappresentate. Se un modello per la tua scrittura specifica non esiste, puoi addestrare un modello personalizzato.
EUAT

Costruito per la ricerca. Ospitato in Europa. Aperto e cooperativo.

Transkribus è sviluppato e ospitato da READ-COOP SCE, una cooperativa europea di oltre 250 istituzioni. I tuoi dati restano tuoi.

I vostri dati restano vostri

Piena proprietà. Cancellate in qualsiasi momento.

Ospitato in Austria, UE

Elaborazione sui nostri server. Conforme al GDPR. Nessuna dipendenza cloud di terzi.

Cooperativa, non una startup

Migliaia di archivi, biblioteche e università come comproprietari. Costruito per decenni, non per un'uscita VC.

L'HTR in azione

Esplora le guide per caso d'uso

Applicazioni reali dell'HTR

Pronto a provare il riconoscimento del testo manoscritto?

Crea un account gratuito ed elabora i tuoi primi documenti con Transkribus. 50 crediti gratuiti ogni mese — nessuna carta di credito richiesta.

Utilizzato presso oltre 500 università e istituzioni di ricerca

200 M+Pagine elaborate
500.000+Utenti nel mondo
300+Modelli HTR pubblici