Skip to content
  • Prezzi

Il tuo archivio di giornali, completamente ricercabile.

Milioni di pagine di giornali storici giacciono negli archivi — scansionate ma non ricercabili. Transkribus legge il testo, comprende il layout e trasforma ogni articolo, titolo e annuncio in dati strutturati e ricercabili. Da una singola testata a un'intera collezione nazionale.

Segmentazione del layout di un giornale storico
30M+pagine di giornali elaborate
15M+pagine solo in Zeitpunkt.NRW
100+modelli pubblici per stampa e Fraktur

L'output

Il risultato finale dopo l'elaborazione della tua collezione di giornali.

Ricerca full-text negli articoli di giornale

Testo full-text ricercabile

Ogni articolo, titolo, pubblicità e annuncio classificato su ogni pagina — riconosciuto e indicizzato. Cerca per nome, data, parola chiave o frase nell'intera collezione.

Segmentazione automatica del layout di un giornale

Dati di layout strutturati

L'AI segmenta le pagine a più colonne in singole regioni di contenuto — articoli, titoli, pubblicità, didascalie. Ogni regione è taggata ed esportata separatamente, così i sistemi a valle possono lavorare con gli articoli, non con dump grezzi di pagine.

Collezione di giornali pubblicata come Transkribus Site

Una collezione online sfogliabile

I giornali elaborati possono essere pubblicati come Transkribus Site — un'interfaccia hosted e ricercabile per la tua collezione. Nessuno sviluppo necessario. Con il branding della tua istituzione.

Caso di studio

Zeitpunkt.NRW: 20 milioni di pagine di giornali per la Renania Settentrionale-Vestfalia

Il progetto Zeitpunkt.NRW sta digitalizzando l'intero patrimonio storico di giornali della Renania Settentrionale-Vestfalia — 20 milioni di pagine che abbracciano secoli di storia regionale. Transkribus esegue il riconoscimento del testo su larga scala, trasformando le pagine scansionate in testo ricercabile pubblicato attraverso il portale digitale dei giornali dello Stato.
20 milioni di pagine di giornali elaborate con Transkribus
Secoli di giornali regionali delle biblioteche della Renania Settentrionale-Vestfalia
Ricerca full-text disponibile attraverso il portale Zeitpunkt.NRW
Zeitpunkt.NRW — 20 milioni di pagine di giornali digitalizzate

Caso di studio

NewsEye: miglioramento del riconoscimento del testo dei giornali con la Biblioteca Nazionale della Finlandia

Il progetto NewsEye finanziato dall'UE (Orizzonte 2020) ha riunito la Biblioteca Nazionale della Finlandia con informatici e ricercatori di digital humanities per migliorare il riconoscimento del testo sui giornali storici. Lavorando con 2,5 milioni di pagine di 10 testate giornalistiche finlandesi — metà in svedese, molte in caratteri gotici — il team ha utilizzato Transkribus per addestrare modelli personalizzati che hanno migliorato la precisione del riconoscimento di una media di 10 punti percentuali rispetto ai metodi OCR tradizionali.
2,5 milioni di pagine di giornali (1771–1914), 10 testate
Il riconoscimento dei caratteri gotici è migliorato in media di 10 punti percentuali
Ricerca migliorata nella biblioteca digitale nazionale finlandese
Progetto NewsEye — digitalizzazione di giornali storici

L'approccio

Dalle scansioni al testo strutturato — come le istituzioni digitalizzano i giornali su larga scala

La digitalizzazione dei giornali segue un flusso di lavoro collaudato: carica le tue scansioni, seleziona tra 100+ modelli pre-addestrati per testi a stampa e Fraktur (o addestra il tuo su specifici caratteri tipografici), esegui il riconoscimento del testo batch con analisi automatica del layout ed esporta i risultati strutturati. L'AI gestisce layout a più colonne, tipi di contenuto misto e caratteri tipografici storici — inclusi Fraktur, gotico e stampa della prima età moderna.
100+ modelli pubblici per Fraktur, gotico e stampa storica
Segmentazione automatica del layout per pagine di giornali a più colonne
Elaborazione batch di migliaia di pagine — nessun intervento manuale
Esportazione come PDF ricercabile, testo semplice o XML strutturato (ALTO, PAGE)
Analisi del layout di un giornale e riconoscimento del testo

Guide e modelli

Tutorial, modelli AI e casi d'uso correlati per la digitalizzazione dei giornali.

Come digitalizzare i giornali con Transkribus

Guida passo-passo: scansione, segmentazione del layout, selezione del modello e riconoscimento del testo per giornali storici.

Guida

Modelli AI per Fraktur, Kurrent e Sütterlin

Le scritture storiche tedesche a stampa e manoscritte più comuni — e i modelli pubblici che le sanno leggere.

Modelli

Riduzione dell'arretrato archivistico

Come gli archivi usano l'AI per elaborare milioni di pagine non ricercabili — lo stesso approccio applicabile alle collezioni di giornali.

Caso d'uso

Pronto a rendere ricercabile il tuo archivio di giornali?

Parla con il nostro team della tua collezione. Ti aiuteremo a trovare i modelli giusti, pianificare il flusso di lavoro e stimare la portata del progetto.

30M+pagine di giornali elaborate
100+modelli pubblici per testi a stampa
Hosted in UEconforme al GDPR