Il tuo archivio di giornali, completamente ricercabile.

Milioni di pagine di giornali storici giacciono negli archivi — scansionate ma non ricercabili. Transkribus legge il testo, comprende il layout e trasforma ogni articolo, titolo e annuncio in dati strutturati e ricercabili. Da una singola testata a un'intera collezione nazionale.

Prenota una consulenza Leggi la guida pratica

Segmentazione del layout di un giornale storico

30M+pagine di giornali elaborate

15M+pagine solo in Zeitpunkt.NRW

100+modelli pubblici per stampa e Fraktur

Ricerca full-text negli articoli di giornale

Testo full-text ricercabile

Ogni articolo, titolo, pubblicità e annuncio classificato su ogni pagina — riconosciuto e indicizzato. Cerca per nome, data, parola chiave o frase nell'intera collezione.

Segmentazione automatica del layout di un giornale

Dati di layout strutturati

L'AI segmenta le pagine a più colonne in singole regioni di contenuto — articoli, titoli, pubblicità, didascalie. Ogni regione è taggata ed esportata separatamente, così i sistemi a valle possono lavorare con gli articoli, non con dump grezzi di pagine.

Collezione di giornali pubblicata come Transkribus Site

Una collezione online sfogliabile

I giornali elaborati possono essere pubblicati come Transkribus Site — un'interfaccia hosted e ricercabile per la tua collezione. Nessuno sviluppo necessario. Con il branding della tua istituzione.

Caso di studio

Zeitpunkt.NRW: 20 milioni di pagine di giornali per la Renania Settentrionale-Vestfalia

Il progetto Zeitpunkt.NRW sta digitalizzando l'intero patrimonio storico di giornali della Renania Settentrionale-Vestfalia — 20 milioni di pagine che abbracciano secoli di storia regionale. Transkribus esegue il riconoscimento del testo su larga scala, trasformando le pagine scansionate in testo ricercabile pubblicato attraverso il portale digitale dei giornali dello Stato.

20 milioni di pagine di giornali elaborate con Transkribus

Secoli di giornali regionali delle biblioteche della Renania Settentrionale-Vestfalia

Ricerca full-text disponibile attraverso il portale Zeitpunkt.NRW

Visita Zeitpunkt.NRW

Zeitpunkt.NRW — 20 milioni di pagine di giornali digitalizzate

Caso di studio

NewsEye: miglioramento del riconoscimento del testo dei giornali con la Biblioteca Nazionale della Finlandia

Il progetto NewsEye finanziato dall'UE (Orizzonte 2020) ha riunito la Biblioteca Nazionale della Finlandia con informatici e ricercatori di digital humanities per migliorare il riconoscimento del testo sui giornali storici. Lavorando con 2,5 milioni di pagine di 10 testate giornalistiche finlandesi — metà in svedese, molte in caratteri gotici — il team ha utilizzato Transkribus per addestrare modelli personalizzati che hanno migliorato la precisione del riconoscimento di una media di 10 punti percentuali rispetto ai metodi OCR tradizionali.

2,5 milioni di pagine di giornali (1771–1914), 10 testate

Il riconoscimento dei caratteri gotici è migliorato in media di 10 punti percentuali

Ricerca migliorata nella biblioteca digitale nazionale finlandese

Leggi del progetto NewsEye

Progetto NewsEye — digitalizzazione di giornali storici

L'approccio

Dalle scansioni al testo strutturato — come le istituzioni digitalizzano i giornali su larga scala

La digitalizzazione dei giornali segue un flusso di lavoro collaudato: carica le tue scansioni, seleziona tra 100+ modelli pre-addestrati per testi a stampa e Fraktur (o addestra il tuo su specifici caratteri tipografici), esegui il riconoscimento del testo batch con analisi automatica del layout ed esporta i risultati strutturati. L'AI gestisce layout a più colonne, tipi di contenuto misto e caratteri tipografici storici — inclusi Fraktur, gotico e stampa della prima età moderna.

100+ modelli pubblici per Fraktur, gotico e stampa storica

Segmentazione automatica del layout per pagine di giornali a più colonne

Elaborazione batch di migliaia di pagine — nessun intervento manuale

Esportazione come PDF ricercabile, testo semplice o XML strutturato (ALTO, PAGE)

Come digitalizzare i giornali con Transkribus

Analisi del layout di un giornale e riconoscimento del testo

Come digitalizzare i giornali con Transkribus

Guida passo-passo: scansione, segmentazione del layout, selezione del modello e riconoscimento del testo per giornali storici.

Guida

Leggi la guida

Modelli AI per Fraktur, Kurrent e Sütterlin

Le scritture storiche tedesche a stampa e manoscritte più comuni — e i modelli pubblici che le sanno leggere.

Modelli

Vedi i modelli

Riduzione dell'arretrato archivistico

Come gli archivi usano l'AI per elaborare milioni di pagine non ricercabili — lo stesso approccio applicabile alle collezioni di giornali.

Caso d'uso

Scopri di più

Pronto a rendere ricercabile il tuo archivio di giornali?

Parla con il nostro team della tua collezione. Ti aiuteremo a trovare i modelli giusti, pianificare il flusso di lavoro e stimare la portata del progetto.

Prenota una consulenza Inizia gratuitamente

30M+pagine di giornali elaborate

100+modelli pubblici per testi a stampa

Hosted in UEconforme al GDPR

Il tuo archivio di giornali, completamente ricercabile.

L'output

Testo full-text ricercabile

Dati di layout strutturati

Una collezione online sfogliabile

Zeitpunkt.NRW: 20 milioni di pagine di giornali per la Renania Settentrionale-Vestfalia

NewsEye: miglioramento del riconoscimento del testo dei giornali con la Biblioteca Nazionale della Finlandia

Dalle scansioni al testo strutturato — come le istituzioni digitalizzano i giornali su larga scala

Guide e modelli

Come digitalizzare i giornali con Transkribus

Modelli AI per Fraktur, Kurrent e Sütterlin

Riduzione dell'arretrato archivistico

Pronto a rendere ricercabile il tuo archivio di giornali?