Invia migliaia di job. Al resto pensiamo noi.

L'API di Transkribus gestisce la tua coda di elaborazione in modo intelligente. Invia documenti uno alla volta o migliaia in parallelo — i job vengono distribuiti tra i cluster GPU, elaborati in modo asincrono e i risultati consegnati tramite long polling o polling standard. Da un'integrazione prototipale a milioni di pagine archivistiche.

Prenota una consulenza Scopri l'API

Elaborazione batch di una collezione di documenti

200M+pagine elaborate sulla piattaforma

15M+pagine in un unico progetto

300+modelli AI per qualsiasi scrittura

Pipeline tradizionale vs. Transkribus

L'elaborazione di documenti su larga scala significava un tempo gestire persone e code manualmente. Transkribus gestisce quell'infrastruttura al posto vostro.

Approccio tradizionale

Assumi trascrittori

Recluta, forma e gestisci un team di trascrittori qualificati

Elabora in sequenza

Ogni pagina trascritta a mano, una alla volta

Controllo qualità

Un secondo lettore controlla ogni pagina alla ricerca di errori

Formatta ed esporta

Conversione manuale nel formato di output richiesto

Lineare — si adatta al numero di persone

Elaborazione batch con Transkribus

Invia i job

Carica tramite web app o invia migliaia di job via API

Coda intelligente

I job vengono distribuiti automaticamente tra i cluster GPU

Ricevi i risultati

Long polling per risultati immediati, oppure polling asincrono per i job batch

Esporta

Testo semplice, PAGE XML, ALTO, TEI — output strutturato

Parallelo — si adatta all'infrastruttura

Gestione intelligente della coda

Come funziona la pipeline di elaborazione

L'API di Transkribus è progettata in modo asincrono. Invia job a qualsiasi velocità — la coda li distribuisce tra la capacità GPU disponibile. Per le integrazioni in tempo reale, utilizza il long polling per ricevere i risultati non appena sono pronti. Non sei soddisfatto della precisione? Addestra un modello personalizzato sui tuoi documenti specifici utilizzando l'editor visuale, poi rielabora l'intero batch.

Invia

Invia immagini via API — URL, base64 o caricamento file

Coda

Distribuzione intelligente dei job tra i cluster GPU

Elabora

Analisi del layout e riconoscimento del testo in parallelo

Risultato

Long polling o polling asincrono — a tua scelta

Esporta

Testo semplice, PAGE XML, ALTO o JSON

Caso di studio

Zeitpunkt.NRW: 15 milioni di pagine di giornali in un unico progetto

Il Land del Nordrhein-Westfalen ha utilizzato Transkribus per elaborare 15 milioni di pagine di giornali storici — il più grande progetto di digitalizzazione singolo sulla piattaforma. La collezione copre oltre un secolo di giornali regionali, ora completamente ricercabili e accessibili al pubblico su zeitpunkt.nrw.

15 milioni di pagine elaborate con il riconoscimento del testo AI

Fraktur storico e caratteri gotici gestiti automaticamente

Accessibile al pubblico e ricercabile full-text

Leggi del progetto

Zeitpunkt.NRW — 15 milioni di pagine di giornali elaborate

Testo semplice

Output testuale semplice in UTF-8. Da integrare in indici di ricerca, database o pipeline NLP.

PAGE XML

Coordinate di layout complete — regioni, righe, parole, linee di base. Lo standard per i flussi di lavoro HTR.

ALTO XML

Formato standard per le biblioteche nelle collezioni digitalizzate. Compatibile con Europeana, DFG Viewer e IIIF.

TEI XML

Formato Text Encoding Initiative per edizioni scientifiche e progetti di digital humanities.

Dati tabellari

Riconoscimento strutturato delle tabelle — righe, colonne e contenuto delle celle estratti automaticamente.

Ricerca full-text

I documenti elaborati sono immediatamente ricercabili all'interno di Transkribus — nomi, date, luoghi, parole chiave.

Pronto a elaborare la tua collezione?

Inizia con un account gratuito per testare un campione. Per progetti su larga scala, contatta il nostro team per sapere di più sui prezzi a volume e sul supporto al progetto.

Inizia gratuitamente Prenota una consulenza

200M+pagine elaborate

Volumeprezzi disponibili

Hosted in UEconforme al GDPR

Invia migliaia di job. Al resto pensiamo noi.

Pipeline tradizionale vs. Transkribus

Approccio tradizionale

Assumi trascrittori

Elabora in sequenza

Controllo qualità

Formatta ed esporta

Elaborazione batch con Transkribus

Invia i job

Coda intelligente

Ricevi i risultati

Esporta

Come funziona la pipeline di elaborazione

Invia

Coda

Elabora

Risultato

Esporta

Zeitpunkt.NRW: 15 milioni di pagine di giornali in un unico progetto

Output strutturato, non solo testo piatto

Testo semplice

PAGE XML

ALTO XML

TEI XML

Dati tabellari

Ricerca full-text

Pronto a elaborare la tua collezione?