Skip to content
  • Prezzi

Invia migliaia di job. Al resto pensiamo noi.

L'API di Transkribus gestisce la tua coda di elaborazione in modo intelligente. Invia documenti uno alla volta o migliaia in parallelo — i job vengono distribuiti tra i cluster GPU, elaborati in modo asincrono e i risultati consegnati tramite long polling o polling standard. Da un'integrazione prototipale a milioni di pagine archivistiche.

Elaborazione batch di una collezione di documenti
200M+pagine elaborate sulla piattaforma
15M+pagine in un unico progetto
300+modelli AI per qualsiasi scrittura

Pipeline tradizionale vs. Transkribus

L'elaborazione di documenti su larga scala significava un tempo gestire persone e code manualmente. Transkribus gestisce quell'infrastruttura al posto vostro.

Approccio tradizionale

Assumi trascrittori

Recluta, forma e gestisci un team di trascrittori qualificati

Elabora in sequenza

Ogni pagina trascritta a mano, una alla volta

Controllo qualità

Un secondo lettore controlla ogni pagina alla ricerca di errori

Formatta ed esporta

Conversione manuale nel formato di output richiesto

Lineare — si adatta al numero di persone
vs

Elaborazione batch con Transkribus

Invia i job

Carica tramite web app o invia migliaia di job via API

Coda intelligente

I job vengono distribuiti automaticamente tra i cluster GPU

Ricevi i risultati

Long polling per risultati immediati, oppure polling asincrono per i job batch

Esporta

Testo semplice, PAGE XML, ALTO, TEI — output strutturato

Parallelo — si adatta all'infrastruttura

Gestione intelligente della coda

Come funziona la pipeline di elaborazione

L'API di Transkribus è progettata in modo asincrono. Invia job a qualsiasi velocità — la coda li distribuisce tra la capacità GPU disponibile. Per le integrazioni in tempo reale, utilizza il long polling per ricevere i risultati non appena sono pronti. Non sei soddisfatto della precisione? Addestra un modello personalizzato sui tuoi documenti specifici utilizzando l'editor visuale, poi rielabora l'intero batch.

Invia

Invia immagini via API — URL, base64 o caricamento file

Coda

Distribuzione intelligente dei job tra i cluster GPU

Elabora

Analisi del layout e riconoscimento del testo in parallelo

Risultato

Long polling o polling asincrono — a tua scelta

Esporta

Testo semplice, PAGE XML, ALTO o JSON

Caso di studio

Zeitpunkt.NRW: 15 milioni di pagine di giornali in un unico progetto

Il Land del Nordrhein-Westfalen ha utilizzato Transkribus per elaborare 15 milioni di pagine di giornali storici — il più grande progetto di digitalizzazione singolo sulla piattaforma. La collezione copre oltre un secolo di giornali regionali, ora completamente ricercabili e accessibili al pubblico su zeitpunkt.nrw.
15 milioni di pagine elaborate con il riconoscimento del testo AI
Fraktur storico e caratteri gotici gestiti automaticamente
Accessibile al pubblico e ricercabile full-text
Zeitpunkt.NRW — 15 milioni di pagine di giornali elaborate

Output strutturato, non solo testo piatto

Ogni pagina viene restituita con regioni di layout, righe di testo, coordinate delle parole e punteggi di affidabilità.

Testo semplice

Output testuale semplice in UTF-8. Da integrare in indici di ricerca, database o pipeline NLP.

PAGE XML

Coordinate di layout complete — regioni, righe, parole, linee di base. Lo standard per i flussi di lavoro HTR.

ALTO XML

Formato standard per le biblioteche nelle collezioni digitalizzate. Compatibile con Europeana, DFG Viewer e IIIF.

TEI XML

Formato Text Encoding Initiative per edizioni scientifiche e progetti di digital humanities.

Dati tabellari

Riconoscimento strutturato delle tabelle — righe, colonne e contenuto delle celle estratti automaticamente.

Ricerca full-text

I documenti elaborati sono immediatamente ricercabili all'interno di Transkribus — nomi, date, luoghi, parole chiave.

Pronto a elaborare la tua collezione?

Inizia con un account gratuito per testare un campione. Per progetti su larga scala, contatta il nostro team per sapere di più sui prezzi a volume e sul supporto al progetto.

200M+pagine elaborate
Volumeprezzi disponibili
Hosted in UEconforme al GDPR