Invia migliaia di job. Al resto pensiamo noi.
L'API di Transkribus gestisce la tua coda di elaborazione in modo intelligente. Invia documenti uno alla volta o migliaia in parallelo — i job vengono distribuiti tra i cluster GPU, elaborati in modo asincrono e i risultati consegnati tramite long polling o polling standard. Da un'integrazione prototipale a milioni di pagine archivistiche.

Pipeline tradizionale vs. Transkribus
L'elaborazione di documenti su larga scala significava un tempo gestire persone e code manualmente. Transkribus gestisce quell'infrastruttura al posto vostro.
Approccio tradizionale
Assumi trascrittori
Recluta, forma e gestisci un team di trascrittori qualificati
Elabora in sequenza
Ogni pagina trascritta a mano, una alla volta
Controllo qualità
Un secondo lettore controlla ogni pagina alla ricerca di errori
Formatta ed esporta
Conversione manuale nel formato di output richiesto
Elaborazione batch con Transkribus
Invia i job
Carica tramite web app o invia migliaia di job via API
Coda intelligente
I job vengono distribuiti automaticamente tra i cluster GPU
Ricevi i risultati
Long polling per risultati immediati, oppure polling asincrono per i job batch
Esporta
Testo semplice, PAGE XML, ALTO, TEI — output strutturato
Gestione intelligente della coda
Come funziona la pipeline di elaborazione
L'API di Transkribus è progettata in modo asincrono. Invia job a qualsiasi velocità — la coda li distribuisce tra la capacità GPU disponibile. Per le integrazioni in tempo reale, utilizza il long polling per ricevere i risultati non appena sono pronti. Non sei soddisfatto della precisione? Addestra un modello personalizzato sui tuoi documenti specifici utilizzando l'editor visuale, poi rielabora l'intero batch.
Invia
Invia immagini via API — URL, base64 o caricamento file
Coda
Distribuzione intelligente dei job tra i cluster GPU
Elabora
Analisi del layout e riconoscimento del testo in parallelo
Risultato
Long polling o polling asincrono — a tua scelta
Esporta
Testo semplice, PAGE XML, ALTO o JSON
Caso di studio
Zeitpunkt.NRW: 15 milioni di pagine di giornali in un unico progetto

Output strutturato, non solo testo piatto
Ogni pagina viene restituita con regioni di layout, righe di testo, coordinate delle parole e punteggi di affidabilità.
Testo semplice
Output testuale semplice in UTF-8. Da integrare in indici di ricerca, database o pipeline NLP.
PAGE XML
Coordinate di layout complete — regioni, righe, parole, linee di base. Lo standard per i flussi di lavoro HTR.
ALTO XML
Formato standard per le biblioteche nelle collezioni digitalizzate. Compatibile con Europeana, DFG Viewer e IIIF.
TEI XML
Formato Text Encoding Initiative per edizioni scientifiche e progetti di digital humanities.
Dati tabellari
Riconoscimento strutturato delle tabelle — righe, colonne e contenuto delle celle estratti automaticamente.
Ricerca full-text
I documenti elaborati sono immediatamente ricercabili all'interno di Transkribus — nomi, date, luoghi, parole chiave.
Pronto a elaborare la tua collezione?
Inizia con un account gratuito per testare un campione. Per progetti su larga scala, contatta il nostro team per sapere di più sui prezzi a volume e sul supporto al progetto.