Skip to content
  • Prezzi

Il vostro progetto di digitalizzazione, gestito dall'inizio alla fine

Che abbiate bisogno di riconoscimento testo collaudato su larga scala o di un approccio completamente nuovo per materiale che nessun metodo standard può gestire — il nostro team di esperti, specialisti IA e archivisti gestisce l'intero progetto. Dall'analisi del vostro corpus alla consegna di risultati strutturati e consultabili, integrati nei vostri sistemi.

I vostri documentiScansioni, immagini, manoscritti
Analisi e prova di concettoSelezione modelli, valutazione CER
Elaborazione e addestramentoRiconoscimento, modelli personalizzati, QA
Consegna strutturataXML, CSV, Sites, integrazione sistemi
20M+pagine in un singolo progetto
2,000+istituzioni si affidano a Transkribus
95%+di precisione sui modelli addestrati

Dall'elaborazione standard alla risoluzione di problemi che nessun altro può risolvere

Ogni collezione è diversa. Adattiamo l'approccio alla sfida — dall'elaborazione batch di routine allo sviluppo di nuovi framework IA.

Elaborazione batch con modelli collaudati

Per materiale ben scansionato con scritture standard: selezioniamo i modelli giusti tra oltre 100 modelli di riconoscimento testo e layout, configuriamo il flusso di lavoro, eseguiamo l'elaborazione batch, verifichiamo la qualità e consegniamo.

Libri stampati e documenti governativiScritture standard (latina, Kurrent, Fraktur)Grandi volumi con qualità costante

Addestramento di modelli personalizzati per il vostro materiale

Quando i modelli standard non raggiungono la precisione necessaria — scritture insolite, scansioni degradate, scritture rare — addestriamo modelli IA specificamente sul vostro materiale. Più cicli di addestramento fino a raggiungere la precisione target.

Scritture rare o personaliScansioni degradate o digitalizzazione di microfilmSistemi di scrittura non latini
Vedi il progetto Bautzen — modello Kurrent personalizzato per 200 anni di verbali del consiglio

Definizione schemi, estrazione dati e integrazione sistemi

Oltre il testo semplice: definiamo schemi di estrazione per i vostri tipi di documento — tabelle, campi, record strutturati — e consegniamo dati nel formato richiesto dai vostri sistemi. Pubblicazione come Transkribus Site consultabile con la vostra identità visiva.

Estrazione tabelle e campi da registriOutput CSV, Excel o pronto per databaseIntegrazione con ArchivesSpace, AtoM, scopeArchivTranskribus Sites pubblicati con ricerca full-text
Vedi il progetto St. Gallen — 200.000 pagine pubblicate come Site consultabile

Nuovi framework quando gli approcci standard falliscono

Alcune collezioni non possono essere risolte con strumenti esistenti. Sviluppiamo nuovi approcci IA: modelli Smart Extract end-to-end, riconoscimento di entità nominate per il tagging automatico e framework su misura per problemi che nessun metodo standard può risolvere.

Smart Extract — comprensione contestuale dei documentiRiconoscimento entità nominate e geo-arricchimento automaticoFramework innovativi per documenti non standard
Vedi il progetto MfN Berlino — primo impiego reale di Smart Extract

Come funziona un progetto gestito

Un processo collaudato, perfezionato attraverso decine di progetti istituzionali. Voi mantenete il controllo su ambito e qualità — noi ci occupiamo dell'esecuzione tecnica.

Comprendere il vostro materiale

Analizziamo la vostra collezione: tipi di documento, scritture, layout, condizioni, volume. Quali dati dovete estrarre? In quali sistemi devono essere integrati? Cosa significa il successo per la vostra istituzione?

Prova di concetto

Ci inviate un campione rappresentativo. Eseguiamo l'intera pipeline — incluso l'addestramento di un modello personalizzato se necessario — e restituiamo risultati con misurazioni del tasso di errore e una stima realistica dei costi.

Pianificazione del progetto e avvio

Definiamo ambito, tempistica, milestone, deliverable e prezzi. Un/a project manager dedicato/a con formazione in digital humanities o archivistica viene assegnato/a al vostro progetto.

Elaborazione, addestramento e controllo qualità

Il/la vostro/a PM coordina la pipeline tecnica: riconoscimento, affinamento modelli, estrazione dati, controlli qualità. Riunioni di sincronizzazione bisettimanali vi tengono aggiornati.

Consegna per milestone e revisione

I risultati vengono consegnati progressivamente alle milestone concordate, ciascuna con metriche di qualità e revisione di campioni. Voi esaminate e approvate prima che proseguiamo.

Consegna finale e integrazione

Il dataset completo nel formato richiesto — PAGE XML, ALTO, TEI, CSV, PDF consultabile — o pubblicato come Transkribus Site con ricerca full-text e identità visiva personalizzata. Tutti i modelli addestrati restano vostri.

Cosa abbiamo consegnato

Da 55.000 pagine manoscritte a 20 milioni di pagine di giornali — ogni progetto è diverso.

Etichette di esemplari del Museum für Naturkunde Berlin

Museum für Naturkunde Berlin

Germania
250Ketichette di esemplari trascritte

250.000 etichette di esemplari con metadati manoscritti che coprono due secoli. L'OCR standard ha fallito completamente — inchiostro sbiadito, carta danneggiata, scritture miste e layout non standard.

Sviluppo di un modello Smart Extract — un'IA che comprende contestualmente la struttura delle etichette. Aggiunto riconoscimento di entità nominate con arricchimento GeoNames per il tagging automatico delle specie e la risoluzione dei toponimi.

Primo impiego reale di successo di un modello Smart Extract. Dataset completo di 250.000 etichette trascritte e taggate — un modello replicabile per le collezioni di storia naturale di tutto il mondo.

Leggi la storia completa
Pagine di giornali storici dal progetto Zeitpunkt.NRW

Zeitpunkt.NRW

Renania Settentrionale-Vestfalia, Germania
20Mpagine di giornali con ricerca full-text

L'intero patrimonio di giornali storici della Renania Settentrionale-Vestfalia — 20 milioni di pagine che coprono secoli. Layout multicolonna complessi, caratteri Fraktur, annunci pubblicitari e tipi di contenuto misti.

Riconoscimento full-text su scala senza precedenti. Segmentazione layout con IA per pagine di giornali complesse, elaborazione batch con controllo qualità e pubblicazione attraverso un portale digitale regionale.

Uno dei più grandi progetti di riconoscimento testo mai realizzati. Cittadini e ricercatori possono ora cercare attraverso secoli di storia regionale nel portale Zeitpunkt.NRW.

Visita zeitpunkt.nrw
Documenti notarili del Noord-Hollands Archief

Noord-Hollands Archief

Haarlem, Paesi Bassi
2Mscansioni di archivi notarili consultabili

Secoli di archivi notarili — testamenti, trasferimenti di proprietà, inventari, deposizioni di testimoni — dal 1570 al 1925. Quasi 2 milioni di scansioni di documenti manoscritti da Haarlem, Kennemerland e Amstel- en Meerlanden, inaccessibili a chiunque non sappia leggere le scritture storiche.

Applicazione dell'HTR all'intero archivio notarile. Pubblicato come Transkribus Site consultabile con ricerca fuzzy per nomi di persone e località. Precisione del 93–98,6 %. Parte del progetto pionieristico «De ijsberg zichtbaar maken» (2019–2021).

Quasi 2 milioni di scansioni di atti notarili ora consultabili in full-text online. Ricercatori, genealogisti e cittadini possono cercare nomi, località e argomenti attraverso 350 anni di storia notarile dell'Olanda Settentrionale.

Esplora la collezione
Verbali del consiglio dall'archivio di St. Gallen

Archivio di Stato di San Gallo

Svizzera
200Kpagine ora consultabili pubblicamente

417 volumi, 200.000 pagine di verbali del consiglio — manoscritti e dattiloscritti, molti digitalizzati da vecchi microfilm. Accessibili solo tramite visita in loco all'archivio.

Addestramento modello personalizzato sui verbali del consiglio. Combinazione di trascrizione automatizzata e correzione manuale. Pubblicato come Transkribus Site consultabile con vista affiancata del documento e della trascrizione.

I verbali del consiglio dal 1803 in poi accessibili al pubblico online — consultabili 24 ore su 24. Nessuna competenza paleografica richiesta.

Leggi la storia completa
Scrittura Kurrent storica dall'archivio di Bautzen

Archivverbund Bautzen

Germania
55Kpagine di storia del consiglio comunale

257 volumi di verbali del consiglio comunale dal 1623 al 1832 — 55.000 pagine in scrittura Kurrent. Digitalizzati ma inaccessibili perché la scrittura era troppo difficile da decifrare per i ricercatori non formati.

Applicazione del modello Early Kurrent, seguito dall'addestramento di un modello personalizzato. Pubblicato come Transkribus Site con permalink integrati in Archivportal-D e Findbuch.

200 anni di storia della città di Bautzen completamente consultabili. Scoperta trasparente attraverso i portali archivistici esistenti.

Leggi la storia completa

Utilizzato da istituzioni leader in tutto il mondo

I vostri dati restano vostri

Piena proprietà e controllo. Accordi per il trattamento dati (DPA) e accordi personalizzati disponibili.

Ospitato in Austria, UE

Tutta l'elaborazione sui nostri server. Conforme al GDPR. Nessun cloud di terze parti.

Una cooperativa, non una startup

Oltre 250 archivi, biblioteche e università come comproprietari. Costruito per durare decenni.

Nessun vendor lock-in

Tutti gli output in formati standard. I modelli addestrati restano vostri. Dati sempre esportabili.

Parlateci del vostro progetto

Descrivete la vostra collezione e i vostri obiettivi — vi risponderemo entro un giorno lavorativo con un approccio su misura, dalla prova di concetto alla consegna finale.

Quante pagine dovete elaborare approssimativamente?

20,000 pagine

Inviando, accettate la nostra Privacy Policy.

I vostri dati restano vostriPiena proprietà e controllo. Conforme al GDPR con DPA disponibili.
Ospitato in Austria, UETutta l'elaborazione sui nostri server. Nessun cloud di terze parti.
Una cooperativa, non una startupOltre 250 archivi, biblioteche e università come comproprietari.

Domande frequenti

Tutto quello che dovete sapere sui progetti di digitalizzazione gestiti.