Cerca...

Prezzi

Accedi Inizia ora

Inizia a digitare per cercare tra modelli, sites e articoli del blog...

Il vostro progetto di digitalizzazione, gestito dall'inizio alla fine

Che abbiate bisogno di riconoscimento testo collaudato su larga scala o di un approccio completamente nuovo per materiale che nessun metodo standard può gestire — il nostro team di esperti, specialisti IA e archivisti gestisce l'intero progetto. Dall'analisi del vostro corpus alla consegna di risultati strutturati e consultabili, integrati nei vostri sistemi.

Parlateci del vostro progetto

I vostri documentiScansioni, immagini, manoscritti

Analisi e prova di concettoSelezione modelli, valutazione CER

Elaborazione e addestramentoRiconoscimento, modelli personalizzati, QA

Consegna strutturataXML, CSV, Sites, integrazione sistemi

20M+pagine in un singolo progetto

2,000+istituzioni si affidano a Transkribus

95%+di precisione sui modelli addestrati

Elaborazione batch con modelli collaudati

Per materiale ben scansionato con scritture standard: selezioniamo i modelli giusti tra oltre 100 modelli di riconoscimento testo e layout, configuriamo il flusso di lavoro, eseguiamo l'elaborazione batch, verifichiamo la qualità e consegniamo.

Libri stampati e documenti governativiScritture standard (latina, Kurrent, Fraktur)Grandi volumi con qualità costante

Addestramento di modelli personalizzati per il vostro materiale

Quando i modelli standard non raggiungono la precisione necessaria — scritture insolite, scansioni degradate, scritture rare — addestriamo modelli IA specificamente sul vostro materiale. Più cicli di addestramento fino a raggiungere la precisione target.

Scritture rare o personaliScansioni degradate o digitalizzazione di microfilmSistemi di scrittura non latini

Vedi il progetto Bautzen — modello Kurrent personalizzato per 200 anni di verbali del consiglio →

Definizione schemi, estrazione dati e integrazione sistemi

Oltre il testo semplice: definiamo schemi di estrazione per i vostri tipi di documento — tabelle, campi, record strutturati — e consegniamo dati nel formato richiesto dai vostri sistemi. Pubblicazione come Transkribus Site consultabile con la vostra identità visiva.

Estrazione tabelle e campi da registriOutput CSV, Excel o pronto per databaseIntegrazione con ArchivesSpace, AtoM, scopeArchivTranskribus Sites pubblicati con ricerca full-text

Vedi il progetto St. Gallen — 200.000 pagine pubblicate come Site consultabile →

Nuovi framework quando gli approcci standard falliscono

Alcune collezioni non possono essere risolte con strumenti esistenti. Sviluppiamo nuovi approcci IA: modelli Smart Extract end-to-end, riconoscimento di entità nominate per il tagging automatico e framework su misura per problemi che nessun metodo standard può risolvere.

Smart Extract — comprensione contestuale dei documentiRiconoscimento entità nominate e geo-arricchimento automaticoFramework innovativi per documenti non standard

Vedi il progetto MfN Berlino — primo impiego reale di Smart Extract →

Comprendere il vostro materiale

Analizziamo la vostra collezione: tipi di documento, scritture, layout, condizioni, volume. Quali dati dovete estrarre? In quali sistemi devono essere integrati? Cosa significa il successo per la vostra istituzione?

Prova di concetto

Ci inviate un campione rappresentativo. Eseguiamo l'intera pipeline — incluso l'addestramento di un modello personalizzato se necessario — e restituiamo risultati con misurazioni del tasso di errore e una stima realistica dei costi.

Pianificazione del progetto e avvio

Definiamo ambito, tempistica, milestone, deliverable e prezzi. Un/a project manager dedicato/a con formazione in digital humanities o archivistica viene assegnato/a al vostro progetto.

Elaborazione, addestramento e controllo qualità

Il/la vostro/a PM coordina la pipeline tecnica: riconoscimento, affinamento modelli, estrazione dati, controlli qualità. Riunioni di sincronizzazione bisettimanali vi tengono aggiornati.

Consegna per milestone e revisione

I risultati vengono consegnati progressivamente alle milestone concordate, ciascuna con metriche di qualità e revisione di campioni. Voi esaminate e approvate prima che proseguiamo.

Consegna finale e integrazione

Il dataset completo nel formato richiesto — PAGE XML, ALTO, TEI, CSV, PDF consultabile — o pubblicato come Transkribus Site con ricerca full-text e identità visiva personalizzata. Tutti i modelli addestrati restano vostri.

Etichette di esemplari del Museum für Naturkunde Berlin

Museum für Naturkunde Berlin

Germania

La sfida

250.000 etichette di esemplari con metadati manoscritti che coprono due secoli. L'OCR standard ha fallito completamente — inchiostro sbiadito, carta danneggiata, scritture miste e layout non standard.

Il nostro approccio

Sviluppo di un modello Smart Extract — un'IA che comprende contestualmente la struttura delle etichette. Aggiunto riconoscimento di entità nominate con arricchimento GeoNames per il tagging automatico delle specie e la risoluzione dei toponimi.

Il risultato

Primo impiego reale di successo di un modello Smart Extract. Dataset completo di 250.000 etichette trascritte e taggate — un modello replicabile per le collezioni di storia naturale di tutto il mondo.

Leggi la storia completa →

Pagine di giornali storici dal progetto Zeitpunkt.NRW

Zeitpunkt.NRW

Renania Settentrionale-Vestfalia, Germania

La sfida

L'intero patrimonio di giornali storici della Renania Settentrionale-Vestfalia — 20 milioni di pagine che coprono secoli. Layout multicolonna complessi, caratteri Fraktur, annunci pubblicitari e tipi di contenuto misti.

Il nostro approccio

Riconoscimento full-text su scala senza precedenti. Segmentazione layout con IA per pagine di giornali complesse, elaborazione batch con controllo qualità e pubblicazione attraverso un portale digitale regionale.

Il risultato

Uno dei più grandi progetti di riconoscimento testo mai realizzati. Cittadini e ricercatori possono ora cercare attraverso secoli di storia regionale nel portale Zeitpunkt.NRW.

Visita zeitpunkt.nrw →

Documenti notarili del Noord-Hollands Archief

Noord-Hollands Archief

Haarlem, Paesi Bassi

La sfida

Secoli di archivi notarili — testamenti, trasferimenti di proprietà, inventari, deposizioni di testimoni — dal 1570 al 1925. Quasi 2 milioni di scansioni di documenti manoscritti da Haarlem, Kennemerland e Amstel- en Meerlanden, inaccessibili a chiunque non sappia leggere le scritture storiche.

Il nostro approccio

Applicazione dell'HTR all'intero archivio notarile. Pubblicato come Transkribus Site consultabile con ricerca fuzzy per nomi di persone e località. Precisione del 93–98,6 %. Parte del progetto pionieristico «De ijsberg zichtbaar maken» (2019–2021).

Il risultato

Quasi 2 milioni di scansioni di atti notarili ora consultabili in full-text online. Ricercatori, genealogisti e cittadini possono cercare nomi, località e argomenti attraverso 350 anni di storia notarile dell'Olanda Settentrionale.

Esplora la collezione →

Verbali del consiglio dall'archivio di St. Gallen

Archivio di Stato di San Gallo

Svizzera

La sfida

417 volumi, 200.000 pagine di verbali del consiglio — manoscritti e dattiloscritti, molti digitalizzati da vecchi microfilm. Accessibili solo tramite visita in loco all'archivio.

Il nostro approccio

Addestramento modello personalizzato sui verbali del consiglio. Combinazione di trascrizione automatizzata e correzione manuale. Pubblicato come Transkribus Site consultabile con vista affiancata del documento e della trascrizione.

Il risultato

I verbali del consiglio dal 1803 in poi accessibili al pubblico online — consultabili 24 ore su 24. Nessuna competenza paleografica richiesta.

Leggi la storia completa →

Scrittura Kurrent storica dall'archivio di Bautzen

Archivverbund Bautzen

Germania

La sfida

257 volumi di verbali del consiglio comunale dal 1623 al 1832 — 55.000 pagine in scrittura Kurrent. Digitalizzati ma inaccessibili perché la scrittura era troppo difficile da decifrare per i ricercatori non formati.

Il nostro approccio

Applicazione del modello Early Kurrent, seguito dall'addestramento di un modello personalizzato. Pubblicato come Transkribus Site con permalink integrati in Archivportal-D e Findbuch.

Il risultato

200 anni di storia della città di Bautzen completamente consultabili. Scoperta trasparente attraverso i portali archivistici esistenti.

Leggi la storia completa →

Utilizzato da istituzioni leader in tutto il mondo

I vostri dati restano vostri

Piena proprietà e controllo. Accordi per il trattamento dati (DPA) e accordi personalizzati disponibili.

Ospitato in Austria, UE

Tutta l'elaborazione sui nostri server. Conforme al GDPR. Nessun cloud di terze parti.

Una cooperativa, non una startup

Oltre 250 archivi, biblioteche e università come comproprietari. Costruito per durare decenni.

Nessun vendor lock-in

Tutti gli output in formati standard. I modelli addestrati restano vostri. Dati sempre esportabili.

I vostri dati restano vostriPiena proprietà e controllo. Conforme al GDPR con DPA disponibili.

Ospitato in Austria, UETutta l'elaborazione sui nostri server. Nessun cloud di terze parti.

Una cooperativa, non una startupOltre 250 archivi, biblioteche e università come comproprietari.