Stuur duizenden taken in. Wij doen de rest.
De Transkribus API beheert uw verwerkingswachtrij op intelligente wijze. Dien documenten één voor één in of duizenden tegelijk — taken worden verdeeld over GPU-clusters, asynchroon verwerkt en resultaten geleverd via long polling of standaard polling. Van een prototype-integratie tot miljoenen archiefpagina's.

Traditionele pijplijn versus Transkribus
Documentverwerking op grote schaal betekende vroeger het handmatig beheren van mensen en wachtrijen. Transkribus neemt die infrastructuur van u over.
Traditionele aanpak
Transcribenten aannemen
Een team van bekwame lezers werven, opleiden en aansturen
Sequentieel verwerken
Elke pagina handmatig getranscribeerd, één voor één
Kwaliteitscontrole
Een tweede lezer controleert elke pagina op fouten
Opmaken en exporteren
Handmatige conversie naar het vereiste uitvoerformaat
Transkribus bulkverwerking
Taken indienen
Upload via de webapp of dien duizenden taken in via de API
Intelligente wachtrij
Taken worden automatisch verdeeld over GPU-clusters
Resultaten ontvangen
Long polling voor directe resultaten, of asynchroon pollen voor bulktaken
Exporteren
Platte tekst, PAGE XML, ALTO, TEI — gestructureerde uitvoer
Intelligent wachtrijbeheer
Hoe de verwerkingspijplijn werkt
De Transkribus API is asynchroon van ontwerp. Dien taken in op elk gewenst tempo — de wachtrij verdeelt ze over beschikbare GPU-capaciteit. Voor realtime-integraties kunt u long polling gebruiken om resultaten te ontvangen zodra ze gereed zijn. Niet tevreden met de nauwkeurigheid? Train een aangepast model op uw specifieke documenten via de visuele editor en verwerk vervolgens de hele batch opnieuw.
Indienen
POST-afbeeldingen via API — URL, base64 of bestandsupload
Wachtrij
Intelligente taakverdeling over GPU-clusters
Verwerken
Lay-outanalyse en tekstherkenning parallel
Resultaat
Long polling of asynchrone polling — uw keuze
Exporteren
Platte tekst, PAGE XML, ALTO of JSON
Casestudy
Zeitpunkt.NRW: 15 miljoen krantenbladzijden in één project

Gestructureerde uitvoer, niet alleen platte tekst
Elke pagina wordt teruggestuurd met lay-outregio's, tekstregels, woordcoördinaten en betrouwbaarheidsscores.
Platte tekst
Eenvoudige UTF-8-tekstuitvoer. Geschikt voor zoekindexen, databases of NLP-pijplijnen.
PAGE XML
Volledige lay-outcoördinaten — regio's, regels, woorden, basislijnen. De standaard voor HTR-workflows.
ALTO XML
Bibliotheekstandaardformaat voor gedigitaliseerde collecties. Compatibel met Europeana, DFG Viewer en IIIF.
TEI XML
Text Encoding Initiative-formaat voor wetenschappelijke edities en digital humanities-projecten.
Tabelgegevens
Gestructureerde tabelherkenning — rijen, kolommen en celinhoud worden automatisch geëxtraheerd.
Volledige tekst zoeken
Verwerkte documenten zijn direct doorzoekbaar binnen Transkribus — namen, datums, plaatsen, trefwoorden.
Klaar om uw collectie te verwerken?
Begin met een gratis account om uw collectie te testen. Voor grootschalige projecten kunt u contact opnemen met ons team over volumeprijzen en projectondersteuning.