Stuur duizenden taken in. Wij doen de rest.

De Transkribus API beheert uw verwerkingswachtrij op intelligente wijze. Dien documenten één voor één in of duizenden tegelijk — taken worden verdeeld over GPU-clusters, asynchroon verwerkt en resultaten geleverd via long polling of standaard polling. Van een prototype-integratie tot miljoenen archiefpagina's.

Een gesprek inplannen Bekijk de API

Bulkverwerking van een documentcollectie

200M+pagina's verwerkt op het platform

15M+pagina's in één project

300+AI-modellen voor elk schrift

Traditionele pijplijn versus Transkribus

Documentverwerking op grote schaal betekende vroeger het handmatig beheren van mensen en wachtrijen. Transkribus neemt die infrastructuur van u over.

Traditionele aanpak

Transcribenten aannemen

Een team van bekwame lezers werven, opleiden en aansturen

Sequentieel verwerken

Elke pagina handmatig getranscribeerd, één voor één

Kwaliteitscontrole

Een tweede lezer controleert elke pagina op fouten

Opmaken en exporteren

Handmatige conversie naar het vereiste uitvoerformaat

Lineair — schaalt met personeelsomvang

Transkribus bulkverwerking

Taken indienen

Upload via de webapp of dien duizenden taken in via de API

Intelligente wachtrij

Taken worden automatisch verdeeld over GPU-clusters

Resultaten ontvangen

Long polling voor directe resultaten, of asynchroon pollen voor bulktaken

Exporteren

Platte tekst, PAGE XML, ALTO, TEI — gestructureerde uitvoer

Parallel — schaalt met infrastructuur

Intelligent wachtrijbeheer

Hoe de verwerkingspijplijn werkt

De Transkribus API is asynchroon van ontwerp. Dien taken in op elk gewenst tempo — de wachtrij verdeelt ze over beschikbare GPU-capaciteit. Voor realtime-integraties kunt u long polling gebruiken om resultaten te ontvangen zodra ze gereed zijn. Niet tevreden met de nauwkeurigheid? Train een aangepast model op uw specifieke documenten via de visuele editor en verwerk vervolgens de hele batch opnieuw.

Indienen

POST-afbeeldingen via API — URL, base64 of bestandsupload

Wachtrij

Intelligente taakverdeling over GPU-clusters

Verwerken

Lay-outanalyse en tekstherkenning parallel

Resultaat

Long polling of asynchrone polling — uw keuze

Exporteren

Platte tekst, PAGE XML, ALTO of JSON

Casestudy

Zeitpunkt.NRW: 15 miljoen krantenbladzijden in één project

De deelstaat Noordrijn-Westfalen gebruikte Transkribus om 15 miljoen historische krantenbladzijden te verwerken — het grootste enkelvoudige digitalisatieproject op het platform. De collectie beslaat meer dan een eeuw aan regionale kranten, nu volledig doorzoekbaar en toegankelijk voor het publiek op zeitpunkt.nrw.

15 miljoen pagina's verwerkt met AI-tekstherkenning

Historisch Fraktur- en gotisch schrift automatisch verwerkt

Openbaar toegankelijk en volledige tekst doorzoekbaar

Lees meer over het project

Zeitpunkt.NRW — 15 miljoen krantenbladzijden verwerkt

Platte tekst

Eenvoudige UTF-8-tekstuitvoer. Geschikt voor zoekindexen, databases of NLP-pijplijnen.

PAGE XML

Volledige lay-outcoördinaten — regio's, regels, woorden, basislijnen. De standaard voor HTR-workflows.

ALTO XML

Bibliotheekstandaardformaat voor gedigitaliseerde collecties. Compatibel met Europeana, DFG Viewer en IIIF.

TEI XML

Text Encoding Initiative-formaat voor wetenschappelijke edities en digital humanities-projecten.

Tabelgegevens

Gestructureerde tabelherkenning — rijen, kolommen en celinhoud worden automatisch geëxtraheerd.

Volledige tekst zoeken

Verwerkte documenten zijn direct doorzoekbaar binnen Transkribus — namen, datums, plaatsen, trefwoorden.

Klaar om uw collectie te verwerken?

Begin met een gratis account om uw collectie te testen. Voor grootschalige projecten kunt u contact opnemen met ons team over volumeprijzen en projectondersteuning.

Gratis beginnen Een gesprek inplannen

200M+verwerkte pagina's

Volumebeschikbare prijsstelling

EU-hostingAVG-conform

Stuur duizenden taken in. Wij doen de rest.

Traditionele pijplijn versus Transkribus

Traditionele aanpak

Transcribenten aannemen

Sequentieel verwerken

Kwaliteitscontrole

Opmaken en exporteren

Transkribus bulkverwerking

Taken indienen

Intelligente wachtrij

Resultaten ontvangen

Exporteren

Hoe de verwerkingspijplijn werkt

Indienen

Wachtrij

Verwerken

Resultaat

Exporteren

Zeitpunkt.NRW: 15 miljoen krantenbladzijden in één project

Gestructureerde uitvoer, niet alleen platte tekst

Platte tekst

PAGE XML

ALTO XML

TEI XML

Tabelgegevens

Volledige tekst zoeken

Klaar om uw collectie te verwerken?