Skip to content
  • Prijzen

Stuur duizenden taken in. Wij doen de rest.

De Transkribus API beheert uw verwerkingswachtrij op intelligente wijze. Dien documenten één voor één in of duizenden tegelijk — taken worden verdeeld over GPU-clusters, asynchroon verwerkt en resultaten geleverd via long polling of standaard polling. Van een prototype-integratie tot miljoenen archiefpagina's.

Bulkverwerking van een documentcollectie
200M+pagina's verwerkt op het platform
15M+pagina's in één project
300+AI-modellen voor elk schrift

Traditionele pijplijn versus Transkribus

Documentverwerking op grote schaal betekende vroeger het handmatig beheren van mensen en wachtrijen. Transkribus neemt die infrastructuur van u over.

Traditionele aanpak

Transcribenten aannemen

Een team van bekwame lezers werven, opleiden en aansturen

Sequentieel verwerken

Elke pagina handmatig getranscribeerd, één voor één

Kwaliteitscontrole

Een tweede lezer controleert elke pagina op fouten

Opmaken en exporteren

Handmatige conversie naar het vereiste uitvoerformaat

Lineair — schaalt met personeelsomvang
vs

Transkribus bulkverwerking

Taken indienen

Upload via de webapp of dien duizenden taken in via de API

Intelligente wachtrij

Taken worden automatisch verdeeld over GPU-clusters

Resultaten ontvangen

Long polling voor directe resultaten, of asynchroon pollen voor bulktaken

Exporteren

Platte tekst, PAGE XML, ALTO, TEI — gestructureerde uitvoer

Parallel — schaalt met infrastructuur

Intelligent wachtrijbeheer

Hoe de verwerkingspijplijn werkt

De Transkribus API is asynchroon van ontwerp. Dien taken in op elk gewenst tempo — de wachtrij verdeelt ze over beschikbare GPU-capaciteit. Voor realtime-integraties kunt u long polling gebruiken om resultaten te ontvangen zodra ze gereed zijn. Niet tevreden met de nauwkeurigheid? Train een aangepast model op uw specifieke documenten via de visuele editor en verwerk vervolgens de hele batch opnieuw.

Indienen

POST-afbeeldingen via API — URL, base64 of bestandsupload

Wachtrij

Intelligente taakverdeling over GPU-clusters

Verwerken

Lay-outanalyse en tekstherkenning parallel

Resultaat

Long polling of asynchrone polling — uw keuze

Exporteren

Platte tekst, PAGE XML, ALTO of JSON

Casestudy

Zeitpunkt.NRW: 15 miljoen krantenbladzijden in één project

De deelstaat Noordrijn-Westfalen gebruikte Transkribus om 15 miljoen historische krantenbladzijden te verwerken — het grootste enkelvoudige digitalisatieproject op het platform. De collectie beslaat meer dan een eeuw aan regionale kranten, nu volledig doorzoekbaar en toegankelijk voor het publiek op zeitpunkt.nrw.
15 miljoen pagina's verwerkt met AI-tekstherkenning
Historisch Fraktur- en gotisch schrift automatisch verwerkt
Openbaar toegankelijk en volledige tekst doorzoekbaar
Zeitpunkt.NRW — 15 miljoen krantenbladzijden verwerkt

Gestructureerde uitvoer, niet alleen platte tekst

Elke pagina wordt teruggestuurd met lay-outregio's, tekstregels, woordcoördinaten en betrouwbaarheidsscores.

Platte tekst

Eenvoudige UTF-8-tekstuitvoer. Geschikt voor zoekindexen, databases of NLP-pijplijnen.

PAGE XML

Volledige lay-outcoördinaten — regio's, regels, woorden, basislijnen. De standaard voor HTR-workflows.

ALTO XML

Bibliotheekstandaardformaat voor gedigitaliseerde collecties. Compatibel met Europeana, DFG Viewer en IIIF.

TEI XML

Text Encoding Initiative-formaat voor wetenschappelijke edities en digital humanities-projecten.

Tabelgegevens

Gestructureerde tabelherkenning — rijen, kolommen en celinhoud worden automatisch geëxtraheerd.

Volledige tekst zoeken

Verwerkte documenten zijn direct doorzoekbaar binnen Transkribus — namen, datums, plaatsen, trefwoorden.

Klaar om uw collectie te verwerken?

Begin met een gratis account om uw collectie te testen. Voor grootschalige projecten kunt u contact opnemen met ons team over volumeprijzen en projectondersteuning.

200M+verwerkte pagina's
Volumebeschikbare prijsstelling
EU-hostingAVG-conform