Skip to content
  • Prijzen

Uw krantenarchief, volledig doorzoekbaar.

Miljoenen historische krantenbladzijden liggen in archieven — gescand maar onzoekbaar. Transkribus leest de tekst, begrijpt de lay-out en transformeert elk artikel, elke kop en elke advertentie in gestructureerde, doorzoekbare data. Van één titel tot een volledige nationale collectie.

Historische krantenlay-outsegmentatie
30M+krantenbladzijden verwerkt
15M+pagina's in Zeitpunkt.NRW alleen
100+publieke druk- & Fraktur-modellen

De uitvoer

Wat u overhoudt na het verwerken van uw krantencollectie.

Volledige tekstzoekfunctie in krantenartikelen

Doorzoekbare volledige tekst

Elk artikel, elke kop, elke advertentie en elke kleine advertentie op elke pagina — herkend en geïndexeerd. Zoek op naam, datum, trefwoord of zin in de gehele collectie.

Automatische lay-outsegmentatie van kranten

Gestructureerde lay-outdata

De AI segmenteert meerkolomspagina's in afzonderlijke inhoudsregio's — artikelen, koppen, advertenties, bijschriften. Elke regio wordt getagd en afzonderlijk geëxporteerd, zodat systemen verderop in de keten met artikelen kunnen werken, niet met ruwe paginadumps.

Gepubliceerde krantencollectie als Transkribus Site

Een doorbladerbare online collectie

Verwerkte kranten kunnen worden gepubliceerd als Transkribus Site — een gehoste, doorzoekbare interface voor uw collectie. Geen ontwikkeling nodig. Voorzien van de huisstijl van uw instelling.

Casestudy

Zeitpunkt.NRW: 20 miljoen krantenbladzijden voor Noordrijn-Westfalen

Het Zeitpunkt.NRW-project digitaliseert de volledige historische krantencollectie van Noordrijn-Westfalen — 20 miljoen pagina's die eeuwen regionale geschiedenis bestrijken. Transkribus verzorgt de volledige tekstherkenning op grote schaal en zet gescande pagina's om in doorzoekbare tekst die via het digitale krantenportaal van de deelstaat wordt gepubliceerd.
20 miljoen krantenbladzijden verwerkt met Transkribus
Eeuwen regionale kranten uit NRW-bibliotheken
Volledige tekstzoekfunctie beschikbaar via het Zeitpunkt.NRW-portaal
Zeitpunkt.NRW — 20 miljoen gedigitaliseerde krantenbladzijden

Casestudy

NewsEye: Verbetering van krantentelstherkenning met de Nationale Bibliotheek van Finland

Het EU-gefinancierde NewsEye-project (Horizon 2020) bracht de Nationale Bibliotheek van Finland samen met informatici en digital humanities-onderzoekers om de tekstherkenning op historische kranten te verbeteren. Het team werkte met 2,5 miljoen pagina's uit 10 Finse krantenstitels — de helft in het Zweeds, veel in gotische lettertypen — en gebruikte Transkribus om aangepaste modellen te trainen die de herkenningsnauwkeurigheid gemiddeld 10 procentpunten verbeterden ten opzichte van oudere OCR-methoden.
2,5 miljoen krantenbladzijden (1771–1914), 10 titels
Gotische lettertypeherkenning gemiddeld 10 procentpunten verbeterd
Verbeterd zoeken in de nationale digitale bibliotheek van Finland
NewsEye-project — historische krantendigitalisering

De aanpak

Van scans naar gestructureerde tekst — hoe instellingen kranten op grote schaal digitaliseren

Krantendigitalisering volgt een bewezen workflow: upload uw scans, selecteer uit 100+ voorgetrainde druk- en Fraktur-modellen (of train uw eigen op uw specifieke lettertypen), voer bulktekstherkenning uit met automatische lay-outanalyse en exporteer gestructureerde resultaten. De AI verwerkt meerkolomsindelingen, gemengde inhoudstypen en historische lettertypen — inclusief Fraktur, gotisch lettertype en vroegmoderne druk.
100+ publieke modellen voor Fraktur, gotisch lettertype en historische druk
Automatische lay-outsegmentatie voor meerkolomskrantenpagina's
Bulkverwerking voor duizenden pagina's — geen handmatige interventie
Exporteer als doorzoekbare PDF, platte tekst of gestructureerde XML (ALTO, PAGE)
Lay-outanalyse van kranten en tekstherkenning

Handleidingen en modellen

Tutorials, AI-modellen en verwante use cases voor krantendigitalisering.

Kranten digitaliseren met Transkribus

Stapsgewijze handleiding: scannen, lay-outsegmentatie, modelselectie en tekstherkenning voor historische kranten.

Handleiding

AI-modellen voor Fraktur, Kurrent & Sütterlin

De meest voorkomende historische Duitse druk- en handschriftschriften — en de publieke modellen die ze kunnen lezen.

Modellen

Vermindering van archievenachierstanden

Hoe archieven AI gebruiken om miljoenen ongedoorzoekbare pagina's te verwerken — dezelfde aanpak die van toepassing is op krantenarchieven.

Use Case

Klaar om uw krantenarchief doorzoekbaar te maken?

Neem contact op met ons team over uw collectie. Wij helpen u de juiste modellen te vinden, de workflow te plannen en de omvang in te schatten.

30M+krantenbladzijden verwerkt
100+publieke drukmodellen
EU-hostingAVG-conform