Extraheer gestructureerde data uit elk document
Onderzoeks- en digitaliseringsprojecten hebben meer nodig dan leesbare tekst — ze hebben gestructureerde data nodig. Namen, datums, plaatsen, bedragen, relaties. Transkribus combineert AI-tekstherkenning met tabelextractie, Field Models en entiteitstagging om handgeschreven en gedrukte documenten om te zetten in gestructureerde datasets die klaar zijn voor analyse, databases en spreadsheets.

Drie manieren om data uit documenten te extraheren
Verschillende documenttypen vereisen verschillende extractiemethoden. Transkribus biedt alle drie — en ze kunnen worden gecombineerd.

Tabelherkenning
Detecteer rijen, kolommen en celgrenzen in tabulaire documenten — kerkregisters, volkstellingen, belastingrollen, grootboeken. Elke cel wordt een datapunt. Exporteer de hele tabel als spreadsheet of XML.

Veldextractie
Train modellen om specifieke velden te vinden en te extraheren uit gestructureerde documenten — datums, namen, referentienummers, bedragen. Werkt met formulieren, indexkaarten, certificaten en elk document met een herhalende structuur.

Entiteitstagging
Tag personen, plaatsen, datums en aangepaste entiteiten in lopende tekst. Tags worden doorzoekbare metadata. Exporteer als TEI-XML of filter getagde entiteiten als gestructureerde data voor je onderzoeksdatabase.
Tabelherkenning in actie
Transkribus detecteert de rasterstructuur van tabulaire registers en extraheert elke cel in een gestructureerd spreadsheet — klaar voor je database, genealogiesoftware of onderzoekspipeline.

| Institution | Town | Amount | Object | Date | Disposition |
|---|---|---|---|---|---|
| Franklin College (6) | New Athen, O. | General | 3/23/16 | ||
| Fargo College (3) | Fargo, N.D. | 100,000 | Endowment | 4/27/16 | Gen 1914, 5/18/16 |
| Franklin Academy (2) | Franklin, Neb. | 5,000 | Library Building | 8/3/16 | Gen 1914, 8/7/16 |
| Fessenden Acad. & Ind. School | Fessenden, Fla. | General | 12/22/16 | ||
| Ferris Institute (2) | Big Rapids, Mich. | 50,000 | Buildings | 2/12/17 | |
| Findlay College (2) | Findlay, O. | 100,000 | Endowment | 5/23/17 | Gen 1914, 5/28/17 |
| Fairmount College | Wichita, Kan. | 200,000 | Endowment | 6/7/17 | 6/14/17 |
| Franklin College | Franklin, Ind. | 50,000 | General | 9/13/17 | Gen 1914, 9/17/17 |
| Fisk University | Nashville, Tenn. | 1,000,000 | Endowment | 6/14/18 | |
| Friends University | Wichita, Kan. | 200,000 | Endowment | 6/20/18 | Gen 1914, 8/8/18 |
Veldextractie in actie
Field Models detecteren en extraheren specifieke gegevensvelden uit documenten — namen, datums, locaties, referenties — nauwkeurig en op grote schaal. Train op je eigen formulierindelingen voor de beste resultaten.

Intelligente documentverwerking
Van documentafbeeldingen naar onderzoeksdatabases

Trainbaar
Train extractiemodellen op je specifieke documenttype

Toepassingen
Wat onderzoekers extraheren met Transkribus

Handschriftspecialisten
Het enige IDP-platform gebouwd voor handschrift

Begin met het extraheren van data uit je documenten
Maak een gratis account aan. Upload je scans, voer tekstherkenning uit en extraheer gestructureerde data — zonder programmeren, zonder ML-expertise.