Extrayez des donnees structurees de n'importe quel document
Les projets de recherche et de numerisation ont besoin de plus que du texte lisible — ils ont besoin de donnees structurees. Noms, dates, lieux, montants, relations. Transkribus combine la reconnaissance de texte par IA avec l'extraction de tableaux, les Field Models et le balisage d'entites pour transformer les documents manuscrits et imprimes en jeux de donnees structures, prets pour l'analyse, les bases de donnees et les tableurs.

Trois facons d'extraire des donnees de vos documents
Differents types de documents necessitent differentes methodes d'extraction. Transkribus offre les trois — et elles peuvent etre combinees.

Reconnaissance de tableaux
Detectez les lignes, colonnes et limites de cellules dans les documents tabulaires — registres paroissiaux, recensements, roles fiscaux, grands livres. Chaque cellule devient un point de donnees. Exportez le tableau entier sous forme de tableur ou de XML.

Extraction de champs
Entrainez des modeles pour trouver et extraire des champs specifiques dans des documents structures — dates, noms, numeros de reference, montants. Fonctionne sur des formulaires, des fiches, des certificats et tout document a structure repetitive.

Balisage d'entites
Balisez les personnes, lieux, dates et entites personnalisees dans le texte courant. Les balises deviennent des metadonnees interrogeables. Exportez en TEI-XML ou filtrez les entites balisees comme donnees structurees pour votre base de recherche.
Reconnaissance de tableaux en action
Transkribus detecte la structure en grille des registres tabulaires et extrait chaque cellule dans un tableur structure — pret pour votre base de donnees, votre logiciel de genealogie ou votre pipeline de recherche.

| Institution | Town | Amount | Object | Date | Disposition |
|---|---|---|---|---|---|
| Franklin College (6) | New Athen, O. | General | 3/23/16 | ||
| Fargo College (3) | Fargo, N.D. | 100,000 | Endowment | 4/27/16 | Gen 1914, 5/18/16 |
| Franklin Academy (2) | Franklin, Neb. | 5,000 | Library Building | 8/3/16 | Gen 1914, 8/7/16 |
| Fessenden Acad. & Ind. School | Fessenden, Fla. | General | 12/22/16 | ||
| Ferris Institute (2) | Big Rapids, Mich. | 50,000 | Buildings | 2/12/17 | |
| Findlay College (2) | Findlay, O. | 100,000 | Endowment | 5/23/17 | Gen 1914, 5/28/17 |
| Fairmount College | Wichita, Kan. | 200,000 | Endowment | 6/7/17 | 6/14/17 |
| Franklin College | Franklin, Ind. | 50,000 | General | 9/13/17 | Gen 1914, 9/17/17 |
| Fisk University | Nashville, Tenn. | 1,000,000 | Endowment | 6/14/18 | |
| Friends University | Wichita, Kan. | 200,000 | Endowment | 6/20/18 | Gen 1914, 8/8/18 |
L'extraction de champs en action
Les Field Models detectent et extraient des champs de donnees specifiques dans les documents — noms, dates, lieux, references — avec precision et a grande echelle. Entrainez-les sur vos propres mises en page de formulaires pour de meilleurs resultats.

Traitement intelligent de documents
Des images de documents aux bases de recherche

Entrainable
Entrainez des modeles d'extraction sur votre type de document

Cas d'utilisation
Ce que les chercheurs extraient avec Transkribus

Specialistes de l'ecriture manuscrite
La seule plateforme IDP concue pour l'ecriture manuscrite

Commencez a extraire des donnees de vos documents
Creez un compte gratuit. Telechargez vos scans, lancez la reconnaissance de texte et extrayez des donnees structurees — sans programmation, sans expertise en ML.