Skip to content
  • Tarifs

La plateforme IA conçue pour la recherche en sciences humaines.

Transkribus vous offre un pipeline complet, de l'image du document au texte structuré et consultable — avec l'entraînement de modèles, l'analyse de mise en page, l'annotation d'entités et l'export TEI-XML. Sans programmation. Né de la recherche financée par l'UE, gouverné par une coopérative de plus de 250 institutions, et utilisé dans plus de 40 universités.

Éditeur Transkribus — interface de transcription et d'annotation
40+universités utilisant Transkribus
300+modèles IA entraînés par la communauté
TEI-XMLexport pour les éditions savantes

Le pipeline de recherche

De l'image du document aux données de recherche structurées — ce que Transkribus vous apporte à chaque étape.

Reconnaissance de texte par IA sur un document historique

Texte lisible par machine pour toute écriture

La reconnaissance d'écriture manuscrite (HTR) convertit les images de documents en texte modifiable et consultable. Plus de 300 modèles publics couvrent les écritures du latin médiéval au Kurrent du XXe siècle. Entraînez votre propre modèle sur 50 pages de vérité terrain si aucun ne convient.

Extraction de données structurées à partir de documents historiques

Données structurées, pas seulement du texte brut

La reconnaissance de tableaux, l'extraction de champs et l'annotation d'entités transforment les documents non structurés en ensembles de données structurés. Extrayez des noms, des dates, des lieux et des relations — prêts pour des bases de données, des tableurs ou une analyse computationnelle.

Édition savante numérique publiée

Éditions publiées et citables

Exportez en TEI-XML pour les éditions savantes, ou publiez directement sous forme de Site Transkribus consultable. Vos transcriptions deviennent un résultat de recherche citables et accessibles — pas seulement un fichier de travail sur votre ordinateur.

Pour une recherche rigoureuse

Reproductible, versionné, documenté

Chaque modèle dans Transkribus est versionné. Vos données d'entraînement sont préservées. La précision est mesurée avec le taux d'erreur au caractère (CER) sur des ensembles de test non vus. Cela signifie que votre workflow de transcription est reproductible, vérifiable et prêt pour la revue par les pairs — les mêmes standards que vous appliquez au reste de votre méthodologie de recherche.
Modèles versionnés avec données d'entraînement documentées et métriques de précision
Évaluation du taux d'erreur au caractère (CER) sur des ensembles de test non vus
Export complet de la vérité terrain, des paramètres du modèle et des résultats de reconnaissance
Citez la version exacte du modèle utilisée dans vos publications
Évaluation de la précision du modèle avec les métriques CER

Sans programmation

Entraînez des modèles IA personnalisés dans une interface visuelle

Vous n'avez pas besoin d'écrire du code, de gérer des serveurs ni de comprendre les architectures de réseaux de neurones. Préparez vos données d'entraînement dans l'éditeur intégré, cliquez sur entraîner, et Transkribus construit un modèle optimisé pour vos documents spécifiques. La même technologie de deep learning utilisée dans la recherche computationnelle — accessible à tout chercheur en sciences humaines.
Éditeur visuel de vérité terrain — transcrivez et corrigez en contexte
Commencez l'entraînement avec seulement 50 pages transcrites
Les modèles s'améliorent à mesure que vous ajoutez de la vérité terrain
Partagez des modèles avec des collaborateurs ou toute la communauté
Interface d'entraînement de modèles personnalisés dans Transkribus

Ressources pour les chercheurs en humanités numériques

Guides, méthodologie et outils pour intégrer Transkribus dans votre recherche.

Comment intégrer le HTR dans votre demande de financement

Exemples de textes méthodologiques, benchmarks CER et conseils de gestion des données pour la DFG, l'ERC, la NEH, l'AHRC et d'autres organismes de financement.

Méthodologie

Le taux d'erreur au caractère (CER) expliqué

La métrique de précision standard pour le HTR — comment elle est calculée, les benchmarks attendus et comment la rapporter.

Référence

Parcourir les modèles publics

Plus de 300 modèles entraînés par la communauté pour des écritures allant du latin médiéval au Kurrent du XXe siècle. Trouvez un point de départ pour vos documents.

Modèles

Démarrez votre projet de recherche avec Transkribus

Commencez gratuitement avec 50 crédits par mois — suffisamment pour traiter des centaines de pages. Pour les projets plus importants, contactez notre équipe pour les formules institutionnelles et les partenariats de recherche.

300+modèles IA publics
40+universités
Hébergé en UEconforme au RGPD