Le problème
La crise des fonds inexploités : les arriérés de traitement archivistique ne cessent de croître

La solution
Réduire l'arriéré archivistique avec l'IA : des boîtes non traitées aux documents consultables

Comparaison
Traitement assisté par IA vs. transcription manuelle pour les archives
Les archives font face à un problème fondamental de débit : des millions de pages attendent d'être cataloguées, rendues consultables et accessibles. Voici comment le traitement assisté par IA se compare aux flux de travail manuels traditionnels.
| Feature | Traitement IA Transkribus | Transcription manuelle |
|---|---|---|
| Débit de traitement | Des milliers de pages par jour en traitement par lots — s'adapte à la taille de la collection | Un transcripteur expérimenté traite 5 à 15 pages par jour selon la difficulté |
| Coût par page | Une fraction de centime par page grâce à la tarification par crédits | Forte intensité de main-d'œuvre — les coûts augmentent linéairement avec chaque page |
| Cohérence | Le même modèle produit des résultats cohérents sur des milliers de pages | La qualité varie selon les transcripteurs, la fatigue et les différences d'interprétation |
| Recherche en texte intégral | Chaque page traitée devient immédiatement consultable en texte intégral | Seules les pages transcrites sont consultables — l'arriéré reste inexploité |
| Prise en charge des écritures historiques | Plus de 300 modèles publics couvrant les écritures du IXe siècle à nos jours | Nécessite une formation spécialisée en paléographie — rares sont les agents qui possèdent ces compétences |
| Délai d'accès | Les collections deviennent accessibles quelques jours ou semaines après la numérisation | Des retards de plusieurs années, voire décennies, sont courants dans les grandes institutions |
| Contrôle qualité | Les scores de confiance signalent les lignes incertaines pour une relecture ciblée | Nécessite une relecture complète de chaque transcription |
Cette comparaison reflète les flux de travail institutionnels typiques. Le traitement par IA fonctionne au mieux en complément de l'expertise humaine — première passe automatisée suivie d'une relecture manuelle ciblée.
Comment traiter une collection archivistique en 4 étapes
Importer les collections numérisées
Importez des séries entières ou des fonds en PDF multipages, TIFF ou lots d'images. Transkribus gère automatiquement la détection de mise en page — colonnes, tableaux, marginalia.
Sélectionner un modèle IA
Choisissez parmi plus de 300 modèles publics filtrés par langue, siècle et type d'écriture. Pour les collections mixtes, exécutez plusieurs modèles sur différents groupes de documents au sein d'un même projet.
Lancer la reconnaissance par lots
Mettez en file d'attente des milliers de pages pour le traitement. Transkribus exécute la reconnaissance de texte en arrière-plan — aucune intervention manuelle requise. Suivez la progression depuis le tableau de bord.
Exporter et intégrer
Exportez les résultats en PAGE XML, ALTO XML, TEI-XML, texte brut ou PDF consultable. Intégrez directement dans ArchivesSpace, AtoM ou publiez via Transkribus Sites.
A grande échelle
Traitement archivistique automatisé avec l'API Metagrapho
import requests
API = "https://transkribus.eu/processing/v1"
TOKEN = "your-api-token"
# 1. Upload collection
upload = requests.post(f"{API}/uploads",
headers={"Authorization": f"Bearer {TOKEN}"},
json={"collectionId": 12345}
)
# 2. Start recognition on all pages
job = requests.post(f"{API}/processes",
headers={"Authorization": f"Bearer {TOKEN}"},
json={
"docId": upload.json()["docId"],
"htrId": 53042, # model ID
"pages": "all"
}
)
# 3. Poll for completion
status = requests.get(
f"{API}/processes/{job.json()['processId']}",
headers={"Authorization": f"Bearer {TOKEN}"}
).json()
print(f"Status: {status['state']}")Questions fréquemment posées
Ressources connexes
Plus pour les archives et institutions

Prêt à résorber votre arriéré archivistique ?
Discutez avec notre équipe des offres institutionnelles pour le traitement de collections à grande échelle, ou créez un compte gratuit pour évaluer Transkribus sur vos propres documents.
Utilisé par plus de 2 000 archives et bibliothèques dans le monde