El problema
La crisis de las colecciones ocultas: los atrasos en la digitalización de archivos siguen creciendo

La solución
Reduce el atraso archivístico con IA: de cajas sin procesar a registros buscables

Comparación
Procesamiento asistido por IA vs. transcripción manual para archivos
Los archivos afrontan un problema fundamental de rendimiento: millones de páginas esperando a ser catalogadas, buscables y accesibles. Así es como el procesamiento asistido por IA se compara con los flujos de trabajo manuales tradicionales.
| Feature | Procesamiento con IA de Transkribus | Transcripción manual |
|---|---|---|
| Rendimiento | Miles de páginas al día con procesamiento por lotes, escalable según el tamaño de la colección | Un transcriptor cualificado procesa entre 5 y 15 páginas al día según la dificultad |
| Coste por página | Una fracción de céntimo por página con precios basados en créditos | Intensivo en mano de obra: los costes se acumulan linealmente con cada página |
| Consistencia | El mismo modelo produce resultados consistentes en miles de páginas | La calidad varía según el transcriptor, la fatiga y las diferencias de interpretación |
| Posibilidad de búsqueda | Cada página procesada se convierte en texto completo con búsqueda inmediata | Solo las páginas transcritas son buscables; el resto del fondo permanece inaccesible |
| Manejo de escrituras históricas | Más de 300 modelos públicos que cubren escrituras desde el siglo IX hasta la actualidad | Requiere formación especializada en paleografía; pocos empleados poseen las competencias necesarias |
| Tiempo de acceso | Las colecciones quedan accesibles en días o semanas tras la digitalización | Es habitual acumular retrasos de años o décadas en grandes instituciones |
| Control de calidad | Las puntuaciones de confianza señalan las líneas inciertas para una revisión humana selectiva | Requiere una revisión completa de cada transcripción |
La comparación refleja flujos de trabajo institucionales típicos. El procesamiento con IA funciona mejor como complemento de la experiencia humana: una primera pasada automatizada con revisión manual selectiva.
Cómo procesar una colección archivística en 4 pasos
Sube colecciones escaneadas
Sube series o fondos completos como PDF de varias páginas, TIFF o lotes de imágenes. Transkribus gestiona automáticamente la detección de diseño — columnas, tablas, notas marginales.
Seleccionar un modelo de IA
Elige entre más de 300 modelos públicos filtrados por idioma, siglo y tipo de escritura. Para colecciones mixtas, ejecuta múltiples modelos en diferentes grupos de documentos dentro del mismo proyecto.
Ejecuta el reconocimiento por lotes
Pon en cola miles de páginas para su procesamiento. Transkribus ejecuta el reconocimiento de texto en segundo plano sin intervención manual. Monitorea el progreso desde el panel de control.
Exporta e integra
Exporta los resultados como PAGE XML, ALTO XML, TEI-XML, texto plano o PDF buscable. Importa directamente en ArchivesSpace, AtoM o publica a través de Transkribus Sites.
A escala
Procesamiento archivístico automatizado con la API Metagrapho
import requests
API = "https://transkribus.eu/processing/v1"
TOKEN = "your-api-token"
# 1. Upload collection
upload = requests.post(f"{API}/uploads",
headers={"Authorization": f"Bearer {TOKEN}"},
json={"collectionId": 12345}
)
# 2. Start recognition on all pages
job = requests.post(f"{API}/processes",
headers={"Authorization": f"Bearer {TOKEN}"},
json={
"docId": upload.json()["docId"],
"htrId": 53042, # model ID
"pages": "all"
}
)
# 3. Poll for completion
status = requests.get(
f"{API}/processes/{job.json()['processId']}",
headers={"Authorization": f"Bearer {TOKEN}"}
).json()
print(f"Status: {status['state']}")Preguntas frecuentes
Recursos relacionados
Más para archivos e instituciones

¿Listo para abordar el atraso de tu archivo?
Habla con nuestro equipo sobre planes institucionales para el procesamiento de colecciones a gran escala, o crea una cuenta gratuita para evaluar Transkribus con tus propios materiales.
Utilizado por más de 2000 archivos y bibliotecas en todo el mundo