Envíe miles de trabajos. Nosotros nos encargamos del resto.
La API de Transkribus gestiona su cola de procesamiento de forma inteligente. Envíe documentos de uno en uno o miles en paralelo: los trabajos se distribuyen entre clústeres GPU, se procesan de forma asíncrona y los resultados se entregan mediante long polling o sondeo estándar. Desde una integración prototipo hasta millones de páginas de archivo.

Flujo tradicional vs. Transkribus
El procesamiento de documentos a escala solía implicar gestionar personas y colas de forma manual. Transkribus se encarga de esa infraestructura por usted.
Enfoque tradicional
Contratar transcriptores
Reclutar, formar y gestionar un equipo de lectores especializados
Procesar de forma secuencial
Cada página transcrita a mano, una a una
Revisión de calidad
Un segundo lector comprueba cada página en busca de errores
Formatear y exportar
Conversión manual al formato de salida requerido
Procesamiento masivo con Transkribus
Enviar trabajos
Cargue mediante la aplicación web o envíe miles de trabajos vía API
Cola inteligente
Los trabajos se distribuyen automáticamente entre los clústeres GPU
Obtener resultados
Long polling para resultados instantáneos, o sondeo asíncrono para trabajos en lote
Exportar
Texto sin formato, PAGE XML, ALTO, TEI: salida estructurada
Gestión inteligente de colas
Cómo funciona el flujo de procesamiento
La API de Transkribus es asíncrona por diseño. Envíe trabajos a cualquier ritmo: la cola los distribuye entre la capacidad GPU disponible. Para integraciones en tiempo real, utilice long polling para obtener resultados en cuanto estén listos. ¿No está satisfecho con la precisión? Entrene un modelo personalizado con sus documentos específicos usando el editor visual y, a continuación, reprocese todo el lote.
Enviar
Envíe imágenes vía API: URL, base64 o carga de archivos
Cola
Distribución inteligente de trabajos en clústeres GPU
Procesar
Análisis de maquetación y reconocimiento de texto en paralelo
Resultado
Long polling o sondeo asíncrono: usted elige
Exportar
Texto sin formato, PAGE XML, ALTO o JSON
Caso de estudio
Zeitpunkt.NRW: 15 millones de páginas de periódico en un solo proyecto

Resultados estructurados, no solo texto plano
Cada página devuelve regiones de maquetación, líneas de texto, coordenadas de palabras y puntuaciones de confianza.
Texto sin formato
Texto de salida UTF-8 sencillo. Aliméntese en índices de búsqueda, bases de datos o canales de procesamiento NLP.
PAGE XML
Coordenadas de maquetación completas: regiones, líneas, palabras y líneas base. El estándar para los flujos de trabajo HTR.
ALTO XML
Formato estándar de biblioteca para colecciones digitalizadas. Compatible con Europeana, DFG Viewer e IIIF.
TEI XML
Formato de la Text Encoding Initiative para ediciones académicas y proyectos de humanidades digitales.
Datos tabulares
Reconocimiento estructurado de tablas: filas, columnas y contenido de celdas extraídos automáticamente.
Búsqueda en texto completo
Los documentos procesados son inmediatamente buscables en Transkribus: nombres, fechas, lugares y palabras clave.
¿Listo para procesar su colección?
Comience con una cuenta gratuita para probar con una muestra. Para proyectos a gran escala, hable con nuestro equipo sobre precios por volumen y apoyo al proyecto.