UiPath Documentation
document-understanding
2023.10
false

Guía del usuario de Document Understanding

Última actualización 6 de abr. de 2026

Requisitos de hardware

La ejecución de los paquetes ML de Document UnderstandingTM en una GPU incluye una optimización destinada a acelerar el proceso de entrenamiento.

Matriz de compatibilidad

Como resultado, el entrenamiento en la GPU es cinco veces más rápido que en la CPU (antes era entre 10 y 20 veces más rápido). Esto también permite entrenar modelos en CPU con hasta 5000 páginas (anteriormente el máximo eran 500).

Please be aware that training Document Understanding models on GPU requires a GPU with at least 11GB of video RAM to run successfully.

Utiliza la siguiente tabla para comprobar la compatibilidad entre los paquetes ML, la versión de CUDA y la versión del controlador de la GPU.

versión de paquetes MLVersión de CUDAVersión de cudDNNControlador de NVIDIA (versión inferior compatible)Generación de hardware
2023.10CUDA 11.8 o más recientecuDNN 8.2.0 o más recienteR450.80.04Ampere, Turing, Volta, Pascal, Maxwell, Kepler

CUDA es compatible con versiones anteriores, lo que significa que las aplicaciones CUDA existentes pueden seguir utilizándose con versiones CUDA más recientes.

Puedes encontrar más información sobre la compatibilidad aquí.

Uso de CPU y GPU

Puedes utilizar el marco de Document Understanding para leer texto utilizando un motor OCR, clasificar los documentos y extraer información de los mismos. Mientras que las tareas de clasificación y extracción se ejecutan en CPU, se recomienda que el OCR se ejecute en GPU (aunque también se proporciona una versión para CPU en caso de que no haya GPU disponible).

La implementación local se realiza utilizando Automation Suite y sus requisitos de hardware.

Puedes utilizar el mismo tipo de máquina virtual tanto para los extractores como para los clasificadores, la única diferencia es el tamaño de la infraestructura. Se recomienda utilizar el motor OCR con una máquina virtual de GPU. En la sección Matriz de compatibilidad se describen la compatibilidad entre los paquetes ML, la versión de CUDA y la versión del controlador de la GPU.

Tomemos un ejemplo real para comprender mejor los requisitos de hardware.

Paquete MLRequisitos de hardwareCapacidad
Paquetes de extractor (Facturas, Recibos, Órdenes de compra, etc.)Utilizar una máquina virtual con un mínimo de 2 núcleos de CPU y 8 GB de RAMCan process 25,000 pages/day or 5 million pages/year, assuming perfectly constant traffic (no spikes).
Paquetes de clasificador (DocumentClassifier)Utilizar una máquina virtual con un mínimo de 2 núcleos de CPU y 8 GB de RAMCan process 40,000 documents/day or 8 million documents/year, assuming perfectly constant traffic (no spikes).
OCRRequiere un mínimo de 8 GB de RAM si se ejecuta en la CPU. No hay requisitos si se ejecuta en GPU.Can process 50,000 pages/day.
OCR_CPURequiere un mínimo de 4 GB de RAM.Puede procesar 25 000 páginas/día.

Ejemplo: si procesas 10 millones de páginas al año, necesitarás una máquina virtual con 4 núcleos de CPU, 16 GB de RAM para el extractor, otra para el clasificador y una tercera máquina virtual con un núcleo de GPU NVidia para el motor OCR.

También puedes optar por utilizar una sola máquina virtual para el extractor y el clasificador, lo que significa que necesitarás una sola máquina virtual con 8 núcleos de CPU y 32 GB de RAM.

Nota:

You can always use more more powerful CPU/GPU VMs for increasing the number of processed documents/day.

  • Matriz de compatibilidad
  • Uso de CPU y GPU

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado