- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Requisitos de hardware
Running the Document UnderstandingTM ML Packages on a GPU includes an optimization meant to accelerate the training process.
Como resultado, el entrenamiento en la GPU es cinco veces más rápido que en la CPU (antes era entre 10 y 20 veces más rápido). Esto también permite entrenar modelos en CPU con hasta 5000 páginas (anteriormente el máximo eran 500).
Ten en cuenta que entrenar modelos Document Understanding en la GPU requiere una GPU con al menos 11 GB de RAM de vídeo para funcionar correctamente.
Utiliza la siguiente tabla para comprobar la compatibilidad entre los paquetes ML, la versión de CUDA y la versión del controlador de la GPU.
versión de paquetes ML |
Versión de CUDA |
Versión de cudDNN |
Controlador de NVIDIA (versión inferior compatible) |
Generación de hardware |
---|---|---|---|---|
2023.10 |
CUDA 11.8 o más reciente |
cuDNN 8.2.0 o más reciente |
R450.80.04 |
Ampere, Turing, Volta, Pascal, Maxwell, Kepler |
CUDA es compatible con versiones anteriores, lo que significa que las aplicaciones CUDA existentes pueden seguir utilizándose con versiones CUDA más recientes.
Aquí puedes encontrar más información sobre compatibilidad.
Puedes utilizar el marco de Document Understanding para leer texto utilizando un motor OCR, clasificar los documentos y extraer información de los mismos. Mientras que las tareas de clasificación y extracción se ejecutan en la CPU, se recomienda ejecutar OCR en la GPU (aunque también se proporciona una versión para CPU en caso de que no se disponga de GPU).
La implementación local se realiza mediante Automation Suite y sus requisitos de hardware.
Puedes utilizar el mismo tipo de máquina virtual tanto para los extractores como para los clasificadores, la única diferencia es el tamaño de la infraestructura. Se recomienda utilizar el motor OCR con una máquina virtual de GPU. En la sección Matriz de compatibilidad se describen la compatibilidad entre los paquetes ML, la versión de CUDA y la versión del controlador de la GPU.
Tomemos un ejemplo real para comprender mejor los requisitos de hardware.
Paquete ML | Requisitos de hardware | Capacidad |
---|---|---|
Paquetes de extractor (Facturas, Recibos, Órdenes de compra, etc.) | Utilizar una máquina virtual con un mínimo de 2 núcleos de CPU y 8 GB de RAM | Se pueden procesar 25 000 páginas al día o 5 millones de páginas al año, siempre que el tráfico sea constante (sin subidas repentinas). |
Paquetes de clasificador (DocumentClassifier) | Utilizar una máquina virtual con un mínimo de 2 núcleos de CPU y 8 GB de RAM | Pueden procesar 40 000 documentos/día u 8 millones de documentos/año, suponiendo que el tráfico sea perfectamente constante (sin picos). |
OCR | Requiere un mínimo de 8 GB de RAM si se ejecuta en la CPU. No hay requisitos si se ejecuta en GPU. | Se pueden procesar 50 000 páginas/día. |
OCR_CPU | Requiere un mínimo de 4 GB de RAM. | Se pueden procesar 50 000 páginas/día. |
Ejemplo: si procesas 10 millones de páginas/año, necesitas una máquina virtual con 4 núcleos de CPU, 16 GB de RAM para el extractor, otra para el clasificador y una tercera máquina virtual con un núcleo de GPU NVidia para el motor OCR.
También puedes optar por utilizar una sola máquina virtual para el extractor y el clasificador, lo que significa que necesitarás una sola máquina virtual con 8 núcleos de CPU y 32 GB de RAM.