- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Implementar UiPathDocumentOCR
Crea un paquete ML UiPathDocumentOCR en AI Center.
Para la instalación en línea, el modelo UiPathDocumentOCR ya está incluido en la sección Paquetes listos para usar. Ve a Paquetes ML > Paquetes listos para usar > UiPath Document Understanding > UiPathDocumentOCR, y haz clic en Enviar.
Para instalaciones sin conexión, ve a la pestaña Paquetes ML en la barra lateral izquierda de AI Center y crea un nuevo paquete. Nombra el paquete y carga el paquete que has descargado desde esta página. Escoge el tipo de entrada JSON y el lenguaje Python correspondiente. Crea el paquete.
Ve a Habilidades ML y crea una nueva Habilidad ML para el paquete UiPathDocumentOCR que hayas creado.
Utiliza Configuración avanzada de la infraestructura para actualizar la implementación a fin de actualizar la réplica (lo ideal es que el número de réplicas sea igual al número de nodos) y maximizar las solicitudes de CPU (al menos 4) y RAM si no utilizas máquinas GPU, o el procesamiento de UiPathDocumentOCR será lento y puede fallar.
El motor OCR necesita la GPU para un rendimiento óptimo, y se recomienda para cargas de trabajo de producción. Sin embargo, si la GPU no está disponible, puede seguir ejecutándose en la CPU, aunque requiere recursos superiores a los predeterminados. La configuración avanzada de infraestructura debe ajustarse como tal:
Réplicas: aumentan si hay un uso simultáneo de UiPathDocumentOCR. Si utilizas UiPathDocumentOCR para realizar importaciones en una única sesión de etiquetado de datos a la vez y UiPathDocumentOCR no se utiliza en otros flujos de trabajo de UiPath, entonces basta con 1 réplica. De lo contrario, habrá que aumentar el número de réplicas. No existe un número "mágico", necesitarás probar y equivocarte. No utilices más de 2 réplicas en una instalación de nodo único. Lo ideal es que el número de réplicas sea igual al número de nodos del clúster (1 réplica/nodo). Si se necesita más paralelismo, aumentar la CPU ayuda
CPU: debería ser al menos 4 (para cada réplica). Asegúrate de disponer de los recursos adecuados. No existe una cifra "mágica", pero más CPU significa un tiempo de procesamiento más rápido. Necesitas experimentar qué es suficiente en tus escenarios específicos.
La habilidad ML puede tardar hasta 30 minutos en estar lista. Es posible que tengas que actualizar la página de AI Center para ver el cambio de estado.
¡Enhorabuena! Has implementado correctamente UiPathDocumentOCR en AI Center.
Puedes seleccionar la Habilidad ML directamente como tu habilidad privada en el flujo de trabajo de Studio. O, si has instalado la versión en línea del AI Center independiente y quieres utilizar la Habilidad ML pública, sigue las instrucciones a continuación para obtener el punto final de la habilidad ML (opcional).
Cuando la Habilidad ML esté disponible, haz doble clic en la Habilidad ML y ve a Modificar la implementación actual.
Activa el selector para hacer pública la habilidad ML. Es posible que tengas que esperar unos minutos y actualizar la página.
Haz doble clic en la habilidad ML y copia la URL, que es el punto final de UiPathDocumentOCR para su uso posterior.