- Primeros pasos
- Componentes de marco
- Document Understanding en AI Center
- Procesos
- Paquetes ML
- Gestor de datos
- Servicios de OCR
- Licencia
- Referencias
Guía del usuario de Document Understanding
Configure OCR
Para importar documentos en Data Manager, es obligatorio configurar un servicio de OCR. Para ello, ve a la vista Configuración > OCR, a la que se accede a través del botón situado en la parte superior derecha de la pantalla.
La configuración de OCR requiere que el servicio OCR disponga de una URL. Estas son las posibles URL que puedes usar:
- URL públicas como https://du.uipath.com/ocr o URL de terceros desde Google Vision OCR o Microsoft Read OCR;
- URL de contenedores independientes UiPath Document OCR u Omnipage OCR proporcionados por UiPath e implementados de forma local;
- Las URL del paquete ML de OCR se implementan como Habilidades ML que se han hecho públicas en la versión 2020.10 local de AI Center o superior.
Importante:Si estás ejecutando el OCR en la misma máquina que Data Manager, entonces no utilices
localhost
para referirte a la máquina local. pero mejor usa la dirección IP o el nombre de dominio de la máquina local.En el caso de las URL de OCR implementadas como habilidad ML pública en AI Center local, usa la URL tal y como aparece en la pantalla de detalles de la habilidad ML de AI Center.
La elección del motor OCR que se utilizará para importar documentos en Data Manager es una decisión fundamental.
Se recomienda usar el mismo OCR para importar los datos de entrenamiento (tiempo de entrenamiento) que el que se utilizará cuando se implemente el modelo (tiempo de ejecución).
Lo ideal es probar algunos diferentes para ver cuál funciona mejor en sus documentos y solo entonces tomar una decisión.
Las opciones en las instalaciones son las siguientes:
- Contenedor UiPath OCR que admite los principales idiomas de Europa Occidental;
- El contenedor Omnipage OCR (también disponible en UiPath) funciona mejor en documentos bien escaneados y tiene la mejor cobertura lingüística;
- El contenedor Microsoft Read (disponible como vista previa de Microsoft) también tiene una buena cobertura lingüística;
- Habilidades ML de OCR UiPath implementadas en AI Center local v2020.10 o posterior.
Las opciones basadas en la nube son las siguientes:
- UiPath Document OCR: https://du.uipath.com/ocr;
- Google Cloud OCR, que tiene la mejor cobertura de idiomas;
- Microsoft Read Azure OCR.