- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Servicios de OCR
Los servicios de OCR se utilizan para lo siguiente:
- En el momento de etiquetar los datos, al importar los documentos en el Administrador de documentos. Los motores disponibles para este paso son UiPath Document OCR, Google Cloud Vision OCR y Microsoft Read OCR.
- Durante el tiempo de ejecución a la hora de ejecutar los modelos desde los flujos de trabajo RPA. Los motores disponibles para este paso son todos los motores integrados en la plataforma UiPath RPA, incluidos los anteriores, además de Abbyy Finereader, Microsoft OCR (heredado), Microsoft Project Oxford OCR y Tesseract.
En producción, recomendamos llamar al OCR mediante la actividad Digitalizar documento en el flujo de trabajo y pasar el modelo de objetos del documento como entrada a la actividad que llama al modelo ML. Para ello, debes utilizar la actividad Extractor con aprendizaje automático (fuente oficial).
Para facilitar las pruebas, también se puede configurar el OCR directamente en AI Center (ventana de Configuración), aunque no se recomienda para las implementaciones de producción.
Configuración del servicio de OCR en el Administrador de documentos y en los paquetes ML de Document Understanding
En la siguiente tabla se muestra cómo configurar los seis tipos de motores OCR admitidos tanto en el Administrador de documentos como en AI Center.
ocr.method
corresponde al menú desplegable del motor OCR en la vista de creación del paquete ML en AI Center.
Motor OCR |
Método OCR |
Clave OCR |
URL del OCR |
---|---|---|---|
UiPath |
UiPath Document OCR |
UiPath Automation Cloud Clave API de Document Understanding Plan empresarial |
|
|
Google Cloud Vision OCR |
Clave de API de la consola GCP |
|
Microsoft Read 2.0 On-Prem |
Microsoft Read OCR |
Ninguno |
|
Microsoft Read 2.0 Azure |
Microsoft Read OCR |
Clave API para los recursos del Portal Azure |
|
Microsoft Read 3.2 local |
Microsoft Read OCR |
Ninguno |
|
Microsoft Read 3.2 Azure |
Microsoft Read OCR |
Clave API para los recursos del Portal Azure |
|