document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Guía del usuario de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Última actualización 18 de dic. de 2024

Servicios de OCR

Acerca de los servicios de OCR

Los servicios de OCR se utilizan para lo siguiente:

  • At data labeling time, when importing documents into Document Manager. The engines available for this step are UiPath® Document OCR, Google Cloud Vision OCR, and Microsoft Read OCR.
  • Durante el tiempo de ejecución a la hora de ejecutar los modelos desde los flujos de trabajo RPA. Los motores disponibles para este paso son todos los motores integrados con la plataforma UiPath RPA, incluidos los anteriores, además de Microsoft OCR (heredado), Microsoft Project Oxford OCR y Tesseract.

En producción, recomendamos llamar al OCR mediante la actividad Digitalizar documento en el flujo de trabajo y pasar el modelo de objetos del documento como entrada a la actividad que llama al modelo ML. Para ello, debes utilizar la actividad Extractor con aprendizaje automático (fuente oficial).

Para facilitar las pruebas, también se puede configurar el OCR directamente en AI Center (ventana de Configuración), aunque no se recomienda para las implementaciones de producción.

Configurar el servicio OCR en los paquetes ML de Document Manager y AI Center Document Understanding™

En la siguiente tabla se muestra cómo configurar los seis tipos de motores OCR admitidos tanto en el Administrador de documentos como en AI Center.

Importante: El argumento ocr.method corresponde al menú desplegable del motor OCR en la vista de creación del paquete ML en AI Center.

Motor OCR

Método OCR

Clave OCR

URL del OCR

UiPath

UiPath Document OCR (en la nube y en las instalaciones)

UiPathDocumentOCR_CPU(en las instalaciones)

OCR para chino, japonés, coreano (en la nube y en las instalaciones)

Clave API de Automation Suite*

Plan empresarial

La URL de la habilidad ML generada después de implementar UiPath Document OCR.

Google

Google Cloud Vision OCR

Clave de API de la consola GCP

https://vision.googleapis.com/v1/images:annotate

Microsoft Read 2.0 On-Prem

Microsoft Read OCR

Ninguno

http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze

Microsoft Read 2.0 Azure

Microsoft Read OCR

Clave API para los recursos del Portal Azure

<Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze

Microsoft Read 3.2 local

Microsoft Read OCR

Ninguno

http://<IP_addr>:<port_number>/vision/v3.2/read/analyze

Microsoft Read 3.2 Azure

Microsoft Read OCR

Clave API para los recursos del Portal Azure

<Azure_resource_Endpoint>/vision/v3.2/read/analyze

Nota: *If you consume services or endpoints from an Automation CloudTM environment (for example, du.uipath.com/ocr or du.uipath.com/ie/invoices) while you are using a deployment type other than Automation Cloud, such as Automation Suite offline, you need to add the API key from an Automation Cloud account. Make sure that you use the Automation Cloud API Key for public endpoints, and the Automation Suite API Key for endpoints hosted within Automation Suite.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.