document-understanding
2023.10
false
UiPath logo, featuring letters U and I in white
Guía del usuario de Document Understanding
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 11 de nov. de 2024

Servicios de OCR

Acerca de los servicios de OCR

Los servicios de OCR se utilizan para lo siguiente:

  • En el momento del etiquetado de datos, al importar documentos en Document Manager. Los motores disponibles para este paso son UiPath® Document OCR, Google Cloud Vision OCR y Microsoft Read OCR.
  • Durante el tiempo de ejecución a la hora de ejecutar los modelos desde los flujos de trabajo RPA. Los motores disponibles para este paso son todos los motores integrados con la plataforma UiPath RPA, incluidos los anteriores, además de Microsoft OCR (heredado), Microsoft Project Oxford OCR y Tesseract.

En producción, recomendamos llamar al OCR mediante la actividad Digitalizar documento en el flujo de trabajo y pasar el modelo de objetos del documento como entrada a la actividad que llama al modelo ML. Para ello, debes utilizar la actividad Extractor con aprendizaje automático (fuente oficial).

Para facilitar las pruebas, también se puede configurar el OCR directamente en AI Center (ventana de Configuración), aunque no se recomienda para las implementaciones de producción.

Configurar el servicio OCR en los paquetes ML de Document Manager y AI Center Document Understanding™

En la siguiente tabla se muestra cómo configurar los seis tipos de motores OCR admitidos tanto en el Administrador de documentos como en AI Center.

Importante: El argumento ocr.method corresponde al menú desplegable del motor OCR en la vista de creación del paquete ML en AI Center.

Motor OCR

Método OCR

Clave OCR

URL del OCR

UiPath

UiPath Document OCR (en la nube y en las instalaciones)

UiPathDocumentOCR_CPU(en las instalaciones)

OCR para chino, japonés, coreano (en la nube y en las instalaciones)

Clave API de Automation Suite*

Plan empresarial

La URL de la habilidad ML generada después de implementar UiPath Document OCR.

Google

Google Cloud Vision OCR

Clave de API de la consola GCP

https://vision.googleapis.com/v1/images:annotate

Microsoft Read 2.0 On-Prem

Microsoft Read OCR

Ninguno

http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze

Microsoft Read 2.0 Azure

Microsoft Read OCR

Clave API para los recursos del Portal Azure

<Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze

Microsoft Read 3.2 local

Microsoft Read OCR

Ninguno

http://<IP_addr>:<port_number>/vision/v3.2/read/analyze

Microsoft Read 3.2 Azure

Microsoft Read OCR

Clave API para los recursos del Portal Azure

<Azure_resource_Endpoint>/vision/v3.2/read/analyze

Nota: *Si consumes servicios o puntos finales de un entorno de Automation CloudTM (por ejemplo, du.uipath.com/ocr o du.uipath.com/ie/invoices) mientras utilizas un tipo de implementación que no sea Automation Cloud, como Automation Suite sin conexión, debes añadir la clave API desde una cuenta de Automation Cloud. Asegúrate de utilizar la clave API de Automation Cloud para los puntos finales públicos y la clave API de Automation Suite para los puntos finales alojados en Automation Suite.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.