- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Instalar y utilizar
- Primera experiencia de ejecución
- Implementar UiPathDocumentOCR
- Implementar un paquete ML listo para usar
- Paquetes sin conexión 2022.10.0
- Paquetes sin conexión 2022.10.2
- Paquetes sin conexión 2022.10.4
- Paquetes sin conexión 2022.10.6
- Paquetes sin conexión 2022.10.9
- Paquetes sin conexión 2022.10.10
- Paquetes sin conexión 2022.10.11
- Paquetes sin conexión 2022.10.12
- Paquetes sin conexión 2022.10.13
- Paquetes sin conexión 2022.10.14
- Utiliza Document Manager
- Utilizar el marco
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Instalar y utilizar
Esta página describe cómo implementar y configurar Document UnderstandingTM, así como instrucciones especiales sobre cómo utilizar Document UnderstandingTM en Automation Suite.
Document Understanding depende de AI Center, lo que significa que, si se instala Document Understanding, siempre deberá estar instalado AI Center.
Por otra parte, es preciso activar Orchestrator antes de utilizar Document Understanding.
Antes de comenzar la instalación de Document Understanding, asegúrate de comprobar y satisfacer todos los requisitos de Automation Suite para nodo único de este enlace y para multinodo de este otro.
Se recomienda encarecidamente una GPU para Document Understanding en uno de los siguientes escenarios:
-
Si vuelves a entrenar los modelos Document Understanding (DocumentUnderstanding: el modelo general, Facturas, Recibos, etc.) en AI Center.
El entrenamiento en CPU es entre 5 y 7 veces más lento y el rendimiento del modelo se reduce en comparación con el entrenamiento en GPU.
-
Si ejecutas UiPathDocumentOCR (versión no perimetral) en AI Center para procesar más de 2 millones de páginas al año.
Si no utilizas una GPU, el rendimiento lento puede afectar a la experiencia del producto.
Para obtener más información sobre cómo aprovisionar una GPU, consulta Inclusión de un nodo agente dedicado compatible con GPU.
Document Understanding requiere que la característica FullTextSearch esté habilitada en el servidor SQL. De lo contrario, la instalación fracasará sin un mensaje de error explícito.
Consulta el archivo de configuración de Document Understanding aquí.
Accede al Extractor de formularios y al Clasificador inteligente de palabras clave, con la siguiente URL pública:
<FQDN> / du_ / svc / formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
con la información real del entorno. Por ejemplo, <FQDN>/du_/svc/formextractor
se convierte en https://servicefabricserver.domain.com/du_/svc/formextractor
cuando se utiliza en un flujo de trabajo.
Tras la instalación, puedes habilitar o deshabilitar Document Understanding. Puedes encontrar más detalles aquí.
Si deseas utilizar el punto final OCR para chino, japonés y coreano en un entorno sin conexión, debes instalar el paquete sin conexión siguiendo estas instrucciones y, una vez instalado, activar OCR en ArgoCD.
- Cuando se use OCR para chino, japonés y coreano en Document Understanding, asegúrese de haber configurado la actividad con el punto final público de OCR y la clave API de Document Understanding.
- El OCR para chino, japonés y coreano solo se admite en Document Understanding implementado en Automation Suite. Esto no se admite en Document Understanding implementado en AI Center conectado a un Orchestrator externo.
Estos son los pasos que debes seguir para habilitar OCR en ArgoCD:
- Accede a ArgoCD.
- Abre el marco de Document Understanding.
- Haz clic en la pestaña Parámetros y ve a
du-cjk-ocr.enabled
. - Haz clic en el botón Editar, establece el valor en
TRUE
, y haz clic en el botón Guardar.
{Cluster_FQDN}/du_/cjk-ocr/
.
Consulta aquí los problemas relacionados con Document Understanding.