- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Instalar y utilizar
Esta página describe cómo implementar y configurar Document Understanding, además de instrucciones especiales sobre cómo utilizar Document Understanding en Automation Suite.
Document Understanding depende de AI Center, lo que significa que, si se instala Document Understanding, siempre deberá estar instalado AI Center.
Por otra parte, es preciso activar Orchestrator antes de utilizar Document Understanding.
Antes de comenzar la instalación de Document Understanding, asegúrate de comprobar y satisfacer todos los requisitos de Automation Suite para nodo único de este enlace y para multinodo de este otro.
Se recomienda encarecidamente una GPU para Document Understanding en uno de los siguientes escenarios:
-
Si vuelves a entrenar los modelos Document Understanding (DocumentUnderstanding: el modelo general, Facturas, Recibos, etc.) en AI Center.
El entrenamiento en CPU es entre 5 y 7 veces más lento y el rendimiento del modelo se reduce en comparación con el entrenamiento en GPU.
-
Si ejecutas UiPathDocumentOCR (versión no perimetral) en AI Center para procesar más de 2 millones de páginas al año.
Si no utilizas una GPU, el rendimiento lento puede afectar a la experiencia del producto.
Para obtener más información sobre cómo aprovisionar una GPU, consulta Inclusión de un nodo agente dedicado compatible con GPU.
Document Understanding requiere que la característica FullTextSearch esté habilitada en el servidor SQL. De lo contrario, la instalación fracasará sin un mensaje de error explícito.
Para obtener más información sobre la instalación de Document Understanding en un entorno en línea, consulta las siguientes guías:
El proceso es prácticamente el mismo que el de instalación de otros servicios, y el único requisito es asegurarse de que AI Center y Document Understanding están habilitados.
- Si utilizas el instalador interactivo, asegúrate de seleccionar ambos productos siguiendo los pasos que se indican.
-
Si no utilizas el instalador interactivo, habilita AI Center y Document Understanding en el archivo de configuración antes de la instalación, o en ArgoCD después de la instalación.
Se incluye un archivo de configuración de ejemplo en la página Archivo de configuración de Document Understanding.
Para obtener más información sobre la instalación de Document Understanding en un entorno sin conexión, consulta las siguientes guías:
Los cambios que se indican a continuación son imprescindibles para instalar correctamente Document Understanding en un entorno sin conexión:
-
Asegúrate de que AI Center y Document Understanding están habilitados en el archivo de configuración antes de la instalación, o en ArgoCD después de la instalación. Asegúrate también de que la escritura manual está activada en el archivo de configuración si quieres utilizar esta función.
Se incluye un archivo de configuración de ejemplo en la página Archivo de configuración de Document Understanding.
-
Comprueba que se ha descargado e instalado el paquete Document Understanding.
Para obtener más información sobre la descarga e instalación del paquete Document Understanding consulta la página Instalación sin conexión de los Paquetes ML.
Consulta el archivo de configuración de Document Understanding aquí.
Accede al Extractor de formularios y al Clasificador inteligente de palabras clave, con la siguiente URL pública:
<FQDN> / du_ / svc / formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
con la información real del entorno. Por ejemplo, <FQDN>/du_/svc/formextractor
se convierte en https://servicefabricserver.domain.com/du_/svc/formextractor
cuando se utiliza en un flujo de trabajo.
Tras la instalación, puedes habilitar o deshabilitar Document Understanding. Puedes encontrar más detalles aquí.
Si deseas utilizar el punto final OCR para chino, japonés y coreano en un entorno sin conexión, debes instalar el paquete sin conexión siguiendo estas instrucciones y, una vez instalado, activar OCR en ArgoCD.
- Cuando se use OCR para chino, japonés y coreano en Document Understanding, asegúrese de haber configurado la actividad con el punto final público de OCR y la clave API de Document Understanding.
- El OCR para chino, japonés y coreano solo se admite en Document Understanding implementado en Automation Suite. Esto no se admite en Document Understanding implementado en AI Center conectado a un Orchestrator externo.
Estos son los pasos que debes seguir para habilitar OCR en ArgoCD:
- Accede a ArgoCD.
- Abre el marco de Document Understanding.
- Haz clic en la pestaña Parámetros y ve a
du-cjk-ocr.enabled
. - Haz clic en el botón Editar, establece el valor en
TRUE
, y haz clic en el botón Guardar.
{Cluster_FQDN}/du_/cjk-ocr/
.
Consulta aquí los problemas relacionados con Document Understanding.