- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Instalación sin conexión de paquetes ML
dusemistructured-2024.10.0.tar.gz
contains information about all out-of-the-box pre-trained ML Packages included in the 2023.4.0 version.
du-ondemand.tar.gz
en la línea de comandos. Por ejemplo, si descargaste el paquete DU llamado dusemistructured-2024.10.0.tar.gz
, en el momento de la instalación tienes que cambiar su nombre a du-ondemand.tar.gz
.
- Para equipos Windows, la descarga se realiza directamente a través del enlace del paquete y se cambia el nombre del archivo a
du-ondemand.tar.gz
. -
Para las máquinas Linux, desde que la máquina tiene acceso a Internet, descarga el paquete necesario según el siguiente comando:
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'Este es un ejemplo de cómo descargar el paquete necesario para Linux:
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2024.10.0/dusemistructured-2024.10.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2024.10.0/dusemistructured-2024.10.0.tar.gz' -
Copia el siguiente paquete en la carpeta
/uipath/tmp" id="1"/> en la máquina principal del clúster (donde se realizó la instalación): scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
Conéctate a esta máquina principal y carga el paquete:
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
Después de descargar e instalar los modelos, sigue los pasos descritos aquí para cargarlos en AI Center.
Accede al Extractor de formularios y al Clasificador inteligente de palabras clave, con la siguiente URL pública:
<FQDN> / du_ / svc / formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
con la información real del entorno. Por ejemplo, <FQDN>/du_/svc/formextractor
se convierte en https://servicefabricserver.domain.com/du_/svc/formextractor
cuando se utiliza en un flujo de trabajo.
Sigue estos pasos para cargar un paquete de Document Understanding en tu registro de docker externo:
- Pull the desired DU image from the UiPath® registry hosted on registry.uipath.com
- Cambia el nombre del host de imágenes por tu nombre de registro de Docker.
- Extrae la imagen al registro de docker externo
docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>
A continuación te mostramos un ejemplo de cómo extraer la imagen del paquete UiPathDocumentOCR de un registro llamado registry.uipath.com:
docker pull registry.uipath.com/aicenter/du-doc-ocr:v24.10-10.3-rc02
docker pull registry.uipath.com/aicenter/du-doc-ocr:v24.10-10.3-rc02
Cambia el nombre del host de imágenes mediante la ejecución del comando siguiente:
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
A continuación te mostramos un ejemplo de cómo cambiar el nombre de la imagen del paquete UiPathDocumentOCR de un registro llamado registry.uipath.com a un registro llamado registory.mycompany.com:
docker tag registry.uipath.com/aicenter/du-doc-ocr:v24.10-10.3-rc02 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker tag registry.uipath.com/aicenter/du-doc-ocr:v24.10-10.3-rc02 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Extrae la imagen a tu registro de docker externo mediante la ejecución del siguiente comando:
docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>
A continuación te mostramos un ejemplo de cómo enviar la imagen del paquete UiPathDocumentOCR a un registro de docker externo:
docker push registory.mycompany.com/aicenter/du-doc-ocr:v24.10.0
docker push registory.mycompany.com/aicenter/du-doc-ocr:v24.10.0
Paquete de Document Understanding |
Imagen |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v24.10-11.21-rc12 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v24.10-11.21-rc12 |
OCR de idiomas ampliados |
du/du-extended-ocr-proxy:v24.10-12.03-rc04 du/uipath-ocr-extended:v24.10-12.03-rc04 du/du-extended-ocr-reporting:v24.10-12.03-rc04 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v24.10-11.21-rc12 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v24.10-11.21-rc12 |
Paquete de Document Understanding |
Imagen |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v24.10-10.03-rc02 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v24.10-10.03-rc02 |
OCR de idiomas ampliados |
du/du-extended-ocr-proxy:v24.10-10.26-rc01 du/uipath-ocr-extended:v24.10-10.26-rc01 du/du-extended-ocr-reporting:v24.10-10.26-rc01 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v24.10-10.03-rc02 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v24.10-10.17-rc02 |
- Primeros pasos
- Install the offline bundle
- Upload the model to AI Center
- Extractor de formularios y Clasificador inteligente de palabras clave
- Cargar un paquete de Document Understanding™ en un registro de docker externo
- Extrae las imágenes de Document Understanding deseadas
- Renombra el host de imágenes
- Extrae la imagen al registro de docker externo
- Imágenes para cada paquete de Document Understanding
- 2024.10.1
- 2024.10.0