- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador de CapturaFlexible
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 4506T: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Instalación sin conexión de paquetes ML
Dependiendo de los modelos que desees utilizar, necesitas lo siguiente:
- Para modelos 2022.10 y posteriores:
- Download the needed Document UnderstandingTM bundle. Here are the links for all the available bundles. The du bundle contains information about all models included into a specific version. For example, the
dusemistructured-2023.10.0.tar.gz
contains information about all out-of-the-box pre-trained ML Packages included in the 2023.10.0 version.
- Download the needed Document UnderstandingTM bundle. Here are the links for all the available bundles. The du bundle contains information about all models included into a specific version. For example, the
- Para los modelos 2022.4 y anteriores (
python37duv3
ypython37duv4
):- Todos los Paquetes ML se proporcionan como archivo
.zip
, y se cargan directamente como Paquete personalizado en AI Center. Para descargar los modelos, ponte en contacto con tu Gestor de cuenta, CSM o Soporte para recibir un enlace de descargue por cada paquete. - Descarga el paquete de Document Understanding necesario. Aquí están los enlaces para todos los paquetes disponibles.
- Todos los Paquetes ML se proporcionan como archivo
du-ondemand.tar.gz
en la línea de comandos. Por ejemplo, si descargaste el paquete DU llamado dusemistructured-2023.10.0.tar.gz
, en el momento de la instalación tienes que cambiar su nombre a du-ondemand.tar.gz
.
- Para equipos Windows, la descarga se realiza directamente a través del enlace del paquete y se cambia el nombre del archivo a
du-ondemand.tar.gz
. -
Para las máquinas Linux, desde que la máquina tiene acceso a Internet, descarga el paquete necesario según el siguiente comando:
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'Este es un ejemplo de cómo descargar el paquete necesario para Linux:
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz' -
Copia el siguiente paquete en la carpeta
/uipath/tmp" id="1"/> en la máquina principal del clúster (donde se realizó la instalación): scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
Conéctate a esta máquina principal y carga el paquete:
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
Después de descargar e instalar los modelos, sigue los pasos descritos aquí para cargarlos en AI Center.
Accede al Extractor de formularios y al Clasificador inteligente de palabras clave, con la siguiente URL pública:
<FQDN> / du_ / svc / formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
con la información real del entorno. Por ejemplo, <FQDN>/du_/svc/formextractor
se convierte en https://servicefabricserver.domain.com/du_/svc/formextractor
cuando se utiliza en un flujo de trabajo.
Sigue estos pasos para cargar un paquete de Document Understanding en tu registro de docker externo:
- Pull the desired DU image from the UiPath® registry hosted on registry.uipath.com
- Cambia el nombre del host de imágenes por tu nombre de registro de Docker.
- Extrae la imagen al registro de docker externo
docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>
A continuación te mostramos un ejemplo de cómo extraer la imagen del paquete UiPathDocumentOCR de un registro llamado registry.uipath.com:
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
Cambia el nombre del host de imágenes mediante la ejecución del comando siguiente:
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
A continuación te mostramos un ejemplo de cómo cambiar el nombre de la imagen del paquete UiPathDocumentOCR de un registro llamado registry.uipath.com a un registro llamado registory.mycompany.com:
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Extrae la imagen a tu registro de docker externo mediante la ejecución del siguiente comando:
docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>
A continuación te mostramos un ejemplo de cómo enviar la imagen del paquete UiPathDocumentOCR a un registro de docker externo:
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Paquete de Document Understanding |
Imagen |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10.0 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.0 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.0 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10.0 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.0 |
Dulv4 | aicenter/python37duv4:23.10.0 |
Dulv3 | aicenter/python37duv3:23.10.0 |
Dulv2 | aicenter/python37duv2:23.10.0 |
- Primeros pasos
- Install the offline bundle
- Upload the model to AI Center
- Extractor de formularios y Clasificador inteligente de palabras clave
- Cargar un paquete de Document Understanding™ en un registro de docker externo
- Extrae las imágenes de Document Understanding deseadas
- Renombra el host de imágenes
- Extrae la imagen al registro de docker externo
- Imágenes para cada paquete de Document Understanding