UiPath Documentation
document-understanding
2023.10
false
Importante :
La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Guía del usuario de Document Understanding

Instalación sin conexión de paquetes ML

Primeros pasos

Dependiendo de los modelos que desees utilizar, necesitas lo siguiente:

  • Para modelos 2022.10 y posteriores:
    • Descarga el paquete Document UnderstandingTM necesario. Aquí están los enlaces para todos los paquetes disponibles. El paquete du contiene información sobre todos los modelos incluidos en una versión específica. Por ejemplo, dusemistructured-2023.10.0.tar.gz contiene información sobre todos los paquetes ML preentrenados incluidos en la versión 2023.10.0.
  • Para los modelos 2022.4 y anteriores (python37duv3 y python37duv4):
    • Todos los Paquetes ML se proporcionan como archivo .zip, y se cargan directamente como Paquete personalizado en AI Center. Para descargar los modelos, ponte en contacto con tu Gestor de cuenta, CSM o Soporte para recibir un enlace de descargue por cada paquete.
    • Descarga el paquete Document Understanding necesario. Aquí están los enlaces para todos los paquetes disponibles.

Install the offline bundle

Las instalaciones sin conexión requieren que el nombre del paquete DU descargado se cambie a du-ondemand.tar.gz en la línea de comandos. Por ejemplo, si descargaste el paquete DU llamado dusemistructured-2023.10.0.tar.gz, en el momento de la instalación tienes que cambiar su nombre a du-ondemand.tar.gz.

  1. Para equipos Windows, la descarga se realiza directamente a través del enlace del paquete y se cambia el nombre del archivo a du-ondemand.tar.gz.

  2. Para las máquinas Linux, desde que la máquina tiene acceso a Internet, descarga el paquete necesario según el siguiente comando:

    wget -O ~/<bundle-name.tar.gz> 'bundle-link'
    wget -O ~/<bundle-name.tar.gz> 'bundle-link'
    

    Este es un ejemplo de cómo descargar el paquete necesario para Linux:

    wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz'
    wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz'
    
  3. Copia el siguiente paquete en la carpeta /uipath/tmp" id="1"/> en la máquina principal del clúster (donde se realizó la instalación):

    scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
    scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
    
  4. Conéctate a esta máquina principal y carga el paquete:

    ./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
    ./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
    

Cargar el modelo en AI Center

Después de descargar e instalar los modelos, sigue los pasos descritos en la página de instalación sin conexión de paquetes ML de la Guía del usuario de AI Center para cargarlos en AI Center. Para este procedimiento se necesitan tanto el paquete ML zip como los archivos de metadatos json .

Extractor de formularios y Clasificador inteligente de palabras clave

Accede al extractor de formularios y al clasificador inteligente de palabras clave, con la siguiente URL pública:

  • <FQDN>/du_/svc/formextractor
  • <FQDN>/du_/svc/intelligentkeywords
Nota:

Cuando utilices una URL pública, sustituye el marcador de posición <FQDN> por la información del entorno real. Por ejemplo, <FQDN>/du_/svc/formextractor se convierte en https://servicefabricserver.domain.com/du_/svc/formextractor cuando se utiliza en un flujo de trabajo.

Cargar un paquete de Document Understanding™ en un registro de docker externo

Sigue estos pasos para cargar un paquete de Document Understanding en tu registro de docker externo:

  • Extrae la imagen de DU deseada del registro de UiPath® alojado en registration.uipath.com
  • Cambia el nombre del host de imágenes por tu nombre de registro de Docker.
  • Extrae la imagen al registro de docker externo

Extrae las imágenes de Document Understanding deseadas

Extrae las imágenes del registro de UiPath® ejecutando estos comandos:

docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>

A continuación te mostramos un ejemplo de cómo extraer la imagen del paquete UiPathDocumentOCR de un registro llamado registry.uipath.com:

docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0

Renombra el host de imágenes

Cambia el nombre del host de imágenes mediante la ejecución del comando siguiente:

docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>

A continuación te mostramos un ejemplo de cómo cambiar el nombre de la imagen del paquete UiPathDocumentOCR de un registro llamado registry.uipath.com a un registro llamado registory.mycompany.com:

docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0

Extrae la imagen al registro de docker externo

Extrae la imagen a tu registro de docker externo mediante la ejecución del siguiente comando:

docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>

A continuación te mostramos un ejemplo de cómo enviar la imagen del paquete UiPathDocumentOCR a un registro de docker externo:

docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0

Imágenes para cada paquete de Document Understanding

2023.10.12+parche1

Paquete de Document UnderstandingImagen
OCR for Chinese, Japanese, Koreandu/uipath-ocr-cjk:v23.10-11.21-rc02 du/du-cjk-ocr-proxy:v23.10-11.21-rc02
OCR de idiomas ampliadosdu/du-extended-ocr-proxy:v23.10-11.21-rc02 du/uipath-ocr-extended:v23.10-11.21-rc02 du/du-extended-ocr-reporting:v23.10-11.21-rc02

2023.10.12

Paquete de Document UnderstandingImagen
OCR for Chinese, Japanese, Koreandu/uipath-ocr-cjk:v23.10-10.17-rc02 du/du-cjk-ocr-proxy:v23.10-10.17-rc02
OCR de idiomas ampliadosdu/du-extended-ocr-proxy:v23.10-10.31-rc06 du/uipath-ocr-extended:v23.10-10.31-rc06 du/du-extended-ocr-reporting:v23.10-10.31-rc06

2023.10.11

Paquete de Document UnderstandingImagen
UiPath Document OCRaicenter/du-doc-ocr:v23.10-08.25-rc02
UiPathDocumentOCR_CPUaicenter/du-doc-ocr-cpu:v23.10-08.25-rc02
OCR for Chinese, Japanese, Koreandu/uipath-ocr-cjk:v23.10-8.26-rc02 du/du-cjk-ocr-proxy:v23.10-8.26-rc02
OCR de idiomas ampliadosdu/du-extended-ocr-proxy:v23.10-8.26-rc02 du/uipath-ocr-extended:v23.10-8.26-rc02 du/du-extended-ocr-reporting:v23.10-8.26-rc02
Clasificador de documentosaicenter/du-ml-document-type-text-classifier:v23.10-08.25-rc02
Paquetes ML preentrenados listos para usaraicenter/du-semistructured:v23.10-08.25-rc02

2023.10.10

Paquete de Document UnderstandingImagen
UiPath Document OCRaicenter/du-doc-ocr:v23.10-06.05-rc05
UiPathDocumentOCR_CPUaicenter/du-doc-ocr-cpu:v23.10-06.05-rc05
OCR for Chinese, Japanese, Koreandu/uipath-ocr-cjk:v23.10-6.05-rc02 du/du-cjk-ocr-proxy:v23.10-6.05-rc02
OCR de idiomas ampliadosdu/du-extended-ocr-proxy:v23.10-6.05-rc02 du/uipath-ocr-extended:v23.10-6.05-rc02 du/du-extended-ocr-reporting:v23.10-6.05-rc02
Clasificador de documentosaicenter/du-ml-document-type-text-classifier:v23.10-06.05-rc05
Paquetes ML preentrenados listos para usaraicenter/du-semistructured:v23.10-06.05-rc05

2023.10.9

Paquete de Document UnderstandingImagen
UiPath Document OCRaicenter/du-doc-ocr:v23.10-03.14-rc02
UiPathDocumentOCR_CPUaicenter/du-doc-ocr-cpu:v23.10-03.14-rc02
OCR for Chinese, Japanese, Koreandu/uipath-ocr-cjk:v23.10-4.01-rc06 du/du-cjk-ocr-proxy:v23.10-4.01-rc06
OCR de idiomas ampliadosdu/du-extended-ocr-proxy:v23.10-4.01-rc06 du/uipath-ocr-extended:v23.10-4.01-rc06 du/du-extended-ocr-reporting:v23.10-4.01-rc06
Clasificador de documentosaicenter/du-ml-document-type-text-classifier:v23.10-03.14-rc02
Paquetes ML preentrenados listos para usaraicenter/du-semistructured:v23.10-03.14-rc02

2023.10.8

Paquete de Document UnderstandingImagen
UiPath Document OCRaicenter/du-doc-ocr:v23.10-01.28-rc07
UiPathDocumentOCR_CPUaicenter/du-doc-ocr-cpu:v23.10-01.28-rc07
OCR for Chinese, Japanese, Koreandu/uipath-ocr-cjk:vision-3.2-20241211.1 du/du-cjk-ocr-proxy:v23.10-02.11-rc01
Clasificador de documentosaicenter/du-ml-document-type-text-classifier:v23.10-01.28-rc07
Out-of-the-box Pre-trained ML Packagesaicenter/du-semistructured:v23.10-01.28-rc07

2023.10.7+parche1

Paquete de Document UnderstandingImagen
OCR for Chinese, Japanese, Koreandu/uipath-ocr-cjk:vision-3.2-20241211.1 du/du-cjk-ocr-proxy:v23.10-12.01-rc01

2023.10.7

Paquete de Document UnderstandingImagen
OCR for Chinese, Japanese, Koreandu/du-cjk-ocr-proxy:v23.10-12.01-rc01

2023.10.6

Paquete de Document UnderstandingImagen
UiPath Document OCRaicenter/du-doc-ocr:v23.10-09.25-rc08
UiPathDocumentOCR_CPUaicenter/du-doc-ocr-cpu:v23.10-09.25-rc08
OCR for Chinese, Japanese, Koreandu/du-cjk-ocr-proxy:v23.10-10.15-rc03
Clasificador de documentosaicenter/du-ml-document-type-text-classifier:v23.10-09.25-rc08
Out-of-the-box Pre-trained ML Packagesaicenter/du-semistructured:v23.10-09.25-rc08

2023.10.5

Paquete de Document UnderstandingImagen
UiPath Document OCRaicenter/du-doc-ocr:v23.10-rc28
UiPathDocumentOCR_CPUaicenter/du-doc-ocr-cpu:v23.10-rc28
OCR for Chinese, Japanese, Koreandu/du-cjk-ocr-proxy:v23.10-rc58
Clasificador de documentosaicenter/du-ml-document-type-text-classifier:v23.10-rc28
Out-of-the-box Pre-trained ML Packagesaicenter/du-semistructured:v23.10-rc28

2023.10.4

Paquete de Document UnderstandingImagen
UiPath Document OCRaicenter/du-doc-ocr:v23.10.4-rc125
UiPathDocumentOCR_CPUaicenter/du-doc-ocr-cpu:v23.10.4-rc125
OCR for Chinese, Japanese, Koreandu/du-cjk-ocr-proxy:v23.10.4-rc45
Clasificador de documentosaicenter/du-ml-document-type-text-classifier:v23.10.4-rc125
Out-of-the-box Pre-trained ML Packagesaicenter/du-semistructured:v23.10.4-rc125

2023.10.3

Paquete de Document UnderstandingImagen
UiPath Document OCRaicenter/du-doc-ocr:v23.10.3-rc04
OCR for Chinese, Japanese, Koreandu/du-cjk-ocr-proxy:v23.10.3-rc20
Clasificador de documentosaicenter/du-ml-document-type-text-classifier:v23.10.3-rc04
Out-of-the-box Pre-trained ML Packagesaicenter/du-semistructured:v23.10.3-rc04

2023.10.2

Paquete de Document UnderstandingImagen
UiPath Document OCRaicenter/du-doc-ocr:v23.10.2-rc22
UiPathDocumentOCR_CPUaicenter/du-doc-ocr-cpu:v23.10.2-rc22
OCR for Chinese, Japanese, Koreandu/du-cjk-ocr-proxy:v23.10.2-rc13
Clasificador de documentosaicenter/du-ml-document-type-text-classifier:v23.10.2-rc42
Out-of-the-box Pre-trained ML Packagesaicenter/du-semistructured:v23.10.2-rc22

2023.10.1

Paquete de Document UnderstandingImagen
OCR for Chinese, Japanese, Koreandu/du-cjk-ocr-proxy:v23.10.1-rc19

2023.10.0

Paquete de Document UnderstandingImagen
UiPath Document OCRaicenter/du-doc-ocr:v23.10.0-rc68
UiPathDocumentOCR_CPUaicenter/du-doc-ocr-cpu:v23.10.0-rc68
OCR for Chinese, Japanese, Koreandu/du-cjk-ocr-proxy:v23.10.0-rc82
Out-of-the-box Pre-trained ML Packagesaicenter/du-semistructured:v23.10.0-rc68

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado