- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador de CapturaFlexible
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 4506T: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Document Understanding implementado en Automation Suite
- Instalar y utilizar
- Primera experiencia de ejecución
- Implementar UiPathDocumentOCR
- Implementar un paquete ML listo para usar
- Offline bundles 2023.4.10
- Paquetes sin conexión 2023.4.9
- Paquetes sin conexión 2023.4.8
- Paquetes sin conexión 2023.4.7
- Paquetes sin conexión 2023.4.6
- Paquetes sin conexión 2023.4.5
- Paquetes sin conexión 2023.4.4
- Paquetes sin conexión 2023.4.3
- Paquetes sin conexión 2023.4.2
- Paquetes sin conexión 2023.4.1
- Paquetes sin conexión 2023.4.0
- Utiliza Document Manager
- Utilizar el marco
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Instalación sin conexión de paquetes ML
Dependiendo de los modelos que desees utilizar, necesitas lo siguiente:
- Para modelos 2022.10 y posteriores:
- Descarga el paquete de Document Understanding necesario. Aquí están los enlaces para todos los paquetes disponibles. El paquete du contiene información acerca de todos los modelos incluidos en una versión específica. Por ejemplo,
dusemistructured-2023.4.0.tar.gz
contiene información sobre todos los paquetes ML preentrenados incluidos en la versión 2023.4.0.
- Descarga el paquete de Document Understanding necesario. Aquí están los enlaces para todos los paquetes disponibles. El paquete du contiene información acerca de todos los modelos incluidos en una versión específica. Por ejemplo,
- Para los modelos 2022.4 y anteriores (
python37duv3
ypython37duv4
):- Todos los Paquetes ML se proporcionan como archivo
.zip
, y se cargan directamente como Paquete personalizado en AI Center. Para descargar los modelos, ponte en contacto con tu Gestor de cuenta, CSM o Soporte para recibir un enlace de descargue por cada paquete. - Descarga el paquete de Document Understanding necesario. Aquí están los enlaces para todos los paquetes disponibles.
- Todos los Paquetes ML se proporcionan como archivo
du-ondemand.tar.gz
en la línea de comandos. Por ejemplo, si descargaste el paquete DU llamado dusemistructured-2023.4.0.tar.gz
, en el momento de la instalación tienes que cambiar su nombre a du-ondemand.tar.gz
.
- Para equipos Windows, la descarga se realiza directamente a través del enlace del paquete y se cambia el nombre del archivo a
du-ondemand.tar.gz
. -
Para las máquinas Linux, desde que la máquina tiene acceso a Internet, descarga el paquete necesario según el siguiente comando:
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'Este es un ejemplo de cómo descargar el paquete necesario para Linux:
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.4.0/dusemistructured-2023.4.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.4.0/dusemistructured-2023.4.0.tar.gz' -
Copia el siguiente paquete en la carpeta
/uipath/tmp" id="1"/> en la máquina principal del clúster (donde se realizó la instalación): scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
Conéctate a esta máquina principal y carga el paquete:
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
Después de descargar e instalar los modelos, sigue los pasos descritos aquí para cargarlos en AI Center.
Sigue estos pasos para cargar un paquete DU en tu registro de docker externo:
- Extrae la imagen DU deseada del registro de UiPath alojado en registry.uipath.com
- Cambia el nombre del host de imágenes por tu nombre de registro de Docker.
- Extrae la imagen al registro de docker externo
docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>
A continuación te mostramos un ejemplo de cómo extraer la imagen del paquete UiPathDocumentOCR de un registro llamado registry.uipath.com:
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70
Cambia el nombre del host de imágenes mediante la ejecución del comando siguiente:
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
A continuación te mostramos un ejemplo de cómo cambiar el nombre de la imagen del paquete UiPathDocumentOCR de un registro llamado registry.uipath.com a un registro llamado registory.mycompany.com:
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.4.0-rc70
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.4.0-rc70
Extrae la imagen a tu registro de docker externo mediante la ejecución del siguiente comando:
docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>
A continuación te mostramos un ejemplo de cómo enviar la imagen del paquete UiPathDocumentOCR a un registro de docker externo:
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.4.0-rc70
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.4.0-rc70
Document Understanding bundle | Imagen |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.4-11.15-rc01 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.4-11.15-rc01 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4-12.01-rc01 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.4-11.15-rc01 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4-11.15-rc01 |
Document Understanding bundle | Imagen |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.4-10.10-rc02 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.4-10.10-rc02 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4-10.11-rc02 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.4-10.10-rc02 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4-10.10-rc02 |
Document Understanding bundle | Imagen |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.4-rc02 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.4-rc02 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.7-rc62 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.4-rc02 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4-rc02 |
Document Understanding bundle | Imagen |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.7-rc35 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.4.7-rc35 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.7-rc35 |
Document Understanding bundle | Imagen |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.6-rc16 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.4.5-rc83 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.5-rc83 |
Document Understanding bundle | Imagen |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.5-rc12 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.4.5-rc72 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.5-rc72 |
Document Understanding bundle | Imagen |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.4-rc16 |
Document Understanding bundle | Imagen |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.3-rc24 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.4.3-rc21 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.3-rc21 |
Document Understanding bundle | Imagen |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.2-rc29 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.1-rc09 |
Document Understanding bundle | Imagen |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.1-rc60 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.1-rc09 |
Document Understanding bundle | Imagen |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.4.0-rc70 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.4.0-rc70 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.0-rc70 |
Clasificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.4.0-rc70 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.4.0-rc70 |
- Primeros pasos
- Instalar el paquete sin conexión
- Sube el modelo a AI Center
- Cargar un paquete DU en un registro de Docker externo
- Extrae las imágenes DU deseadas
- Renombra el host de imágenes
- Extrae la imagen al registro de docker externo
- Images for each Document Understanding bundle
- 2023.4.10
- 2023.4.9
- 2023.4.8
- 2023.4.7
- 2023.4.6
- 2023.4.5
- 2023.4.4
- 2023.4.3
- 2023.4.2
- 2023.4.1
- 2023.4.0