- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos – Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Instalar e usar
- Experiência de primeira execução
- Implantar o UiPathDocumentOCR
- Implante um Pacote de ML pré-configurado
- Pacotes offline 2023.10.10
- Pacotes offline 2023.10.9
- Pacotes offline 2023.10.8
- Pacotes offline 2023.10.7+patch1
- Pacotes offline 2023.10.7
- Pacotes offline 2023.10.6
- Pacotes offline 2023.10.5
- Pacotes offline 2023.10.4
- Pacotes offline 2023.10.3
- Pacotes offline 2023.10.2
- Pacotes offline 2023.10.1
- Pacotes offline 2023.10.0
- Use o Document Manager
- Usar o Framework
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Guia do usuário do Document Understanding.
Instalação offline de pacotes de ML
linkIntrodução
linkDependendo dos modelos que você deseja usar, você precisa do seguinte:
- Para modelos 2022.10 e mais recentes:
- Baixe o pacote necessário do Document UnderstandingTM. Aqui estão os links para todos os pacotes disponíveis. O pacote du contém informações sobre todos os modelos incluídos em uma versão específica. Por exemplo, o
dusemistructured-2023.10.0.tar.gz
contém informações sobre todos os pacotes de ML pré-treinados e pré-configurados incluídos na versão 2023.10.0.
- Baixe o pacote necessário do Document UnderstandingTM. Aqui estão os links para todos os pacotes disponíveis. O pacote du contém informações sobre todos os modelos incluídos em uma versão específica. Por exemplo, o
- Para modelos 2022.4 e mais antigos (
python37duv3
epython37duv4
):- Todos os pacotes de ML são fornecidos como um arquivo
.zip
carregado diretamente como um pacote personalizado AI Center. Para baixar os modelos, entre em contato com seu gerente de contas, CSM ou suporte para receber um link de download por pacote. - Baixe o pacote necessário do Document Understanding. Aqui estão os links para todos os pacotes disponíveis.
- Todos os pacotes de ML são fornecidos como um arquivo
Install the offline bundle
linkdu-ondemand.tar.gz
. Por exemplo, se você baixou o pacote du chamado dusemistructured-2023.10.0.tar.gz
, no momento da instalação é preciso renomeá-lo para du-ondemand.tar.gz
.
- Para máquinas Windows, baixe diretamente pelo link do pacote e renomeie o arquivo para
du-ondemand.tar.gz
-
Para máquinas Linux, a partir máquina que tem acesso à internet, baixe o pacote necessário seguindo o comando abaixo:
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'Veja um exemplo de como baixar o pacote necessário para Linux:
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz' -
Copie o seguinte pacote para a pasta
/uipath/tmp
na máquina principal do cluster (onde a instalação ocorreu):scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
Conecte-se a essa máquina principal e carregue o pacote:
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
Upload the model to AI Center
linkzip
e os arquivos de metadados json
são necessários para esse procedimento.
Form Extractor e Intelligent Keyword Classifier
linkAcesse o Extrator de formulários e o Classificador de palavras-chave inteligente, com o seguinte URL público:
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
pelas informações do ambiente real. Por exemplo, <FQDN>/du_/svc/formextractor
torna-se https://servicefabricserver.domain.com/du_/svc/formextractor
quando usado em um fluxo de trabalho.
Carregue um pacote do Document Understanding™ para um registro do docker externo
linkSiga essas etapas para fazer upload de um pacote do Document Understanding para seu registro externo do docker:
- Baixe a imagem DU desejada do registro UiPath® hospedado em registry.uipath.com
- Renomeie o host de imagem de acordo com seu nome de registro do Docker.
- Empurre a imagem para o registro do docker externo
Baixe as imagens do Document Understanding desejadas
Baixe as imagens do registro UiPath® executando estes comandos:docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>
Aqui está um exemplo de como extrair a imagem do pacote UiPathDocumentOCR de um registro chamado Registry.uipath.com:
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
Renomeie o host da imagem
Renomeie o host de imagem executando o seguinte comando:
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
Aqui está um exemplo de como renomear a imagem do pacote UiPathDocumentOCR de um registro chamado registro.uipath.com para um registro chamado registrory.mycompany.com:
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Empurre a imagem para o registro do docker externo
Envie a imagem para o registro do docker externo executando o seguinte comando:
docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>
Aqui está um exemplo de como enviar a imagem do pacote UiPathDocumentOCR para um registro externo do docker:
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Imagens para cada pacote do Document Understanding
link2023.10.10
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10-06.05-rc05 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10-06.05-rc05 |
OCR for Chinese, Japanese, Korean |
|
OCR para Idiomas Estendidos |
|
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10-06.05-rc05 |
Pacotes de ML pré-treinados prontos para uso | aicenter/du-semistructured:v23.10-06.05-rc05 |
2023.10.9
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10-03.14-rc02 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10-03.14-rc02 |
OCR for Chinese, Japanese, Korean |
|
OCR para Idiomas Estendidos |
|
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10-03.14-rc02 |
Pacotes de ML pré-treinados prontos para uso | aicenter/du-semistructured:v23.10-03.14-rc02 |
2023.10.8
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10-01.28-rc07 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10-01.28-rc07 |
OCR for Chinese, Japanese, Korean |
|
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10-01.28-rc07 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10-01.28-rc07 |
2023.10.7+patch1
Pacote do Document Understanding | Imagem |
---|---|
OCR for Chinese, Japanese, Korean |
|
2023.10.7
Pacote do Document Understanding | Imagem |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10-12.01-rc01 |
2023.10.6
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10-09.25-rc08 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10-09.25-rc08 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10-10.15-rc03 |
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10-09.25-rc08 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10-09.25-rc08 |
2023.10.5
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10-rc28 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10-rc28 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10-rc58 |
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10-rc28 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10-rc28 |
2023.10.4
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10.4-rc125 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.4-rc125 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.4-rc45 |
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10.4-rc125 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.4-rc125 |
2023.10.3
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10.3-rc04 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.3-rc20 |
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10.3-rc04 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.3-rc04 |
2023.10.2
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10.2-rc22 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.2-rc22 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.2-rc13 |
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10.2-rc42 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.2-rc22 |
2023.10.1
Pacote do Document Understanding | Imagem |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.1-rc19 |
2023.10.0
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10.0-rc68 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.0-rc68 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.0-rc82 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.0-rc68 |
- Introdução
- Install the offline bundle
- Upload the model to AI Center
- Form Extractor e Intelligent Keyword Classifier
- Carregue um pacote do Document Understanding™ para um registro do docker externo
- Baixe as imagens do Document Understanding desejadas
- Renomeie o host da imagem
- Empurre a imagem para o registro do docker externo
- Imagens para cada pacote do Document Understanding
- 2023.10.10
- 2023.10.9
- 2023.10.8
- 2023.10.7+patch1
- 2023.10.7
- 2023.10.6
- 2023.10.5
- 2023.10.4
- 2023.10.3
- 2023.10.2
- 2023.10.1
- 2023.10.0