- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guia do usuário do Document Understanding.
Instalação offline de pacotes de ML
Dependendo dos modelos que você deseja usar, você precisa do seguinte:
- Para modelos 2022.10 e mais recentes:
- Download the needed Document UnderstandingTM bundle. Here are the links for all the available bundles. The du bundle contains information about all models included into a specific version. For example, the
dusemistructured-2023.10.0.tar.gz
contains information about all out-of-the-box pre-trained ML Packages included in the 2023.10.0 version.
- Download the needed Document UnderstandingTM bundle. Here are the links for all the available bundles. The du bundle contains information about all models included into a specific version. For example, the
- Para modelos 2022.4 e mais antigos (
python37duv3
epython37duv4
):- Todos os pacotes de ML são fornecidos como um arquivo
.zip
carregado diretamente como um pacote personalizado AI Center. Para baixar os modelos, entre em contato com seu gerente de contas, CSM ou suporte para receber um link de download por pacote. - Baixe o pacote necessário do Document Understanding. Aqui estão os links para todos os pacotes disponíveis.
- Todos os pacotes de ML são fornecidos como um arquivo
du-ondemand.tar.gz
. Por exemplo, se você baixou o pacote du chamado dusemistructured-2023.10.0.tar.gz
, no momento da instalação é preciso renomeá-lo para du-ondemand.tar.gz
.
- Para máquinas Windows, baixe diretamente pelo link do pacote e renomeie o arquivo para
du-ondemand.tar.gz
-
Para máquinas Linux, a partir máquina que tem acesso à internet, baixe o pacote necessário seguindo o comando abaixo:
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'Veja um exemplo de como baixar o pacote necessário para Linux:
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.10.0/dusemistructured-2023.10.0.tar.gz' -
Copie o seguinte pacote para a pasta
/uipath/tmp
na máquina principal do cluster (onde a instalação ocorreu):scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
Conecte-se a essa máquina principal e carregue o pacote:
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
Após baixar e instalar os modelos, siga os passos descritos aqui para carregá-los para o AI Center.
Acesse o Form Extractor e o Intelligent Keyword Classifier, com a URL pública abaixo:
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
pelas informações do ambiente real. Por exemplo, <FQDN>/du_/svc/formextractor
torna-se https://servicefabricserver.domain.com/du_/svc/formextractor
quando usado em um fluxo de trabalho.
Siga essas etapas para fazer upload de um pacote do Document Understanding para seu registro externo do docker:
- Pull the desired DU image from the UiPath® registry hosted on registry.uipath.com
- Renomeie o host de imagem de acordo com seu nome de registro do Docker.
- Empurre a imagem para o registro do docker externo
docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>
Aqui está um exemplo de como extrair a imagem do pacote UiPathDocumentOCR de um registro chamado Registry.uipath.com:
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
Renomeie o host de imagem executando o seguinte comando:
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
Aqui está um exemplo de como renomear a imagem do pacote UiPathDocumentOCR de um registro chamado registro.uipath.com para um registro chamado registrory.mycompany.com:
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Envie a imagem para o registro do docker externo executando o seguinte comando:
docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>
Aqui está um exemplo de como enviar a imagem do pacote UiPathDocumentOCR para um registro externo do docker:
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Pacote do Document Understanding | Imagem |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10-12.01-rc01 |
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10-09.25-rc08 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10-09.25-rc08 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10-10.15-rc03 |
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10-09.25-rc08 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10-09.25-rc08 |
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10-rc28 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10-rc28 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10-rc58 |
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10-rc28 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10-rc28 |
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10.4-rc125 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.4-rc125 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.4-rc45 |
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10.4-rc125 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.4-rc125 |
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10.3-rc04 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.3-rc20 |
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10.3-rc04 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.3-rc04 |
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10.2-rc22 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.2-rc22 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.2-rc13 |
Classificador de documentos | aicenter/du-ml-document-type-text-classifier:v23.10.2-rc42 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.2-rc22 |
Pacote do Document Understanding | Imagem |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.1-rc19 |
Pacote do Document Understanding | Imagem |
---|---|
UiPath Document OCR | aicenter/du-doc-ocr:v23.10.0-rc68 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.0-rc68 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.0-rc82 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.0-rc68 |
- Introdução
- Install the offline bundle
- Upload the model to AI Center
- Form Extractor e Intelligent Keyword Classifier
- Carregue um pacote do Document Understanding™ para um registro do docker externo
- Baixe as imagens do Document Understanding desejadas
- Renomeie o host da imagem
- Empurre a imagem para o registro do docker externo
- Imagens para cada pacote do Document Understanding
- 2023.10.7
- 2023.10.6
- 2023.10.5
- 2023.10.4
- 2023.10.3
- 2023.10.2
- 2023.10.1
- 2023.10.0