- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Instalar e usar
Esta página descreve como implantar e configurar o Document UnderstandingTM, bem como instruções especiais sobre como usar o Document UnderstandingTM no Automation Suite.
O Document Understanding depende do AI Center, o que significa que o AI Center sempre precisa ser instalado se o Document Understanding estiver instalado.
Além disso, o Orchestrator deve ser ativado antes de usar o Document Understanding.
Antes de iniciar a instalação do Document Understanding, certifique-se de verificar e atender a todos os requisitos do Automation Suite para nó único e para vários nós aqui.
Uma GPU é altamente recomendada para o Document Understanding em um dos seguintes cenários:
-
Se você treinar novamente os modelos do Document Understanding (DocumentUnderstanding - o modelo geral, faturas, recibos, etc.) no AI Center.
O treinamento em CPU é de 5 a 7 vezes mais lento e o desempenho do modelo diminui em comparação com o treinamento em GPU.
-
Se você executar o UiPathDocumentOCR (versão non-edge) no AI Center para processar mais de 2 milhões de páginas por ano.
Se você não usar uma GPU, o desempenho lento pode afetar a experiência com o produto.
Para obter mais detalhes sobre como provisionar uma GPU, consulte Adicionando um nó de agente dedicado com suporte a GPU.
O Document Understanding requer que a funcionalidade FullTextSearch esteja habilitada no SQL Server. Caso contrário, a instalação falhará sem uma mensagem de erro explícita.
Consulte o arquivo de configuração Document Understanding aqui.
Acesse o Form Extractor e o Intelligent Keyword Classifier, com a URL pública abaixo:
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
pelas informações do ambiente real. Por exemplo, <FQDN>/du_/svc/formextractor
torna-se https://servicefabricserver.domain.com/du_/svc/formextractor
quando usado em um fluxo de trabalho.
Como uma operação de pós-instalação, você pode ativar ou desativar o Document Understanding. Mais informações podem ser encontradas aqui.
Se você deseja usar o ponto de extremidade de OCR para chinês, japonês e coreano em um ambiente offline, é necessário instalar o pacote offline seguindo estas instruções e, uma vez instalado, você deve habilitar o OCR no ArgoCD.
- Quando o OCR para chinês, japonês e coreano for usado no Document Understanding, certifique-se de que você configurou a atividade com o terminal público do OCR e a Chave de API do Document Understanding.
- O OCR para chinês, japonês e coreano é suportado apenas no Document Understanding implantado no Automation Suite. Isso não é suportado no Document Understanding implantado no AI Center conectado a um Orchestrator externo.
Estes são os passos que você precisa seguir para habilitar o OCR no ArgoCD:
- Acesse o ArgoCD.
- Abra o framework do Document Understanding.
- Clique na guia Parâmetros e vá para
du-cjk-ocr.enabled
. - Clique no botão Editar, defina o valor como
TRUE
e clique no botão Salvar.
{Cluster_FQDN}/du_/cjk-ocr/
.
Verifique os problemas relacionados ao Document Understanding aqui.