- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Pipelines
- Document Manager
- Serviços de OCR
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Aprendizagem profunda
- Licenciamento
- Referências
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Instalar e usar
Esta página descreve como implantar e configurar o Document UnderstandingTM, bem como instruções especiais sobre como usar o Document UnderstandingTM no Automation Suite.
O Document Understanding depende do AI Center, o que significa que o AI Center sempre precisa ser instalado se o Document Understanding estiver instalado.
Além disso, o Orchestrator deve ser ativado antes de usar o Document Understanding.
Antes de iniciar a instalação do Document Understanding, certifique-se de verificar e atender a todos os requisitos do Automation Suite para nó único e para vários nós aqui.
Uma GPU é altamente recomendada para o Document Understanding em um dos seguintes cenários:
-
Se você treinar novamente os modelos do Document Understanding (DocumentUnderstanding - o modelo geral, faturas, recibos, etc.) no AI Center.
O treinamento em CPU é de 5 a 7 vezes mais lento e o desempenho do modelo diminui em comparação com o treinamento em GPU.
-
Se você executar o UiPathDocumentOCR (versão non-edge) no AI Center para processar mais de 2 milhões de páginas por ano.
Se você não usar uma GPU, o desempenho lento pode afetar a experiência com o produto.
Para obter mais detalhes sobre como provisionar uma GPU, consulte Adicionando um nó de agente dedicado com suporte a GPU.
O Document Understanding requer que a funcionalidade FullTextSearch esteja habilitada no SQL Server. Caso contrário, a instalação falhará sem uma mensagem de erro explícita.
Consulte o arquivo de configuração Document Understanding aqui.
Acesse o Form Extractor e o Intelligent Keyword Classifier, com a URL pública abaixo:
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
pelas informações do ambiente real. Por exemplo, <FQDN>/du_/svc/formextractor
torna-se https://servicefabricserver.domain.com/du_/svc/formextractor
quando usado em um fluxo de trabalho.
Como uma operação de pós-instalação, você pode ativar ou desativar o Document Understanding. Mais informações podem ser encontradas aqui.
Se você deseja usar o ponto de extremidade de OCR para chinês, japonês e coreano em um ambiente offline, é necessário instalar o pacote offline seguindo estas instruções e, uma vez instalado, você deve habilitar o OCR no ArgoCD.
- Quando o OCR para chinês, japonês e coreano for usado no Document Understanding, certifique-se de que você configurou a atividade com o terminal público do OCR e a Chave de API do Document Understanding.
- O OCR para chinês, japonês e coreano é suportado apenas no Document Understanding implantado no Automation Suite. Isso não é suportado no Document Understanding implantado no AI Center conectado a um Orchestrator externo.
Estes são os passos que você precisa seguir para habilitar o OCR no ArgoCD:
- Acesse o ArgoCD.
- Abra o framework do Document Understanding.
- Clique na guia Parâmetros e vá para
du-cjk-ocr.enabled
. - Clique no botão Editar, defina o valor como
TRUE
e clique no botão Salvar.
{Cluster_FQDN}/du_/cjk-ocr/
.
Verifique os problemas relacionados ao Document Understanding aqui.