- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos – Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Instalar e usar
- Experiência de primeira execução
- Implantar o UiPathDocumentOCR
- Implante um Pacote de ML pré-configurado
- Pacotes offline 2023.10.12+patch1
- Pacotes offline 2023.10.12
- Pacotes offline 2023.10.11
- Pacotes offline 2023.10.10
- Pacotes offline 2023.10.9
- Pacotes offline 2023.10.8
- Pacotes offline 2023.10.7+patch1
- Pacotes offline 2023.10.7
- Pacotes offline 2023.10.6
- Pacotes offline 2023.10.5
- Pacotes offline 2023.10.4
- Pacotes offline 2023.10.3
- Pacotes offline 2023.10.2
- Pacotes offline 2023.10.1
- Pacotes offline 2023.10.0
- Use o Document Manager
- Usar o Framework
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Guia do usuário do Document Understanding.
Requisitos de Hardware
A execução dos Pacotes de ML do Document UnderstandingTM em uma GPU inclui uma otimização destinada a acelerar o processo de treinamento.
Matriz de compatibilidade
Como resultado, o treinamento em GPU é cinco vezes mais rápido do que em CPU (anteriormente era de 10 a 20 vezes mais rápido). Isso também possibilita treinar modelos em CPU com até 5.000 páginas (anteriormente eram 500 no máximo).
Please be aware that training Document Understanding models on GPU requires a GPU with at least 11GB of video RAM to run successfully.
Use a tabela a seguir para verificar a compatibilidade entre os Pacotes de ML, a versão CUDA e a versão do driver de GPU.
| Versão de pacotes de ML | Versão CUDA | Versão cudDNN | Driver NVIDIA (versão compatível mais antiga) | Geração de hardware |
|---|---|---|---|---|
| 2023.10 | CUDA 11.8 ou mais recente | cuDNN 8.2.0 ou mais recente | R450.80.04 | Ampere, Turing, Volta, Pascal, Maxwell, Kepler |
CUDA é retrocompatível, o que significa que os aplicativos CUDA existentes podem continuar a ser usados com versões CUDA mais recentes.
Mais informações sobre compatibilidade podem ser encontradas aqui.
Uso de CPU e GPU
Você pode usar o framework do Document Understanding para ler texto usando um mecanismo de OCR, classificando os documentos e extraindo suas informações. Embora as tarefas de classificação e extração sejam executadas na CPU, recomenda-se que o OCR seja executado na GPU (embora uma versão de CPU também seja fornecida para o caso de uma GPU não estar disponível).
A implantação local é feita usando o Automation Suite e seus requisitos de hardware.
Você pode usar o mesmo tipo de máquina virtual (VM) para extratores e classificadores, sendo a única diferença o tamanho da infraestrutura. Recomendamos usar o mecanismo de OCR com uma VM de GPU. A compatibilidade entre os Pacotes de ML, versão CUDA e versão do driver GPU é descrita na seção.
Vamos dar um exemplo real para entender melhor os requisitos de hardware.
| Pacote de ML | Requisitos de hardware | Recursos |
|---|---|---|
| Pacotes do extrator (Faturas, Recibos, Ordens de Compra, etc.) | Use uma VM com no mínimo 2 núcleos de CPU e 8 GB de RAM | Can process 25,000 pages/day or 5 million pages/year, assuming perfectly constant traffic (no spikes). |
| Pacotes do classificador (DocumentClassifier) | Use uma VM com no mínimo 2 núcleos de CPU e 8 GB de RAM | Can process 40,000 documents/day or 8 million documents/year, assuming perfectly constant traffic (no spikes). |
| OCR | Requer no mínimo 8 GB de RAM se estiver executando na CPU. Nenhum requisito se estiver executando em GPU. | Can process 50,000 pages/day. |
| OCR_CPU | Requer no mínimo 4 GB de memória RAM. | Pode processar 25.000 páginas/dia. |
Exemplo: se você processar 10 milhões de páginas/ano, precisará de uma VM com 4 núcleos de CPU, 16 GB de RAM para o extrator, outra para o classificador e uma terceira VM com núcleo de GPU NVidia para o mecanismo de OCR.
Você também pode optar por usar apenas uma VM para ambos o extrator e o classificador, o que significa que precisará de uma única VM com 8 núcleos de CPU e 32 GB de RAM.
You can always use more more powerful CPU/GPU VMs for increasing the number of processed documents/day.