- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Requisitos de Hardware
A execução dos Pacotes de ML do Document UnderstandingTM em uma GPU inclui uma otimização com o objetivo de acelerar o processo de treinamento.
Como resultado, o treinamento em GPU é cinco vezes mais rápido do que em CPU (anteriormente era de 10 a 20 vezes mais rápido). Isso também possibilita treinar modelos em CPU com até 5.000 páginas (anteriormente eram 500 no máximo).
Esteja ciente de que os modelos de treinamento do Document Understanding na GPU exigem uma GPU com pelo menos 11 GB de RAM de vídeo para ser executado com sucesso.
Use a tabela abaixo para verificar a compatibilidade entre os Pacotes de ML, a versão CUDA e a versão do driver GPU.
Versão de pacotes de ML |
Versão CUDA |
Versão cudDNN |
Driver NVIDIA (versão compatível mais antiga) |
Geração de hardware |
---|---|---|---|---|
2023.4 |
CUDA 11.3 ou mais recente |
cuDNN 8.2.0 ou mais recente |
R450.80.04 |
Ampere, Turing, Volta, Pascal, Maxwell, Kepler |
CUDA é retrocompatível, o que significa que os aplicativos CUDA existentes podem continuar a ser usados com versões CUDA mais recentes.
Mais informações sobre compatibilidade podem ser encontradas aqui.
Você pode usar o framework do Document Understanding para ler texto usando um mecanismo de OCR, classificando os documentos e extraindo suas informações. Embora as tarefas de classificação e extração sejam executadas na CPU, recomenda-se que o OCR seja executado na GPU (apesar de uma versão da CPU também ser fornecida caso uma GPU não esteja disponível).
A implantação local (On-premises) é feita usando o Automation Suite e seus requisitos de hardware.
Você pode usar o mesmo tipo de máquina virtual (VM) para extratores e classificadores, sendo a única diferença o tamanho da infraestrutura. Recomendamos usar o mecanismo de OCR com uma VM de GPU. A compatibilidade entre os Pacotes de ML, versão CUDA e versão do driver GPU é descrita na seção.
Vamos dar um exemplo real para entender melhor os requisitos de hardware.
Pacote de ML | Requisitos de hardware | Recursos |
---|---|---|
Pacotes do extrator (Faturas, Recibos, Ordens de Compra, etc.) | Use uma VM com no mínimo 2 núcleos de CPU e 8 GB de RAM | Capacidade de processar 25.000 páginas/dia ou 5 milhões de páginas/ano, assumindo um tráfego perfeitamente constante (sem picos). |
Pacotes do classificador (DocumentClassifier) | Use uma VM com no mínimo 2 núcleos de CPU e 8 GB de RAM | Pode processar 40.000 documentos/dia ou 8 milhões de documentos/ano, assumindo um tráfego perfeitamente constante (sem picos). |
OCR | Requer no mínimo 8 GB de RAM se estiver executando na CPU. Nenhum requisito se estiver executando em GPU. | Capacidade de processar 50.000 páginas/dia. |
OCR_CPU | Requer no mínimo 4 GB de memória RAM. | Capacidade de processar 50.000 páginas/dia. |
Exemplo: se você processar 10 milhões de páginas/ano, precisará de uma VM com 4 núcleos de CPU, 16 GB de RAM para o extrator, outra para o classificador e uma terceira VM com núcleo de GPU NVidia para o mecanismo de OCR.
Você também pode optar por usar apenas uma VM para ambos o extrator e o classificador, o que significa que precisará de uma única VM com 8 núcleos de CPU e 32 GB de RAM.