document-understanding

2023.4

false

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Guia do usuário do Document Understanding.

ENTREGA:

Última atualização 4 de dez de 2025

Requisitos de Hardware

A execução dos Pacotes de ML do Document Understanding^TM em uma GPU inclui uma otimização com o objetivo de acelerar o processo de treinamento.

Matriz de compatibilidade

Como resultado, o treinamento em GPU é cinco vezes mais rápido do que em CPU (anteriormente era de 10 a 20 vezes mais rápido). Isso também possibilita treinar modelos em CPU com até 5.000 páginas (anteriormente eram 500 no máximo).

Esteja ciente de que os modelos de treinamento do Document Understanding na GPU exigem uma GPU com pelo menos 11 GB de RAM de vídeo para ser executado com sucesso.

Use a tabela a seguir para verificar a compatibilidade entre os Pacotes de ML, a versão CUDA e a versão do driver de GPU.

Versão de pacotes de ML	Versão CUDA	Versão cudDNN	Driver NVIDIA (versão compatível mais antiga)	Geração de hardware
2023.4	CUDA 11.3 ou mais recente	cuDNN 8.2.0 ou mais recente	R450.80.04	Ampere, Turing, Volta, Pascal, Maxwell, Kepler

CUDA é retrocompatível, o que significa que os aplicativos CUDA existentes podem continuar a ser usados com versões CUDA mais recentes.

Mais informações sobre compatibilidade podem ser encontradas aqui.

Uso de CPU e GPU

Você pode usar o framework do Document Understanding para ler texto usando um mecanismo de OCR, classificando os documentos e extraindo suas informações. Embora as tarefas de classificação e extração sejam executadas na CPU, recomenda-se que o OCR seja executado na GPU (embora uma versão de CPU também seja fornecida para o caso de uma GPU não estar disponível).

A implantação local (On-premises) é feita usando o Automation Suite e seus requisitos de hardware.

Você pode usar o mesmo tipo de máquina virtual (VM) para extratores e classificadores, sendo a única diferença o tamanho da infraestrutura. Recomendamos usar o mecanismo de OCR com uma VM de GPU. A compatibilidade entre os Pacotes de ML, versão CUDA e versão do driver GPU é descrita na seção.

Vamos dar um exemplo real para entender melhor os requisitos de hardware.

Pacote de ML	Requisitos de hardware	Recursos
Pacotes do extrator (Faturas, Recibos, Ordens de Compra, etc.)	Use uma VM com no mínimo 2 núcleos de CPU e 8 GB de RAM	Capacidade de processar 25.000 páginas/dia ou 5 milhões de páginas/ano, assumindo um tráfego perfeitamente constante (sem picos).
Pacotes do classificador (DocumentClassifier)	Use uma VM com no mínimo 2 núcleos de CPU e 8 GB de RAM	Pode processar 40.000 documentos/dia ou 8 milhões de documentos/ano, assumindo um tráfego perfeitamente constante (sem picos).
OCR	Requer no mínimo 8 GB de RAM se estiver executando na CPU. Nenhum requisito se estiver executando em GPU.	Capacidade de processar 50.000 páginas/dia.
OCR_CPU	Requer no mínimo 4 GB de memória RAM.	Pode processar 25.000 páginas/dia.

Exemplo: se você processar 10 milhões de páginas/ano, precisará de uma VM com 4 núcleos de CPU, 16 GB de RAM para o extrator, outra para o classificador e uma terceira VM com núcleo de GPU NVidia para o mecanismo de OCR.

Você também pode optar por usar apenas uma VM para ambos o extrator e o classificador, o que significa que precisará de uma única VM com 8 núcleos de CPU e 32 GB de RAM.

Observação: você sempre pode usar VMs de CPU/GPU mais potentes para aumentar o número de documentos processados/dia.

Nesta página

Matriz de compatibilidade
Uso de CPU e GPU

Esta página foi útil?

AnteriorOutros Serviços

AvançarSobre pipelines