- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Licenciamento
Limitações de tráfego
Os pacotes de ML de extração e classificação requerem uma quantidade significativa de recursos de processamento, o que implica algumas limitações à medida que o tamanho dos documentos e/ou a taxa de transferência do número de documentos por minuto aumenta.
Espera-se que documentos maiores que 100 páginas sejam executados para limitações de computação ou latência, fazendo com que as Habilidades de ML sejam instáveis ou retornem erros de HTTP. Um limite superior exato é difícil de definir porque a densidade de texto e a resolução da imagem dos documentos têm um grande intervalo dinâmico e a densidade de texto (número de palavras por página) afeta os recursos de computação e RAM necessários, bem como a latência. Além disso, a capacidade de uma habilidade de ML depende do tamanho do hardware usado para implantá-la, que é controlado pelo AI Center. Por exemplo, as habilidades de ML podem ser implantadas na GPU ou no CPU, o que tem um grande impacto na capacidade e velocidade da habilidade de ML.
Em relação à transferência, as Habilidades de ML só podem processar um documento por vez; isso significa que você precisa esperar pela conclusão de um documento antes de enviar o próximo. Quanto maiores os documentos, menos você pode processar por unidade de tempo.
Para mitigar esses problemas, se você precisar processar documentos muito grandes, tenha em mente que, em muitos casos, os dados relevantes podem ser encontrados em um subconjunto menor de páginas e esse subconjunto pode ser dividido usando o Classificador de palavra-chave inteligente. Essa pode ser uma ótima estratégia porque elimina erros/falhas/tempos limite de habilidade de ML, aumenta a taxa de transferência e a resposta, aumenta a precisão da extração reduzindo falsos positivos e reduz os gastos eliminando o consumo desnecessário de unidades de IA.