- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Licenciamento
Guia do usuário do Document Understanding.
Caixas de seleção e assinaturas
Existem diversos tipos de campos de múltipla escolha que usam caixas de seleção:
- as caixas de seleção mutuamente exclusivas
- as caixas de seleção não mutuamente exclusivas, onde você pode selecionar mais de uma opção.
Outro aspecto importante é o número de opções disponíveis para um determinado campo de múltipla escolha. Em alguns casos, pode haver uma única opção, na qual a caixa de seleção está marcada ou não; em outros casos pode haver 10, 20 ou mais opções, organizadas em uma grade ou tabela, como em muitos formulários de saúde.
Há duas maneiras principais pelas quais você pode rotular esses tipos de campos de múltipla escolha.
Vamos dar um exemplo para entender como você pode rotular as opções. Os formulários podem incluir as opções Projeto ou Política. Neste caso, você tem apenas um campo e rotula somente a palavra selecionada, ou seja, rotula Projeto se a caixa de seleção ao lado dela estiver marcada ou Política se a caixa de seleção ao lado estiver marcada. Se nenhuma das palavras estiver marcada, nada será rotulado, e como ambas não marcadas não é um resultado aceitável, esses documentos seriam excluídos do conjunto de treinamento.
Essa abordagem tem a vantagem de ter um único campo, o que requer menos dados. Também tem a vantagem de não depender de uma detecção bem-sucedida de caixas de seleção. Se uma caixa de seleção for detectada como uma letra X, o modelo ainda poderá aprender a reconhecer que isso significa que a opção próxima a ela está selecionada.
A desvantagem é que você precisa garantir que ambas as opções sejam representadas de maneira aproximadamente igual, o que nem sempre é o caso. Potencialmente, em seu conjunto de treinamento, 90% dos documentos podem ter Projeto marcado. Nesse caso, o modelo pode não ter um bom desempenho e essa abordagem falha. O problema piora quando você tem mais opções, pois algumas delas quase sempre são pouco frequentes. Nesses casos, pode ser necessário criar documentos falsos com as opções menos frequentes marcadas para equilibrar a análise.
A partir do lançamento da versão 2022.4, Versão LTS Enterprise, as assinaturas podem ser detectadas usando o UiPath Document OCR, portanto, os modelos de aprendizado de máquina podem detectar assinaturas diretamente.
Rotule uma assinatura como qualquer outro campo é rotulado em seu documento. Uma vez detectado pelo UiPath Document OCR, o modelo de Machine Learning aprende a reconhecer o campo como uma assinatura.