- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Pacotes de ML
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- Receipts Japan - ML package
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Endpoints públicos
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Licenciamento
- Como fazer
- Tables and group table rows
- Caixas de seleção e assinaturas
- Classificar documentos automaticamente
- Treinar um classificador
Guia do usuário de projetos modernos do Document Understanding
Caixas de seleção e assinaturas
As caixas de seleção e assinaturas são dois elementos que desempenham funções cruciais em vários tipos de documentos, que variam de acordos contratuais a formulários de registro.Entender como anotar corretamente caixas de seleção e assinaturas é importante para tirar o máximo proveito do seu modelo.
- Caixas de seleção mutuamente exclusivas.
- Caixas de seleção não mutuamente exclusivas, nas quais você pode selecionar mais de uma opção.
Um aspecto importante a considerar é o número de opções oferecidas dentro de um determinado campo de múltipla escolha. Em alguns casos, pode haver uma única opção, onde a caixa de seleção é marcada ou não. No entanto, em muitas instâncias, pode haver 10, 20 ou até mais opções, muitas vezes organizadas em um formato de grade ou tabela, que é comum para formulários de saúde.
Em termos de anotação desses diversos campos de múltipla escolha, há dois métodos principais que você pode usar.
Vamos usar um exemplo para entender como você pode anotar as opções.
Essa abordagem tem a vantagem de ter um único campo, o que requer menos dados. Também não depende da detecção bem-sucedida de caixas de seleção. Por exemplo, se uma caixa de seleção for detectada por engano como a letra X, o modelo ainda pode aprender a reconhecer que ela indica a seleção da opção ao lado.
No entanto, uma desvantagem potencial é a necessidade de garantir que ambas as opções sejam representadas aproximadamente de forma igual, o que pode nem sempre ser o caso. Por exemplo, se 90% dos documentos em seu conjunto de dados tiverem 2018 marcado, o desempenho do modelo poderá ser afetado, levando à falha dessa abordagem. O problema piora quando você tem mais opções, pois algumas delas quase sempre são pouco frequentes. Nesses casos, pode ser necessário criar documentos falsos com as opções menos frequentes marcadas para equilibrar a análise.
Essa abordagem também simplifica o processo de anotação e é menos sensível aos erros de detecção de caixa de seleção. No entanto, pode ser mais sensível a opções desequilibradas.
As assinaturas podem ser identificadas usando o UiPath Document OCR, permitindo que modelos de ML as detectem diretamente.
Você pode anotar uma assinatura como qualquer outro campo em seu documento. Depois que a assinatura é identificada pelo UiPath Document OCR, o modelo de ML aprende a reconhecer o campo como uma assinatura.
No momento de inferência, a assinatura será recuperada conforme exibida nos documentos. Você tem que converter isso em um campo booleano (Sim/Não) usando a lógica de RPA.