- Visão geral
- Criação de modelos
- Consumo de modelos
- Pacotes de ML
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Endpoints públicos
- Idiomas suportados
- Dados e segurança
- Lógica de licenciamento e carregamento
- Como fazer
Caixas de seleção e assinaturas
As caixas de seleção e assinaturas são dois elementos que desempenham funções cruciais em vários tipos de documentos, que variam de acordos contratuais a formulários de registro.Entender como anotar corretamente caixas de seleção e assinaturas é importante para tirar o máximo proveito do seu modelo.
- Caixas de seleção mutuamente exclusivas.
- Caixas de seleção não mutuamente exclusivas, nas quais você pode selecionar mais de uma opção.
Um aspecto importante a considerar é o número de opções oferecidas dentro de um determinado campo de múltipla escolha. Em alguns casos, pode haver uma única opção, onde a caixa de seleção é marcada ou não. No entanto, em muitas instâncias, pode haver 10, 20 ou até mais opções, muitas vezes organizadas em um formato de grade ou tabela, que é comum para formulários de saúde.
Em termos de anotação desses diversos campos de múltipla escolha, há quatro métodos principais que você pode usar.
Vamos usar um exemplo para entender como você pode anotar as opções.
Essa abordagem tem a vantagem de ter um único campo, o que requer menos dados. Também não depende da detecção bem-sucedida de caixas de seleção. Por exemplo, se uma caixa de seleção for detectada por engano como a letra X, o modelo ainda pode aprender a reconhecer que ela indica a seleção da opção ao lado.
No entanto, uma desvantagem potencial é a necessidade de garantir que ambas as opções sejam representadas aproximadamente de forma igual, o que pode nem sempre ser o caso. Por exemplo, se 90% dos documentos em seu conjunto de dados tiverem 2018 marcado, o desempenho do modelo poderá ser afetado, levando à falha dessa abordagem. O problema piora quando você tem mais opções, pois algumas delas quase sempre são pouco frequentes. Nesses casos, pode ser necessário criar documentos falsos com as opções menos frequentes marcadas para equilibrar a análise.
No exemplo anterior, você pode ter criado dois campos distintos: um rotulado 2018, onde você anotou de forma consistente a caixa de seleção para esse ano e outro rotulado 2019 onde você anotou continuamente a caixa de seleção para 2019, esteja ela marcada ou não.O aspecto positivo desse método é que o equilíbrio torna-se menos crítico; mesmo que uma escolha seja selecionada em 90% do tempo, o modelo ainda pode aprender a identificá-la porque as caixas de seleção mantêm posições fixas.
A desvantagem é que você tem dois campos em vez de um. Embora isso possa não ser um problema considerável ao lidar com duas opções, a manipulação de 10-20 opções e, consequentemente, a criação de 10-20 campos, em vez de um único, pode complicar significativamente o processo de anotação. Além disso, isso também leva a um processo de treinamento de modelo mais desafiador, exigindo mais dados de treinamento.
Outra desvantagem é a detecção ocasional incorreta da caixa de seleção, que pode exigir uma lógica mais complexa no fluxo de trabalho para gerenciar todos os caracteres X, V ou K retornados.Em alguns casos, o OCR pode até mesclar a caixa de seleção com a palavra ao lado dela, como X2018, exigindo uma lógica de RPA ainda mais complexa para lidar com essa situação.
Os campos de vários valores facilitam a anotação e não são afetados por desequilíbrios em opções marcadas ou por uma ampla variedade de seleções. No entanto, esses campos ainda estão sujeitos à precisão da detecção de caixas de seleção e ao risco potencial de as caixas de seleção serem mescladas com opções adjacentes.Os erros de OCR são muito difíceis de previnir.
Essa abordagem também simplifica o processo de anotação e é menos sensível aos erros de detecção de caixa de seleção. No entanto, pode ser mais sensível a opções desequilibradas.
Todas essas opções podem ser apropriadas em algumas situações. Inicialmente, a primeira opção é preferida. À medida que a precisão da detecção da caixa de seleção no UiPath® Document OCR melhorou, as segunda e terceira opções são preferidas.
As assinaturas podem ser identificadas usando o UiPath Document OCR, permitindo que modelos de ML as detectem diretamente.
Você pode anotar uma assinatura como qualquer outro campo em seu documento. Depois que a assinatura é identificada pelo UiPath Document OCR, o modelo de ML aprende a reconhecer o campo como uma assinatura.
No momento de inferência, a assinatura será recuperada conforme exibida nos documentos. Você tem que converter isso em um campo booleano (Sim/Não) usando a lógica de RPA.