document-understanding
latest
false
Guia do usuário do Document Understanding.
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 21 de out de 2024

Caixas de seleção e assinaturas

As caixas de seleção e assinaturas são dois elementos que desempenham funções cruciais em vários tipos de documentos, que variam de acordos contratuais a formulários de registro.Entender como anotar corretamente caixas de seleção e assinaturas é importante para tirar o máximo proveito do seu modelo.

Caixas de seleção

Ao anotar seus documentos, você pode encontrar vários tipos de campos de múltipla escolha que usam caixas de seleção:
  • Caixas de seleção mutuamente exclusivas.
  • Caixas de seleção não mutuamente exclusivas, nas quais você pode selecionar mais de uma opção.

Um aspecto importante a considerar é o número de opções oferecidas dentro de um determinado campo de múltipla escolha. Em alguns casos, pode haver uma única opção, onde a caixa de seleção é marcada ou não. No entanto, em muitas instâncias, pode haver 10, 20 ou até mais opções, muitas vezes organizadas em um formato de grade ou tabela, que é comum para formulários de saúde.

Em termos de anotação desses diversos campos de múltipla escolha, há quatro métodos principais que você pode usar.

Anotar a opção

Vamos usar um exemplo para entender como você pode anotar as opções.

Observação: antes de começar a anotar opções, certifique-se de criar um campo regular para cada opção relevante.


Considere situações em que um documento inclui opções de ano. Nesses cenários, você tem apenas um campo e só anota a palavra que foi selecionada. Por exemplo, anote 2018 se a caixa de seleção ao lado for selecionada ou 2019 se essa opção for escolhida. Se nenhuma opção for selecionada, nenhuma deve ser anotada. Um cenário em que ambas as opções são marcadas não é possível; documentos com essas instâncias devem ser omitidos do conjunto.


Essa abordagem tem a vantagem de ter um único campo, o que requer menos dados. Também não depende da detecção bem-sucedida de caixas de seleção. Por exemplo, se uma caixa de seleção for detectada por engano como a letra X, o modelo ainda pode aprender a reconhecer que ela indica a seleção da opção ao lado.

No entanto, uma desvantagem potencial é a necessidade de garantir que ambas as opções sejam representadas aproximadamente de forma igual, o que pode nem sempre ser o caso. Por exemplo, se 90% dos documentos em seu conjunto de dados tiverem 2018 marcado, o desempenho do modelo poderá ser afetado, levando à falha dessa abordagem. O problema piora quando você tem mais opções, pois algumas delas quase sempre são pouco frequentes. Nesses casos, pode ser necessário criar documentos falsos com as opções menos frequentes marcadas para equilibrar a análise.

Anotar as caixas de seleção, com campo separado para cada caixa de seleção

Observação: antes de começar a anotar opções, certifique-se de criar um campo regular para cada opção relevante.


No exemplo anterior, você pode ter criado dois campos distintos: um rotulado 2018, onde você anotou de forma consistente a caixa de seleção para esse ano e outro rotulado 2019 onde você anotou continuamente a caixa de seleção para 2019, esteja ela marcada ou não.O aspecto positivo desse método é que o equilíbrio torna-se menos crítico; mesmo que uma escolha seja selecionada em 90% do tempo, o modelo ainda pode aprender a identificá-la porque as caixas de seleção mantêm posições fixas.

A desvantagem é que você tem dois campos em vez de um. Embora isso possa não ser um problema considerável ao lidar com duas opções, a manipulação de 10-20 opções e, consequentemente, a criação de 10-20 campos, em vez de um único, pode complicar significativamente o processo de anotação. Além disso, isso também leva a um processo de treinamento de modelo mais desafiador, exigindo mais dados de treinamento.

Outra desvantagem é a detecção ocasional incorreta da caixa de seleção, que pode exigir uma lógica mais complexa no fluxo de trabalho para gerenciar todos os caracteres X, V ou K retornados.Em alguns casos, o OCR pode até mesclar a caixa de seleção com a palavra ao lado dela, como X2018, exigindo uma lógica de RPA ainda mais complexa para lidar com essa situação.



Anote apenas as caixas de seleção com um único campo de vários valores.

Observação: para usar essa abordagem, crie um campo de vários valores que você usará para anotar as caixas de seleção.


Os campos de vários valores facilitam a anotação e não são afetados por desequilíbrios em opções marcadas ou por uma ampla variedade de seleções. No entanto, esses campos ainda estão sujeitos à precisão da detecção de caixas de seleção e ao risco potencial de as caixas de seleção serem mescladas com opções adjacentes.Os erros de OCR são muito difíceis de previnir.



Anotar as opções com um único campo de vários valores

Observação: para usar essa abordagem, crie um campo de vários valores que você usará para anotar as caixas de seleção.


Essa abordagem também simplifica o processo de anotação e é menos sensível aos erros de detecção de caixa de seleção. No entanto, pode ser mais sensível a opções desequilibradas.

Todas essas opções podem ser apropriadas em algumas situações. Inicialmente, a primeira opção é preferida. À medida que a precisão da detecção da caixa de seleção no UiPath® Document OCR melhorou, as segunda e terceira opções são preferidas.



Detecção de assinatura

As assinaturas podem ser identificadas usando o UiPath Document OCR, permitindo que modelos de ML as detectem diretamente.

Você pode anotar uma assinatura como qualquer outro campo em seu documento. Depois que a assinatura é identificada pelo UiPath Document OCR, o modelo de ML aprende a reconhecer o campo como uma assinatura.

No momento de inferência, a assinatura será recuperada conforme exibida nos documentos. Você tem que converter isso em um campo booleano (Sim/Não) usando a lógica de RPA.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.