- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Pipelines
- Document Manager
- Serviços de OCR
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Aprendizagem profunda
- Licenciamento
- Referências
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guia do usuário do Document Understanding.
Caixas de seleção e assinaturas
Campos de múltipla escolha com caixas de seleção podem ser de alguns tipos diferentes. Primeiro, há os tipos mutuamente exclusivos e, em seguida, os não mutuamente exclusivos, nos quais mais de uma opção pode ser selecionada. Outro aspecto importante é o número de opções disponíveis para um determinado campo de múltipla escolha. Em alguns casos, pode haver uma única opção, na qual a caixa de seleção está marcada ou não; em outros casos pode haver 10, 20 ou mais opções, organizadas em uma grade ou tabela, como em muitos formulários de saúde.
Há quatro maneiras principais pelas quais você pode rotular esses tipos de campos de múltipla escolha.
Vamos dar um exemplo para entender como você pode rotular as opções. Os formulários podem incluir as opções Projeto ou Política. Neste caso, você tem apenas um campo e rotula somente a palavra selecionada, ou seja, rotula Projeto se a caixa de seleção ao lado dela estiver marcada ou Política se a caixa de seleção ao lado estiver marcada. Se nenhuma das palavras estiver marcada, nada será rotulado, e como ambas não marcadas não é um resultado aceitável, esses documentos seriam excluídos do conjunto de treinamento.
Essa abordagem tem a vantagem de ter um único campo, o que requer menos dados. Também tem a vantagem de não depender de uma detecção bem-sucedida de caixas de seleção. Se uma caixa de seleção for detectada como uma letra X, o modelo ainda poderá aprender a reconhecer que isso significa que a opção próxima a ela está selecionada.
A desvantagem é que você precisa garantir que ambas as opções sejam representadas de maneira aproximadamente igual, o que nem sempre é o caso. Potencialmente, em seu conjunto de treinamento, 90% dos documentos podem ter Projeto marcado. Nesse caso, o modelo pode não ter um bom desempenho e essa abordagem falha. O problema piora quando você tem mais opções, pois algumas delas quase sempre são pouco frequentes. Nesses casos, pode ser necessário criar documentos falsos com as opções menos frequentes marcadas para equilibrar a análise.
No exemplo acima, você pode ter um campo chamado Projeto onde sempre marca a caixa de seleção para Projeto, e um campo chamado Política onde sempre marca a caixa de seleção para Política, estejam elas marcadas ou não. Isso tem a vantagem de que o saldo importa muito menos, mesmo que uma das opções seja marcada 90% das vezes, o modelo ainda aprende a reconhecê-las, pois as caixas de seleção estão sempre no mesmo lugar.
A desvantagem é que você tem dois campos em vez de um. Quando há duas opções, isso pode não ser um grande problrma, mas quando há 10 a 20 opções, ter 10 a 20 campos em vez de um torna muito mais difícil rotular e o modelo é mais difícil de treinar, exigindo mais treinamento dados.
Outra desvantagem é que, às vezes, a caixa de seleção pode não ser detectada corretamente e pode ser necessário adicionar uma lógica mais complexa no fluxo de trabalho para lidar com todos os caracteres X, V ou K retornados. Em alguns casos, o OCR pode até mesclar a caixa de seleção com a palavra ao lado dela, como XProject, exigindo uma lógica de RPA ainda mais complexa para lidar com essa situação.
Os campos de valores múltiplos fazem parte da versão 2022.10 do Document Understanding. Isso facilita a rotulagem, não sendo afetado por opções desbalanceadas em verificação e não se houver um grande número de opções. No entanto, ainda depende da precisão da detecção da caixa de seleção ou do risco de que as caixas de seleção possam ser mescladas com as opções próximas a elas. Os erros de OCR são muito difíceis de previnir.
Isso também facilita a rotulagem, é menos sensível a erros de detecção de caixa de seleção, mas pode ser mais sensível a opções desbalanceadas, assim como a primeira opção.
Em nossa experiência, todas essas opções podem ser apropriadas em algumas situações. Inicialmente, dávamos preferência à primeira opção, no entanto, como a precisão de detecção de caixa de seleção no UiPath Document OCR melhorou, nossa tendência é maior para as opções dois e três. As opções dois e três também têm outra grande vantagem: são compatíveis entre o Forms AI e nosso AI Center baseado em pacotes de ML. Assim, você pode começar com o Forms AI e, se achar que a precisão é menor do que o esperado, basta mover o conjunto de dados para uma sessão do Document Manager e apenas treinar um modelo de ML diretamente sem nenhuma outra alteração. Essa opção se tornou particularmente interessante porque nossos pacotes de ML ficaram mais poderosos e exigem menos dados de treinamento.
A partir do lançamento da versão 2022.4, versão LTS Enterprise, as assinaturas podem ser detectadas usando o UiPath Document OCR, portanto, os modelos de aprendizado de máquina podem detectar assinaturas diretamente.
Rotule uma assinatura como qualquer outro campo é rotulado em seu documento. Uma vez detectado pelo UiPath Document OCR, o modelo de Machine Learning aprende a reconhecer o campo como uma assinatura.