Document Understanding
2020.10
falso
Imagem de fundo do banner
Obsoleto
Guia do usuário do Document Understanding.
Última atualização 28 de fev de 2024

Criar e configurar campos

Adicionando campos

Os campos não podem ser excluídos ou renomeados, portanto, pense bem antes de adicionar novos campos. Se, no entanto, houver campos que você decidir posteriormente que não deseja usar para treinar um modelo de ML, sempre poderá ocultá-los usando a caixa de seleção Oculto na janela Editar campo.

Clique aqui para obter detalhes sobre os campos, seu significado e quando usá-los.

Observação: um máximo de 40 campos podem ser criados.

Campos de coluna

Uma Descrição de item de linha ou Preço unitário em um documento de fatura seriam exemplos de campos de coluna.

  1. Clique em + na seção de tabela na parte superior da página para adicionar um novo campo Coluna. A janela Criar campo de coluna é exibida.
  2. No campo Inserir nome exclusivo de campo, preencha um nome único para o campo. O campo não aceita letras maiúsculas.
  3. Clique em Criar. A janela Editar campo é exibida.
  4. Na lista suspensa Tipo de conteúdo, selecione o tipo de conteúdo.
  5. Do menu suspenso Pontuação, selecione a medida usada para determinar a precisão ao executar avaliações de previsões de modelo.
  6. Clique no campo Hotkey e pressione uma tecla no teclado para preenchê-lo automaticamente.
  7. Preencha o código hexadecimal da cor de campo desejada no campo Cor.
  8. Marque a caixa de seleção Múltiplas linhas se o campo a ser verificado puder abranger várias linhas de texto, como endereços ou descrições. Se esta opção não for selecionada, somente a primeira linha será retornada.
  9. Marque a caixa de seleção Dividir itens se desejar que esse campo seja usado como delimitador entre itens de linha ou linhas em uma tabela. Qualquer linha na qual esse campo apareça é considerada um novo item de linha ou linha na tabela. É mais comumente usado em campos Valor de linha nos itens de linha Fatura.
  10. Marque a caixa de seleção Oculto se não quiser que esse campo faça parte dos conjuntos de dados exportados.
  11. Clique em Salvar para salvar suas configurações.

Campos Regulares

Estes são campos que aparecem apenas uma vez em um determinado documento. Um item de linha Número da fatura ou Valor total em um documento de fatura seriam exemplos de campos de Coluna.

  1. Clique em + no painel direito na seção Campos regulares. A janela Criar campo regular é exibida.
  2. Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas.
  3. Clique em Criar. A janela Editar campo é exibida.
  4. Selecione o tipo de conteúdo na lista suspensa Tipo de conteúdo.
  5. Selecione o mecanismo de pós-processamento caso o modelo preveja mais de uma instância de um campo em uma determinada página a partir do menu suspenso Pós-processamento.
  6. Clique no campo Hotkey e pressione uma tecla no teclado para preenchê-lo automaticamente.
  7. No campo Cor, preencha o código hexadecimal da cor do campo desejada.
  8. No menu suspenso Várias páginas, selecione a estratégia de recuperação de dados. Isso é usado caso os campos apareçam em algumas páginas diferentes de um documento de várias páginas. Essa opção define como o modelo decide qual será retornada.
  9. Do menu suspenso Pontuação, selecione a medida usada para determinar a precisão ao executar avaliações de previsões de modelo.
  10. Marque a caixa de seleção Múltiplas linhas se o campo a ser verificado puder abranger várias linhas de texto, como endereços ou descrições. Se esta opção não for selecionada, somente a primeira linha será retornada.
  11. Marque a caixa de seleção Oculto se não quiser que esse campo faça parte dos conjuntos de dados exportados.
  12. Clique em Salvar para salvar suas configurações.

Campos de Classificação

Pontos de dados que se referem a um documento como um todo. Por exemplo, o Tipo de Despesa de um recibo (Alimentação, Hotel, Companhia Aérea, Transporte) ou a Moeda de uma fatura (USD, EUR, JPY) seriam exemplos de campos de Classificação.

  1. Clique em + no painel direito na seção Campos de Classificação. A janela Criar campo de classificação é exibida.
  2. Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas.
  3. Clique em Criar. A janela Editar campo é exibida.
  4. Na área de texto, preencha a lista de classes e digite os nomes como uma lista separada por vírgulas.
  5. Clique em Salvar para salvar suas configurações.
    Importante: ao contrário dos campos Regular e de Coluna, os campos de Classificação não são retreinados. Por exemplo, para o campo Moeda, se você treinar novamente o modelo de Faturas em um conjunto de dados contendo apenas faturas em USD e INR, o modelo resultante só poderá reconhecer essas duas moedas.

Descrições de campos

Barra de gerenciamento

Exibido na parte superior da página no Data Manager. Permite realizar várias operações: navegar entre documentos, excluir um documento, filtrar documentos, executar previsões de modelos de IA, importar e exportar documentos.

Campo

Description

Navegue entre os documentos que correspondam ao filtro ativo.

Entre as duas setas é exibido um contador.

Ele ilustra o número do documento atual do número total de documentos que correspondem ao filtro ativo.

Excluir / Recuperar

Exclua ou recupere um documento.

Filtro suspenso

Filtre documentos. Esse filtro também se aplica aos dados exportados. As seguintes opções estão disponíveis:

  • treinar validar definir

    -Conjunto de teste

    -excluídos

    -rotulado

    -sem rótulo

    -<batch_name>

Predict

Execute as previsões do modelo de IA e exiba os resultados.

Importar

Importe um novo documento a ser rotulado.

Exportar

Exporte dados rotulados.

O filtro ativo se aplica aos dados exportados.

[Nome do Documento]

O nome do documento atualmente ativo.

[Nome de Usuário]

O nome de usuário do usuário ativo no momento.

Sair

Saia do Data Manager.

Sair também limpa os cookies.

Ajuda

Janela Criar campo

Permite configurar o nome do campo a ser adicionado.

Campo

Description

Insira um nome de campo exclusivo

O nome do campo. Pode conter apenas letras minúsculas, números, sublinhado “_” e hífen “-“.

Janela Editar campo

Permite configurar o campo regular e coluna.

Campo

Description

Tipo de Conteúdo

O tipo de conteúdo de um campo. As seguintes opções estão disponíveis:

  • string - apropriado para nomes ou endereços de empresas, bem como condições de pagamento ou para qualquer outro campo em que o RPA Developer prefira construir a lógica de análise ou formatação manualmente, no fluxo de trabalho de RPA.
  • number - apropriado para valores ou quantidades, com análise inteligente dos separadores decimais/milhares.
  • date - o modelo analisa, formata e unifica a saída em um formato aaaa-mm-dd.
  • phone - apropriado para números de telefone.
  • id-no - apropriado para códigos alfanuméricos, números de identificação, é semelhante ao tipo de conteúdo string, mas inclui a remoção de quaisquer caracteres antes de ":". Se o número de identificação que você precisa extrair pode conter caracteres ":", use string como tipo de conteúdo para evitar perda de dados.

Pós-processamento

Exibido apenas para campos regulares.

Mecanismo de pós-processamento. As seguintes opções estão disponíveis:

  • primeira aparição – se o modelo prever mais de uma instância de um campo em uma determinada página, retornará a primeira.
  • valor maior – se o modelo prever mais de uma instância de um campo em uma determinada página, retornará o maior valor numérico. Isso é exibido apenas para conteúdo do tipo número e é apropriado para campos de Valor total.
  • valor mais longo – se o modelo prever mais de uma instância de um campo em uma determinada página, retornará o valor que consiste na string de caracteres mais longa.

Tecla de atalho

A tecla de atalho para o campo.

Cor

A cor do campo.

Multipágina

A estratégia de retorno de dados no caso de um campo aparecer em várias páginas de um documento. As seguintes opções estão disponíveis:

  • highest confidence - a escolha padrão para tipos de conteúdo string, phone e number.
  • first occurrence - a escolha padrão para tipos de conteúdo id-no e data.
  • Última ocorrência

    - string mais longa - exibido apenas para conteúdo do tipo string.

    - shortest string - exibido apenas para conteúdo do tipo string.

    - valor numérico mais alto - exibido apenas para conteúdo do tipo número.

    - lowest numeric value - exibido apenas para conteúdo do tipo number.

Pontuação

Só pode ser configurado para conteúdo do tipo string. Todos os outros tipos de conteúdo usam uma estratégia de pontuação de correspondência exata.

Medida usada para determinar a precisão ao executar avaliações de previsões de modelo.

  • exact match - uma previsão só é considerada correta (pontuação de 1) se corresponder exatamente ao valor verdadeiro. Se ela diferir, mesmo que seja por apenas um caractere, ela será considerada incorreta (pontuação de 0).
  • levenshtein - uma previsão é considerada parcialmente correta de acordo com a distância de Levenshtein entre a previsão e o valor verdadeiro. Se um valor com 10 letras for previsto corretamente exceto pelos dois últimos caracteres, a pontuação será de 0,8.

Multilinha

Marque esta caixa de seleção para campos que podem abranger várias linhas, como endereços ou descrições. Caso contrário, apenas a primeira linha é retornada.

Dividir itens

Exibido apenas para campos de coluna.

Marque esta caixa de seleção se deseja que este campo seja usado como delimitador entre itens de linha ou linhas em uma tabela. Qualquer linha na qual esse campo apareça é considerada um novo item de linha ou linha na tabela. É mais comumente usado em campos Line Amount nos itens de linha Fatura.

Oculto

Marque esta caixa de seleção se não quiser que esse campo faça parte dos conjuntos de dados exportados.

Menu de ajuda do Data Manager

A seção Controles de rotulagem exibe os controles a serem usados ao manipular dados.

A seção Atalhos do documento que exibe os atalhos usados para executar várias operações, como navegação e dimensionamento da interface do usuário.

A seção Configuração que exibe detalhes sobre a configuração da instância conforme executada durante a instalação.

A seção Relatório de erros permite visualizar logs gerados recentemente.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.