document-understanding
2021.10
false
UiPath logo, featuring letters U and I in white
Fora do período de suporte

Guia do usuário do Document Understanding.

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Última atualização 11 de nov de 2024

Criar e configurar campos

Os campos não podem ser renomeados, então pense bem antes de nomear um campo. Se, no entanto, houver campos que você decidir posteriormente que não deseja usar para treinar um modelo de ML, poderá excluí-los ou ocultá-los usando a caixa de seleção Oculto na janela Editar campo.

Observação: um máximo de 300 campos podem ser criados.

Campos de coluna

Uma Descrição de item de linha ou Preço unitário em um documento de fatura seriam exemplos de campos de coluna.

Criar um novo campo de coluna

  1. Clique em docs image na seção de tabela na parte superior da página para adicionar um novo campo Coluna. A janela Criar campo de coluna é exibida.
  2. Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.
  3. Clique em Criar. A janela Editar campo é exibida.
  4. Na lista suspensa Tipo de conteúdo, selecione o tipo de conteúdo.
  5. Do menu suspenso Pontuação, selecione a medida usada para determinar a precisão ao executar avaliações de previsões de modelo.
  6. Clique no campo Hotkey e pressione uma tecla no teclado para preenchê-lo automaticamente.
  7. Preencha o código hexadecimal da cor de campo desejada no campo Cor.
  8. Marque a caixa de seleção Dividir itens se desejar que esse campo seja usado como delimitador entre itens de linha ou linhas em uma tabela. Qualquer linha na qual esse campo apareça é considerada um novo item de linha ou linha na tabela. É mais comumente usado em campos Line Amount nos itens de linha Fatura.
  9. Marque a caixa de seleção Oculto se não quiser que esse campo faça parte dos conjuntos de dados exportados.
  10. Clique em Salvar para salvar suas configurações.

Editar um campo de coluna

Clique no botão Editar campo. As opções disponíveis para campos de coluna podem ser encontradas na tabela abaixo.

Opção

Description

Tipo de Conteúdo

O tipo de conteúdo de um campo:

  • string: apropriado para nomes ou endereços de empresas, bem como condições de pagamento ou para qualquer outro campo em que o desenvolvedor de RPA prefira construir a lógica de análise ou formatação manualmente, no fluxo de trabalho de RPA.
  • number: apropriado para valores ou quantidades, com análise inteligente dos separadores decimais/de milhares.
  • date: o modelo analisa, formata e unifica a saída em formato aaaa-mm-dd.
  • ** phone**: apropriado para números de telefone. A formatação remove letras e parênteses e substitui espaços por traços.
  • id-no: apropriado para códigos alfanuméricos, números de identificação, é semelhante ao tipo de conteúdo string, mas inclui a remoção de quaisquer caracteres antes de dois pontos :. Se o número de identificação que você precisa extrair pode conter dois-pontos :caracteres, use string como tipo de conteúdo para evitar perda de dados.

Atalho

A tecla de atalho para o campo. Uma ou duas chaves permitidas.

Cor

A cor do campo em formato hexadecimal. Se o valor não for válido, um novo será gerado.

Pontuação

Medida usada para determinar a precisão ao executar avaliações de previsões de modelo. Ela só pode ser configurada para o tipo de conteúdo string. Todos os outros tipos de conteúdo usam uma estratégia de pontuação de correspondência exata. Opções:

  • exact match: uma previsão só é considerada correta (pontuação de 1) se corresponder exatamente ao valor verdadeiro. Se ela diferir, mesmo que seja por apenas um caractere, ela será considerada incorreta (pontuação de 0).
  • levenshtein: uma previsão é considerada parcialmente correta de acordo com a distância de Levenshtein entre a previsão e o valor verdadeiro. Se um valor de 10 letras for previsto corretamente, exceto os 2 últimos caracteres, a pontuação dessa previsão será 0,8.

Dividir itens

Marque esta caixa de seleção se deseja que este campo seja usado como delimitador entre itens de linha ou linhas em uma tabela. Qualquer linha na qual esse campo apareça é considerada um novo item de linha ou linha na tabela. É mais comumente usado em campos Valor de linha nos itens de linha Fatura.

Oculto

Marque esta caixa de seleção se não quiser que esse campo faça parte dos conjuntos de dados exportados.

Excluir um campo de coluna

Para excluir um campo de coluna, siga estas etapas:

  1. Clique no botão docs image Editar campo correspondente ao campo de coluna que deseja excluir.
  2. Clique no botão Excluir.
  3. Digite o nome exato do campo.


  4. Clique em OK.
  5. O campo da coluna e seus dados rotulados associados são excluídos.

Campos Regulares

Estes são campos que aparecem apenas uma vez em um determinado documento. Um item de linha Número da fatura ou Valor total em um documento de fatura seriam exemplos de campos de Coluna.

Cria um novo campo regular

  1. Clique em docs image no painel direito na seção Campos regulares. A janela Criar campo regular é exibida.
  2. Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.
  3. Clique em Criar. A janela Editar campo é exibida.
  4. Selecione o tipo de conteúdo na lista suspensa Tipo de conteúdo.
  5. Selecione o mecanismo de pós-processamento caso o modelo preveja mais de uma instância de um campo em uma determinada página na lista suspensa Pós-processamento.
  6. Clique no campo Hotkey e pressione uma tecla no teclado para preenchê-lo automaticamente.
  7. No campo Cor, preencha o código hexadecimal da cor do campo desejada.
  8. No menu suspenso Várias páginas, selecione a estratégia de recuperação de dados. Essa opção é usada caso os campos apareçam em algumas páginas diferentes de um documento de várias páginas. Essa opção define como o modelo decide qual será retornada.
  9. Do menu suspenso Pontuação, selecione a medida usada para determinar a precisão ao executar avaliações de previsões de modelo.
  10. Marque a caixa de seleção Múltiplas linhas se o campo a ser verificado puder abranger várias linhas de texto, como endereços ou descrições. Se esta opção não for selecionada, somente a primeira linha será retornada.
  11. Marque a caixa de seleção Oculto se não quiser que esse campo faça parte dos conjuntos de dados exportados.
  12. Clique em Salvar para salvar suas configurações.

Editar um campo regular

Clique no botão Editar campo. As opções disponíveis para campos regulares podem ser encontradas na tabela abaixo.

Opção

Description

Tipo de Conteúdo

O tipo de conteúdo de um campo:

  • string: apropriado para nomes ou endereços de empresas, bem como condições de pagamento ou para qualquer outro campo em que o desenvolvedor de RPA prefira construir a lógica de análise ou formatação manualmente, no fluxo de trabalho de RPA.
  • number: apropriado para valores ou quantidades, com análise inteligente dos separadores decimais/de milhares.
  • date: o modelo analisa, formata e unifica a saída em formato aaaa-mm-dd.
  • ** phone**: apropriado para números de telefone. A formatação remove letras e parênteses e substitui espaços por traços.
  • id-no: apropriado para códigos alfanuméricos, números de identificação, é semelhante ao tipo de conteúdo string, mas inclui a remoção de quaisquer caracteres antes de dois pontos :. Se o número de identificação que você precisa extrair pode conter dois-pontos :caracteres, use string como tipo de conteúdo para evitar perda de dados.

Pós-processamento

Mecanismo de pós-processamento. Se o modelo prever mais de uma instância de um campo em uma determinada página, ele retornará:

  • highest_confidence: o valor com a maior confiança.
  • first_span: o primeiro valor.
  • largest_value: o maior valor numérico. Isso só é exibido para o tipo de conteúdo number e é apropriado para campos de Valor Total.
  • longest_value: o valor que consiste no maior número de caracteres.

Atalho

A tecla de atalho para o campo. Uma ou duas chaves permitidas.

Cor

A cor do campo em formato hexadecimal. Se o valor não for válido, um novo será gerado.

Multipágina

A estratégia de retorno de dados caso um campo apareça em páginas diferentes de um documento de várias páginas.

  • highest_confidence - a escolha padrão para tipos de conteúdo string, phone e number.
  • first_occurrence - a escolha padrão para tipos de conteúdo id-no e date.
  • last_occurrence

    -longest_string

  • shortest_string
  • highest_num_value - exibido apenas para tipo de conteúdo number.
  • lowest_num_value - exibido apenas para tipo de conteúdo number.

Pontuação

Medida usada para determinar a precisão ao executar avaliações de previsões de modelo. Ela só pode ser configurada para o tipo de conteúdo string. Todos os outros tipos de conteúdo usam uma estratégia de pontuação de correspondência exata. Opções:

  • exact match: uma previsão só é considerada correta (pontuação de 1) se corresponder exatamente ao valor verdadeiro. Se ela diferir, mesmo que seja por apenas um caractere, ela será considerada incorreta (pontuação de 0).
  • levenshtein: uma previsão é considerada parcialmente correta de acordo com a distância de Levenshtein entre a previsão e o valor verdadeiro. Se um valor de 10 letras for previsto corretamente, exceto os 2 últimos caracteres, a pontuação dessa previsão será 0,8.

Multilinha

Marque esta caixa de seleção para campos que podem abranger várias linhas de texto (endereços ou descrições), caso contrário, apenas a primeira linha será retornada.

Oculto

Marque esta caixa de seleção se não quiser que esse campo faça parte dos conjuntos de dados exportados.

Excluir um campo regular

Para excluir um campo regular, siga estas etapas:

  1. Clique no botão docs image Editar campo correspondente ao campo regular que deseja excluir.
  2. Clique no botão Excluir.
  3. Digite o nome exato do campo.


  4. Clique em OK.
  5. O campo regular e seus dados rotulados associados são excluídos.

Campos de Classificação

Pontos de dados que se referem a um documento como um todo. Por exemplo, o Tipo de Despesa de um recibo (Alimentação, Hotel, Companhia Aérea, Transporte) ou a Moeda de uma fatura (USD, EUR, JPY) seriam exemplos de campos de Classificação.

Cria um novo campo de classificação

  1. Clique em docs image no painel direito na seção Campos de Classificação. A janela Criar campo de classificação é exibida.
  2. Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.
  3. Clique em Criar. A janela Editar campo é exibida.
  4. Na área de texto, preencha a lista de classes e digite os nomes como uma lista separada por vírgulas.
  5. Clique em Salvar para salvar suas configurações.

Editar um campo de classificação

Clique no botão docs image Editar campo. Defina uma lista de valores possíveis. As vírgulas devem separar os valores. Uma descrição opcional do valor pode ser incluída após dois pontos : (opção 1: descrição 1).


Excluir um campo de classificação

Para excluir um campo de classificação, siga estas etapas:

  1. Clique no botão docs image Editar campo correspondente ao campo de classificação que deseja excluir.
  2. Clique no botão Excluir.
  3. Digite o nome exato do campo.


  4. Clique em OK.
  5. O campo de classificação e seus dados rotulados associados são excluídos.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.