document-understanding
2023.10
false
UiPath logo, featuring letters U and I in white

Guia do usuário do Document Understanding.

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Última atualização 18 de dez de 2024

Criar e configurar campos

Os campos podem ser renomeados. Basta clicar no botão Editar campo e simplesmente editar o nome do campo na parte superior da janela.

Se houver campos que, posteriormente, você decidir que não deseja usar para treinar um modelo de ML, poderá excluí-los ou ocultá-los usando a caixa de seleção Oculto na janela Editar campo.

Observação: um máximo de 300 campos podem ser criados.

Campos de coluna

Uma Descrição de item de linha ou Preço unitário em um documento de fatura seriam exemplos de campos de coluna.

Criar um novo campo de coluna

  • Clique em docs image na seção de tabela na parte superior da página para adicionar um novo campo Coluna. A janela Criar campo de coluna é exibida.
  • Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.
  • Clique em OK. A janela Editar campo é exibida com a guia Geral aberta.

    docs image
  • Na lista suspensa Tipo de conteúdo, selecione o tipo de conteúdo.
  • Clique no campo Hotkey e pressione uma tecla no teclado para preenchê-lo automaticamente.
  • Marque a caixa de seleção Dividir itens se desejar que esse campo seja usado como delimitador entre itens de linha ou linhas em uma tabela. Qualquer linha na qual esse campo apareça é considerada um novo item de linha ou linha na tabela. É mais comumente usado em campos Line Amount nos itens de linha Fatura.

  • Marque a caixa de seleção Oculto se não quiser que esse campo faça parte dos conjuntos de dados exportados.
  • Clique na guia Avançado.
  • Do menu suspenso Pontuação, selecione a medida usada para determinar a precisão ao executar avaliações de previsões de modelo.
  • Preencha o código hexadecimal da cor de campo desejada no campo Cor.
  • Clique em Salvar para salvar suas configurações.

Editar um campo de coluna

Clique no botão Editar campo. As opções disponíveis para campos de coluna podem ser encontradas na tabela abaixo.

Opção

Guia

Description

Nome do campo

N/A

O nome exclusivo para o campo.

O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.

Tipo de Conteúdo

Geral

O tipo de conteúdo de um campo:

  • string: apropriado para nomes ou endereços de empresas, bem como condições de pagamento ou para qualquer outro campo em que o desenvolvedor de RPA prefira construir a lógica de análise ou formatação manualmente, no fluxo de trabalho de RPA.
  • number: apropriado para valores ou quantidades, com análise inteligente dos separadores decimais/de milhares.
  • data: o modelo analisa, formata e unifica a saída em um formato aaaa-mm-dd . Você pode indicar como datas ambíguas devem ser analisadas e retornadas. Para fazer isso, escolha entre o estilo não americano (aaaa-mm-dd) e o estilo americano (aaaa-dd-mm) na opção Formato da data .
  • phone: apropriado para números de telefone. A formatação remove letras e parênteses e substitui espaços por traços.
  • id-no: apropriado para códigos alfanuméricos, números de identificação, é semelhante ao tipo de conteúdo string, mas inclui a remoção de quaisquer caracteres antes de dois pontos :. Se o número de identificação que você precisa extrair pode conter dois-pontos :caracteres, use string como tipo de conteúdo para evitar perda de dados.

Atalho

Geral

A tecla de atalho para o campo. Uma ou duas chaves permitidas.

Dividir itens

Geral

Marque esta caixa de seleção se deseja que este campo seja usado como delimitador entre itens de linha ou linhas em uma tabela. Qualquer linha na qual esse campo apareça é considerada um novo item de linha ou linha na tabela. É mais comumente usado em campos Valor de linha nos itens de linha Fatura.

Oculto

Geral

Marque esta caixa de seleção se não quiser que esse campo faça parte dos conjuntos de dados exportados.

Cor

Avançado

A cor do campo em formato hexadecimal. Se o valor não for válido, um novo será gerado.

Pontuação

Avançado

Medida usada para determinar a precisão ao executar avaliações de previsões de modelo. Ela só pode ser configurada para o tipo de conteúdo string. Todos os outros tipos de conteúdo usam uma estratégia de pontuação de correspondência exata. Opções:

  • exact match: uma previsão só é considerada correta (pontuação de 1) se corresponder exatamente ao valor verdadeiro. Se ela diferir, mesmo que seja por apenas um caractere, ela será considerada incorreta (pontuação de 0).
  • levenshtein: uma previsão é considerada parcialmente correta de acordo com a distância de Levenshtein entre a previsão e o valor verdadeiro. Se um valor de 10 letras for previsto corretamente, exceto os 2 últimos caracteres, a pontuação dessa previsão será 0,8.

Excluir um campo de coluna

Para excluir um campo de coluna, siga estas etapas:

  1. Clique no botão Editar campodocs image correspondente ao campo de coluna que você deseja excluir.
  2. Clique no botão Excluir.
  3. Digite o nome exato do campo.


  4. Clique em OK.
  5. O campo da coluna e seus dados rotulados associados são excluídos.

Campos regulares

Estes são campos que aparecem apenas uma vez em um determinado documento. Um item de linha Número da fatura ou Valor total em um documento de fatura seriam exemplos de campos de Coluna.

Cria um novo campo regular

  • Clique em docs image no painel direito na seção Campos regulares. A janela Criar campo regular é exibida.
  • Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.
  • Clique em OK. A janela Editar campo é exibida com a guia Geral aberta.
  • Selecione o tipo de conteúdo na lista suspensa Tipo de conteúdo.
  • Clique no campo Atalho e pressione uma tecla no teclado para preenchê-lo automaticamente.
  • Marque a caixa de seleção Múltiplas linhas se o campo a ser verificado puder abranger várias linhas de texto, como endereços ou descrições. Se esta opção não for selecionada, somente a primeira linha será retornada.
  • Marque a caixa de seleção Multi-value para todos os valores detectados no documento serem exibidos como uma lista. Você pode selecionar tanto a caixa multi-line como a multi-value.
  • Marque a caixa de seleção Oculto se não quiser que esse campo faça parte dos conjuntos de dados exportados.
  • Clique na guia Avançado.
  • Selecione o mecanismo de pós-processamento caso o modelo preveja mais de uma instância de um campo em uma determinada página na lista suspensa Pós-processamento.
  • Do menu suspenso Pontuação, selecione a medida usada para determinar a precisão ao executar avaliações de previsões de modelo.
  • No campo Cor, preencha o código hexadecimal da cor do campo desejada.
  • Clique em Salvar para salvar suas configurações.

Editar um campo regular

Clique no botão Editar campo. As opções disponíveis para campos regulares podem ser encontradas na tabela abaixo.

Opção

Guia

Description

Nome do campo

N/A

O nome exclusivo para o campo.

O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.

Tipo de Conteúdo

Geral

O tipo de conteúdo de um campo:

  • string: apropriado para nomes ou endereços de empresas, bem como condições de pagamento ou para qualquer outro campo em que o desenvolvedor de RPA prefira construir a lógica de análise ou formatação manualmente, no fluxo de trabalho de RPA.
  • number: apropriado para valores ou quantidades, com análise inteligente dos separadores decimais/de milhares.
  • data: o modelo analisa, formata e unifica a saída em um formato aaaa-mm-dd . Você pode indicar como datas ambíguas devem ser analisadas e retornadas. Para fazer isso, escolha entre o estilo não americano (aaaa-mm-dd) e o estilo americano (aaaa-dd-mm) na opção Formato da data . Essa opção não tem impacto quando a data não é ambígua e é compatível apenas com os Pacotes de ML versão 22.10.2 ou posteriores.
  • phone: apropriado para números de telefone. A formatação remove letras e parênteses e substitui espaços por traços.
  • id-no: apropriado para códigos alfanuméricos, números de identificação, é semelhante ao tipo de conteúdo string, mas inclui a remoção de quaisquer caracteres antes de dois pontos :. Se o número de identificação que você precisa extrair pode conter dois-pontos :caracteres, use string como tipo de conteúdo para evitar perda de dados.

Pós-processamento

Avançado

Mecanismo de pós-processamento. Se o modelo prever mais de uma instância de um campo em uma determinada página, ele retornará:

  • highest_confidence: o valor com a maior confiança.
  • first_span: o primeiro valor.
  • largest_value: o maior valor numérico. Isso só é exibido para o tipo de conteúdo number e é apropriado para campos de Valor Total.
  • longest_value: o valor que consiste no maior número de caracteres.

Atalho

Geral

A tecla de atalho para o campo. Uma ou duas chaves permitidas.

Multilinha

Geral

Marque esta caixa de seleção para campos que podem abranger várias linhas de texto (endereços ou descrições), caso contrário, apenas a primeira linha será retornada.

Multivalor

GeralSelecione esta caixa para exibir todos os valores detectados no documento como lista. Você pode selecionar tanto a caixa multi-line como a multi-value.

Oculto

Geral

Marque esta caixa de seleção se não quiser que esse campo faça parte dos conjuntos de dados exportados.

Pontuação

Avançado

Medida usada para determinar a precisão ao executar avaliações de previsões de modelo. Ela só pode ser configurada para o tipo de conteúdo string. Todos os outros tipos de conteúdo usam uma estratégia de pontuação de correspondência exata. Opções:

  • exact match: uma previsão só é considerada correta (pontuação de 1) se corresponder exatamente ao valor verdadeiro. Se ela diferir, mesmo que seja por apenas um caractere, ela será considerada incorreta (pontuação de 0).
  • levenshtein: uma previsão é considerada parcialmente correta de acordo com a distância de Levenshtein entre a previsão e o valor verdadeiro. Se um valor de 10 letras for previsto corretamente, exceto os 2 últimos caracteres, a pontuação dessa previsão será 0,8.

Cor

Avançado

A cor do campo em formato hexadecimal. Se o valor não for válido, um novo será gerado.

Excluir um campo regular

Para excluir um campo regular, siga estas etapas:

  1. Clique no botão Editar campodocs image correspondente ao campo regular que você deseja excluir.
  2. Clique no botão Excluir.
  3. Digite o nome exato do campo.


  4. Clique em OK.
  5. O campo regular e seus dados rotulados associados são excluídos.

Campos de Classificação

Pontos de dados que se referem a um documento como um todo. Por exemplo, o Tipo de Despesa de um recibo (Alimentação, Hotel, Companhia Aérea, Transporte) ou a Moeda de uma fatura (USD, EUR, JPY) seriam exemplos de campos de Classificação.

Cria um novo campo de classificação

  1. Clique em docs image no painel direito na seção Campos de Classificação. A janela Criar um novo campo de classificação é exibida.
  2. Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.
  3. Clique em OK. A janela Editar campo é exibida.
  4. Na área de texto, preencha a lista de classes e digite os nomes como uma lista separada por vírgulas.
  5. Clique em Salvar para salvar suas configurações.

Editar um campo de classificação

Clique no botão docs image Editar campo. Defina uma lista de valores possíveis. As vírgulas devem separar os valores. Uma descrição opcional do valor pode ser incluída após dois pontos : (opção 1: descrição 1).


Excluir um campo de classificação

Para excluir um campo de classificação, siga estas etapas:

  1. Clique no botão Editar campodocs image correspondente ao campo de classificação que você deseja excluir.
  2. Clique no botão Excluir.
  3. Digite o nome exato do campo.


  4. Clique em OK.
  5. O campo de classificação e seus dados rotulados associados são excluídos.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.