activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Atividades de Document Understanding

Última atualização 5 de dez de 2024

Carregar Taxonomia

UiPath.IntelligentOCR.Activities.TaxonomyManagement.LoadTaxonomy

Transforma o arquivo taxonomy.json criado com a ajuda do Gerenciador de Taxonomia em uma variável que pode ser utilizada posteriormente com outras atividades.

Propriedades

Comum
  • NomeDeExibição - o nome de exibição da atividade.
Diversos
  • Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Saída
  • Taxonomia - A taxonomia que você deseja carregar, armazenada em uma variável DocumentTaxonomy . Esta saída pode ser utilizada posteriormente em atividades que recebam uma taxonomia como entrada.
    Importante: caso você use uma GPU Intel Xe e o Gerenciador de Taxonomia não seja exibido corretamente, recomendamos atualizar o driver gráfico para a versão mais recente. Para obter mais informações, consulte esta página.

Métodos de extensão da taxonomia

  • Serialize(): Ao ser requisitado em um objeto DocumentTaxonomy, o método Serialize() retorna uma representação JSON do objeto, para que possa ser armazenado e recuperado para uso posterior.
  • Deserialize(String): a extensão estática DocumentTaxonomy.Deserialize(jsonString) retorna um objeto DocumentTaxonomy, hidratado com os dados codificados JSON transmitidos como um parâmetro.
  • GetFields(String): Ao ser requisitado em um objeto DocumentTaxonomy , o método GetFields() chamado com uma string DocumentTypeId retorna uma lista de campos definidos dentro desse tipo de documento.

O Gerenciador de Taxonomia pode ser usado para criar e editar um arquivo de Taxonomia específico para seu projeto de automação atual. Este arquivo de Taxonomia contém tipos de documentos definidos pelo usuário, organizados em Grupos e Categorias.

Você pode aproveitar ainda mais o arquivo de Taxonomia convertendo-o em um tipo de dados .NET com a atividade Load Taxonomy e, em seguida, passando-o como entrada para atividades como:

O Gerenciador de Taxonomia pode ser acessado somente após a instalação de um pacote UiPath.IntelligentOCR.Activities versão v1.6.0 ou superior como dependência para seu projeto. Após a instalação do pacote, um botão para o Gerenciador de Taxonomia aparece na faixa de opções, na seção Assistentes.

Figura 1. Visão geral do Gerenciador de taxonomia na barra de ferramentas do Studio

Usando o Gerenciador de Taxonomia

A janela do Gerenciador de Taxonomia permite criar tipos de documentos, organizados por grupos e categorias. Quando aberta pela primeira vez em um projeto, nenhum grupo, categoria ou tipo de documento é definido.

Figura 2. O Gerenciador de taxonomia antes de mapear quaisquer tipos ou campos de documentos

Estabelecendo a Estrutura

O primeiro passo é criar um grupo ou um tipo de documento. A diferença entre os dois é que um grupo envolve uma estrutura hierárquica, enquanto um tipo de documento pode ser criado como um único arquivo. Um projeto complexo implica a criação de grupos, categorias e tipos de documentos; um projeto simples pode exigir apenas um ou dois tipos de documentos.

Criando um Grupo

Quando um grupo é criado, também é necessária uma categoria para o tipo de documento que você deseja criar dentro do grupo. Isso é feito usando o botão Grupo. Depois de escolher um nome para seu grupo, você pode salvá-lo usando o botão Salvar ou usando a tecla Enter.

Criando uma Categoria

Depois que um grupo é definido e selecionado, você pode criar uma Categoria e/ou um Tipo de Documento dentro do grupo, usando seus botões definidos. Selecione Salvar ou use a tecla Enter para salvar a configuração.

Criando um Tipo de documento

Um Tipo de documento pode ser criado como parte de um grupo ou como um documento isolado. Quando criado dentro de um grupo, certifique-se de que o grupo esteja selecionado e, em seguida, selecione Tipo de documento.

Se o Tipo de Documento for criado como um único arquivo, certifique-se de que nenhum grupo esteja selecionado e selecione Tipo de Documento. Depois de selecionar Tipo de Documento, insira um nome para o arquivo e selecione Salvar.

Observação: quando uma Ação de Document Understanding é enviada do Orchestrator ao utilizar a versão 2020.10 do Studio, certifique-se de que a taxonomia não tenha tipos de documentos criados sem categoria.

Selecionar um Tipo de documento já criado permite alterar seu nome, copiar seu ID exclusivo para a área de transferência, reatribuí-lo a outro grupo/categoria ou remover a categorização. Você também pode inserir um código para o tipo de documento.

Depois que um tipo de documento é salvo, uma ID de tipo de documento é gerada para ele. Abrir o documento para edição exibe a ID ao lado da guia Nome do tipo de documento . O Document Type ID tem uma estrutura do tipo Group.Category.Document e pode ser copiado para a área de transferência. O código de ID do tipo de documento é uma funcionalidade opcional e pode ser usado para localizar seus documentos ou mapear seus documentos para os tipos de documento definidos na taxonomia.
Como criar campos

Quando o Tipo de Documento é selecionado, o botão Campo fica disponível para você criar um novo campo. Depois que o botão Campo for selecionado, você pode inserir um nome para ele e selecionar seu tipo na lista suspensa.

A categoria Campo tem duas guias: Detalhes e Regras. A guia Detalhes fornece informações sobre o campo selecionado, como Nome do campo, tecla de atalho atribuída ou tipo de campo, enquanto a guia Regras permite que você crie regras que precisam ser atendidas pelo resultado da extração para o campo.

Os tipos de campos disponíveis são os seguintes:

  • Texto
  • Número
  • Data - A escolha desse tipo também permite que você especifique um formato esperado, que é opcional.
    Observação:

    Se você quiser adicionar um formato esperado, use um formato compatível com o MSDN (MicroSoft Developer Network).

    Este formato pode ser usado por extratores e é usado pela atividade Data Extraction Scope ao tentar analisar uma Data em suas partes constituintes de Dia, Mês e Ano.

  • Name
  • Address
  • Definir - Escolher esse tipo permite que você adicione vários valores ao campo de uma lista preestabelecida.
  • Booleano
  • Tabela - A escolha desse tipo permite que você edite a estrutura da tabela, pois você pode adicionar colunas e editar seu nome e tipo.

Aba Detalhes

Depois que o novo Campo for criado, selecione-o para visualizar mais informações. Por padrão, quando você abre um campo, a guia Detalhes é exibida permitindo que você modifique o nome, cor ou tecla de atalho do campo. Você também pode especificar se é multivalor (É multivalor) ou se permite que valores sem evidência no documento sejam processados (Requer referência).A opção multivalor permite que um campo tenha vários valores, sem ser restrito a uma lista específica.

Para obter mais informações sobre como usar os dois campos, consulte as seguintes descrições:
  • É multivalor: se um campo for definido como multivalor, você pode ter mais de um valor relatado para esse campo específico.Por exemplo, você deseja extrair uma "Lista de Diretores" onde o número de entradas pode variar.Imagine um campo de vários valores como uma tabela de coluna única.
  • Requer referência: quando um campo requer referência, você pode adicionar um valor a ele apenas se selecionar algo do documento que você vê na Estação de Validação. Para campos especiais nos quais você deseja capturar valores que talvez não sejam visíveis no documento, você pode alternar Requer referência para Off. O efeito será que o usuário poderá adicionar um valor sem especificar um local no documento de onde esses valores vêm.

Você também pode selecionar o Tipo do campo na lista suspensa ou adicionar um valor Padrão. Use o campo Valor padrão para definir valores a serem preenchidos no Resultado da extração, caso não haja valor para o campo identificado no documento.

Figura 3. Visão geral da guia Detalhes de um campo

Você pode optar por habilitar as notas do Validador na guia Detalhes . Ao configurar notas do validador, o validador humano pode adicionar notas sobre a decisão que tomaram durante a validação. Você pode fazer as seguintes configurações:
  • Somente leitura: se estiver habilitado, o validador manual pode visualizar quaisquer notas do validador definidas no campo ExtractionResult no Validation Station como uma mensagem. Se desabilitado (estado padrão), o validador humano também pode editar essa nota no Validation Station e, assim, comunicar de volta ao robô informações sobre a decisão tomada.
  • Texto: se Texto estiver selecionado, a nota do validador é exibida como uma mensagem de texto (ou texto editável, quando a edição está habilitada) no Validation Station. O validador humano pode exibir, editar ou adicionar uma mensagem de no máximo 200 caracteres no Validation Station.
  • Opções: se você selecionar Opções, você pode configurar uma série de botões de opção que a validação manual pode visualizar e, se não for somente leitura, selecionar na Estação de Validação. É possível adicionar no máximo 10 opções.
Dica: verifique a página Classe ExtractionResult na seção UiPath.DocumentProcessing.Contracts para obter mais informações sobre os dois métodos relacionados às notas de validador GetFieldValidatorNotes(<fieldId>) e SetFieldValidatorNotes(<fieldId>, <validatorNote>).

Os campos criados podem ser excluídos usando o botão excluir que aparece ao lado ou reordenados usando a função arrastar e soltar.

Um campo também pode ser excluído da janela Detalhes, selecionando Excluir.

Refazendo essas etapas, é possível criar vários grupos, categorias e tipos de documento que você pode filtrar usando o campo Pesquisar.

Aba Regras

As regras de campo ajudam você a otimizar os resultados da extração e validá-los automaticamente ao executar seu fluxo de trabalho. Sua função é aumentar a eficiência da extração e ajudar você a validar facilmente os campos que precisam de atenção na Estação de validação, destacando-os. Você pode criar várias regras que se aplicam a um campo.

Você define uma regra definindo o tipo de avaliador e o nível de criticidade.

Tipo de avaliador

Use o Tipo de avaliador para especificar como as regras definidas devem ser avaliadas. Existem dois tipos de avaliadores que você pode escolher: AND, OR.

Tabela 1. Tabela mostrando Tipos de avaliadores, suas descrições e exemplos deles.

Tipo de avaliador

Description

Exemplo

AND

Use esse tipo de avaliador quando todas as regras precisarem ser executadas.

Regra : O número da fatura começa com A e termina com X.

  • Resultado Válido : O valor do campo válido é A123X.
  • Resultado inválido : o valor do campo válido é A123.

OU

Apenas uma das regras precisa ser executada.

Regra : O número da fatura começa com A OU é 123.

  • Resultado válido : o valor campo válido é A123, 123.
  • Resultado inválido : o valor campo válido é 234, 1A23.

Nível de criticidade

Indica a criticidade de todas as regras definidas para um campo. Você não pode definir um nível MUST se a regra for quebrada na sessão da Estação de Validação. Existem dois níveis de criticalidade que você pode escolher: MUST, SHOULD.

A regra criada é acionada assim que o nível de criticidade definido é identificado.

Quando você deseja enviar uma regra, uma regra MUST requer 100% de sucesso, caso contrário, a operação de envio falha. Uma regra DEVERIA permitir que você a envie mesmo se a regra for quebrada.

Você sempre pode verificar se uma regra é quebrada usando o método do ajudante da classe Classe ExtractionResult, que reside no pacote de atividades UiPath.DocumentProcessing.Contracts.

Tabela 2. Tabela que exibe Níveis de criticidade e suas descrições
 

Description

MUST

Use este nível de criticidade quando a regra criada for imperativa para ser incluída no processo de Resultado da Extração.

SHOULD

Use este nível de criticalidade quando a regra criada for opcional.

Depois de selecionar o Tipo de avaliador e o Nível de criticidade, você deve definir um tipo aplicável à sua regra recém-criada. Existem várias opções que você pode escolher. Aqui está uma lista completa com todos os disponíveis:

  • Não está vazio
  • Valores possíveis
  • Inicia com
  • Termina com
  • Contém
  • Comprimento fixo
  • É email
  • RegEx
    Observação: o tipo de campo para o qual você criou uma regra dita o número de tipos de regras possíveis dos quais você pode selecionar um. Por exemplo, um campo do tipo Texto exibe todos os tipos de regras possíveis, enquanto um campo do tipo Data exibe apenas dois tipos de regras, Não vazio e valores Possíveis.

Tipo de regras

A tabela a seguir mostra detalhes para cada tipo de regra disponível, classificado dependendo do nível de criticidade e do tipo de avaliador.
Tabela 3. Tipos de regras e suas descrições, dependendo do nível de criticidade e do tipo do avaliador
 DescriptionTipo de campoNível de criticidadeTipo de avaliador
Não está vazioO valor extraído não pode estar vazio, o que significa que o campo é obrigatório. Se o valor estiver ausente, a validação/entrada manual será necessária. Aplicável aos campos dos seguintes tipos:
  • Número
  • text
  • data
  • Address
  • name
  • DEFINIR
  • Booleano

MUST

SHOULD

AND

OU

Valores possíveisO usuário define todos os valores possíveis e os dados extraídos são um dos valores adicionados como entrada ao criar a regra (por exemplo, Tipo de empregador é "tempo integral", "meio período" ou "estágio"). Aplicável aos campos dos seguintes tipos:
  • Número
  • text
  • data

MUST

SHOULD

AND

OU

ExpressionDefina expressões matemáticas que atuam como uma regra para extrair dados. Aplicável aos campos do tipo número.
Uma condição é obrigatória ao configurar a regra. Escolha uma das seguintes opções:
  • É igual a
  • Não é igual a
  • é maior que
  • é maior ou igual a
  • é menor ou igual a
Uma expressão matemática é necessária. Use os operadores predefinidos para definir sua expressão. Verifique os seguintes exemplos:
  • Quantidade de soma * Preço unitário líquido\n- Total = Subtotal + Entrega
  • Desconto — o operador de soma reúne todos os valores da coluna de uma tabela.

MUST

SHOULD

AND

OU

Inicia comEsta é uma regra fixa, o que significa que o valor extraído precisa começar com um dos valores adicionados pelo usuário. Aplicável aos campos dos seguintes tipos:
  • text
  • Address
  • name

MUST

SHOULD

AND

OU

Termina comEsta é uma regra fixa, o que significa que o valor extraído precisa terminar com um dos valores adicionados pelo usuário. Aplicável aos campos dos seguintes tipos:
  • text
  • Address
  • name

MUST

SHOULD

AND

OU

ContémEsta é uma regra fixa, o que significa que o valor extraído precisa conter um dos valores adicionados pelo usuário. Aplicável aos campos dos seguintes tipos:
  • text
  • Address
  • name

MUST

SHOULD

AND

OU

Comprimento fixoEsta é uma regra fixa, o que significa que o valor extraído precisa ter um determinado comprimento fixo. Aplicável aos campos dos seguintes tipos:
  • text
  • Address
  • name

MUST

SHOULD

AND

OU

É emailEsta é uma regra fixa, o que significa que o valor extraído precisa ser escrito em um formato de e-mail. Aplicável aos campos dos seguintes tipos:
  • text
  • Address
  • name

MUST

SHOULD

AND

OU

RegExEsta é uma regra fixa, o que significa que o valor extraído precisa conter uma expressão regular semelhante a um dos valores adicionados pelo usuário. Aplicável aos campos dos seguintes tipos:
  • text
  • Address
  • name

MUST

SHOULD

AND

OU

Usando Regras

Vamos tomar um exemplo prático para entender melhor a aplicabilidade dessas regras. Criaremos um conjunto de regras para o campo Endereço do documento. Verifique as seguintes etapas de exemplos para saber como você pode criar uma nova regra ou um conjunto de regras para um campo:
  1. Selecione um campo no painel Taxonomia.
  2. Acesse a guia Regras.
  3. Selecione Adicionar novo, para adicionar uma nova regra.
  4. Digite a regra full address, para a qual o Tipo é Contém e a Expressão é st, str, street.
  5. Escolha o Tipo de avaliador.

    Nesse exemplo, selecione OR.

  6. Escolha o nível de Criticidade.

    Nesse exemplo, selecione MUST.

  7. Selecione Adicionar novo.
  8. Digite a regra phone number, para a qual o Tipo é Não está vazio.
  9. Selecione Adicionar novo.
  10. Digite a regra city or state, para a qual o Tipo é Contém e a Expressão é city, state.

A imagem animada a seguir mostra as etapas descritas anteriormente.

Figura 4. Imagem animada exibindo como adicionar três regras para um campo

Outras opções

Editando

Você pode Editar o nome de qualquer grupo, categoria ou tipo de documento criado. Isso pode ser feito selecionando um dos três níveis de configuração e editando o campo Nome.

Excluindo

Grupos, categorias e tipos de documento também podem ser excluídos. Há duas opções disponíveis:

  • Selecione Excluir Excluir, no elemento pai do objeto que você deseja excluir.
  • Selecione Excluir Excluir ao selecionar o objeto que você deseja excluir.

Em ambos os casos, um pop-up é exibido pedindo que você confirme a ação de exclusão. Selecione Excluir para aprovar a ação.

Personalização e acessibilidade

Uma tecla de atalho e uma cor são alocadas automaticamente para o campo recém-criado. Você pode usá-las para melhor visibilidade e navegação mais rápida em sua taxonomia. Personalize-as clicando na tecla de atalho ou no campo do código de cores.

Um campo personalizado com cor e tecla de atalho pode instruir a Estação de Validação e o Gerenciador de Modelos a usar a cor atribuída ao exibir o campo e a usar a tecla de atalho atribuída como um atalho para fornecer valores aos campos. Acesse Estação de validação para obter mais informações sobre como usar os atalhos de campo para atribuir valores a um campo.

Para atribuir uma cor e uma tecla de atalho para um campo, selecione o campo e escolha um código de cor específico no campo Cor e, em seguida, selecione uma tecla de atalho específica no menu Tecla de atalho.

Navegue pelo Gerenciador de Taxonomia usando os atalhos de teclado. Selecione Mostrar atalhos de teclado disponíveis e ative a opção Alternar atalhos de teclado para evitar o disparo acidental dos atalhos de teclado. Os nós também podem ser recolhidos.

Observação: as alterações feitas no Gerenciador de Taxonomia são salvas automaticamente no arquivo taxonomy.json específico para seu projeto.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.