UiPath Documentation
document-understanding
latest
false
Importante :
A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Document Understanding classic user guide

Última atualização 23 de abr de 2026

Visão geral da taxonomia

O que é taxonomia

The Taxonomy is the metadata that the Document UnderstandingTM framework considers in each of its steps.

  • A Taxonomia é uma coleção de Tipos de Documentos.
  • Um Tipo de Documento é a definição de um tipo lógico de documento, que deve ser tratado por diferentes processos de negócios. Exemplos de Tipos de Documentos são faturas, registros médicos, formulários W-2 do IRS, contratos, etc. Um tipo de documento, além do nome, grupo e categoria (para facilitar o manuseio), geralmente contém uma coleção de Campos.
  • Um Campo é uma informação a qual se espera ser encontrada e capturada de um Tipo de Documento específico

Uma Taxonomia é uma estrutura hierárquica que contém o esquema das informações que a estrutura do Document Understanding usará ao longo do processo. Cada definição de entidade (para tipos de documento ou campos) encontrada na Taxonomia tem um ID exclusivo. exclusivo.

Como ela ajuda na classificação de documentos?

Se você deseja classificar os arquivos de entrada em diferentes tipos de documentos, a taxonomia deve conter especificamente os tipos de documentos que deseja utilizar. Isso permitirá que você configure seus processos do Document Understanding com base em um esquema de dados uniforme: a estrutura de sua taxonomia.

Como ela ajuda na extração de dados?

Se você deseja extrair dados de determinados tipos de documentos, a taxonomia conterá a lista de campos pretendida para extração automática de dados. Isso permitirá a configuração de vários métodos e regras de extração, novamente, com base em uma única fonte de esquema de dados verdadeiros: a estrutura do seu tipo de documento.

Tipos de campo e detalhes

Um Campo pode conter partes derivadas: informações formatadas extraídas ou editadas do valor textual subjacente encontrado em um documento.

Tipo de Campo

Permite valores múltiplos

Finalidade

Partes derivadas para formatação

Informações Adicionais

Número

Sim

Valores numéricos

  • Valor (até oito casas decimais)

N/A

MonetaryQuantity Sim Amount and currency values
  • Valor
  • Moeda
N/A

Data

Sim

Datas

  • Dia
  • Mês
  • Ano
Date fields allow for the definition of an Expected Format , which must be an MSDN-compliant date format string (for example, dd-MM-yyyy or MM, dd, yyyy ).

Esse formato é usado pela atividade Escopo da Extração de Dados ao tentar analisar uma data em suas partes de dia, mês e ano de constituição.

Name

Sim

Nomes de pessoas

  • Given Name
  • Nome do Meio
  • Sobrenome

N/A

Address

Sim

Endereços

  • Linha de Endereço 1
  • Linha de Endereço 2
  • Linha de Endereço 3
  • Cidade
  • Estado / Município / Província
  • País
  • CEP

N/A

DEFINIR

Sim

Definir uma lista de valores possíveis de um conjunto predefinido

N/A

Um campo Definir deve definir as opções permitidas como valores. Estes são refletidos no Validation Station.

Booleano

Sim

Valores Sim/Não

N/A

Um campo booleano aceita somente Sim ou Não como valores possíveis, e é refletido no Validation Station.

Tabela

Não

Dados tabulares

N/A

Um campo Tabela contém a definição das colunas.

Coluna de tabela

Não

Cada célula na tabela.

N/A

As Colunas de tabela em um campo Tabela são definidas como um dos campos regulares na lista Componentes.

Eles não podem ser do tipo Tabela.

FieldGroup Sim Organize related fields together. Child fields or a field group. Field groups enable the display of hierarchical field structures in Validation Station, allowing logical organization of extracted data. Groups can be single-value, multi-value, or mixed, consisting of fields, field groups, and tables. Field groups with no child fields are excluded from the taxonomy and extraction results sent to Action Center. Field group instances where all child field values are empty are also excluded from extraction results.

Exceções

You can define default Report as Exception reasons at the taxonomy level. These predefined reasons appear in Validation Station when a business user reports a document as an exception.

Isso permite que os usuários empresariais marquem documentos como exceções com base em motivos predefinidos (os motivos para exceções que são definidos no Gerenciador de Taxonomia).

Por exemplo, um usuário pode esperar uma fatura, mas receber um prontuário médico, esperar um documento em coreano, mas receber um em russo ou esperar um documento legível, mas receber um com qualidade muito ruim.

Os motivos que você define aparecem em uma lista suspensa a partir da qual o usuário pode selecionar a opção mais apropriada. Com base no motivo selecionado, a retomada da automação pode ser configurada para determinar qual caminho de processamento adotar em seguida.

Outras informações capturadas na taxonomia

A Taxonomia também contém a lista de grupos e categorias, além de uma coleção de idiomas suportados que podem ser associados aos documentos processados. Por exemplo, para processar documentos em japonês e inglês, a tag Idiomas Suportados deve conter seus respectivos nomes de exibição e código de idioma. Recomenda-se adicionar um Idioma Indeterminado (código und) para dar suporte a casos excepcionais.

Métodos de extensão da taxonomia

Serialize()

Ao ser requisitado em um objeto DocumentTaxonomy, o método Serialize() retorna uma representação JSON do objeto para poder ser armazenado e recuperado para uso posterior.

Deserialize(String)

A extensão estática DocumentTaxonomy.Deserialize(jsonString) retorna um objeto DocumentTaxonomy alimentado com os dados codificados em JSON passados como parâmetro.

GetFields(String)

Called on a DocumentTaxonomy object, the GetFields() method called with a DocumentTypeId string returns a list of fields defined within that document type.

Como criar e editar a taxonomia do seu projeto

Once the UiPath.IntelligentOCR.Activities package is installed in your project in UiPath® Studio, a Taxonomy Manager button appears in the main ribbon of Studio's Design tab. Use the Taxonomy Manager wizard to edit your project taxonomy.

A Taxonomia é armazenada em um arquivo dentro do seu projeto UiPath Studio, na pasta DocumentProcessing e no arquivo taxonomy.json.

The file is automatically created when you first open the Taxonomy Manager wizard. You can check the exact location of the file in the Taxonomy Manager, by hovering over the docs image button. Alternatively, each time you open the Taxonomy Manager, a pop-up message will appear in the upper right corner, informing you of the location of the file. When a project is published from Studio, the taxonomy will be published as well as an artifact of the project.

O arquivo taxonomy.json é exclusivo de cada projeto, mas pode ser reutilizado se for copiado manualmente para um novo projeto. Para isso, basta criar um projeto, acessar a pasta do projeto anterior e copiar o arquivo com a taxonomia de sua escolha para o local correto (na pasta DocumentProcessing).

Importante:

For data integrity purposes, we recommend you always edit the taxonomy using Taxonomy Manager.

Como usar sua taxonomia em seu projeto

A taxonomia para Document Understanding é obrigatória como um Object em todo o framework do Document Understanding.

The simplest and most convenient way to load your object is by using the Load Taxonomy activity. Once your taxonomy object is loaded, you can use it in all subsequent framework components requiring it.

Casos de uso avançados

  • Se você optar por armazenar sua taxonomia em um local diferente, ainda poderá carregá-la em seu projeto (após obter o conteúdo da string do arquivo de taxonomia, por exemplo, em uma variável myTaxonomyContentString), usando uma simples atividade Atribuir, como segue:

myTaxonomy = DocumentTaxonomy.Deserialize(myTaxonomyContentString)

  • Caso seja necessário, lembre-se que a Taxonomia é um POCO (classe de objeto antigo e simples) que, quando necessário, pode ser editado mesmo em execução.

Esta página foi útil?

Conectar

Precisa de ajuda? Suporte

Quer aprender? Academia UiPath

Tem perguntas? Fórum do UiPath

Fique por dentro das novidades