UiPath Documentation
document-understanding
2.2510
true
Importante :
A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Guia do usuário do Document Understanding.

Última atualização 15 de abr de 2026

Visão geral de extração de dados

O que é Extração de Dados

Data Extraction is a component in the Document UnderstandingTM Framework that helps in identifying very specific information that you are interested in, from your document types.

As informações que podem ser direcionadas para Extração de Dados são definidas na Taxonomia do projeto, como a lista de campos para um determinado tipo de documento definido nele. Um campo que não aparece na taxonomia do seu projeto não pode ser configurado para extração automática de dados.

A etapa de extração de dados do framework do Document Understanding garante que os extratores configurados sejam requisitados na ordem correta, para a lista correta de campos, para o intervalo de páginas correto do arquivo que está sendo processado. Isso significa que se, em um mesmo arquivo, houver dois ou mais tipos de documentos identificados (para intervalos de páginas diferentes), é recomendável que a etapa de Extração de Dados seja executada várias vezes, uma vez para cada resultado de classificação. A execução da extração de dados para um resultado de classificação com um determinado intervalo de páginas garantirá que os dados sejam direcionados para extração apenas dessas páginas e apenas para esse tipo de documento.

Como usar o Componente de Extração de Dados

Data Extraction is done through the Data Extraction Scope activity. To extract data from documents, you can use one or more extractors, as the scope activity has the role of configuring and executing one or more algorithms for data extraction and of offering an easy, unitary configuration option for all your needs.

Resumindo, é isso que o Escopo de Extração de Dados faz:

  • Fornece a todos os extratores (algoritmos de extração) as configurações e entradas necessárias para sua execução.
  • Aceita um ou mais extratores.
  • Permite ativação ao nível de campo, mapeamento de taxonomia e configurações de limite mínimo de confiança no nível do extrator.
  • Relata os dados extraídos de maneira unificada, independentemente do extrator que relatou esses dados específicos.

O Escopo de Extração de Dados permite configurá-lo usando o assistente Configurar Extratores. Você pode personalizar:

  • quais campos são solicitados de cada extrator,
  • qual é o limite mínimo de confiança para um determinado extrator de pontos de dados por cada classificador,
  • qual é o mapeamento de taxonomia, ao nível de campo, entre a taxonomia do projeto e a taxonomia interna do extrator (se houver).

You can mix and match extractors, in a hybrid approach, in which you can request a few fields be extracted by a certain Extractor, while other fields are extracted by a different extractor.

Você pode até implementar regras de "retorno" para extração de dados: se um determinado Extractor não relatar um valor aceitável para um determinado campo, ative um extrator de backup.

É importante observar que a ordem dos extratores no Escopo de Extração de Dados é importante:

  • os extratores são executados com prioridade, da esquerda para a direita;
  • um valor extraído para um campo é aceito somente se tiver uma confiança igual ou superior ao limite mínimo de confiança definido para aquele extrator;
  • um extrator é executado apenas para o intervalo de páginas de classificação fornecido, e apenas para os campos que lhe são solicitados de acordo com a configuração do Escopo de Extração de Dados e os campos que ainda não obtiveram um resultado aceitável de extratores anteriores.
    Importante:

    If the Data Extraction Scope does not request any field from a given extractor, then that extractor is not executed. This may be the case of an extractor not configured for a certain incoming document type, or the case of an extractor being used as "fall-back" and the previous extractors reported all expected data already.

Extratores disponíveis

Com base nos requisitos do caso de uso, você pode escolher entre vários algoritmos de extração de dados, chamados de extratores.

You can use any extractor that is available in the UiPath.IntelligentOCR.Activities or UiPath.DocumentUnderstanding.ML.Activities package.

Os Extratores disponíveis são:

Você pode construir seu próprio Extrator utilizando os Contratos de Processamento de Documentos públicos, podendo assim implementar qualquer algoritmo que se adeque ao seu caso de uso.

  • O que é Extração de Dados
  • Como usar o Componente de Extração de Dados
  • Extratores disponíveis

Esta página foi útil?

Conectar

Precisa de ajuda? Suporte

Quer aprender? Academia UiPath

Tem perguntas? Fórum do UiPath

Fique por dentro das novidades