UiPath Documentation
activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Atividades do Document Understanding

Última atualização 27 de abr de 2026

Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor

O exemplo abaixo explica como extrair dados de um formulário que também pode incluir texto manuscrito. O seguinte cenário de caso de uso explica como extrair dados de uma ordem de compra.

It presents activities such as Digitize Document, Data Extraction Scope, or Intelligent Form Extractor. You can find these activities in the UiPath.IntelligentOCR.Activities package.

Como criar o fluxo de trabalho

Os seguintes pacotes precisam ser instalados antes de criar o fluxo de trabalho abaixo:

  • UiPath.DocumentProcessing.Contracts.Activities
  • UiPath.IntelligentOCR.Activities
  • UiPath.OCR.Activities
  • UiPath.OCR.Contracts
  • UiPath.WebApi.Activities

Steps:

  1. Abra o Studio e crie um Processo.

  2. Adicione um contêiner Sequência no Designer de fluxo de trabalho, nomeie-o Sequence1 e crie as variáveis exibidas na tabela a seguir:

    Tabela 1. Variáveis a serem criadas

    Tipo de VariávelValor padrão
    itemStringN/A
    classificationResultClassificationResult[]N/A
    outputFileNameGenericValueN/A
  3. Adicione outro contêiner Sequência no Designer de fluxo de trabalho, após o primeiro, nomeie-o Sequence2 e crie as variáveis exibidas na tabela a seguir:

    Tabela 2. Variáveis a serem criadas

    Tipo de VariávelValor padrão
    textStringN/A
    taxonomyDocumentTaxonomyN/A
    domDocumentoN/A
    documentPathStringN/A
    classificationResult2ClassificationResult[]N/A
    outputFileName2GenericValueN/A
  4. Add a Message Box activity inside the sequence.

    • No painel Propriedades , selecione a opção Ok no menu suspenso Botões . Adicione a seguinte mensagem no campo Texto : "Selecione um arquivo PDF".
  5. Marque a caixa de seleção para a opção Superior. Isso traz a caixa de mensagens para o primeiro plano.

  6. Adicione uma atividade Selecionar Arquivo após a atividade Caixa de Mensagem.

    • In the Properties panel, add the following text in the Filter field: Pdf files (*.pdf)|*.pdf
    • Add the documentPath variable in the SelectedFile field.
  7. Adicione uma atividade Atribuir após a atividade Selecionar Arquivo.

    • Add the outputFileName2 variable in the To field.
    • Adicione a expressão ".temp/" + Path.GetFileName(documentPath) no campo Valor.
  8. Adicione uma atividade Deserialize JSON após a atividade Atribuir.

    • Add the expression File.ReadAllText("DocumentProcessing axonomy.json") in the JSON String field.
    • In the Properties panel, select the UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy option from the TypeArgument dropdown list.
    • Add the taxonomy variable in the JsonObject field.
  9. Adicione uma atividade Digitalizar documento após a atividade Deserialize JSON.

    • In the Properties panel, add the value 1 in the DegreeOfParallelism field.
    • Add the documentPath variable in the DocumentPath field.
    • Add the dom variable in the DocumentObjectModel field.
    • Add the text variable in the DocumentText field.
    • Adicione o motor UiPath® Document OCR dentro da atividade.
    • Add your API Key inside the ApiKey field.
    • Add the "https://du.uipath.com/ocr" expression in the Endpoint field.
  10. Adicione uma atividade Gravar Arquivo de Texto após a atividade Digitalizar Documento.

    • Add the JsonConvert.SerializeObject(dom) expression in the Text field.
    • Add the outputFileName2 + ".dom.json" expression in the FileName field.
  11. Adicione outra atividade Gravar arquivo de texto após a atividade Gravar arquivo de texto.

    • Add the text variable in the Text field.
    • Add the outputFileName2 + ".text.txt" expression in the FileName field.
  12. Arraste outro contêiner Sequência para o Designer do fluxo de trabalho, nomeie-o Sequence3 e crie as variáveis exibidas na tabela a seguir:

    Tabela 3. Variáveis a serem criadas

    Tipo de VariávelValor Padrão
    extractionResultExtractionResultN/A
    validatedResultsExtractionResultN/A
    doubleValidatedResultsExtractionResultN/A
    datasetConjuntoDeDadosN/A
    iInt32N/A
  13. Add a Data Extraction Scope activity inside the Sequence3.

    • In the Properties panel, add the dom variable in the DocumentObjectModel field.
    • Add the documentPath variable in the DocumentPath field.
    • Add the text variable in the DocumentText field.
    • Add the "All.Benchmarks.Invoice" expression in the DocumentTypeId field.
    • Add the taxonomy variable in the Taxonomy field.
    • Add the extractionResult variable in the ExtractionResults field.
  14. Add an Intelligent Form Extractor activity inside the Data Extraction Scope activity.

    • Add your API Key in the ApiKey field.
  15. Adicione uma atividade Gravar Arquivo de Texto após a atividade Escopo da Extração de Dados.

    • Add the JsonConvert.SerializeObject(extractionResult) expression in the Text field.
    • Add the outputFileName2 + ".results.json" expression in the FileName field.
  16. Adicione uma atividade Estação de validação presente após a atividade Gravar Arquivo de Texto.

    • Add the extractionResult variable in the AutomaticExtractionResults field.
    • Add the dom variable in the DocumentObjectModel field.
    • Add the documentPath variable in the DocumentPath field.
    • Add the text variable in the DocumentText field.
    • Add the taxonomy variable in the Taxonomy field.
    • Add the validatedResults variable in the ValidatedExtractionResults field.
  17. Adicione uma atividade Gravar Arquivo de Texto após a atividade Estação de validação presente.

    • Add the JsonConvert.SerializeObject(validatedResults) expression in the Text field.
    • Add the outputFileName2 + ".savedinVS.results.json" expression in the FileName field.
  18. Adicione outra atividade Gravar arquivo de texto após a atividade Gravar arquivo de texto.

    • Add the JsonConvert.SerializeObject(doubleValidatedResults) expression in the Text field.
    • Add the outputFileName2 + ".doubleSavedinVS.results.json" expression in the FileName field.
  19. Execute o processo. O processo de automação deve abrir a Estação de Validação, extrair os dados, validá-los e armazená-los na pasta Saída.

Acesse o link a seguir para baixar o exemplo em um formato ZIP : Exemplo.

Definindo sua taxonomia

Você criou seu fluxo de trabalho, definiu todas as variáveis e personalizou todas as atividades. Agora é hora de definir sua taxonomia. Acesse Carregar taxonomia para saber mais sobre a definição da sua própria taxonomia.

Crie sua taxonomia para poder extrair informações de uma fatura. Você deve estar focado em criar um tipo de documento de Fatura, com os campos exibidos na tabela a seguir:

Tabela 4. Campos de tipo de documento de fatura

Tipo de Campo
Nº da FaturaText
SubtotalNumber
Imposto sobre vendasNumber
TotalNumber

Figura 1. Visão geral da taxonomia concluída com os campos mencionados anteriormente

Visão geral da taxonomia concluída com os campos mencionados anteriormente

Criar seu modelo

Agora é hora de criar o modelo para o processo de extração. Acesse Carregar taxonomia para saber como criar um modelo.

Para esse exemplo, configure o modelo usando os seguintes valores:

  • Tipo de documento: fatura.
  • Nome do modelo: exemplo de fatura.
  • Documento de modelo: selecione o arquivo de destino.
  • Mecanismo de OCR: Microsoft OCR.
  • Idiomas: inglês.
  • Perfil: digitalização.
  • Escala: 1.

Figura 2. Exemplo de imagem animada mostrando a configuração do modelo

Exemplo de imagem animada mostrando a configuração do modelo

Definir âncoras no modelo

As âncoras são um recurso muito especial e útil para usar quando você precisa extrair informações precisas de um documento. Ao definir uma área de extração com uma âncora, você pode esperar uma alta precisão na extração de dados.

Uma vez definida a taxonomia e criado o modelo, você pode começar a configurar o modelo usando âncoras, o que significa que a área de extração é definida em uma caixa e as âncoras são usadas para definir a posição da caixa.

Verifique a lista a seguir para alguns ponteiros antes de começar a adicionar âncoras ao seu modelo:

  • A caixa âncora deve ser o maior possível (altura, largura) para cobrir qualquer tipo de número de fatura, fonte longa, curta, grande, etc.
  • Uma área de extração pode ter quantas âncoras forem necessárias, mas apenas uma definida como principal (a primeira).
  • Use âncoras formadas por várias palavras lado a lado.
  • A âncora principal deve estar o mais próximo possível da área de extração.
  • As posições da área de extração e da âncora principal são fixadas no template, mesmo quando aplicadas a documentos diferentes. A única coisa que pode variar é a distância entre a âncora principal e as secundárias.

Vamos continuar configurando o modelo e ver como você pode extrair dados usando uma âncora.

  1. Defina a área de extração:
    • Na área direita da Estação de Validação, selecione Modos de seleção.

    • Selecione Âncora.

    • Comece a selecionar a área desejada.

      Observação:

      A âncora principal deve conter duas ou três palavras para maior precisão e melhores resultados no processo de extração.

      Selecione várias palavras ao marcar uma âncora pressionando CTRL e selecionando as palavras desejadas.

  2. Defina a âncora principal:
    1. Enquanto ainda estiver no modo de seleção Âncora, selecione a área desejada como sua âncora principal.
    2. Selecione Extrair valor para o campo desejado.
  3. Defina as âncoras secundárias:
    1. Certifique-se de ainda estar no modo de seleção de Âncora e com as principais seleções de âncora ativadas.
    2. Selecione as novas áreas para as âncoras secundárias.
    3. Selecione Opções para o campo desejado e, em seguida, selecione Alterar valor extraído.

Repita o processo até terminar de definir todas as áreas de extração e adicionar todas as suas âncoras. Depois de concluído, salve o modelo.

Esta página foi útil?

Conectar

Precisa de ajuda? Suporte

Quer aprender? Academia UiPath

Tem perguntas? Fórum do UiPath

Fique por dentro das novidades