UiPath Documentation
document-understanding
2024.10
false
Importante :
A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Guia do usuário do Document Understanding.

Última atualização 6 de abr de 2026

Como extrair dados de formulários

Importante:

The aim of this page is to help first time users get familiar with Document UnderstandingTM.

For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.

This quickstart guides you through the steps required to extract information from W-9 forms using the Intelligent Form Extractor. The W-9 forms are used as an example, but the procedure is similar for other types of documents where the data is structured.

Começando do zero, estas são as etapas que precisam ser seguidas:

  1. Crie um processo em branco
  2. Instale os pacotes de atividades exigidos
  3. Crie uma taxonomia
  4. Digitalize o documento
  5. Extraia os dados usando o Intelligent Form Extractor
  6. Valide os resultados usando o Validation Station
  7. Exportar Resultados da Extração

1. Crie um processo em branco

Execute o UiPath Studio.

Na visualização backstage HOME, selecione Processo para criar um novo projeto.

A janela Novo processo em branco é exibida. Nesta janela, insira um nome para o novo projeto. Se desejar, você também pode adicionar uma descrição para classificar seus projetos com mais facilidade.

Selecione Criar. O novo projeto será aberto no Studio.

2. Instale os pacotes de atividades exigidos

No botão Gerenciar Pacotes na faixa de opções, além dos pacotes de atividades principais (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) que são adicionados ao projeto por padrão, instale o seguintes pacotes de atividades:

3. Crie uma taxonomia

Após os Pacotes estarem instalados, liste os campos necessários. Faremos a extração de dados para os seguintes campos:

  • 1_Name - Text
  • 2_BusinessName - Text
  • 3a_Individual - Boolean
  • 3b_CCorp - Boolean
  • 3c_SCorp - Boolean
  • 3d_Partnership - Boolean
  • 3e_TrustEstate - Boolean
  • 3f_LLC - Boolean
  • 3f_LLCTaxClassification - Boolean
  • 3g_Other - Boolean
  • 3g_OtherDetail - Boolean
  • 5_Address - Text
  • 6_CityStateZip - Text
  • 7_AcctNumber - Text
  • TIN_SSN - Text
  • TIN_ETN - Text
  • Certification_Signature - Boolean
  • Certification_SignatureDate - Date

Open Taxonomy Manager and create a group named Structured Documents, a category named Lending Forms, and a document type named W-9. Createlisted fields with user friendly names along with respective data types.

Captura de tela descrevendo o Gerenciador de Taxonomia.

4. Digitalize o documento

In the Main.xaml file, add a Load Taxonomy activity and create a variable for the taxonomy output.

Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.

Lembre-se de adicionar a Chave de API do Document Understanding na atividade UiPath Document OCR.

5. Extraia os dados usando o Intelligent Form Extractor

Adicione uma atividade de Data Extraction Scope e preencha as propriedades.

Drag and drop the Intelligent Form Extractor within it. The endpoint should be auto-populated with the Intelligent Form Extractor endpoint, namely https://du.uipath.com/svc/intelligentforms. Provide the Document Understanding API key.

Após fazer isso, para criar um novo modelo, selecione Gerenciar Modelos > Criar Modelo.Uma janela pop-up abre.

Em Tipo de documento, selecione o tipo de documento W-9 criado anteriormente.

Em Nome do documento, insira um nome para o seu modelo.

Em Documento de modelo (PDF nativo, se possível), anexe um documento de modelo onde você mapeará as posições do campo.

Under OCR Engine, select again the UiPath Document OCR. Just like before, the endpoint should be auto-populated, namely https://du.uipath.com/ocr, and you just need to provide the API Key.

Selecione Configurar para passar para a próxima etapa. A janela pop-up Gerenciador de Modelos é aberta.

Aqui, precisaremos selecionar as áreas onde queremos que o Intelligent Form Extractor pesquise nossos campos. Configure-os seguindo as etapas detalhadas aqui. Você também tem a opção de usar âncoras para seus campos. Mais informações sobre âncoras aqui.

O resultado deve ser parecido com:

Captura de tela descrevendo um formulário W-9 no Gerenciador de modelos.

Selecione Salvar. Nesta tela, você pode definir os campos manuscritos ou de assinatura, quando aplicável. Você também pode definir sinônimos para campos booleanos. Feche a janela após terminar.

Captura de tela descrevendo o Gerenciador de modelos.

O próximo passo é configurar o extrator, ou seja, fazer com que o Intelligent Form Extractor processe todos os documentos do tipo W-9.

Captura de tela descrevendo a Configuração de extratores.

6. Valide os resultados usando o Validation Station

To check the results through Validation Station, drag and drop the Present Validation Station activity and provide the input details.

Captura de tela descrevendo a atividade Validation Station.

7. Exporte os resultados da extração

To export the extraction results, validated or not, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.

Captura de tela descrevendo a atividade Export Extraction Results.

Baixe o exemplo

Download this sample project to execute the W-9 with Intelligent Form Extractor workflow using this link.

Esta página foi útil?

Conectar

Precisa de ajuda? Suporte

Quer aprender? Academia UiPath

Tem perguntas? Fórum do UiPath

Fique por dentro das novidades