document-understanding

2023.10

false

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Guia do usuário do Document Understanding.

ENTREGA:

Última atualização 6 de nov de 2025

Como extrair dados de formulários

Importante:

O objetivo dessa página é ajudar usuários iniciantes a se familiarizarem com o Document Understanding^TM.

Para implantações de produção escaláveis, recomendamos fortemente usar o Processo do Document Understanding disponível no UiPath® Studio na seção Modelos.

Este guia de início rápido orienta você pelas etapas necessárias para extrair informações de formulários W-9 usando o Intelligent Form Extractor. Os formulários W-9 são usados como exemplo, mas o procedimento é semelhante para outros tipos de documentos onde os dados estão estruturados.

Começando do zero, estas são as etapas que precisam ser seguidas:

Crie um processo em branco
Instale os pacotes de atividades exigidos
Crie uma taxonomia
Digitalize o documento
Extraia os dados usando o Intelligent Form Extractor
Valide os resultados usando o Validation Station
Exportar Resultados da Extração

1. Crie um processo em branco

Execute o UiPath Studio.

Na visualização backstage HOME, selecione Processo para criar um novo projeto.

A janela Novo processo em branco é exibida. Nesta janela, insira um nome para o novo projeto. Se desejar, você também pode adicionar uma descrição para classificar seus projetos com mais facilidade.

Selecione Criar. O novo projeto será aberto no Studio.

2. Instale os pacotes de atividades exigidos

No botão Gerenciar Pacotes na faixa de opções, além dos pacotes de atividades principais (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) que são adicionados ao projeto por padrão, instale o seguintes pacotes de atividades:

3. Crie uma taxonomia

Após os Pacotes estarem instalados, liste os campos necessários. Faremos a extração de dados para os seguintes campos:

1_Name - Text
2_BusinessName - Text
3a_Individual - Boolean
3b_CCorp - Boolean
3c_SCorp - Boolean
3d_Partnership - Boolean
3e_TrustEstate - Boolean
3f_LLC - Boolean
3f_LLCTaxClassification - Boolean
3g_Other - Boolean
3g_OtherDetail - Boolean
5_Address - Text
6_CityStateZip - Text
7_AcctNumber - Text
TIN_SSN - Text
TIN_ETN - Text
Certification_Signature - Boolean
Certification_SignatureDate - Date

Abra o Gerenciador de Taxonomia e crie um grupo chamado Documentos Semiestruturados, uma categoria chamada Formulários de empréstimo e um tipo de documento chamado W-9. Crie campos listados com nomes amigáveis com os respectivos tipos de dados.

4. Digitalize o documento

No arquivo Main.xaml, adicione uma atividade Carregar taxonomia e crie uma variável para a saída da taxonomia.

Adicione uma atividade Digitize Document com UiPath Document OCR. Forneça a propriedade de entrada Caminho do Documento e crie variáveis de saída para Texto do Documento e Modelo de Objeto do Documento.

Lembre-se de adicionar a Chave de API do Document Understanding na atividade UiPath Document OCR.

5. Extraia os dados usando o Intelligent Form Extractor

Adicione uma atividade de Data Extraction Scope e preencha as propriedades.

Arraste e solte o Intelligent Form Extractor dentro dele. O endpoint deve ser preenchido automaticamente com o endpoint Intelligent Form Extractor, ou seja, https://du.uipath.com/svc/intelligentforms. Forneça a chave da API do Document Understanding.

Após fazer isso, para criar um novo modelo, selecione Gerenciar Modelos > Criar Modelo.Uma janela pop-up abre.

Em Tipo de documento, selecione o tipo de documento W-9 criado anteriormente.

Em Nome do documento, insira um nome para o seu modelo.

Em Documento de modelo (PDF nativo, se possível), anexe um documento de modelo onde você mapeará as posições do campo.

Em Mecanismo de OCR, selecione novamente o UiPath Document OCR. Assim como antes, o endpoint deve ser preenchido automaticamente, ou seja, https://du.uipath.com/ocr, e você só precisa fornecer a chave de API.

Selecione Configurar para passar para a próxima etapa. A janela pop-up Gerenciador de modelos abre.

Aqui, precisaremos selecionar as áreas onde queremos que o Intelligent Form Extractor pesquise nossos campos. Configure-os seguindo as etapas detalhadas aqui. Você também tem a opção de usar âncoras para seus campos. Mais informações sobre âncoras aqui.

O resultado deve ser parecido com:

Selecione Salvar. Nesta tela, você pode definir os campos manuscritos ou de assinatura, quando aplicável. Você também pode definir sinônimos para campos booleanos. Feche a janela após terminar.

O próximo passo é configurar o extrator, ou seja, fazer com que o Intelligent Form Extractor processe todos os documentos do tipo W-9.

6. Valide os resultados usando o Validation Station

Para verificar os resultados através do Validation Station, arraste e solte a atividade Present Validation Station e forneça os detalhes de entrada.

7. Exporte os resultados da extração

Para exportar os resultados da extração, validados ou não, arraste e solte uma atividade Export Extraction Results para o final do seu fluxo de trabalho. Isso gera os resultados em um DataSet que contém várias tabelas que podem ser gravadas em um arquivo Excel ou usadas diretamente em um processo downstream.