Atividades: extrair dados de documento

activities

latest

false

Atividades do Document Understanding

Importante :

A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Extract Document Data

Extrair dados de um arquivo de documento ou objeto de dados de documento e armazenar os resultados em um objeto de dados de documento usando a atividade Extract Document Data.

UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>

Description

Extrai dados de um arquivo de entrada ou objeto de dados de documento e armazena os resultados em um objeto de dados de documento.

Antes de começar

Pré-requisitos

A atividade Extract Document Data requer objetos de entrada do tipo Dados do documento ou Arquivo. Um possível caso de uso para usar essa atividade é precedê-la com uma atividade Classificar Documento, que gera um objeto do tipo Dados do documento.

Opções de Entrada

A atividade Extract Document Data recebe como entrada uma das seguintes opções:

Dados do Documento - da atividade Classify Document
Arquivo - das atividades Get File/Folder ou Get Newest Email

Idiomas compatíveis com modelos generativos

Os idiomas compatíveis com os modelos generativos são os mesmos que o mecanismo de OCR usado, que depende do projeto. Para os projetos predefinidos e predefinidos generativos , o mecanismo de OCR usado é o UiPath Document OCR. Para obter mais informações, acesse a página Idiomas compatíveis com OCR .

Modelos usados pela atividade

A atividade Extract Document Data usa o seguinte:

Modelos especializados pré-treinados disponíveis para uso com base no Helix Extractor.
Modelos personalizados implantados em projetos modernos e clássicos do Document Understanding.
Modelos de extração generativos.

Restrições conhecidas

O tipo de projeto predefinido generativo e os extratores correspondentes não estão disponíveis no Automation Suite.

Ao usar a atividade Extrair dados de documento, os campos de classificação são compatíveis para extratores de projetos modernos e modelos prontos para uso, mas não para extratores de projetos clássicos.

Fornecer DocumentData com subdocumentos para a atividade Extract Document Data disparará um erro de runtime. Esse comportamento é por design. Para extrair dados de um documento dividido, itere sobre cada subdocumento.

Compatibilidade do projeto

Windows | Multiplataforma

Configuração

Painel do Designer

Entrada - Requer que você especifique o próprio arquivo ou dados do documento, caso você tenha usado outras atividades do Document Understanding antes em seu fluxo de trabalho, (por exemplo, Classify Document).

Importante:
O número máximo de páginas que um arquivo pode ter é 500. Os arquivos que excedem esse limite não são extraídos.
Projeto - Requer que você selecione seu projeto do Document Understanding na lista suspensa. As opções disponíveis são:
- Predefinido – Tipo de projeto clássico que usa modelos especializados pré-treinados recomendados para cenários padrão. Para obter mais informações sobre a lógica de carregamento para o projeto clássico, acesse Medição e lógica de carregamento.
- Predefinido generativo – Tipo de projeto moderno que usa modelos generativos pré-treinados que aceitam instruções como entrada para extração de dados de documentos. Para obter mais informações sobre a lógica de cobrança para projetos modernos, acesse Medição e lógica de cobrança.
- Idiomas não latinos predefinidos – Tipo de projeto moderno que usa modelos pré-treinados para cenários de processamento de documentos não latinos. Para obter mais informações sobre a lógica de cobrança para projetos modernos, acesse Medição e lógica de cobrança.
- Projetos existentes do tenant e da pasta aos quais você está conectado.
- Você pode criar um projeto personalizado acessando o Document Understanding. Para obter mais informações, acesse Introdução à criação de modelos.
  Observação:
  Se você tiver criado mais de 500 projetos em seu tenant e usar a atividade Extract Document Data, o UiPath Studio ou Studio Web não exibirá nenhum projeto além dos 500 iniciais. Portanto, esses projetos não podem ser usados.
Extrator – Depois de selecionar um projeto, você também pode selecionar um extrator que deseja usar.
- Para o projeto Predefinido , você tem duas escolhas: - Selecionar um modelo pré-treinado. Acesse Modelos prontos para uso para obter uma lista de modelos pré-treinados que você pode usar.
  Observação:
  A atividade Extract Document Data extrai as informações para os campos disponíveis no tipo de documento para o extrator selecionado (independentemente do tipo real do documento). Isso não se aplica a modelos generativos.
  - Selecione o extrator Generativo.
    Observação:
    As informações enviadas para o Extrator generativo vão para uma instância do Modelo LLM. Essa instância não está publicamente disponível, não armazena os dados enviados e não os usa para fins de treinamento.
- Para o projeto predefinido generativo, você tem três opções para a extração, personalizadas para um layout de documento específico:
  - Extrator de layout simples de documentos longos – Recomendado para documentos de formato longo com principalmente texto e cabeçalhos. Por exemplo, você pode usar o Extrator de layout simples de documentos longos em documentos como contratos de locação, contratos de serviços principais ou outros documentos semelhantes.
  - Extrator de layout complexo de documentos longos (Pré-visualização) – Recomendado para documentos de formato longo que incluem elementos como imagens, escrita à mão, controles de formulário, caixas de texto flutuantes ou outros tipos de layout complexos. Por exemplo, você pode usar o Extrator de layout de complexo de documentos longos em documentos como apólices de seguro ou outros documentos semelhantes.
  - Extrator de layout complexo de documentos curtos (Pré-visualização) – Recomendado para documentos curtos que incluem elementos como imagens, escrita à mão, controle de formulários, caixas de texto flutuantes ou outros tipos de layout complexos. Por exemplo, você pode usar o Extrator de layout complexo de documentos curtos em documentos como IDs do governo, formulários de entrada de serviços de saúde ou outros documentos semelhantes.
- Para o projeto Idiomas não latinos predefinidos , você tem três opções para a extração, personalizadas para um layout específico de documento não latino:
  - Faturas do Japão – Recomendado para documentos de fatura do Japão. O extrator pode lidar com layouts de faturas japonesas comuns e pode identificar e extrair campos-chave de faturas, como informações do fornecedor, número da fatura e moeda.
  - Faturas China - Recomendado para documentos de fatura chinês. O extrator pode lidar com layouts de faturas chinesas comuns e pode identificar e extrair campos-chave de faturas, como informações do fornecedor, número da fatura e moeda.
  - Recibos Japão - Recomendado para documentos de recibo japoneses. Você pode usar o extrator para identificar e extrair campos como nome do comerciante, data da transação, valor total, impostos e moeda de recibos no idioma japonês.
- Usar resultado de classificação: se a propriedade Gerar tipo de dados estiver definida como falsa, você pode optar pela opção Usar resultado de classificação . Esta opção usa automaticamente um extrator recomendado com base no tipo de documento resultante da atividade Classify Document . Se vários extratores puderem trabalhar com aquele tipo de documento, a atividade retornará um erro. Neste cenário, você deve selecionar manualmente seu extrator preferido.
Detalhes do tipo de documento - Este campo aparece se você escolher a opção Generativo. Solicitação para identificar os campos a serem extraídos, fornecidos como pares de valor-chave, em que a chave representa o nome do campo e o valor, uma descrição para ele, ajudando o extrator a identificar o valor correspondente. Selecione o campo e você receberá um prompt com as seguintes opções, fornecidas em pares:
- Nome do campo - Requer que você insira o nome do campo a ser extraído (Ex. Data de vencimento) (limite de 30 caracteres)
- Instrução – Exige que você forneça instruções sobre quais informações devem ser extraídas para o campo correspondente. O número máximo de caracteres permitidos é 1000. A resposta, resultado da extração, também chamada de Conclusão, tem um limite de 700 palavras. O número é de até 700 palavras. Isso significa que você não pode extrair mais de 700 palavras de um único prompt. Se os requisitos de extração forem superiores a esse limite, você poderá dividir o documento em várias páginas, processá-las individualmente e, então, mesclar os resultados.
  Dica:
  Para obter boas práticas sobre como usar prompts generativos, consulte a página Extrator generativo – Boas práticas .
Versão – Use essa propriedade ao usar um projeto moderno do Document Understanding existente. Selecione o nome da versão ou a tag que corresponde à versão do projeto da qual você quer processar dados. Por exemplo, se você escolher a tag de Produção atribuída à Versão 3, a atividade processa dados da versão 3 do seu projeto no ambiente de produção. Você também pode escolher uma versão específica no menu suspenso se não quiser usar as tags de preparação e produção. Para obter mais informações sobre versões, acesse Modelos de publicação.
Tipo de documento – Quando você escolhe uma tag no campo Versão , a atividade seleciona automaticamente o primeiro tipo de documento publicado da versão relevante do seu projeto escolhido. Além disso, a atividade mostra os campos de extração relacionados ao tipo de documento escolhido.
Use Solution Resource - Enable this toggle to select an IXP model as a solution resource. This option is available only when your workflow is part of a solution. The selected IXP model is added to the solution, appears in the Resource Explorer in Studio Web, and is packaged and deployed together with the rest of the solution's resources.
- IXP Model - Select the IXP model that you want to use for data extraction. This field appears only when you enable the Use Solution Resource toggle.

Painel de Propriedades

Entrada

Tempo limite (segundos) – Tempo máximo de execução (em segundos) para a chamada para o modelo generativo. Se a operação exceder esse tempo limite, ela será encerrada automaticamente para evitar atrasos ou travamentos. Essa propriedade é exibida apenas se o Extrator generativo estiver selecionado como um extrator.
Validação automática – Use essa opção para habilitar a validação automática, um recurso que ajuda a validar os resultados obtidos para extração de dados em relação a um modelo Generativo. O valor padrão do campo de Validação automática é False.
- Limite de confiança - Esse campo fica visível assim que você habilita a Validação automática. Os resultados da extração que ficam abaixo do limite são comparados ao modelo de extração generativo. Se corresponderem, o sistema ajustará a confiança da extração para atender ao valor limite. Os possíveis valores limite variam de 0 a 100. Se o valor for definido como 0, nenhuma validação será aplicada. No entanto, se você definir um valor específico (de 0 a 100), o sistema verificará todos os resultados da extração abaixo desse valor. Por exemplo, se você definir um limite de confiança de 80%, o sistema aplicará a validação generativa para campos com confiança abaixo de 80%.
  Observação:
  A validação automática está disponível apenas para modelos de extração especializados.
Generate Data Type - If set to True, indicates that the output should be generated based on the selected extractor, resulting in an IDocumentData<ExtractorType> object. Alternatively, if set to False, indicates that the data generation should be skipped, resulting in a generic IDocumentData<DictionaryData> object. When set to False, you can consume the results either through the Get/Set methods or through the strongly-typed ExtractionResultHandler navigator, available on the output as DocumentData.Data.Handler. Visit Document Data for additional details and limitations available for the two object types.

Saída

Document Data - All the extracted field data from the file. Information can also be received from Classify Document. To learn how Document Data works and how to consume the extracted results for single and multi-value fields, visit Document data. When Generate Data Type is off, the DictionaryData output can also be navigated and edited with the strongly-typed ExtractionResultHandler navigator, via DocumentData.Data.Handler.

Quando você usa projetos de Documentos não estruturados do IXP com a atividade Extract Document Data , o objeto de saída Dados do documento é compatível com o seguinte:
- Os resultados são relatados como Grupos de campos em vez de Tabelas.
- Os campos retornam os tipos de campos específicos definidos no projeto, incluindo Quantidade Monetária.
- As tarefas de Validação de Documento exibem resultados como Grupos de Campo em vez de Tabelas.
Qualquer lógica de processamento subsequente ou manipulação de dados que dependa dessa saída deve considerar os valores do Grupo de Campos . Para obter a lista completa de tipos de campos compatíveis, consulte CampoTipo Enum.

Conexão externa

Ativo de credenciais - O caminho do ativo de credenciais do Orchestrator usado para autenticar no tenant do Document Understanding. A entrada deve usar o formato <orchestratorFolder>/<assetName>.
URL do tenant - O URL do tenant usado para autenticação no serviço do Document Understanding. A entrada deve usar o formato https://<base_url>/<organization>/<tenant>.

Observação:

Você deve configurar o ativo de credenciais com Escopo de Acesso → Automações e API. A autenticação para um tenant ou organização diferente só funciona em ambientes que são compatíveis com essa configuração de ativo de credenciais.

Modelos suportados

Os extratores generativos disponíveis no projeto Predefinido generativo podem ser usados para os documentos descritos na tabela a seguir:

Observação:

Os extratores de Layout complexo de documentos longos e Layout complexo de documentos curtos não estão atualmente disponíveis no Automation Cloud^TM para ambientes do Setor Público (FedRamp).

Tabela 1. Cenários suportados para extratores generativos

Extrator	Cenário recomendado	Provedor	Disponibilidade de regiões	Suporte multimodal¹
Extrator de Layout Simples para Documento Longo	Recomendado para documentos de formato longo com principalmente texto e cabeçalhos. Por exemplo, você pode usar o Extrator de layout simples de documentos longos em documentos como contratos de locação, acordos de serviço principais ou outros documentos similares.	Azure OpenAI	Austrália, União Europeia, Índia, Japão, Singapura, Reino Unido, Estados Unidos, Canadá	❌
Extrator de Layout Complexo de Documento Longo (Visualização)	Recomendado para documentos de formato longo com layouts complexos, como imagens, texto manuscrito, elementos de formulário ou layouts distintos, como caixas de chamada flutuantes. Você pode usar esse extrator em documentos de formato longo, como apólices de seguro, que geralmente têm layouts complexos.	Azure OpenAI	Estados Unidos, União Europeia, Japão, Cingapura	✅
Extrator de Layout Complexo de Documento Curto (Visualização)	Recomendado para documentos mais curtos (de máximo de 20 páginas) com imagens, texto manuscrito, elementos de formulário ou layouts complexos, como caixas de chamada flutuantes. Você pode usar esse extrator em documentos como identificações do governo ou formulários de atendimento de saúde que normalmente têm layouts mais curtos, mas mais complexos.	Azure OpenAI	Estados Unidos, União Europeia, Japão, Cingapura	✅

¹ O suporte multimodal refere-se à capacidade de extrair diferentes tipos de entradas de dados, como texto, imagens, texto escrito à mão etc.

Usando o extrator generativo

Para começar rapidamente com os recursos generativos da atividade Extract Document Data, execute as seguintes etapas:

Adicione uma atividade Extract Document Data .
Na lista suspensa Projeto, selecione Predefinido generativo.
Para o Extrator, selecione um dos seguintes extratores: Extrator de layout simples de documentos longos, Extrator de layout complexo de documentos longos, ou Extrator de layout complexo de documentos curtos. A propriedade Detalhes do tipo de documento aparece no corpo da atividade.
Para o dicionário, forneça suas instruções como pares de chave-valor do dicionário, onde:
- Nome do campo representa o nome do campo que você deseja extrair do documento. Por exemplo, email address.
- A instrução representa a instrução sobre quais informações você deseja fornecer ao extrator para extrair o campo. É a descrição usada pelo extrator generativo para identificar o valor correspondente. Por exemplo, verifique a tabela a seguir para obter uma amostra de pares de chave-valor:
  
  Tabela 2. Exemplos de pares de chave-valor para o prompt do extrator generativo
  
  Nome do campo Instrução
  Name "Qual é o nome do candidato?"
  Trabalho Atual "Qual é o trabalho atual do candidato?"
  Empregador "Qual é o empregador atual do candidato?"
  
  Figura 1. Detalhes de pares de chave-valor do extrator generativo

Nome do campo	Instrução
Name	"Qual é o nome do candidato?"
Trabalho Atual	"Qual é o trabalho atual do candidato?"
Empregador	"Qual é o empregador atual do candidato?"

Esta página foi útil?

AnteriorExtract PDF Page Range

AvançarCriar tarefa de validação e aguardar

Description​

Antes de começar​

Pré-requisitos​

Opções de Entrada​

Idiomas compatíveis com modelos generativos​

Modelos usados pela atividade​

Restrições conhecidas​

Compatibilidade do projeto​

Configuração​

Painel do Designer​

Painel de Propriedades​

Entrada​

Saída​

Conexão externa​

Modelos suportados​

Usando o extrator generativo​