activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Atividades de Document Understanding

Última atualização 3 de mar de 2025

PREVIEW
Extract Document Data -Visualização

UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>

Description

Extrai dados de um arquivo de entrada ou objeto de dados de documento e armazena os resultados em um objeto de dados de documento.

Restrições conhecidas

O tipo de projeto predefinido generativo e os extratores correspondentes não estão disponíveis no Automation Suite.

Compatibilidade do projeto

Windows | Multiplataforma

Configuração

Painel do Designer
  • Entrada - Requer que você especifique o próprio arquivo ou dados do documento, caso você tenha usado outras atividades do Document Understanding antes em seu fluxo de trabalho, (por exemplo, Classify Document).
    Importante: o número máximo de páginas que um arquivo pode ter é 500. Os arquivos que excedem esse limite não são extraídos.
  • Projeto - Requer que você selecione seu projeto do Document Understanding na lista suspensa. As opções disponíveis são:
    • Predefinido – Tipo de projeto clássico que usa modelos especializados pré-treinados recomendados para cenários padrão.
    • Predefinido generativo – Tipo de projeto moderno que usa modelos generativos pré-treinados que aceitam instruções como entrada para extração de dados de documentos.
    • Projetos existentes do tenant e da pasta aos quais você está conectado.
    • Você pode criar um projeto personalizado acessando o Document Understanding.

      Para obter mais informações, acesse Introdução à criação de modelos.

    Observação: se você tiver criado mais de 500 projetos em seu tenant e usar a atividade Extract Document Data, o UiPath Studio ou Studio Web não exibirá nenhum projeto além dos 500 iniciais.Portanto, esses projetos não podem ser usados.
  • Extrator – Depois de selecionar um projeto, você também pode selecionar um extrator que deseja usar.
    • Para o projeto predefinido, você pode selecionar um modelo pré-treinado. Acesse Modelos prontos para uso para obter uma lista de modelos pré-treinados que você pode usar.
      Observação: a atividade Extract Document Data extrai as informações para os campos disponíveis no tipo de documento para o extrator selecionado (independentemente do tipo de documento). Isso não se aplica a modelos generativos.
    • Para o projeto predefinido generativo, você tem três opções para a extração, personalizadas para um layout de documento específico:
      • Extrator de layout simples de documentos longos – Recomendado para documentos de formato longo com principalmente texto e cabeçalhos. Por exemplo, você pode usar o Extrator de layout simples de documentos longos em documentos como contratos de locação, contratos de serviços principais ou outros documentos semelhantes.
      • Extrator de layout complexo de documentos longos – Recomendado para documentos de formato longo que incluem elementos como imagens, escrita à mão, controles de formulário, caixas de texto flutuantes ou outros tipos de layout complexos. Por exemplo, você pode usar o Extrator de layout de complexo de documentos longos em documentos como apólices de seguro ou outros documentos semelhantes.
      • Extrator de layout complexo de documentos curtos – Recomendado para documentos curtos que incluem elementos como imagens, escrita à mão, controle de formulários, caixas de texto flutuantes ou outros tipos de layout complexos. Por exemplo, você pode usar o Extrator de layout complexo de documentos curtos em documentos como IDs do governo, formulários de entrada de serviços de saúde ou outros documentos semelhantes.
  • Detalhes do tipo de documento - Este campo aparece se você escolher a opção Generativo. Solicitação para identificar os campos a serem extraídos, fornecidos como pares de valor-chave, em que a chave representa o nome do campo e o valor, uma descrição para ele, ajudando o extrator a identificar o valor correspondente. Selecione o campo e você receberá um prompt com as seguintes opções, fornecidas em pares:
    • Nome do campo - Requer que você insira o nome do campo a ser extraído (Ex. Data de vencimento) (Limite de 30 caracteres)
    • InstruçãoExige que você forneça instruções sobre quais informações devem ser extraídas para o campo correspondente. O número máximo de caracteres permitidos é 1000. A resposta, resultado da extração, também chamada de Conclusão, tem um limite de 700 palavras. O número é de até 700 palavras. Isso significa que você não pode extrair mais de 700 palavras de um único prompt. Se os requisitos de extração forem superiores a esse limite, você poderá dividir o documento em várias páginas, processá-las individualmente e, então, mesclar os resultados.
    Dica: para obter boas práticas sobre como usar solicitações generativas, consulte a página Extrator generativo - Boas práticas .
  • Versão ou tag – Use essa propriedade ao usar um projeto moderno existente no Document Understanding. Selecione a tag que corresponde à versão do projeto da qual você quer processar dados. Por exemplo, se você escolher a tag de Produção atribuída à Versão 3, a atividade processa dados da versão 3 do seu projeto no ambiente de produção.

    O valor padrão para Versão é Staging. Se a tag Staging não existir em seu projeto selecionado, o valor padrão é Production.

    Para obter mais informações sobre versões, acesse Modelos de publicação.

  • Tipo de documento – Ao escolher uma tag no campo Versão, a atividade seleciona automaticamente o primeiro tipo de documento implantado da versão relevante do projeto selecionado. Além disso, a atividade mostra os campos de extração relacionados ao tipo de documento escolhido.
Painel de Propriedades

Entrada

  • Tempo limite (segundos) – Tempo máximo de execução (em segundos) para a chamada para o modelo generativo. Se a operação exceder esse tempo limite, ela será encerrada automaticamente para evitar atrasos ou travamentos. Essa propriedade será exibida apenas se um dos seguintes extratores estiver selecionado: Extrator de layout simples de documentos longos, Extrator de layout complexo de documentos longos ou Extrator de layout complexo de documentos curtos.
  • Validação automática — use esta opção para habilitar a validação automática, um recurso que ajuda a validar os resultados obtidos para a extração de dados em relação a um modelo generativo. O valor padrão do campo Validação automática é False.
    • Limite de confiança — esse campo fica visível assim que você habilita a Validação automática. Os resultados da extração que ficam abaixo do limite são comparados ao modelo de extração generativo. Se corresponderem, o sistema ajustará a confiança da extração para atender ao valor limite. Os possíveis valores de limite variam de 0 a 100.

      Se o valor for definido como 0, nenhuma validação é aplicada. No entanto, se você definir um valor específico (de 0 a 100), o sistema verificará todos os resultados de extração abaixo desse valor. Por exemplo, se você definir um limite de confiança de 80%, o sistema aplicará a validação generativa para campos com confiança abaixo de 80%.

      Observação: a validação automática está disponível apenas para modelos de extração especializados.
  • Gerar Tipo de Dados - Se definido como True, indica que a saída deve ser gerada com base no extrator selecionado, resultando em um objeto IDocumentData<ExtractorType>.Ou então, se definido como False, indica que a geração de dados deve ser ignorada, resultando em um objeto IDocumentData<DictionaryData> genérico.

    Acesse Dados do documento para obter detalhes adicionais e limitações disponíveis para os dois tipos de objeto.

Saída
  • Dados do documento - Todos os dados de campo extraídos do arquivo. Informações também podem ser recebidas de Classify Document.

    Acesse Dados do documento para saber como os Dados do documento funcionam e como consumir os resultados extraídos para campos de valor único e múltiplo.

Usando os extratores generativos – Visualização

Para começar rapidamente com os recursos generativos da atividade Extract Document Data, execute as seguintes etapas:

  1. Adicione uma atividade Extract Document Data .
  2. Na lista suspensa Projeto, selecione Predefinido generativo.
  3. Para o Extrator, selecione um dos seguintes extratores: Extrator de layout simples de documentos longos, Extrator de layout complexo de documentos longos, ou Extrator de layout complexo de documentos curtos.

    A propriedade Detalhes do tipo de documento aparece no corpo da atividade.

  4. Para o dicionário, forneça suas instruções como pares de chave-valor do dicionário, onde:
    • Nome do campo representa o nome do campo que você deseja extrair do documento. Por exemplo, email address.
    • A instrução representa a instrução sobre quais informações você deseja fornecer ao extrator para extrair o campo. É a descrição usada pelo extrator generativo para identificar o valor correspondente.

      Por exemplo, verifique a tabela a seguir para obter uma amostra de pares de chave-valor:

    Tabela 1. Exemplos de pares de chave-valor para o prompt do extrator generativo
    Nome do campoInstrução
    Name"Qual é o nome do candidato?"
    Trabalho Atual"Qual é o trabalho atual do candidato?"
    Empregador"Qual é o empregador atual do candidato?"
    Figura 1. Detalhes dos pares de chave-valor para o extrator generativo

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White