Atividades
Mais recente
falso
Imagem de fundo do banner
Atividades de Document Understanding
Última atualização 29 de abril de 2024

Extract Document Data

UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>

Extrai dados de um arquivo de entrada ou objeto de dados de documento e armazena os resultados em um objeto de dados de documento.

Observação:

A atividade Document Data requer uma atividade que a precede que pode fornecer um objeto de dados de documento (produzido como saída por outras atividades Document Understanding, por exemplo, Classify Document).

A atividade Extract Document Data recebe como entrada uma das seguintes opções:
  • Dados do Documento - da atividade Classify Document
  • Arquivo - das atividades Get File/Folder ou Get Newest Email

Os idiomas suportados para os modelos generativos são os mesmos que o mecanismo de OCR usado, que depende do projeto. Para projetos predefinidos , o mecanismo de OCR usado é o UiPath Document OCR. Para obter mais informações, consulte a página Idiomas suportados pelo OCR .

Compatibilidade do projeto: Multiplataforma

Propriedades

  • Projeto - Requer que você selecione seu projeto do Document Understanding no menu suspenso. As opções disponíveis são:
    • Predefinido - O projeto padrão
    • Você pode criar um projeto personalizado acessando o Document Understanding.
  • Extrator - Requer que você selecione o extrator do projeto selecionado. Para o projeto predefinido, as opções disponíveis são:
    • Qualquer um dos pacotes de ML encontrados aqui
      Observação: a atividade Extract Document Data substitui o tipo de documento com o extrator selecionado. Isso não é aplicável para modelos generativos.
    • Generativo
  • Prompt - esse campo é exibido se você escolher a opção Generativo. Solicitação para identificar os campos a serem extraídos, fornecidos como pares de valor-chave, em que a chave representa o nome do campo e o valor, uma descrição para ele, ajudando o extrator a identificar o valor correspondente.Clique no campo e você receberá um prompt com as seguintes opções, fornecidas em pares:
    • Nome do campo - Requer que você insira o nome do campo a ser extraído (Ex. Data de vencimento) (Limite de 30 caracteres)
    • Prompt generativo - Requer que você forneça o prompt como entrada para o Extrator generativo. (Limite de 500 caracteres)
    Dica: para obter boas práticas sobre como usar solicitações generativas, consulte a página Extrator generativo - Boas práticas .
  • Entrada - Requer que você especifique o próprio arquivo ou dados do documento, caso você tenha usado outras atividades do Document Understanding antes em seu fluxo de trabalho, (por exemplo, Classify Document).

Entrada

  • Tempo limite (segundos) - Tempo máximo de execução (em segundos) para a chamada para o modelo generativo. Se a operação exceder esse tempo limite, ela será encerrada automaticamente para evitar atrasos ou travamentos. Essa propriedade é exibida apenas se o Extrator generativo estiver selecionado como extrator.

Avançado

  • Validação automática — use esta opção para habilitar a validação automática, um recurso que ajuda a validar os resultados obtidos para a extração de dados em relação a um modelo generativo. O valor padrão do campo Validação automática é False.
  • Limite de confiança — esse campo fica visível assim que você habilita a Validação automática. Os resultados da extração que ficam abaixo do limite são comparados ao modelo de extração generativo. Se corresponderem, o sistema ajustará a confiança da extração para atender ao valor limite. Os possíveis valores de limite variam de 0 a 100.

    Se o valor for definido como 0, nenhuma validação é aplicada. No entanto, se você definir um valor específico (de 0 a 100), o sistema verificará todos os resultados de extração abaixo desse valor. Por exemplo, se você definir um limite de confiança de 80%, o sistema aplicará a validação generativa para campos com confiança abaixo de 80%.

    Observação: a validação automática está disponível apenas para modelos de extração especializados.
Saída
  • Dados do documento - Todos os dados de campo extraídos do arquivo. Informações também podem ser recebidas de Classify Document.

    Acesse Dados do documento para saber como os Dados do documento funcionam e como consumir os resultados extraídos para campos de valor único e múltiplo.

Observação: os dados enviados ao Extrator generativo serão enviados para uma instância de Modelo LLM que não está disponível publicamente, não a deixarão e, quando processados, não serão armazenados ou usados para treinamento.
Observação: a atividade Extract Document Data usa:
  • Endpoints públicos para modelos prontos para uso.
  • Modelos de ML personalizados implantados em projetos do aplicativo Document Understanding.
  • Modelo de extração generativo.
.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.