Atividades
Mais recente
falso
Imagem de fundo do banner
Atividades de Document Understanding
Última atualização 29 de abr de 2024

Extract Document Data

UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>

Extracts data from an input file or Document Data object, and stores the results into a Document Data object.

Observação:

A atividade Document Data requer uma atividade que a precede que pode fornecer um objeto de dados de documento (produzido como saída por outras atividades Document Understanding, por exemplo, Classify Document).

A atividade Extract Document Data recebe como entrada uma das seguintes opções:
  • Dados do Documento - da atividade Classify Document
  • Arquivo - das atividades Get File/Folder ou Get Newest Email

The supported languages for the generative models are the same as the OCR engine used, which depends on the project. For Predefined projects, the OCR Engine used is UiPath Document OCR. For more information, check the OCR Supported languages page.

Compatibilidade do projeto: Multiplataforma

Propriedades

  • Projeto - Requer que você selecione seu projeto do Document Understanding no menu suspenso. As opções disponíveis são:
    • Predefinido - O projeto padrão
    • Você pode criar um projeto personalizado acessando o Document Understanding.
  • Extrator - Requer que você selecione o extrator do projeto selecionado. Para o projeto predefinido, as opções disponíveis são:
    • Qualquer um dos pacotes de ML encontrados aqui
      Observação: a atividade Extract Document Data substitui o tipo de documento com o extrator selecionado. Isso não é aplicável para modelos generativos.
    • Generativo
  • Prompt - esse campo é exibido se você escolher a opção Generativo. Solicitação para identificar os campos a serem extraídos, fornecidos como pares de valor-chave, em que a chave representa o nome do campo e o valor, uma descrição para ele, ajudando o extrator a identificar o valor correspondente.Clique no campo e você receberá um prompt com as seguintes opções, fornecidas em pares:
    • Nome do campo - Requer que você insira o nome do campo a ser extraído (Ex. Data de vencimento) (Limite de 30 caracteres)
    • Prompt generativo - Requer que você forneça o prompt como entrada para o Extrator generativo. (Limite de 500 caracteres)
    Dica: para obter boas práticas sobre como usar solicitações generativas, consulte a página Extrator generativo - Boas práticas .
  • Entrada - Requer que você especifique o próprio arquivo ou dados do documento, caso você tenha usado outras atividades do Document Understanding antes em seu fluxo de trabalho, (por exemplo, Classify Document).

Entrada

  • Timeout (seconds) - Maximum execution time (in seconds) for the call to the generative model. If the operation exceeds this timeout, it is automatically terminated to prevent delays or hangs. This property is only displayed if the Generative Extractor is selected as an extractor.

Avançado

  • Auto-validation - Use this option to enable automatic validation, a capability that helps validate the results obtained for data extraction against a Generative model. The default value for the Auto-validation field is False.
  • Confidence threshold - This field becomes visible once you enable Auto-validation. Extraction results falling below the threshold are compared to the generative extraction model. If they match, the system adjusts the extraction confidence to meet the threshold value. Possible threshold values range from 0 to 100.

    If the value is set to 0, no validation is applied. However, if you set a specific value (from 0 to 100), the system checks all extraction results below this value. For example, if you set a confidence threshold of 80%, the system will apply the generative validation for fields with confidence below 80%.

    Note: Auto-validation is available only for specialized extraction models.
Saída
  • Document Data - All the extracted field data from the file. Information can also be received from Classify Document.

    Visit Document Data to learn how Document Data works and how to consume the extracted results for single and multi-value fields.

Observação: os dados enviados ao Extrator generativo serão enviados para uma instância de Modelo LLM que não está disponível publicamente, não a deixarão e, quando processados, não serão armazenados ou usados para treinamento.
Note: The Extract Document Data activity uses:
  • Public endpoints for out-of-the-box models.
  • Custom ML models deployed in Document Understanding App projects.
  • Generative extraction model.
.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.