Atividades
Mais recente
falso
Imagem de fundo do banner
Atividades de Document Understanding
Última atualização 10 de abril de 2024

Escopo da Extração de Dados

UiPath.IntelligentOCR.Activities.DataExtraction.DataExtractionScope

Fornece um escopo para as atividades do extrator, permitindo configurá-las de acordo com os tipos de documento definidos em sua taxonomia. A saída da atividade é armazenada em uma variável ExtractionResult , contendo todos os dados extraídos automaticamente e pode ser usada como entrada para a atividade Exportar resultados de extração . Esta atividade também apresenta um assistente Configurar extratores , que permite especificar exatamente quais campos dos tipos de documentos definidos na taxonomia você deseja extrair.

Propriedades

Comum
  • NomeDeExibição - o nome de exibição da atividade.
Entrada
  • ApplyGenerativeValidation (visualização) - Ajuste a confiança usando a verificação cruzada da extração generativa As confianças dos valores relatados que são confirmados pela IA generativa aumentará para 99%. Habilitar essa funcionalidade enquanto em visualização pública não causa nenhum consumo extra de AI Units. O consumo adicional pode ser aplicado assim que a funcionalidade estiver em disponibilidade geral. Siga nossas notas de versão para obter as informações mais recentes.
  • ClassificationResults - Os resultados da execução de uma atividade do classificador no documento especificado, armazenados em um objeto ClassificationResult . Este campo é opcional se você especificar um DocumentTypeId . Este campo suporta apenas ClassificationResult variáveis.
  • ModeloDeObjetoDeDocumento - O modelo de objeto do documento que você deseja usar para validar o documento. Este modelo é armazenado em uma variável Document e pode ser recuperado da atividade Digitize Document . Consulte a documentação da atividade para obter mais informações sobre como fazer isso. Este campo é compatível apenas com variáveis Document .
  • CaminhoDoDocumento — o caminho para o documento que você deseja validar. Esse campo é compatível apenas com strings e variáveis string.

    Nota: Os tipos de arquivo suportados para este campo de propriedade são .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmpe .pdf.
  • TextoDoDocumento — o texto do próprio documento, armazenado em uma variável String. Esse valor pode ser recuperado de uma atividade Digitize Document . Consulte a documentação da atividade para obter mais informações sobre como fazer isso. Esse campo é compatível apenas com strings e variáveis String.
  • DocumentTypeID - O ID do tipo de documento, conforme encontrado no Gerenciador de taxonomia. Este campo é opcional se você especificar um arquivo no campo ClassificationResults . Este campo suporta apenas strings e variáveis String.
  • FormatoValoresSePossíveis — especifica que se um valor tiver partes derivadas relatadas, ele não será substituído pelo escopo de extração de dados. Porém, se não tiver partes derivadas, o escopo de extração de dados tentará calculá-lo. Se a opção estiver definida como False , os valores não serão formatados.
  • GenerativeValidationConfidenceThreshold (Visualização) - Limite de confiança para validação generativa. Apenas valores de campo com confiança abaixo desse limite serão validados. Se os valores forem confirmados, a confiança deles será definida para este limite.
  • Taxonomia — a taxonomia contra a qual o documento será processado, armazenada em uma variável DocumentTaxonomy . Esse objeto pode ser obtido usando uma atividade Carregar taxonomia . Este campo é compatível apenas com variáveis DocumentTaxonomy .
Diversos
  • Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Saída
  • ResultadosDaExtração — os resultados da extração do processo de extração de dados, armazenados em uma variável ExtractionResult.
    Nota: Se o intervalo de páginas para extração de dados indicar que apenas uma parte do arquivo original é direcionada, o Escopo de extração de dados gera um arquivo na pasta do projeto TEMP que é passado para os extratores. O arquivo temporário contém apenas o intervalo de páginas que os extratores devem receber para o processamento do documento.

Usando o assistente de configuração do extrator

O Assistente para configurar extratores pode ser acessado por meio do Escopo de Extração de Dados e permite que você escolha quais extratores são aplicados para cada tipo de documento e campo.

No corpo da atividade, clique no botão Configurar extratores . O botão do assistente fica disponível depois de arrastar pelo menos uma atividade do extrator para o corpo da atividade Escopo de extração de dados . Este assistente exibe todos os tipos de documento definidos na taxonomia e seus respectivos campos, e permite escolher qual extrator deseja utilizar para cada um.



Cada tipo de documento pode ser expandido e seus campos podem ser visualizados no assistente e selecionados para extração.



O campo Framework Alias pode ser usado para mapear um extrator para um ou mais treinadores. Por exemplo, você pode dar a um Machine Learning Extractor o alias R2D2 e, em seguida, pode usar o mesmo alias para um Machine Learning Extractor Trainer. Isso cria um vínculo entre o extrator e o treinador e tem propósitos de treinamento para o extrator. Cada extrator tem um alias exclusivo, enquanto vários treinadores podem compartilhar o mesmo alias.

O campo Confiança Mínima pode ser configurado com um valor entre 0 e 100 e representa o limite de confiança acima do qual os dados extraídos são levados em consideração. Se um resultado de um campo selecionado tiver um nível de confiança abaixo do limite de confiança, ele não será relatado no resultado final.

O botão Obter ou atualizar recursos do extrator, para os extratores que suportam esta funcionalidade, pode ser usado para mapear facilmente seus campos de taxonomia com os campos extratores disponíveis ou atualizá-los caso os campos extratores tenham mudado.



As caixas de seleção ao lado de cada campo em qualquer coluna, se selecionadas, fazem com que o escopo do extrator de dados solicite esse campo específico do extrator. Se a caixa de seleção estiver desmarcada, o Data Extractor Scope não solicitará um valor para aquele campo do extrator.

As entradas de texto ao lado de cada campo permitem que você mapeie os campos definidos em sua taxonomia com os campos definidos na taxonomia interna do extrator, se houver. Para campos regulares, adicione na entrada de texto o identificador do campo de destino da taxonomia interna do extrator. Para campos de tabela, o campo da tabela pai é mapeado no nível da tabela, e as colunas correspondentes são mapeadas individualmente.

Observação: ao usar o Machine Learning Extractor em uma configuração com campos de coluna definidos, eles podem ser mapeados para um campo de tabela de sua taxonomia. Eles serão exibidos em uma coleção chamada itens.

O número de colunas no assistente varia de acordo com o número de extratores presentes na atividade do escopo. O nome de cada coluna é fornecido pelo nome de exibição de cada atividade do extrator.



Se vários extratores forem usados na atividade, a ordem dos extratores no escopo definirá sua prioridade. Por exemplo, na imagem acima, se o Extrator 1 retornar um valor aceitável (que está acima do nível de Confiança Mínima) para um determinado campo solicitado, esse campo não é solicitado quando o Extrator 2 e o Extrator 3 são executados. Se o Extrator 1 e o Extrator 2 retornarem valores abaixo do nível de Confiança Mínima para aquele campo específico, ou não retornarem nada, os resultados do Extrator 3 serão levados em consideração, se satisfizerem as condições de aceitabilidade de confiança.

Integração de Compreensão de Documentos

A atividade Data Extraction Scope faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.

  • Propriedades
  • Usando o assistente de configuração do extrator

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.