activities

latest

false

Atividades de Document Understanding

Última atualização 5 de dez de 2024

Escopo da Extração de Dados

UiPath.IntelligentOCR.Activities.DataExtraction.DataExtractionScope

Description

Fornece um escopo para as atividades do extrator, permitindo configurá-las de acordo com os tipos de documento definidos em sua taxonomia. A saída da atividade é armazenada em uma variável ExtractionResult , contendo todos os dados extraídos automaticamente e pode ser usada como entrada para a atividade Exportar resultados de extração . Esta atividade também apresenta um assistente Configurar extratores , que permite especificar exatamente quais campos dos tipos de documentos definidos na taxonomia você deseja extrair.

Compatibilidade do projeto

Windows - Legado | Windows

Configuração

Painel do Designer

Entrada

CaminhoDoDocumento — o caminho para o documento que você deseja validar. Esse campo é compatível apenas com strings e variáveis string.
Nota: Os tipos de arquivo suportados para este campo de propriedade são .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmpe .pdf.
TextoDoDocumento — o texto do próprio documento, armazenado em uma variável String. Esse valor pode ser recuperado de uma atividade Digitize Document. Acesse Digitize Document para obter mais informações sobre como conseguir isso. Esse campo é compatível apenas com strings e variáveis String.
ModeloDeObjetoDeDocumento — o modelo de objeto do documento que você deseja usar para validar o documento. Este modelo é armazenado em uma variável Document e pode ser recuperado da atividade Digitize Document. Acesse Digitize Document para obter mais informações sobre como conseguir isso. Este campo é compatível apenas com variáveis Document.
Taxonomia — a taxonomia contra a qual o documento será processado, armazenada em uma variável DocumentTaxonomy . Esse objeto pode ser obtido usando uma atividade Carregar taxonomia . Este campo é compatível apenas com variáveis DocumentTaxonomy .
ClassificationResults - Os resultados da execução de uma atividade do classificador no documento especificado, armazenados em um objeto ClassificationResult . Este campo é opcional se você especificar um DocumentTypeId . Este campo suporta apenas ClassificationResult variáveis.
IDdoTipoDeDocumento - O ID do tipo de documento, conforme encontrado no Gerenciador de taxonomia. Esse campo é opcional se você especificar um arquivo no campo ResultadosDaClassificação. Esse campo é compatível apenas com strings e variáveis String.

Saída

ResultadosDaExtração — os resultados da extração do processo de extração de dados, armazenados em uma variável ExtractionResult.
Nota: Se o intervalo de páginas para extração de dados indicar que apenas uma parte do arquivo original é direcionada, o Escopo de extração de dados gera um arquivo na pasta do projeto TEMP que é passado para os extratores. O arquivo temporário contém apenas o intervalo de páginas que os extratores devem receber para o processamento do documento.

Painel de Propriedades

Autenticação

As propriedades Autenticação dessa atividade permitem que você realize a autovalidação por meio de UiPath Robots no local. Antes de configurar essas propriedades, certifique-se de ter atendido aos pré-requisitos mencionados na página Configuração da autenticação. Depois que essas etapas forem concluídas, você pode prosseguir para preencher as propriedades Autenticação da atividade.

Ativo de credenciais de runtime - Use esse campo quando você precisar acessar funcionalidades de validação automática do Document Understanding enquanto o UiPath Robot é conectado a um Orchestrator local ou de um tenant diferente. Você pode optar por inserir um Ativo de credenciais, para fins de autenticação, de uma das seguintes maneiras:
- Na lista suspensa, selecione o Ativo de Credenciais desejado no Orchestrator ao qual o UiPath® Robot está conectado.
- Insira manualmente o caminho para o Ativo de credenciais do Orchestrator, onde você armazena as credenciais de aplicativos externos para acessar as funcionalidades de validação automática.
  O formato do caminho deve ser: <OrchestratorFolderName>/<AssetName>.
URL do tenant do runtime - Use esse campo, ao lado do campo Ativo de credenciais de runtime. Insira o URL do tenant ao qual o UiPath Robot se conectará para executar a validação automática. A URL deve estar no seguinte formato: https://<baseURL>/<OrganizationName>/<TenantName>.

Comum

NomeDeExibição - o nome de exibição da atividade.

Entrada

AplicarValidaçãoAutomática - Ajuste a confiança usando a verificação cruzada de extração generativa. As confianças para valores relatados que são confirmados por IA generativa serão aumentadas para 99%. A habilitação dessa funcionalidade tem consumo adicional de AI Unit.
Importante:
Essa funcionalidade faz parte atualmente de um processo de auditoria e não deve ser considerada parte da Autorização do FedRAMP até que a revisão seja finalizada. Veja aqui a lista completa das funcionalidades atualmente em revisão.
ClassificationResults - Os resultados da execução de uma atividade do classificador no documento especificado, armazenados em um objeto ClassificationResult . Este campo é opcional se você especificar um DocumentTypeId . Este campo suporta apenas ClassificationResult variáveis.
ModeloDeObjetoDeDocumento — o modelo de objeto do documento que você deseja usar para validar o documento. Este modelo é armazenado em uma variável Document e pode ser recuperado da atividade Digitize Document. Acesse Digitize Document para obter mais informações sobre como conseguir isso. Este campo é compatível apenas com variáveis Document.
CaminhoDoDocumento — o caminho para o documento que você deseja validar. Esse campo é compatível apenas com strings e variáveis string.
Nota: Os tipos de arquivo suportados para este campo de propriedade são .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmpe .pdf.
TextoDoDocumento — o texto do próprio documento, armazenado em uma variável String. Esse valor pode ser recuperado de uma atividade Digitize Document. Acesse Digitize Document para obter mais informações sobre como conseguir isso. Esse campo é compatível apenas com strings e variáveis String.
IDdoTipoDeDocumento - O ID do tipo de documento, conforme encontrado no Gerenciador de taxonomia. Esse campo é opcional se você especificar um arquivo no campo ResultadosDaClassificação. Esse campo é compatível apenas com strings e variáveis String.
FormatoValoresSePossíveis — especifica que se um valor tiver partes derivadas relatadas, ele não será substituído pelo escopo de extração de dados. Porém, se não tiver partes derivadas, o escopo de extração de dados tentará calculá-lo. Se a opção estiver definida como False , os valores não serão formatados.
AutoValidationConfidenceThreshold - Limite de confiança para validação generativa. Apenas valores de campo com confiança abaixo desse limite serão validados. Se os valores forem confirmados, a confiança deles será definida para este limite.
Importante:
Essa funcionalidade faz parte atualmente de um processo de auditoria e não deve ser considerada parte da Autorização do FedRAMP até que a revisão seja finalizada. Veja aqui a lista completa das funcionalidades atualmente em revisão.
Taxonomia — a taxonomia contra a qual o documento será processado, armazenada em uma variável DocumentTaxonomy . Esse objeto pode ser obtido usando uma atividade Carregar taxonomia . Este campo é compatível apenas com variáveis DocumentTaxonomy .

Diversos

Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.

Saída

ResultadosDaExtração — os resultados da extração do processo de extração de dados, armazenados em uma variável ExtractionResult.
Nota: Se o intervalo de páginas para extração de dados indicar que apenas uma parte do arquivo original é direcionada, o Escopo de extração de dados gera um arquivo na pasta do projeto TEMP que é passado para os extratores. O arquivo temporário contém apenas o intervalo de páginas que os extratores devem receber para o processamento do documento.

Usando o assistente de configuração do extrator

O Assistente para configurar extratores pode ser acessado por meio do Escopo de Extração de Dados e permite que você escolha quais extratores são aplicados para cada tipo de documento e campo.

No corpo da atividade, selecione Configurar extratores. O botão do assistente fica disponível depois de arrastar pelo menos uma atividade do extrator para o corpo da atividade Data Extraction Scope. Esse assistente exibe todos os tipos de documentos definidos na taxonomia e seus respectivos campos e permite que você escolha qual extrator você deseja usar para cada um.

Figura 1. Visão geral do assistente Configurar extratores

Cada tipo de documento pode ser expandido e seus campos podem ser visualizados no assistente e selecionados para extração.

Figura 2. A seleção de um extrator para um tipo de documento no assistente Configurar extratores

O campo Framework Alias pode ser usado para mapear um extrator para um ou mais treinadores. Por exemplo, você pode dar ao Machine Learning Extractor o alias R2D2 e, em seguida, usar o mesmo alias para um Machine Learning Extractor Trainer. Isso cria um vínculo entre o extrator e o treinador e tem propósitos de treinamento para o extrator. Cada extrator tem um alias exclusivo, enquanto vários treinadores podem compartilhar o mesmo alias.

Você pode configurar o campo Confiança mínima para permitir um limite de confiança entre 0 e 100. O valor previsto para um campo é considerado apenas se a pontuação de confiança da previsão for igual ou maior do que a confiança mínima configurada. Se a pontuação de confiança de uma previsão for menor do que o limite de confiança mínima, o valor previsto não será armazenado na saída da atividade Escopo de extração de dados.

Dica: você pode identificar um nível de confiança ideal testando vários documentos dentro do seu fluxo de trabalho, gravando os resultados em uma planilha do Excel, por exemplo, e, em seguida, analisar qual valor de limite é o mais preciso.

Selecione Obter de recursos de extrator de atualização, para os extratores que são compatíveis com essa funcionalidade, para mapear facilmente seus campos de taxonomia com os campos de extrator disponíveis ou atualizá-los caso os campos de extrator tenham sido alterados.

As caixas de seleção ao lado de cada campo em qualquer coluna, se selecionadas, fazem com que o Escopo do Extrator de dados solicite esse campo específico do extrator. Se a caixa de seleção estiver desmarcada, Escopo do Extrator de dados não solicitará um valor para esse campo do extrator.

As entradas de texto ao lado de cada campo permitem que você mapeie campos definidos em sua taxonomia com os campos definidos na taxonomia interna do extrator, se houver. Para campos regulares, adicione na entrada de texto o identificador para o campo de destino da taxonomia interna do extrator. Para campos de tabelas, o campo de tabela pai é mapeado no nível da tabela e as colunas correspondentes são mapeadas individualmente.

Observação: ao usar o Machine Learning Extractor em uma configuração com Campos de coluna definidos, eles podem ser mapeados para um campo de tabela da sua Taxonomia. Eles serão exibidos em uma coleção chamada itens.

O número de colunas no assistente varia de acordo com o número de extratores presentes na atividade do escopo. O nome de cada coluna é fornecido pelo nome de exibição de cada atividade do extrator.

Figura 3. Vários extratores presentes no assistente Configurar extratores

Se vários extratores forem usados na atividade, a ordem dos extratores no escopo definirá sua prioridade. Por exemplo, vamos considerar três extratores. O Extrator 1 retorna um valor aceitável (que está acima do nível de Confiança Mínima) para um campo solicitado específico e, em seguida, esse campo não é solicitado quando o Extrator 2 e o Extrator 3 são executados. Se o Extrator 1 e o Extrator 2 retornarem valores abaixo do nível de Confiança Mínima para aquele campo específico, ou não retornarem nada, os resultados do Extrator 3 serão levados em consideração, se satisfizerem as condições de aceitabilidade de confiança.

Integração de Compreensão de Documentos

A atividade Data Extraction Scope faz parte das Document Understanding Solutions. Visite o Guia do Document Understanding para obter mais informações.

Nesta página

Description
Compatibilidade do projeto
Configuração
Uso do Assistente de configurar extrator
Integração de Compreensão de Documentos

Esta página foi útil?

AnteriorIntelligent Keyword Classifier Trainer

AvançarDocument Understanding Project Extractor

Suporte e serviços

Obtenha a ajuda que você precisa

UiPath Academy

Aprendendo RPA - Cursos de automação

Fórum do UiPath

Fórum da comunidade da Uipath

Confiança e segurança

Termos de Uso

Política de Privacidade

Política de cookies