activities

latest

false

Importante :

A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Atividades de Document Understanding

Última atualização 3 de mar de 2025

Machine Learning Extractor Trainer

UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer

Description

Permite a coleta de dados que foram processados por meio da Estação de validação para que possam ser importados para o Document Manager. Esta atividade pode ser usada apenas dentro da atividade Train Extractors Scope.

Compatibilidade do projeto

Windows-Legacy | Windows

Configuração

Painel do Designer

Armazenamento local

Pasta de Saída - O diretório onde os dados coletados são armazenados. Depois que os dados são armazenados, eles podem ser importados para ferramentas de treinamento de aprendizado de máquina.

Selecionar conjunto de dados privado para projeto

Conjunto de dados - O conjunto de dados onde os dados de treinamento podem ser carregados. Se o robô estiver conectado a um inquilino que tenha o AI Center ativado, você poderá ver todos os conjuntos de dados do AI Center no menu suspenso e selecionar a pasta onde carregar os documentos validados usando o menu suspenso.
Projeto - O projeto onde os dados de treinamento podem ser carregados.
Observação: a seleção de projeto e conjunto de dados é habilitada apenas quando conectado ao Orchestrator. Acesse Gerenciamento de conjuntos de dados para obter mais informações sobre Conjuntos de dados públicos/privados.

Fornecer endpoint de conjunto de dados público

Dataset ApiKey - A chave de autenticação do conjunto de dados.
Ponto de extremidade do conjunto de dados - O ponto de extremidade do conjunto de dados no qual os dados de treinamento podem ser carregados. Depois que um conjunto de dados é público, ele pode ser acessado fora do ambiente da UiPath® por meio de um ponto de extremidade e usando a chave de API. Faça isso se você quiser carregar conjuntos de dados para uma instância do AI Center à qual você não esteja conectado (por exemplo, no caso de implantações híbridas nas quais o AI Center está na nuvem e o UiPath Robot está conectado a um tenant no local).

Painel de Propriedades

Comum

NomeDeExibição - o nome de exibição da atividade.

Armazenamento local

Pasta de Saída - O diretório onde os dados coletados são armazenados. Depois que os dados são armazenados, eles podem ser importados para ferramentas de treinamento de aprendizado de máquina.

Diversos

Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.

Fornecer endpoint de conjunto de dados público

Dataset ApiKey - A chave de autenticação do conjunto de dados.
Ponto de extremidade do conjunto de dados - O ponto de extremidade do conjunto de dados no qual os dados de treinamento podem ser carregados. Depois que um conjunto de dados é público, ele pode ser acessado fora do ambiente da UiPath® por meio de um ponto de extremidade e usando a chave de API. Faça isso se você quiser carregar conjuntos de dados para uma instância do AI Center à qual você não esteja conectado (por exemplo, no caso de implantações híbridas nas quais o AI Center está na nuvem e o UiPath Robot está conectado a um tenant no local).

Selecionar conjunto de dados privado para projeto

Conjunto de dados - O conjunto de dados onde os dados de treinamento podem ser carregados. Se o robô estiver conectado a um inquilino que tenha o AI Center ativado, você poderá ver todos os conjuntos de dados do AI Center no menu suspenso e selecionar a pasta onde carregar os documentos validados usando o menu suspenso.
Projeto - O projeto onde os dados de treinamento podem ser carregados.

Observação: a seleção de projeto e conjunto de dados é habilitada apenas quando conectado ao Orchestrator. Acesse Gerenciamento de conjuntos de dados para obter mais informações sobre Conjuntos de dados públicos/privados.

Servidor

TentarNovamenteEmCasoDeFalha — tentar novamente na falha temporária. Este campo só aceita valores boolianos (Rue, False). O valor padrão é True.
Tempo limite (milissegundos) — especifica o tempo (em milissegundos) a ser aguardado para que uma resposta do servidor seja executada antes de gerar um erro. O valor padrão é 100.000 milissegundos (100 segundos).

Usando o assistente de treinamento do extrator de aprendizado de máquina

O Machine Learning Extractor Trainer coleta o feedback humano para você, em um diretório de sua escolha. Depois de coletar dados e quiser treinar novamente um Modelo de ML, você pode simplesmente compactar o conteúdo do diretório e carregá-lo no Document Manager para coletar e filtrar dados.

Como usar

Para usar a atividade Machine Learning Extractor Trainer, execute as seguintes etapas:

Use o assistente do Gerenciador de Taxonomia para definir seus tipos de documento e campos.
Adicione um Machine Learning Extractor Trainer a uma atividade Train Extractors Scope.
No assistente Machine Learning Extractor que é aberto automaticamente, insira informações para o campo Ponto de extemidade. Você pode escolher um dos pontos de extremidade públicos. Acesse Pontos de extremidade públicos para obter mais informações sobre pontos de extremidade públicos.
Marque a caixa de seleção para Atualizar argumentos de atividade se você também deseja usar os valores inseridos como argumentos de entrada para a atividade, mais precisamente para o Ponto de extremidade.
Selecione Obter recursos.
O assistente fecha após essa operação
Insira um valor para Pasta de saída.
Selecione a opção Configurar Extratores no Train Extractors Scope.
Um assistente é exibido.

Figura 1. O assistente Configurar extratores
O Machine Learning Extractor Trainer agora está pronto para configuração. Expanda o tipo de documento para o qual você deseja aplicá-lo e comece a selecionar os campos que você deseja treinar, marcando as caixas de seleção ao lado dos campos apropriados.
Preencha as caixas de texto manualmente ou selecionando, na lista suspensa disponível, os dados corretos que você deseja mapear para cada campo. A lista suspensa contém todos os campos que o Machine Learning Extractor Trainer, usando o ponto de extremidade inserido no assistente do Machine Learning Extractor, declara como capacidade de extração.
Observação: se você selecionar a caixa de seleção, mas deixar a caixa de texto vazia, a última será preenchida automaticamente com o ID do tipo de documento da taxonomia local. As alterações se aplicam após salvar. Se você quiser evitar o uso de uma string longa para o ID do campo, recomendamos que você insira manualmente um valor caso não tenha acesso à taxonomia interna do extrator.
Para verificar se você está usando os recursos mais recentes do extrator, você pode selecionar Obter ou atualizar recursos do extrator, que abre o assistente do Machine Learning Extractor.
A seleção de uma das opções de uma lista suspensa confirma automaticamente esse campo.
Para treinar um extrator com base em seu resultado de extração, você pode definir o valor alfanumérico exato no campo Framework Alias usado anteriormente para um extrator.
Selecione Salvar uma vez que todos os campos forem configurados corretamente.
Importante: não é possível escolher a mesma opção para dois campos distintos.

Integração de Compreensão de Documentos

A atividade Machine Learning Extractor Trainer faz parte das Document Understanding Solutions. Visite o Guia do Document Understanding para obter mais informações.

Nesta página