UiPath Documentation
activities
latest
false

Atividades do Document Understanding

Última atualização 5 de mai de 2026

Machine Learning Extractor Trainer

UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer

Description

Habilita a coleção de dados que foram processados por meio da Estação de validação para que possam ser importados para o Document Manager. Esta atividade pode ser usada apenas dentro da atividade Train Extractors Scope .

Compatibilidade do projeto

Windows-Legacy | Windows

Configuração

Painel do Designer

Armazenamento local

  • Output Folder - The directory where the collected data is stored. Once the data is stored, it can be imported into machine learning training tools.

Selecionar conjunto de dados privado para projeto

  • Conjunto de dados - O conjunto de dados no qual os dados de treinamento podem ser carregados. Se o robô estiver conectado a um tenant que tenha o AI Center habilitado, você pode ver todos os conjuntos de dados do AI Center no menu suspenso e selecionar a pasta na qual carregar os documentos validados usando o menu suspenso.
  • Project - The project where the training data can be uploaded.
    Observação:

    A seleção de projeto e conjunto de dados é habilitada apenas quando conectado ao Orchestrator. Acesse Gerenciamento de conjuntos de dados para obter mais informações sobre Conjuntos de dados públicos/privados.

Fornecer endpoint de conjunto de dados público

  • Dataset ApiKey - The authentication key of the dataset.
  • Ponto de extremidade do conjunto de dados - O ponto de extremidade do conjunto de dados no qual os dados de treinamento podem ser carregados. Depois que um conjunto de dados é público, ele pode ser acessado fora do ambiente da UiPath® por meio de um ponto de extremidade e usando a chave de API. Faça isso se você quiser carregar conjuntos de dados para uma instância do AI Center à qual você não esteja conectado (por exemplo, no caso de implantações híbridas em que o AI Center está na nuvem e o robô está conectado a um tenant local).
Painel de Propriedades

Comum

  • DisplayName - O nome de exibição da atividade.

Armazenamento local

  • Output Folder - The directory where the collected data is stored. Once the data is stored, it can be imported into machine learning training tools.

Diversos

  • Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.

Fornecer endpoint de conjunto de dados público

  • Dataset ApiKey - The authentication key of the dataset.
  • Ponto de extremidade do conjunto de dados - O ponto de extremidade do conjunto de dados no qual os dados de treinamento podem ser carregados. Depois que um conjunto de dados é público, ele pode ser acessado fora do ambiente da UiPath® por meio de um ponto de extremidade e usando a chave de API. Faça isso se você quiser carregar conjuntos de dados para uma instância do AI Center à qual você não esteja conectado (por exemplo, no caso de implantações híbridas em que o AI Center está na nuvem e o robô está conectado a um tenant local).

Selecionar conjunto de dados privado para projeto

  • Conjunto de dados - O conjunto de dados no qual os dados de treinamento podem ser carregados. Se o robô estiver conectado a um tenant que tenha o AI Center habilitado, você pode ver todos os conjuntos de dados do AI Center no menu suspenso e selecionar a pasta na qual carregar os documentos validados usando o menu suspenso.
  • Project - The project where the training data can be uploaded.
    Observação:

    A seleção de projeto e conjunto de dados é habilitada apenas quando conectado ao Orchestrator. Acesse Gerenciamento de conjuntos de dados para obter mais informações sobre Conjuntos de dados públicos/privados.

Servidor

  • RetryOnFailure - Retry on transient failure. This field only supports Boolean values (True, False). The default value is True.
  • Timeout (milliseconds) - Specifies the amount of time (in milliseconds) to wait for a response from the server before an error is thrown. The default value is 100000 milliseconds (100 seconds).

Usando o assistente de treinamento do extrator de aprendizado de máquina

O Machine Learning Extractor Trainer coleta o feedback humano para você, em um diretório de sua escolha. Depois de coletar dados e quiser treinar novamente um Modelo de ML, você pode simplesmente compactar o conteúdo do diretório e carregá-lo no Document Manager para coletar e filtrar dados.

Como usar

Para usar a atividade Machine Learning Extractor Trainer, execute as seguintes etapas:

  1. Use o assistente do Gerenciador de Taxonomia para definir seus tipos de documento e campos.

  2. Adicione um Machine Learning Extractor Trainer a uma atividade Train Extractors Scope.

  3. No assistente Machine Learning Extractor que é aberto automaticamente, insira informações para o campo Ponto de extemidade. Você pode escolher um dos pontos de extremidade públicos. Acesse Pontos de extremidade públicos para obter mais informações sobre pontos de extremidade públicos.

  4. Marque a caixa de seleção para Atualizar argumentos de atividade se você também deseja usar os valores inseridos como argumentos de entrada para a atividade, mais precisamente para o Ponto de extremidade.

  5. Selecione Obter recursos. O assistente fecha após essa operação

  6. Enter a value for Output Folder.

  7. Select the Configure Extractors option in the Train Extractors Scope. A wizard is displayed.

    Figura 1. O assistente Configurar extratores

    O assistente Configurar extratores

  8. O Machine Learning Extractor Trainer agora está pronto para configuração. Expanda o tipo de documento para o qual você deseja aplicá-lo e comece a selecionar os campos que você deseja treinar, marcando as caixas de seleção ao lado dos campos apropriados.

  9. Preencha as caixas de texto manualmente ou selecionando, na lista suspensa disponível, os dados corretos que você deseja mapear para cada campo. A lista suspensa contém todos os campos que o Machine Learning Extractor Trainer, usando o ponto de extremidade inserido no assistente do Machine Learning Extractor, declara como capacidade de extração.

    Observação:

    Se você selecionar a caixa de seleção, mas deixar a caixa de texto vazia, a última será preenchida automaticamente com o ID do Tipo de Documento da taxonomia local. As alterações se aplicam após salvar. Se você quiser evitar o uso de uma string longa para o ID do campo, recomendamos que você insira manualmente um valor caso não tenha acesso à taxonomia interna do extrator.

  10. Para verificar se você está usando os recursos mais recentes do extrator, você pode selecionar Obter ou atualizar recursos do extrator, que abre o assistente do Machine Learning Extractor.

  11. A seleção de uma das opções de uma lista suspensa confirma automaticamente esse campo.

  12. To train an extractor based on its extraction result, you can set the exact alphanumeric value in the Framework Alias field previously used for an extractor.

  13. Selecione Salvar uma vez que todos os campos forem configurados corretamente.

    Importante:

    You cannot choose the same option for two distinct fields.

Integração de Compreensão de Documentos

A atividade Machine Learning Extractor Trainer faz parte das Document Understanding Solutions. Acesse o Guia do Document Understanding para obter mais informações.

Esta página foi útil?

Conectar

Precisa de ajuda? Suporte

Quer aprender? Academia UiPath

Tem perguntas? Fórum do UiPath

Fique por dentro das novidades