Communications Mining
Mais recente
falso
Imagem de fundo do banner
Guia do usuário do Communications Mining
Última atualização 18 de abr de 2024

Perguntas frequentes do treinamento do modelo

As informações nesta página estão divididas em duas seções:
  • Treinamento geral do modelo
  • Treinamento de rótulo

Treinamento geral do modelo

Qual é o objetivo de treinar um modelo?

O objetivo do treinamento de um modelo é criar um conjunto de dados de treinamento que seja o mais representativo possível do conjunto de dados como um todo, para que a plataforma possa prever com precisão e confiança os rótulos e entidades relevantes para cada mensagem. Os rótulos e entidades dentro de um conjunto de dados precisam estar intrínsecos aos objetivos gerais do caso de uso e fornecer valor significativo para o negócio.

Por que não consigo ver nada no Discover se eu acabava de carregar dados na plataforma?

Assim que os dados são carregados para a plataforma, a plataforma inicia um processo chamado aprendizado não supervisionado, pelo qual agrupa mensagens em clusters de intenção semântica semelhante. Esse processo pode levar algumas horas, dependendo do tamanho do conjunto de dados, e os clusters aparecerão assim que estiver concluído.

Quantos dados históricos preciso para treinar um modelo?

Para poder treinar um modelo, você precisa de uma quantidade mínima de dados históricos existentes. Isso é usado como dados de treinamento para fornecer à plataforma as informações necessárias para prever com confiança cada um dos conceitos relevantes para sua análise e/ou automação.

A recomendação para qualquer caso de uso é de um mínimo de 12 meses de dados históricos, a fim de capturar adequadamente qualquer Sazonalidade ou irregularidade nos dados (por exemplo, processos de fim de mês e períodos de maior atividade).

Preciso salvar meu modelo toda vez que fizer uma alteração?

Não, você não precisa salvar seu modelo após qualquer alteração ser feita. Toda vez que você treinar a plataforma em seus dados (ou seja, rotulando qualquer mensagem), uma nova versão do modelo é criada para seu conjunto de dados. As estatísticas de desempenho para versões de modelo mais antigas podem ser exibidas na Validação.

Como saber qual é o desempenho do modelo?

Confira a página Validação na plataforma, que relata várias medidas de desempenho e fornece uma classificação holística da integridade do modelo. Esta página é atualizada após cada evento de treinamento e pode ser usada para identificar áreas em que o modelo pode precisar de mais exemplos de treinamento ou algumas correções de rótulo para garantir a consistência.

Consulte a página Validação para obter explicações completas sobre o desempenho do modelo e como melhorá-lo.

Por que há apenas 30 clusters disponíveis e podemos defini-los individualmente?

Os clusters são uma maneira útil de ajudar você a criar rapidamente sua taxonomia, mas os usuários passarão a maior parte do tempo treinando em Explorar em vez de Descobrir.

Se os usuários gastam muito tempo rotulando por meio de clusters, existe o risco de sobreajuste o modelo para procurar mensagens que só se encaixam nesses clusters ao fazer previsões. Quanto mais exemplos variados houver para cada rótulo, melhor será o modelo para encontrar as diferentes maneiras de expressar a mesma intenção ou conceito. Esse é um dos principais motivos pelos quais mostramos apenas 30 clusters de cada vez.

Entretanto, após um treinamento suficiente ser concluído ou um volume significativo de dados ser adicionado à plataforma (consulte aqui), o Discover faz retreinamento. Quando retreina, ele leva em consideração o treinamento existente até hoje e tenta apresentar novos clusters que não são bem cobertos pela taxonomia atual.

Para obter mais informações sobre o Discover, consulte aqui.

Quantas mensagens há em cada cluster?

Há 30 clusters no total, cada um contendo 12 mensagens. Na plataforma, é possível filtrar o número de mensagens exibidas na página em incrementos entre 6 e 12 por página. Nossa recomendação é rotular seis de cada vez para garantir que você reduza o risco de rotular parcialmente qualquer mensagem.

O que significa precisão e recall?

Precisão e recall são métricas usadas para medir o desempenho de um modelo de aprendizado de máquina. Uma descrição detalhada de cada uma pode ser encontrada na seção Usando a validação de nossos guias de instruções.

Posso voltar para uma versão anterior do meu modelo?

Você pode acessar a visão geral da validação de modelos anteriores, passando o mouse sobre "Versão do modelo", no canto superior esquerdo da página Validação. Isso pode ser útil para rastrear e comparar o progresso à medida que você treina seu modelo.

Se você precisar reverter seu modelo para uma versão anterior fixada, consulte aqui para obter mais detalhes.

Treinamento de rótulo

Posso alterar o nome de um rótulo mais tarde?

Sim, é muito fácil de fazer. Você pode acessar as configurações de cada rótulo e renomeá-lo quando quiser. Você pode ver como fazer isso aqui.

Como posso saber o número de mensagens rotuladas?

Informações sobre seu conjunto de dados, incluindo quantas mensagens foram rotuladas, são exibidas na página Configurações de conjuntos de dados. Para ver como acessá-lo, clique aqui.

Um dos meus rótulos está apresentando baixo desempenho. O que posso fazer para melhorá-lo?

Se você puder ver na página Validação que seu rótulo está apresentando um desempenho ruim, existem várias maneiras de melhorá-lo. Veja aqui para entender mais.

O que o mostrador vermelho ao lado do meu rótulo ou entidade indica? Como posso me livrar dele?

Os pequenos mostrador vermelho ao lado de cada rótulo/entidade indicam se mais exemplos são necessários para a plataforma estimar com precisão o desempenho do rótulo/entidade. Os seletores começam a desaparecer à medida que você fornece mais exemplos de treinamento e desaparecerão completamente quando você atingir 25 exemplos.

Depois disso, a plataforma conseguirá avaliar com eficiência o desempenho de um determinado rótulo/entidade e poderá retornar um aviso de desempenho se o rótulo/entidade não estiver íntegro.

Deve-se evitar rotular mensagens vazias/não informativas?

A plataforma é capaz de aprender com mensagens vazias e mensagens não informativas, desde que sejam rotuladas corretamente. No entanto, vale a pena observar que rótulos não informativos provavelmente precisarão de um número significativo de exemplos de treinamento, além de serem ligeiramente agrupados por conceito, para garantir o melhor desempenho.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.