communications-mining
latest
false
- Introdução
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Campos gerais (anteriormente entidades)
- Rótulos (previsões, níveis de confiança, hierarquia etc.)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens revisadas e não revisadas
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Administração
- Gerencie origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Crie ou exclua uma fonte de dados no GUI
- Carregar um arquivo CSV para uma origem
- Preparando dados para carregamento de .CSV
- Criar um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Corrigir configurações de conjunto de dados
- Excluir mensagens por meio da interface do usuário
- Excluir um conjunto de dados
- Exportar um conjunto de dados
- Usando integrações do Exchange
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, campos gerais e metadados
- Hierarquia de rótulo e práticas recomendadas
- Definição dos seus objetivos de taxonomia
- Casos de uso de análise versus automação
- Transformando seus objetivos em rótulos
- Criação da sua estrutura taxonômica
- Práticas recomendadas de design de taxonomia
- Importando sua taxonomia
- Visão geral do processo de treinamento do modelo
- Anotação Generativa (Novo)
- Status do conjunto de dados
- Treinamento de modelos e práticas recomendadas de anotação
- Treinamento com análise de sentimento de rótulo habilitada
- Compreensão dos requisitos de dados
- Treinamento
- Introdução ao Refine
- Precisão e recall explicados
- Precisão e recall
- Como funciona a Validação?
- Compreender e melhorar o desempenho do modelo
- Por que um rótulo pode ter uma precisão média baixa?
- Treinamento usando Check label e Perda de rótulo
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Melhorando o balanceamento e usando o Rebalanceamento
- Quando parar de treinar seu modelo
- Uso dos campos gerais
- Extração generativa
- Uso de análise e monitoramento
- Automations e Communications Mining
- Informações de licenciamento
- Perguntas frequentes e mais
Práticas recomendadas de design de taxonomia
Importante :
Este conteúdo foi traduzido com auxílio de tradução automática.
Guia do usuário do Communications Mining
Última atualização 20 de dez de 2024
Práticas recomendadas de design de taxonomia
Elementos-chave da taxonomia
-
Número de rótulos: os conjuntos de dados típicos têm de 50 a 100 rótulos, mas esse número pode variar dependendo dos objetivos para um conjunto de dados. Um caso de uso eficaz pode ter muito menos de 50 rótulos. O sistema impõe um limite de 200 rótulos para um conjunto de dados porque, além desse ponto, a taxonomia se torna muito difícil de gerenciar e treinar, e isso leva a um desempenho reduzido.
- Nomes de rótulos: os nomes de rótulos devem ser concisos e descritivos porque a funcionalidade Anotação generativa os usa como entrada de treinamento para acelerar e melhorar o processo de treinamento. Você sempre pode editá-los, mas para garantir que sejam exibidos de forma eficaz na interface do usuário da plataforma, um limite de 64 caracteres é definido para qualquer rótulo, incluindo seus níveis de hierarquia.
- Descrições de rótulos: adicione descrições em idioma natural a seus rótulos porque eles são usadas como entrada de treinamento pela funcionalidade Anotação generativa para treinamento automático. As descrições também ajudam a garantir a consistência das anotações entre treinadores de modelos e fornecem contexto útil para outras pessoas que visualizam o conjunto de dados para fins analíticos.
Estruturação da taxonomia
Recomendamos seguir estas práticas recomendadas para estruturar sua taxonomia corretamente e garantir um alto desempenho do modelo:
- Alinhar com os objetivos: certifique-se de que cada rótulo atenda a uma finalidade de negócios específica e esteja alinhado aos seus objetivos definidos. Se seu conjunto de dados for destinado à automação, muitos rótulos devem corresponder às solicitações específicas necessárias para o processamento downstream. Se seu conjunto de dados for destinado a análises (ou ambos), inclua rótulos adicionais que cubram conceitos como tipos de problemas, causas raiz e problemas de qualidade do serviço, como mensagens de busca, escalonamentos e disputas.
- Ser distinto: cada rótulo deve ser específico e não se sobrepor a outros rótulos.
- Seja específico: evite conceitos amplos, imprecisos ou confusos, pois é mais provável que eles tenham um desempenho ruim e forneçam menos valor para os negócios. Se possível, divida rótulos amplos em vários rótulos distintos. Comece com rótulos específicos, como mais níveis de hierarquia, e mescle-os mais tarde se necessário, em vez de dividir rótulos amplos manualmente.
- Seja identificável: certifique-se de que cada rótulo seja claramente identificável a partir do texto das mensagens às quais é aplicado.
- Usar rótulos pai: se você espera ter muitos conceitos semelhantes relacionados a um tópico mais amplo, use um rótulo pai.
- Usar rótulos filhos:certifique-se de que cada rótulo aninhado sob outro rótulo seja um subconjunto desse rótulo.
- Limitar os níveis de hierarquia: tente não adicionar mais de quatro níveis de hierarquia, pois o modelo torna-se cada vez mais complexo para treinar.
- Incluir rótulos não informativos: crie alguns rótulos que não agregam valor, como e-mails de agradecimento, para que você possa dizer à plataforma o que é ou não importante analisar.