- Introdução
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Campos gerais (anteriormente entidades)
- Rótulos (previsões, níveis de confiança, hierarquia etc.)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens revisadas e não revisadas
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Administração
- Gerencie origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Create or delete a data source in the GUI
- Carregar um arquivo CSV para uma origem
- Preparando dados para carregamento de .CSV
- Criar um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Corrigir configurações de conjunto de dados
- Excluir mensagens por meio da interface do usuário
- Excluir um conjunto de dados
- Exportar um conjunto de dados
- Usando integrações do Exchange
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, campos gerais e metadados
- Hierarquia de rótulo e práticas recomendadas
- Definição dos seus objetivos de taxonomia
- Casos de uso de análise versus automação
- Transformando seus objetivos em rótulos
- Criação da sua estrutura taxonômica
- Práticas recomendadas de design de taxonomia
- Importando sua taxonomia
- Visão geral do processo de treinamento do modelo
- Anotação Generativa (Novo)
- Status do conjunto de dados
- Treinamento de modelos e práticas recomendadas de anotação
- Treinamento com análise de sentimento de rótulo habilitada
- Compreensão dos requisitos de dados
- Treinamento
- Introdução ao Refine
- Precisão e recall explicados
- Precisão e recall
- Como funciona a Validação?
- Compreender e melhorar o desempenho do modelo
- Por que um rótulo pode ter uma precisão média baixa?
- Treinamento usando Check label e Perda de rótulo
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Melhorando o balanceamento e usando o Rebalanceamento
- Quando parar de treinar seu modelo
- Uso dos campos gerais
- Extração generativa
- Uso de análise e monitoramento
- Automations e Communications Mining
- Informações de licenciamento
- Perguntas frequentes e mais
Guia do usuário do Communications Mining
Cobertura
Cobertura é um termo frequentemente usado em Machine Learning e relacionado a quão bem um modelo "cobre" os dados que ele usa para analisar. No Communications Mining™, isso está relacionado à proporção de mensagens no conjunto de dados que têm previsões de rótulos informativos, e é apresentado no Validação como uma pontuação percentual.
Os "Rótulos informativos " são aqueles que a plataforma entende serem úteis como rótulos independentes, considerando a frequência com que são atribuídos a outros rótulos. Rótulos que são sempre atribuídos com outro rótulo, por exemplo, rótulos pais que nunca são atribuídos por conta própria ou 'Urgent' se sempre for atribuído com outro rótulo, recebem um peso menor quando a pontuação é calculada.
O visual abaixo dá uma indicação de como seria a aparência de baixa cobertura versus alta cobertura em todo um conjunto de dados. Imagine que os círculos sombreados sejam mensagens que têm previsões de rótulos informativos.
Como uma métrica, a cobertura é uma maneira muito útil de entender se você capturou todos os diferentes conceitos potenciais em seu conjunto de dados e se você forneceu exemplos de treinamento variados o suficiente para eles para que a plataforma possa prevê-los com eficácia.
Em quase todos os casos, quanto maior a cobertura de um modelo, melhor seu desempenho, porém não deve ser considerado isoladamente ao verificar o desempenho do modelo.
Também é muito importante que os rótulos na taxonomia sejam íntegros, o que significa que têm precisão média alta e nenhum outro alerta de desempenho, e que os dados de treinamento sejam uma representação equilibrada do conjunto de dados como um todo.
Se seus rótulos não estiverem íntegros ou os dados de treinamento não forem representativos do conjunto de dados, então a cobertura do seu modelo calculada pela plataforma não será confiável.
Ter um modelo de alta cobertura é particularmente importante se você o estiver usando para orientar processos automatizados.
Para obter mais detalhes sobre a cobertura do modelo e como verificar a cobertura do seu modelo, consulte aqui.