- Introdução
- Configurando sua conta
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Campos gerais
- Rótulos (previsões, níveis de confiança, hierarquia do rótulo e sentimento do rótulo)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens anotadas e não anotadas
- Campos de extração
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Controle de acesso e administração
- Gerencie origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Criando ou excluindo uma origem de dados na GUI
- Carregar um arquivo CSV para uma origem
- Preparando dados para carregamento de .CSV
- Criação de um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Como corrigir as configurações do conjunto de dados
- Excluindo uma mensagem
- Exclusão de um conjunto de dados
- Exportação de um conjunto de dados
- Usando integrações do Exchange
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, campos gerais e metadados
- Hierarquia de rótulos e práticas recomendadas
- Comparação de casos de uso de análise e automação
- Transformando seus objetivos em rótulos
- Visão geral do processo de treinamento do modelo
- Anotação generativa
- Status do conjunto de dados
- Treinamento de modelos e práticas recomendadas de anotação
- Treinamento com análise de sentimento de rótulo habilitada
- Dados de chamadas e chat de treinamento
- Compreensão dos requisitos de dados
- Treinamento
- Introdução ao Refine
- Precisão e recall explicados
- Precisão e recall
- Como a validação funciona
- Compreender e melhorar o desempenho do modelo
- Motivos para baixa precisão média do rótulo
- Treinamento usando Check label e Perda de rótulo
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Melhorando o balanceamento e usando o Rebalanceamento
- Quando parar de treinar seu modelo
- Uso dos campos gerais
- Extração generativa
- Uso de análise e monitoramento
- Automations e Communications Mining™
- Desenvolvedor
- Carregamento de dados
- Baixando dados
- Integração do Exchange com usuário do serviço do Azure
- Integração do Exchange com Autenticação de Aplicativo do Azure
- Integração do Exchange com Autenticação de aplicativo e gráfico do Azure
- Como buscar dados para o Tableau com o Python
- Integração do Elasticsearch
- Extração de campo geral
- Integração auto-hospedada do Exchange
- Framework de automação da UiPath®
- Atividades oficiais da UiPath®
- Como as máquinas aprendem a entender as palavras: um guia para incorporações ao NLP
- Aprendizado baseado em solicitação com Transformers
- Efficient Transformers II: extração de conhecimento e ajustes finos
- Transformers eficientes I: mecanismos de atenção
- Modelagem de intenção hierárquica profunda não supervisionada: obtenção de valor sem dados de treinamento
- Corrigindo viés de anotação com o Communications Mining™
- Aprendizado ativo: melhores modelos de ML em menos tempo
- Está tudo nos números - avaliando o desempenho do modelo com métricas
- Por que a validação de modelos é importante
- Comparação do Communications Mining™ e do Google AutoML para inteligência de dados de conversa
- Licenciamento
- Perguntas frequentes e mais

Guia do usuário do Communications Mining
Balanceamento: Introdução e importância
A Classificação de saldo apresentada na Classificação do modelo na Validação reflete o quão equilibrados os dados revisados (ou seja, os dados de treinamento) em um conjunto de dados são, quando comparados ao conjunto de dados como um todo.
Ela leva em consideração vários fatores, incluindo:
- A similaridade dos dados revisados e não revisados, exibida como uma pontuação percentual.
- A proporção de dados revisados que foram revisados por meio de amostra aleatória, ou seja, modo aleatório .
- A proporção de dados que foi revisada usando Rebalancear.
- A proporção de dados que foram revisados durante o uso da Pesquisa de texto.
É importante que a proporção de dados revisados por meio de amostra aleatória seja alta (idealmente mais de 20%) e a proporção de dados revisados anotados usando a pesquisa seja baixa.
A classificação de saldo é mais fortemente influenciada, no entanto, pela pontuação de similaridade, que mede a similaridade dos dados não revisados com os dados revisados.
Essa pontuação de similaridade é calculada por um modelo de viés de anotação proprietário que compara os dados revisados e não revisados para garantir que os dados anotados sejam representativos de todo o conjunto de dados. Se os dados não forem representativos e tiverem sido anotados de maneira tendenciosa, as medidas de desempenho do modelo podem ser enganosas e potencialmente não confiáveis.
O viés de anotação na plataforma é normalmente o resultado de um equilíbrio entre os modos de treinamento usados para atribuir rótulos, especialmente se for usada muita "pesquisa de texto" e pouco modo "Aleatório". No entanto, ele ainda pode ocorrer mesmo se uma alta proporção do modo "Aleatório" for usada. O treinamento de rótulos específicos em modos como "Ensinar rótulo" pode levar naturalmente a um pequeno equilíbrio nos dados revisados. A plataforma ajuda você a identificar quando isso acontece e a ajudar a resolvê-lo de maneira rápida e eficaz.
Rebalancear: Introdução e uso
Rebalancear é um modo de treinamento que ajuda a reduzir os possíveis desequilíbrios em como um modelo foi anotado, ou seja, anotação de viés, o que significa que os dados revisados não são tão representativos de todo o conjunto de dados quanto poderiam ser.
O modo de treinamento Rebalancear mostra mensagens que estão sub-representadas no conjunto revisado.
Anotar as mensagens (como você faria em qualquer outro modo de treinamento) apresentadas nesse modo ajudará a resolver equilíbrios nos dados de treinamento e melhorar a pontuação de equilíbrio do modelo.
Se você achar que tem uma pontuação de similaridade alta, mas a classificação de Balanceamento ainda é baixa, isso provavelmente ocorre porque você não anotou o suficiente dos dados de treinamento no modo Aleatório . Se for esse o caso, a plataforma sugerirá anotar uma seleção aleatória de mensagens como a ação recomendada de prioridade. O treinamento nesse modo dá à plataforma confiança adicional de que o conjunto de dados não foi anotado de maneira tendenciosa e que os dados de treinamento são uma amostra representativa.
Quanto Rebalancear usar
Você deve continuar a usar Rebalancear iterativamente para melhorar a pontuação de similaridade para seu modelo, o que, por sua vez, aumentará sua classificação de Balanceamento .
Após atingir uma classificação Boa em Validação, é sua decisão de quanto mais você gostaria de aumentar a pontuação de similaridade antes de interromper o treinamento em Rebalancear.
Você pode tentar otimizar essa classificação o máximo possível, mas o treinamento contínuo sempre terá retornos decrescentes. Uma classificação Boa normalmente deve ser considerada um nível aceitável de desempenho para um bom modelo.