- Introdução
- Configurando sua conta
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Campos gerais
- Rótulos (previsões, níveis de confiança, hierarquia do rótulo e sentimento do rótulo)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens anotadas e não anotadas
- Campos de extração
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Controle de acesso e administração
- Gerencie origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Criando ou excluindo uma origem de dados na GUI
- Carregar um arquivo CSV para uma origem
- Preparando dados para carregamento de .CSV
- Criação de um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Como corrigir as configurações do conjunto de dados
- Excluindo uma mensagem
- Exclusão de um conjunto de dados
- Exportação de um conjunto de dados
- Usando integrações do Exchange
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, campos gerais e metadados
- Hierarquia de rótulos e práticas recomendadas
- Comparação de casos de uso de análise e automação
- Transformando seus objetivos em rótulos
- Visão geral do processo de treinamento do modelo
- Anotação generativa
- Status do conjunto de dados
- Treinamento de modelos e práticas recomendadas de anotação
- Treinamento com análise de sentimento de rótulo habilitada
- Dados de chamadas e chat de treinamento
- Compreensão dos requisitos de dados
- Treinamento
- Introdução ao Refine
- Precisão e recall explicados
- Precisão e recall
- Como a validação funciona
- Compreender e melhorar o desempenho do modelo
- Motivos para baixa precisão média do rótulo
- Treinamento usando Check label e Perda de rótulo
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Melhorando o balanceamento e usando o Rebalanceamento
- Quando parar de treinar seu modelo
- Uso dos campos gerais
- Extração generativa
- Uso de análise e monitoramento
- Automations e Communications Mining™
- Desenvolvedor
- Carregamento de dados
- Baixando dados
- Integração do Exchange com usuário do serviço do Azure
- Integração do Exchange com Autenticação de Aplicativo do Azure
- Integração do Exchange com Autenticação de aplicativo e gráfico do Azure
- Como buscar dados para o Tableau com o Python
- Integração do Elasticsearch
- Extração de campo geral
- Integração auto-hospedada do Exchange
- Framework de automação da UiPath®
- Atividades oficiais da UiPath®
- Como as máquinas aprendem a entender as palavras: um guia para incorporações ao NLP
- Aprendizado baseado em solicitação com Transformers
- Efficient Transformers II: extração de conhecimento e ajustes finos
- Transformers eficientes I: mecanismos de atenção
- Modelagem de intenção hierárquica profunda não supervisionada: obtenção de valor sem dados de treinamento
- Corrigindo viés de anotação com o Communications Mining™
- Aprendizado ativo: melhores modelos de ML em menos tempo
- Está tudo nos números - avaliando o desempenho do modelo com métricas
- Por que a validação de modelos é importante
- Comparação do Communications Mining™ e do Google AutoML para inteligência de dados de conversa
- Licenciamento
- Perguntas frequentes e mais

Guia do usuário do Communications Mining
Para atender a seus objetivos de negócios, é importante entender como criar sua taxonomia antes de começar a treinar seu modelo. Isso inclui como nomear e estruturar seus rótulos e como eles devem consistir. Para obter mais detalhes, consulte Construir sua estrutura de taxonomia.
A funcionalidade de anotação generativa usa nomes e descrições de rótulos como entrada de treinamento. Como resultado, é importante usar nomes de rótulos claros, distintos e descritivos. Os nomes e as descrições de rótulos fornecem ao modelo as melhores entradas de treinamento quando ele gera automaticamente previsões.
Você pode renomear rótulos e adicionar níveis de hierarquia a qualquer momento. Isso permite que você refine rótulos e descrições de rótulos para melhorar as previsões geradas automaticamente antes de anotar mensagens com rótulos.
>
, para capturar quando um conceito de rótulo for um subconjunto de um conceito pai mais amplo.
Exemplos de estrutura de rótulo:
- [Rótulo Principal]
- [Rótulo Pai] > [Rótulo Filho]
- [Rótulo Pai] > [Rótulo da Ramificação] > [Rótulo Filho]
Você pode adicionar mais de três níveis de hierarquia, mas não recomendamos que você faça isso com frequência, pois fica complexo treinar o modelo. Para adicionar mais níveis de hierarquia, você pode renomear seus rótulos mais tarde no processo de treinamento do modelo.
>
quando você especifica o nome do rótulo.
Para entender como as hierarquias funcionam, considere o Rótulo filho X do diagrama na seção Hierarquias de rótulos .
Quando o modelo prevê que o rótulo filho X se aplica a uma mensagem, ele também prevê o rótulo de ramificação C e o rótulo pai 1 ao mesmo tempo. Isso ocorre porque o rótulo filho X é um subconjunto dos dois.
Cada nível de hierarquia adiciona um nível crescente de especificidade. No entanto, o modelo costuma ser mais confiante ao atribuir um rótulo pai ou de ramificação do que um rótulo filho mais específico. Isso significa que o modelo pode atribuir diferentes probabilidades a diferentes previsões de rótulos dentro da mesma hierarquia.
Para exemplificar, para uma mensagem específica, o modelo poderia ser:
- 99% de confiança que o Rótulo Pai 1 se aplica.
- 88% de confiança que o rótulo da ramificação C se aplica.
- 75% de confiança que o rótulo filho X se aplica.
O modelo prevê cada rótulo de forma independente, por isso é importante que os rótulos pais representem tópicos ou conceitos verdadeiros, em vez de resumos.
Por exemplo, é ineficaz usar Processo como rótulo pai se ele agrupar processos específicos, pois é muito resumo para o modelo prever. Em vez disso, um nome de processo específico do texto da mensagem funciona melhor como um rótulo pai, com ramificações e rótulos filhos que representam subprocessos relevantes.
Às vezes, você pode precisar fazer escolhas difíceis em relação à estrutura de sua taxonomia. Por exemplo, pode ser difícil escolher se um rótulo deve ser pai ou filho. Isso pode acontecer porque o rótulo pode servir logicamente como uma categoria pai ampla com suas próprias subcategorias ou pode ser uma subcategoria específica de outra categoria pai mais ampla.
Por exemplo, pense em um conjunto de dados de avaliações de hoteis. Muitas avaliações podem incluir o preço de vários aspectos das férias e do host, como o restaurante, o barra, os salas, as atividades, entre outros.
Você pode considerar as seguintes opções:
- Você pode ter o Preço como um rótulo pai e cada aspecto específico do preço (ou seja, restaurante) como rótulos filhos.
- No entanto, você também pode ter rótulos pai que se relacionam com aspectos específicos, comoRestaurantes e Salões, e ter o Preço como um rótulo filho em cada um.
Quando você decidir, certifique-se de considerar o seguinte:
- Há um número significativo de outros conceitos relacionados a este tópico mais amplo que você gostaria de incluir? Se sim, então ele deve ser um rótulo pai.
- Qual é a coisa mais importante a rastrear de uma perspectiva de gerenciamento de informações ou relatórios? Considerando nosso exemplo, não é útil visualizar claramente na análise do Communications Mining™ exatamente quantas pessoas estão falando sobre preços e suas subcategorias ou é mais útil visualizar estatísticas gerais sobre o feedback sobre salas, restaurantes, atividades e e assim por diante, com os preços sendo apenas um aspecto deles?
Nem sempre há uma resposta certa ou errada nessas situações, e isso depende do que é mais importante para você e para sua empresa.
Até agora, discutimos como nomear rótulos e estruturá-los em hierarquias. No entanto, você ainda pode estar se perguntando o que exatamente um rótulo deve capturar.
É importante lembrar que o Communications Mining™ é uma ferramenta de processamento de linguagem natural (NLP). A plataforma lê e interpreta cada mensagem que recebe um rótulo e começa a compreender como identificar esse conceito de rótulo com base predominantemente no texto dentro dele.
À medida que você adiciona exemplos mais variados e consistentes para cada rótulo, o modelo melhora sua compreensão desse conceito de rótulo. Depois que um rótulo funcionar bem, evite adicionar mais rótulos, pois o processo renderia retornos decrescentes. Além disso, evite aceitar um grande número de previsões de alta confiança para um rótulo, pois isso não fornece novas informações ao modelo.
Como o Communications Mining usa a linguagem da mensagem para entender e identificar o que constitui os conceitos dos rótulos, o rótulo deve ser claramente identificável a partir do texto das mensagens às quais é aplicado. Para uma mensagem de e-mail, isso inclui o assunto e o corpo do e-mail.
Cancellation > Confirmation > Termination
aplicado:
Você pode inferir claramente o nome do rótulo a partir do assunto e do corpo do email.
Embora o modelo possa considerar certas propriedades de metadados, como pontuações do NPS, quando treina com base em conjuntos de dados de feedback dos clientes para ajudar a entender o sentimento, o texto da mensagem continua sendo o dado mais importante para os modelos do Communications Mining.
Isso significa que cada rótulo deve ser específico no que visa capturar. Caso contrário, o modelo terá dificuldade em identificar as tendências e padrões na linguagem necessários para prever o conceito do rótulo com precisão.
Rótulos extremamente amplos, como Consulta geral ou Tudo o mais, podem não ajudar se você os usar para agrupar vários tópicos diferentes e não houver um padrão claro ou algo em comum entre os exemplos fornecidos ao modelo.
Para que o modelo preveja um rótulo com precisão, são necessários vários exemplos semelhantes das várias expressões de cada conceito capturado pelo rótulo. Portanto, rótulos extremamente amplos precisam de um número muito grande de exemplos para serem previstos com eficácia.
É uma prática recomendada dividir rótulos amplos em rótulos distintos, mesmo que você tenha Tudo o mais > [Vários rótulos secundários].
Se o modelo pode identificar melhor um rótulo filho por ser mais específico e claramente identificável, em comparação com uma categoria pai muito ampla, ele também pode aprimorar significativamente sua capacidade de prever o rótulo pai.
A funcionalidade Anotação generativa usa descrições e nomes de rótulos para treinar automaticamente um modelo especializado. Portanto, é importante adicionar descrições descritivas, claras e informativas a cada rótulo para que o modelo possa gerar previsões precisas.
O modelo de IA Generativa usa descrições como entradas para pré-anotar mensagens em segundo plano. Isso reduz o tempo e o esforço que você gasta para anotar manualmente exemplos.
Você pode adicionar descrições de rótulos após o processo Criar conjunto de dados criá-las ou pode adicioná-las ou editá-las na página Taxonomia nas Configurações do conjunto de dados.
Uma maneira eficaz de manter a consistência dos rótulos em todo o processo de construção de modelos é adicionar descrições a cada rótulo. Isso é útil se vários usuários treinarem seu modelo, porque garante que todos os usuários tenham a mesma compreensão de um determinado rótulo e seu conceito associado. Outro benefício de manter a consistência do rótulo é que isso torna o processo de transferência mais eficiente se você precisar transferir o modelo para outro usuário.