- Introdução
- Configurando sua conta
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Campos gerais
- Rótulos (previsões, níveis de confiança, hierarquia do rótulo e sentimento do rótulo)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens anotadas e não anotadas
- Campos de extração
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Controle de acesso e administração
- Gerencie origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Criando ou excluindo uma origem de dados na GUI
- Carregar um arquivo CSV para uma origem
- Preparando dados para carregamento de .CSV
- Criação de um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Como corrigir as configurações do conjunto de dados
- Excluindo uma mensagem
- Exclusão de um conjunto de dados
- Exportação de um conjunto de dados
- Usando integrações do Exchange
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, campos gerais e metadados
- Hierarquia de rótulos e práticas recomendadas
- Comparação de casos de uso de análise e automação
- Transformando seus objetivos em rótulos
- Visão geral do processo de treinamento do modelo
- Anotação generativa
- Status do conjunto de dados
- Treinamento de modelos e práticas recomendadas de anotação
- Treinamento com análise de sentimento de rótulo habilitada
- Compreensão dos requisitos de dados
- Treinamento
- Introdução ao Refine
- Precisão e recall explicados
- Precisão e recall
- Como a validação funciona
- Compreender e melhorar o desempenho do modelo
- Motivos para baixa precisão média do rótulo
- Treinamento usando Check label e Perda de rótulo
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Melhorando o balanceamento e usando o Rebalanceamento
- Quando parar de treinar seu modelo
- Uso dos campos gerais
- Extração generativa
- Uso de análise e monitoramento
- Automations e Communications Mining™
- Desenvolvedor
- Carregamento de dados
- Baixando dados
- Integração do Exchange com usuário do serviço do Azure
- Integração do Exchange com Autenticação de Aplicativo do Azure
- Integração do Exchange com Autenticação de aplicativo e gráfico do Azure
- Como buscar dados para o Tableau com o Python
- Integração do Elasticsearch
- Extração de campo geral
- Integração auto-hospedada do Exchange
- Framework de automação da UiPath®
- Atividades oficiais da UiPath®
- Como as máquinas aprendem a entender as palavras: um guia para incorporações ao NLP
- Aprendizado baseado em solicitação com Transformers
- Efficient Transformers II: extração de conhecimento e ajustes finos
- Transformers eficientes I: mecanismos de atenção
- Modelagem de intenção hierárquica profunda não supervisionada: obtenção de valor sem dados de treinamento
- Corrigindo viés de anotação com o Communications Mining™
- Aprendizado ativo: melhores modelos de ML em menos tempo
- Está tudo nos números - avaliando o desempenho do modelo com métricas
- Por que a validação de modelos é importante
- Comparação do Communications Mining™ e do Google AutoML para inteligência de dados de conversa
- Licenciamento
- Perguntas frequentes e mais

Guia do usuário do Communications Mining
- Rótulos
- Campos gerais
Os rótulos descrevem toda a mensagem, por exemplo, Cancelamento, Falha comercial ou Urgente. Os campos gerais referem-se a partes específicas da mensagem, como por exemplo, Nome da contraparte, ID do cliente ou Data do cancelamento.
Em um processo downstream, os rótulos são usados para classificar, priorizar e decidir que tipo de ação deve ser executada. Os campos gerais são usados para preencher os campos de solicitações. Por exemplo, um processo downstream pode filtrar mensagens para aquelas que têm o rótulo de Cancelamento e, em seguida, usar os campos gerais extraídos ID do cliente e Data de cancelamento para chamar uma API para processar automaticamente o cancelamento.
O Communications Mining vem com vários campos gerais integrados para conceitos comuns, como Organização, Código de moeda ou Data. Você pode personalizar os campos gerais integrados do Communications Mining para que sejam adaptados ao seu caso de uso específico. Por exemplo, o Communications Mining tem um campo geral Data pré-construído altamente treinado que você pode usar como ponto de partida para um campo geral mais personalizado, como Data de renovação ou Data de cancelamento. Alternativamente, você pode começar do zero e treinar o Communications Mining a reconhecer algo completamente novo.
Esta caixa de correio recebe solicitações de Renovação, Cancelamento e Administrador que ocasionalmente são Urgentes. O Communications Mining™ foi treinado para reconhecer cada um desses conceitos, e as previsões do Communications Mining podem ser usadas para classificar os emails para a equipe correta criando tickets de suporte.
Como o formato do número da apólice é específico para essa seguradora em particular, configuramos o campo geral para ser treinado do zero. Por outro lado, a organização segurada é um tipo de organização e, portanto, a configuramos para ser treinável com base no campo geral da Organização integrado. Por fim, observamos que os agente nem sempre coloca seu nome no e-mail, então decidimos usar o endereço de e-mail do agente (disponível nos metadados dos comentários) para procurar o nome correspondente em um banco de dados interno, em vez de extraí-lo como um campo geral.
A tabela a seguir resume essas abordagens.
| Configuração | Quando usar | Exemplos |
|---|---|---|
| Campo geral treinável sem campo geral de base | Usado mais frequentemente para vários tipos de IDs internos ou quando não há nenhum campo geral de base adequado no Communications Mining. | Número da apólice, ID do cliente |
| Campo geral treinável com campo geral base | Usado para personalizar um campo geral pré-construído existente no Communications Mining. | Data de Cancelamento (com base na Data), Organização Segurada (com base na Organização) |
| Campos gerais pré-construídos (não treináveis) | Usado para campos gerais que devem ser correspondidos exatamente conforme definidos, onde o treinamento geraria erros. | está em |
| Como usar metadados de comentário em vez de campos gerais | Usado quando as informações necessárias já estão presentes em forma estruturada nos metadados do comentário. | Endereço do remetente, Domínio do remetente |
O Communications Mining™ fornece várias maneiras de buscar previsões, incluindo campos gerais previstos. Consulte a visão geral do download de dados para entender qual método funcionará melhor no seu caso de uso.
Seja qual for o método escolhido, você precisa estar ciente dos seguintes casos extremos e lidar com eles em seu aplicativo:
- Nem todos os campos gerais esperados estão presentes na resposta
- A resposta contém várias correspondências para um ou mais campos gerais
- Nem todos os campos gerais presentes na resposta estão corretos
Nesta seção, examinamos cada um desses casos extremos com mais detalhes.
Nem todos os campos gerais estão presentes na resposta
A resposta contém várias correspondências para um ou mais campos gerais
Observe que você pode usar os metadados na resposta ao lidar com esses casos. Por exemplo, podemos optar por escolher preferencialmente números de política que aparecem no assunto de e-mail em vez daqueles que aparecem no corpo do e-mail. O seguinte exemplo mostra a resposta que a API retornará para o nosso e-mail de exemplo.
{
"predictions": [
{
"uid": "aa05ba2250de48e3.7588b85f68f81c3b",
"labels": [...],
"entities": [
{
"id": "6a1d11118b60868e",
"name": "policy-number",
"span": {
"content_part": "body",
"message_index": 0,
"utf16_byte_start": 200,
"utf16_byte_end": 222,
"char_start": 100,
"char_end": 111
},
"kind": "policy-number",
"formatted_value": "GHI-0204963"
},
{
"id": "6a1d11118b60868e",
"name": "policy-number",
"span": {
"content_part": "subject",
"message_index": 0,
"utf16_byte_start": 0,
"utf16_byte_end": 22,
"char_start": 0,
"char_end": 11
},
"kind": "policy-number",
"formatted_value": "GHI-0068448"
},
{...},
{...},
{...}
]
}
],
"model": {
"version": 31,
"time": "2021-07-14T15:00:57.608000Z"
},
"status": "ok"
}{
"predictions": [
{
"uid": "aa05ba2250de48e3.7588b85f68f81c3b",
"labels": [...],
"entities": [
{
"id": "6a1d11118b60868e",
"name": "policy-number",
"span": {
"content_part": "body",
"message_index": 0,
"utf16_byte_start": 200,
"utf16_byte_end": 222,
"char_start": 100,
"char_end": 111
},
"kind": "policy-number",
"formatted_value": "GHI-0204963"
},
{
"id": "6a1d11118b60868e",
"name": "policy-number",
"span": {
"content_part": "subject",
"message_index": 0,
"utf16_byte_start": 0,
"utf16_byte_end": 22,
"char_start": 0,
"char_end": 11
},
"kind": "policy-number",
"formatted_value": "GHI-0068448"
},
{...},
{...},
{...}
]
}
],
"model": {
"version": 31,
"time": "2021-07-14T15:00:57.608000Z"
},
"status": "ok"
}