- Introdução
- Configurando sua conta
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Campos gerais
- Rótulos (previsões, níveis de confiança, hierarquia do rótulo e sentimento do rótulo)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens anotadas e não anotadas
- Campos de extração
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Controle de acesso e administração
- Gerencie origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Criando ou excluindo uma origem de dados na GUI
- Carregar um arquivo CSV para uma origem
- Preparando dados para carregamento de .CSV
- Criação de um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Como corrigir as configurações do conjunto de dados
- Excluindo uma mensagem
- Exclusão de um conjunto de dados
- Exportação de um conjunto de dados
- Usando integrações do Exchange
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, campos gerais e metadados
- Hierarquia de rótulos e práticas recomendadas
- Comparação de casos de uso de análise e automação
- Transformando seus objetivos em rótulos
- Visão geral do processo de treinamento do modelo
- Anotação generativa
- Status do conjunto de dados
- Treinamento de modelos e práticas recomendadas de anotação
- Treinamento com análise de sentimento de rótulo habilitada
- Compreensão dos requisitos de dados
- Treinamento
- Introdução ao Refine
- Precisão e recall explicados
- Precisão e recall
- Como a validação funciona
- Compreender e melhorar o desempenho do modelo
- Motivos para baixa precisão média do rótulo
- Treinamento usando Check label e Perda de rótulo
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Melhorando o balanceamento e usando o Rebalanceamento
- Quando parar de treinar seu modelo
- Uso dos campos gerais
- Extração generativa
- Uso de análise e monitoramento
- Automations e Communications Mining™
- Desenvolvedor
- Carregamento de dados
- Baixando dados
- Integração do Exchange com usuário do serviço do Azure
- Integração do Exchange com Autenticação de Aplicativo do Azure
- Integração do Exchange com Autenticação de aplicativo e gráfico do Azure
- Como buscar dados para o Tableau com o Python
- Integração do Elasticsearch
- Extração de campo geral
- Integração auto-hospedada do Exchange
- Framework de automação da UiPath®
- Atividades oficiais da UiPath®
- Como as máquinas aprendem a entender as palavras: um guia para incorporações ao NLP
- Aprendizado baseado em solicitação com Transformers
- Efficient Transformers II: extração de conhecimento e ajustes finos
- Transformers eficientes I: mecanismos de atenção
- Modelagem de intenção hierárquica profunda não supervisionada: obtenção de valor sem dados de treinamento
- Corrigindo viés de anotação com o Communications Mining™
- Aprendizado ativo: melhores modelos de ML em menos tempo
- Está tudo nos números - avaliando o desempenho do modelo com métricas
- Por que a validação de modelos é importante
- Comparação do Communications Mining™ e do Google AutoML para inteligência de dados de conversa
- Licenciamento
- Perguntas frequentes e mais

Guia do usuário do Communications Mining
-
Atualizar qualquer coisa que não seja as propriedades do usuário fará com que as anotações de campos gerais nos conjuntos de dados associados sejam perdidas. Por exemplo, atualizar mensagens existentes em uma origem, alterar as propriedades da mensagem, como texto da mensagem, enviado_no carimbo de data/hora e para ou de. Certifique-se de fixar a versão mais recente do modelo nos conjuntos de dados associados antes de fazer isso.
-
Para obter detalhes sobre como criar uma origem de dados, consulte Criando ou excluindo uma origem de dados no GUI.
- Navegue até a página Administrador .
- Selecione a guia Origens e localize a origem para a qual você deseja carregar dados.
- Selecione o ícone de upload no cartão de origem de dados.
- Use Selecionar arquivo para escolher um arquivo CSV do seu computador.
- Selecione o arquivo CSV que você deseja carregar. Certifique-se de que o arquivo atenda aos seguintes critérios:
- O arquivo deve incluir cabeçalhos na primeira linha e ser delimitado por vírgulas ou tabulações.
- O arquivo deve conter no mínimo três colunas:
- Mensagem: o texto da mensagem.
- Carimbo de data/hora: de quando a mensagem foi criada.
- ID exclusivo: um identificador distinto para cada mensagem.
- Todos os campos de texto devem estar entre aspas duplas no arquivo.
- O arquivo deve ser codificado como UTF-8, UTF-16 ou UTF-32. A plataforma detecta automaticamente a codificação correta.
- O arquivo deve ter 128 MiB ou menos. Para arquivos maiores, divida-os em vários arquivos, cada um com menos de 128 MiB.
- Selecione as colunas necessárias, onde os menus suspensos contêm os cabeçalhos das colunas detectados no arquivo CSV:
- Coluna ID da mensagem — uma coluna com um ID exclusivo que pode identificar a mensagem. Os IDs de mensagem podem conter apenas caracteres alfanuméricos ASCII (AZ, az, 0-9) e pontuação, exceto para barra
/.Observação: se houver mensagens existentes na origem com o mesmo ID, elas serão atualizadas para corresponder ao conteúdo do novo arquivo. - Coluna de mensagem – A coluna que contém o texto da mensagem que você deseja analisar na plataforma.
- Coluna de carimbo de data/hora — a coluna que contém a data e a hora em que a mensagem foi gravada. O formato do carimbo de data/hora é flexível e a plataforma o infere automaticamente. Para obter mais detalhes, consulte Usando os formatos corretos.
- Coluna ID da mensagem — uma coluna com um ID exclusivo que pode identificar a mensagem. Os IDs de mensagem podem conter apenas caracteres alfanuméricos ASCII (AZ, az, 0-9) e pontuação, exceto para barra
- Você pode selecionar as seguintes colunas adicionais, se tiver dados que contenham linhas de assunto, threads ou participantes, geralmente encontrados em casos ou threads de e-mail:
- Coluna de assunto — a coluna que contém o assunto da mensagem.
- Coluna do remetente - A coluna que contém o remetente.
- Coluna Para — a coluna que contém um ou mais destinatários. Certifique-se de que vários destinatários estejam separados por ponto e vírgula
;. - Coluna Cc — a coluna que contém um ou mais destinatários no campo Cc. Certifique-se de que vários destinatários estejam separados por ponto e vírgula
;.- Para obter mais detalhes sobre o uso dos formatos corretos nos campos Remetente, Para e Cc, consulte Usando os formatos corretos.
- Coluna ID do thread - A coluna que contém o ID do thread de mensagem. O ID da thread vincula mensagens diferentes para o mesmo thread.
- Você pode selecionar as propriedades do usuário adicionais que você deseja carregar com as mensagens. As propriedades do usuário são metadados contextuais associados a cada mensagem que você pode filtrar na plataforma. Os modelos de aprendizado de máquina na plataforma também podem aproveitar essas propriedades de usuário, que são dos seguintes tipos:
- Propriedades de usuário de string são metadados categorizados, por exemplo, IDs, países, contrapartes e assim por diante.
- As Propriedades de número do usuário são metadados numéricos, por exemplo, NPS, estatísticas de e-mail, valores e assim por diante.
Observação: se seu arquivo contiver uma pontuação NPS como propriedade do usuário, você deve incluir isso como uma propriedade numérica e nomeá-laNPSapenas para acionar os gráficos do NPS nativos a serem carregados na plataforma. - Depois de selecionar todas as propriedades do usuário, selecione Carregar.
Você será solicitado a inspecionar as mensagens carregadas em um conjunto de dados que contém a origem para a qual você carregou dados. Se a origem não estiver associada a nenhum conjunto de dados, você pode criar um novo conjunto de dados para verificar se o upload está sendo conforme o esperado.
Observação: se você cometeu um erro ao selecionar as propriedades do usuário, você pode carregar o mesmo arquivo novamente. A plataforma usará o ID da coluna como identificador para substituir as mensagens e propriedades existentes. Isso não afetará os rótulos aplicados às mensagens existentes.
O formato Remetente/Para/CC
Certifique-se de que:
- O número de destinatários não excede o máximo de 2.048 por thread.
- O remetente ou qualquer destinatário não excede o limite de 512 caracteres.
- Há apenas um ponto e vírgula em uma linha. Por exemplo, o seguinte está formatado incorretamente: john@email.com ; beth@email.com.
- Exemplo 1: Roberto Bog <rob.bog@gmail.com>; John Smith <john.smith@gmail.com>
- Exemplo 2: rob.bog@gmail.com ;john.smith@gmail.com
- Exemplo 3: rob.bog@gmail.com ; john.smith@gmail.com
;.
Antes de carregar seus dados, certifique-se de que os emails estejam formatados corretamente.
O formato do carimbo de data/hora
01/02/03 10:10, é possível sugerir a interpretação correta:
- 2 de janeiro de 2003 - Nenhum
- 1º de fevereiro de 2003 - primeiro dia
- 3 de fevereiro de 2001 — primeiro ano
- 2 de março de 2001 - Primeiro dia + Ano primeiro
RFC 3339 . Por exemplo, 2020-01-31T12:34:56Z para UTC ou com um fuso horário: 2020-08-031T11:20:60-08:00.
Esta seção contém as possíveis mensagens de erro que podem ocorrer durante o processo de upload e as soluções para cada uma delas.
Nas mensagens de erro a seguir, {some Service} mapeia as informações contextuais sobre onde o erro ocorreu. Além disso, a forma como nos referimos a uma posição no arquivo é padronizada como:
| String | Expande para: |
|---|---|
| {position} | registro {row-number} na linha {line-number} coluna {column-number} (byte {byte-number}) |
O título da mensagem de erro é exibido junto com uma descrição, conforme mostrado na imagem a seguir:
| Tipo de Erro | Mensagem de Erro | Description |
|---|---|---|
| Colunas Sem Colunas Sem Coluna | O arquivo CSV contém apenas {number-columns} colunas, mas são necessárias pelo menos três, ou seja, texto, carimbo de data/hora e id. | O CSV carregado não contém pelo menos três colunas ou a plataforma detectou incorretamente a codificação do arquivo. |
| Codificação Inválida | O arquivo contém caracteres inválidos, onde a codificação é detectada como {detected-encoding}. | O arquivo não está codificado corretamente como UTF-8, UTF-16 ou UTF-32. A plataforma detecta automaticamente o formato do arquivo. |
| Cabeçalho Inválido | string:ti:er' não corresponde '(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)' | Se um cabeçalho de coluna for um nome inválido para uma propriedade de usuário, a plataforma retornará a mensagem padrão para quando o esquema de uma solicitação for inválido. Verifique se cada cabeçalho de coluna tem um formato válido para seu propósito. O tamanho máximo de um cabeçalho de coluna é de 32 caracteres alfanuméricos. |
| Comprimentos de Linhas Desiguais | O CSV contém comprimentos de linha desiguais. A mensagem {position} tem {number} campos, mas o registro anterior tem {number} campos. | O CSV contém linhas com números diferentes de células ou que são inconsistentes com o número de cabeçalhos. |
| Formato do ID | ID de mensagem inválido para {record}. Os IDs podem consistir apenas em caracteres alfanuméricos ASCII e pontuação, exceto barra /. Valor da célula: {ell-value}.
| Ocorre quando um campo de ID consiste em caracteres inválidos, conforme descrito na mensagem de erro. |
| Tamanho do ID | O ID é muito longo para a mensagem {record}. Ele tem {number} bytes, o que é esperado no máximo 1024. | Ocorre quando um campo de ID é mais longo do que o comprimento máximo permitido, 1024 caracteres. |
| Formato do carimbo de data/hora | Carimbo de data/hora formatado incorretamente na mensagem {position}: {timestamp-error-message}. Valor da célula: {ell-value}. | Ocorre quando um campo de carimbo de data/hora não pode ser analisado. |
| Tamanho da Mensagem | A mensagem é muito longa para a mensagem {position}. Ela tem {number} bytes, o que é esperado no máximo 65536. | Ocorre quando um campo de mensagem é mais longo do que o comprimento máximo permitido, 65.536 caracteres. |
| Formato da Propriedade Numérica | Número formatado incorretamente na mensagem {position}: {number-error-message}. Valor da célula: {ell-value}. | Ocorre quando um campo de propriedade do usuário number não pode ser analisado. A plataforma deve permitir qualquer formato que possa ser decodificado como um número. |
| Tamanho da Propriedade | A propriedade é muito longa para a mensagem {position}. Ele tem {number} bytes, o que é esperado no máximo 4096. | Ocorre quando um campo de propriedade do usuário é maior do que o comprimento máximo permitido, 4096 caracteres. |
| Erro Desconhecido | Erro de CSV desconhecido: {underlying-error-message}. | Se ocorrer um erro desconhecido, tente carregar novamente. |