- Introducción
- Configuración de su cuenta
- Equilibrio
- Clústeres
- Deriva del concepto
- Cobertura
- Conjuntos de datos
- Campos generales
- Etiquetas (predicciones, niveles de confianza, jerarquía de etiquetas y sentimiento de etiqueta)
- Modelos
- Transmisiones
- Clasificación del modelo
- Proyectos
- Precisión
- Recordar
- Mensajes anotados y no anotados
- Campos extraídos
- Fuentes
- Taxonomías
- Formación
- Predicciones positivas y negativas verdaderas y falsas
- Validación
- Mensajes
- Control y administración de acceso
- Gestionar fuentes y conjuntos de datos
- Comprender la estructura de datos y los permisos
- Crear o eliminar un origen de datos en la GUI
- Preparando datos para cargar archivos .CSV
- Cargar un archivo CSV en un origen
- Crear un conjunto de datos
- Fuentes y conjuntos de datos multilingües
- Habilitar sentimiento en un conjunto de datos
- Modificar la configuración del conjunto de datos
- Eliminar un mensaje
- Eliminar un conjunto de datos
- Exportar un conjunto de datos
- Utilizar integraciones de Exchange
- Etiquetas de transformación de correo electrónico
- Entrenamiento y mantenimiento de modelos
- Comprender las etiquetas, los campos generales y los metadatos
- Jerarquía de etiquetas y mejores prácticas
- Comparar casos de uso de análisis y automatización
- Convertir tus objetivos en etiquetas
- Descripción general del proceso de entrenamiento del modelo
- Anotación generativa
- Estado de Dastaset
- Entrenamiento de modelos y mejores prácticas de anotación
- Entrenamiento con análisis de sentimiento de etiqueta habilitado
- Comprender los requisitos de datos
- Entrenamiento
- Introducción a Refinar
- Explicación de la precisión y la recuperación
- Precisión y recuperación
- Cómo funciona la validación
- Comprender y mejorar el rendimiento del modelo
- Razones para etiquetar una precisión media baja
- Entrenamiento utilizando la etiqueta Comprobar y la etiqueta Perdida
- Entrenamiento mediante la etiqueta de aprendizaje (refinar)
- Entrenamiento mediante Buscar (Refinar)
- Comprender y aumentar la cobertura
- Mejorar el equilibrio y utilizar Reequilibrar
- Cuándo dejar de entrenar tu modelo
- Uso de campos generales
- Extracción generativa
- Uso de análisis y supervisión
- Automations and Communications Mining™
- Desarrollador
- Uso de la API
- Tutorial de la API
- Fuentes
- Conjuntos de datos
- Comentarios
- Archivos adjuntos
- Predictions
- Crear una transmisión
- Actualizar una transmisión
- Obtener una transmisión por nombre
- Obtener todas las transmisiones
- Eliminar una transmisión
- Obtener resultados de la transmisión
- Obtener comentarios de una transmisión (heredado)
- Avanzar una transmisión
- Restablecer una transmisión
- Etiquetar una excepción
- Desetiquetar una excepción
- Eventos de auditoría
- Obtener todos los usuarios
- Cargar datos
- Descargando datos
- Integración de Exchange con el usuario del servicio de Azure
- Integración de Exchange con la autenticación de aplicaciones de Azure
- Integración de Exchange con Azure Application Authentication y Graph
- Guía de migración: servicios web de Exchange (EWS) a la API de Microsoft Graph
- Obtener datos para Tableau con Python
- Integración de Elasticsearch
- Extracción de campos general
- Integración de Exchange autohospedado
- Marco de automatización de UiPath®
- Actividades oficiales de UiPath®
- Cómo aprenden las máquinas a entender palabras: una guía para las incrustaciones en PNL
- Aprendizaje basado en solicitudes con Transformers
- Efficient Transformers II: destilación de conocimientos y ajuste
- Transformadores eficientes I: mecanismos de atención
- Modelado de intenciones jerárquico profundo no supervisado: obtener valor sin datos de entrenamiento
- Corregir el sesgo de anotación con Communications Mining™
- Aprendizaje activo: mejores modelos ML en menos tiempo
- Todo está en los números: evaluar el rendimiento del modelo con métricas
- Por qué es importante la validación del modelo
- Comparación de Communications Mining™ y Google AutoML para la inteligencia de datos conversacional
- Licencia
- Preguntas frecuentes y más
Guía del usuario de Communications Mining
Cuando los datos de correo electrónico se cargan en Communications Mining™, ya sea a través de una integración de Exchange o a través del punto final de la APIsync-raw-emails , la plataforma recibe el contenido MIME sin procesar de cada correo electrónico. MIME es el formato estándar que utilizan los proveedores de correo electrónico para enviar correos electrónicos. La plataforma convierte este contenido sin procesar en el mensaje que ves en un origen.
Una etiqueta de transformación es una configuración con nombre que controla cómo se produce esta conversión. Para las integraciones de Exchange, la etiqueta de transformación se establece en el origen. Para los puntos finales de la API sync-raw-emails y predict-raw-emails , se pasa como parámetro en cada solicitud.
Las etiquetas de transformación solo se aplican a las cargas de correo electrónico sin formato. No tienen efecto en los datos cargados como archivo CSV o como comentarios preanalizados, incluidas las cargas realizadas utilizando las actividades de Communications Mining™.
Qué controlan las etiquetas de transformación
Una etiqueta de transformación controla, entre otras cosas:
- Formato de texto : si los mensajes se almacenan como texto sin formato o con marcado (formato de texto enriquecido).
- Extracción de firmas : qué modelo, si lo hay, se utiliza para detectar y separar las firmas de correo electrónico del cuerpo del mensaje. Las firmas detectadas se ocultan del modelo para que no añadan ruido a las predicciones.
- Propiedades de usuario predeterminadas : si propiedades como el nombre del buzón desde el que se sincronizó un correo electrónico se establecen en cada mensaje automáticamente.
Comprobar qué etiqueta de transformación utiliza un origen
Utiliza la CLI para enumerar tus orígenes, incluida la etiqueta de transformación que utiliza cada uno:
re get sources
re get sources
La columna Transformar etiqueta muestra la etiqueta actual para cada origen. Un valor de missing significa que el origen no tiene ninguna etiqueta de transformación establecida. Los correos electrónicos sin procesar cargados a dicho origen se procesan con la configuración predeterminada.
Etiquetas de transformación disponibles
Si no especificas una etiqueta de transformación cuando se crea un origen, se utiliza un valor predeterminado razonable. Los nombres de las etiquetas siguen el formato <name>.<version>.<id> y siempre debes especificar la etiqueta completa, por ejemplo generic_simple_markup_set_id.0.3LPWBXWR.
| Etiqueta | Características |
|---|---|
generic_simple_markup_set_id.0.3LPWBXWR | Recomendado para la mayoría de las fuentes. Utiliza marcado. Un modelo de aprendizaje automático detecta y elimina las firmas. Establece el nombre del buzón como propiedad de usuario. |
generic_simp_mark_noop_setid.0.CHOJQ3XY | Como arriba, pero sin extracción de firma. El cuerpo completo del correo electrónico, incluidas las firmas, es visible para el modelo. |
Con ambas etiquetas, solo se procesa el mensaje más reciente de una cadena de correo electrónico. El historial citado de mensajes anteriores se recorta del cuerpo del mensaje.
Las fuentes más antiguas pueden utilizar una etiqueta de transformación que no se enumera aquí, normalmente una etiqueta de texto sin formato más antigua. Estos siguen funcionando, pero prefieren las etiquetas de marcado enumeradas anteriormente. Conservan el formato del correo electrónico original, como las tablas, que tanto la IU de la plataforma como la extracción generativa pueden aprovechar.
Cuándo cambiar la etiqueta de transformación
Para una interrupción mínima, comprueba la etiqueta de transformación que tu origen utiliza actualmente y elige una con características similares, cambiando solo el comportamiento que necesitas. Escenarios comunes:
-
Desactivar la extracción de firmas : la extracción de firmas oculta ocasionalmente el contenido que deseas que el modelo lea, por ejemplo, los números de referencia en la firma de un correo electrónico reenviado. Cambia de
generic_simple_markup_set_id.0.3LPWBXWRageneric_simp_mark_noop_setid.0.CHOJQ3XY.ADVERTENCIA:Deshabilitar la extracción de firmas hace que toda la firma sea visible para el modelo en cada mensaje, lo que introduce ruido y puede reducir la calidad del modelo. Desactívala solo si el contenido que se oculta tiene un alto impacto en tu caso de uso.
-
Habilitar marcado : si tu origen utiliza una etiqueta de texto sin formato más antigua y ves problemas de formato, o quieres que el modelo lea tablas y otro contenido enriquecido, cambia a
generic_simple_markup_set_id.0.3LPWBXWR. -
Enrutar automatizaciones por buzón : ambas etiquetas enumeradas anteriormente registran el buzón desde el que se sincronizó cada correo electrónico como una propiedad de usuario, que las automatizaciones posteriores pueden leer, por ejemplo, para enrutar elementos de trabajo por región cuando varios buzones comparten un origen. Es posible que las etiquetas más antiguas no establezcan esta propiedad.
Aplicar una etiqueta de transformación
Integraciones de Exchange: establece la etiqueta en el origen
Los orígenes se crean automáticamente cuando añades un buzón a través de una integración de Exchange. Usa la CLI para cambiar la etiqueta de transformación de un origen existente:
re update source <project>/<source-name> --transform-tag <tag>
re update source <project>/<source-name> --transform-tag <tag>
Por ejemplo:
re update source DefaultProject/Demo --transform-tag generic_simp_mark_noop_setid.0.CHOJQ3XY
re update source DefaultProject/Demo --transform-tag generic_simp_mark_noop_setid.0.CHOJQ3XY
La actualización surte efecto inmediatamente. Los correos electrónicos ya sincronizados en el origen se vuelven a procesar con la nueva configuración, lo que puede tardar una hora o más para orígenes grandes. Consulta Advertencias antes de cambiar la etiqueta en un origen de producción.
También puedes establecer la etiqueta al crear un origen en un depósito existente:
re create source <project>/<source-name> --bucket <bucket> --transform-tag <tag>
re create source <project>/<source-name> --bucket <bucket> --transform-tag <tag>
Si especificas una etiqueta no válida, la plataforma rechaza la solicitud con un error 422 .
Cargas de API: pasa la etiqueta en la solicitud
Los puntos finales sync-raw-emails y predict-raw-emails toman un parámetro transform_tag en el cuerpo de la solicitud. Pasa la misma etiqueta de forma coherente para todas las cargas a un origen y utiliza la misma etiqueta en el momento de la predicción que se utilizó para cargar los datos de entrenamiento, de modo que los mensajes que el modelo ve en runtime coincidan con los mensajes en los que se entrenó.
Probar una nueva etiqueta de transformación
Antes de cambiar la etiqueta de transformación en una fuente de producción, prueba la nueva etiqueta en una copia de tus datos:
-
Crea un nuevo origen que haga referencia al mismo depósito, con la nueva etiqueta de transformación:
re create source <project>/<test-source-name> --bucket <bucket> --transform-tag <new-tag>re create source <project>/<test-source-name> --bucket <bucket> --transform-tag <new-tag> -
Crea un nuevo conjunto de datos o duplica el existente y añádele el nuevo origen.
-
Revisa cómo se analizan los mensajes y supervisa la validación si entrenas con los nuevos datos.
Reprocesar datos existentes en un origen de prueba no consume AI Unit.
Advertencias
- Cambiar la etiqueta de transformación en un origen existente reprocesa sus datos. El reprocesamiento tarda una hora o más para orígenes grandes. Durante el reprocesamiento, el conjunto de datos contiene una combinación de mensajes analizados con la configuración antigua y la nueva, lo que puede reducir temporalmente la puntuación del modelo.
- Cambiar la forma en que se analiza el texto puede afectar al rendimiento del modelo. El modelo se entrenó en mensajes analizados con la configuración antigua. Los cambios significativos, como deshabilitar la extracción de firmas o cambiar entre texto sin formato y marcado, cambian el texto que ve el modelo y las puntuaciones de validación pueden cambiar. Supervisa la validación después del cambio y vuelve a entrenar según sea necesario.
- Las automatizaciones de producción pueden interrumpirse. Si una automatización de producción consume un flujo en el conjunto de datos afectado, cambiar el formato del mensaje, por ejemplo de texto sin formato a marcado, puede romper la automatización posterior. Pruebe primero el cambio en un origen y un conjunto de datos independientes, y actualice su automatización antes de cambiar el origen de producción.
- Qué controlan las etiquetas de transformación
- Comprobar qué etiqueta de transformación utiliza un origen
- Etiquetas de transformación disponibles
- Cuándo cambiar la etiqueta de transformación
- Aplicar una etiqueta de transformación
- Integraciones de Exchange: establece la etiqueta en el origen
- Cargas de API: pasa la etiqueta en la solicitud
- Probar una nueva etiqueta de transformación
- Advertencias