communications-mining
latest
false
- Documentos de la API
- Introducción
- Información general
- Comentarios
- Etiquetas y campos generales
- Tenants
- Uso de la API
- Tutorial de la API
- Resumen
- Fuentes
- Conjuntos de datos
- Comentarios
- Archivos adjuntos
- Predictions
- Crear una transmisión
- Actualizar una transmisión
- Obtener una transmisión por nombre
- Obtener todas las transmisiones
- Eliminar una transmisión
- Obtener resultados de la transmisión
- Obtener comentarios de una transmisión (heredado)
- Avanzar una transmisión
- Restablecer una transmisión
- Etiquetar una excepción
- Desetiquetar una excepción
- Eventos de auditoría
- Obtener todos los usuarios
- CLI
- Guías de integración
- Blog
- Cómo aprenden las máquinas a entender palabras: una guía para las incrustaciones en PNL
- Aprendizaje basado en solicitudes con Transformers
- Efficient Transformers II: destilación de conocimientos y ajuste
- Transformadores eficientes I: mecanismos de atención
- Modelado de intenciones jerárquico profundo no supervisado: obtener valor sin datos de entrenamiento
- Corrección del sesgo de anotación con Communications Mining
- Aprendizaje activo: mejores modelos ML en menos tiempo
- Todo está en los números: evaluar el rendimiento del modelo con métricas
- Por qué es importante la validación del modelo
- Comparación de Communications Mining y Google AutoML para la inteligencia de datos conversacional
Información general
Importante :
Este contenido se ha traducido mediante traducción automática.
Guía para desarrolladores de Communications Mining
Last updated 3 de oct. de 2024
Información general
Esta sección ofrece una descripción general de los conceptos básicos de la plataforma.
Para obtener más información sobre la plataforma desde la perspectiva del usuario final, consulta nuestra Guía de usuario de Communications Mining.
Concepto | Descripción | Ejemplo |
---|---|---|
Origen | En Communications Mining, los datos se organizan en fuentes de datos o fuentes. Normalmente, una fuente corresponde a un canal. Un buzón de correo electrónico, los resultados de una encuesta o un conjunto de reseñas de clientes son ejemplos de datos que pueden cargarse en Communications Mining como fuente de datos. Se pueden combinar varias fuentes para crear un modelo, por lo que es mejor errar por el lado de varias fuentes en lugar de una sola fuente monolítica. | El diagrama muestra datos de correo electrónico (Origen A, que contiene correos electrónicos individuales) y datos de reseñas de clientes (Fuentes B y C, que contienen reseñas de clientes individuales). Los datos de las opiniones de los clientes se dividen en dos fuentes en función del origen de los datos, pero se combinarán en un único conjunto de datos con el fin de crear un modelo común. |
Comentario | Dentro de las fuentes, cada parte individual de la comunicación de texto se representa como un comentario. Un comentario siempre tendrá un ID, una marca de tiempo y un cuerpo de texto, además de campos adicionales en función del tipo de datos que represente. Por ejemplo, los correos electrónicos tendrán los campos de correo electrónico esperados como "de", "para", "cc", etc. | El diagrama muestra cómo los distintos tipos de comentarios utilizan los campos de comentarios disponibles . Por ejemplo, en un comentario de correo electrónico, el campo "De" contiene la dirección del remitente, mientras que en un comentario de evaluación de cliente contiene el autor de la evaluación. Los campos de metadatos (que se muestran en la parte inferior de cada comentario) son definidos por el usuario. Observa cómo utilizamos el mismo conjunto de campos para ambas fuentes de reseñas de clientes: dado que queremos combinarlos en un único conjunto de datos, los datos deben ser coherentes para garantizar un buen rendimiento del modelo. |
ConjuntoDeDatos | Un conjunto de datos te permite anotar una o más fuentes para construir un modelo. Una fuente puede incluirse en varios conjuntos de datos. El conjunto de todas las etiquetas de un conjunto de datos se denomina taxonomía. | El diagrama muestra dos conjuntos de datos creados sobre los datos del buzón de soporte y un conjunto de datos que combina los datos de las reseñas de los clientes. Ten en cuenta que, aunque el Conjunto de datos 1 y el Conjunto de datos 2 se basan en los mismos datos, su taxonomía de etiquetas es diferente, porque sus casos de uso (análisis y automatización) requieren diferentes conjuntos de etiquetas. |
Modelo | El modelo se actualiza continuamente a medida que los usuarios anotan más datos. Para recibir predicciones coherentes, es necesario especificar un número de versión del modelo al consultar el modelo. | |
Etiqueta | Las etiquetas se aplican al entrenar un modelo y se devuelven al consultar el modelo en busca de predicciones. Cuando las etiquetas se devuelven como predicciones, tienen una puntuación de confianza asociada que indica la probabilidad de que el modelo crea que se aplica la predicción. Para convertir la predicción en una respuesta "Sí/No", la puntuación de confianza debe compararse con un umbral, que se elige para representar una compensación adecuada de precisión/recuperación. | Las etiquetas las asignan los usuarios de Communications Mining al entrenar el modelo. La interfaz de usuario de Communications Mining ayuda al usuario a anotar los comentarios más relevantes, a garantizar que las etiquetas se apliquen de forma coherente y que se anoten suficientes comentarios para producir un modelo de buen rendimiento. |