ixp

latest

false

Importante :

La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Guía del usuario de Communications Mining

Etiquetas de transformación de correo electrónico

Cuando los datos de correo electrónico se cargan en Communications Mining™, ya sea a través de una integración de Exchange o a través del punto final de la APIsync-raw-emails , la plataforma recibe el contenido MIME sin procesar de cada correo electrónico. MIME es el formato estándar que utilizan los proveedores de correo electrónico para enviar correos electrónicos. La plataforma convierte este contenido sin procesar en el mensaje que ves en un origen.

Una etiqueta de transformación es una configuración con nombre que controla cómo se produce esta conversión. Para las integraciones de Exchange, la etiqueta de transformación se establece en el origen. Para los puntos finales de la API sync-raw-emails y predict-raw-emails , se pasa como parámetro en cada solicitud.

Nota:

Las etiquetas de transformación solo se aplican a las cargas de correo electrónico sin formato. No tienen efecto en los datos cargados como archivo CSV o como comentarios preanalizados, incluidas las cargas realizadas utilizando las actividades de Communications Mining™.

Qué controlan las etiquetas de transformación

Una etiqueta de transformación controla, entre otras cosas:

Formato de texto : si los mensajes se almacenan como texto sin formato o con marcado (formato de texto enriquecido).
Extracción de firmas : qué modelo, si lo hay, se utiliza para detectar y separar las firmas de correo electrónico del cuerpo del mensaje. Las firmas detectadas se ocultan del modelo para que no añadan ruido a las predicciones.
Propiedades de usuario predeterminadas : si propiedades como el nombre del buzón desde el que se sincronizó un correo electrónico se establecen en cada mensaje automáticamente.

Comprobar qué etiqueta de transformación utiliza un origen

Utiliza la CLI para enumerar tus orígenes, incluida la etiqueta de transformación que utiliza cada uno:

re get sources
re get sources

La columna Transformar etiqueta muestra la etiqueta actual para cada origen. Un valor de missing significa que el origen no tiene ninguna etiqueta de transformación establecida. Los correos electrónicos sin procesar cargados a dicho origen se procesan con la configuración predeterminada.

Etiquetas de transformación disponibles

Si no especificas una etiqueta de transformación cuando se crea un origen, se utiliza un valor predeterminado razonable. Los nombres de las etiquetas siguen el formato <name>.<version>.<id> y siempre debes especificar la etiqueta completa, por ejemplo generic_simple_markup_set_id.0.3LPWBXWR.

Etiqueta	Características
`generic_simple_markup_set_id.0.3LPWBXWR`	Recomendado para la mayoría de las fuentes. Utiliza marcado. Un modelo de aprendizaje automático detecta y elimina las firmas. Establece el nombre del buzón como propiedad de usuario.
`generic_simp_mark_noop_setid.0.CHOJQ3XY`	Como arriba, pero sin extracción de firma. El cuerpo completo del correo electrónico, incluidas las firmas, es visible para el modelo.

Con ambas etiquetas, solo se procesa el mensaje más reciente de una cadena de correo electrónico. El historial citado de mensajes anteriores se recorta del cuerpo del mensaje.

Nota:

Las fuentes más antiguas pueden utilizar una etiqueta de transformación que no se enumera aquí, normalmente una etiqueta de texto sin formato más antigua. Estos siguen funcionando, pero prefieren las etiquetas de marcado enumeradas anteriormente. Conservan el formato del correo electrónico original, como las tablas, que tanto la IU de la plataforma como la extracción generativa pueden aprovechar.

Cuándo cambiar la etiqueta de transformación

Para una interrupción mínima, comprueba la etiqueta de transformación que tu origen utiliza actualmente y elige una con características similares, cambiando solo el comportamiento que necesitas. Escenarios comunes:

Desactivar la extracción de firmas : la extracción de firmas oculta ocasionalmente el contenido que deseas que el modelo lea, por ejemplo, los números de referencia en la firma de un correo electrónico reenviado. Cambia de generic_simple_markup_set_id.0.3LPWBXWR a generic_simp_mark_noop_setid.0.CHOJQ3XY.

ADVERTENCIA:
Deshabilitar la extracción de firmas hace que toda la firma sea visible para el modelo en cada mensaje, lo que introduce ruido y puede reducir la calidad del modelo. Desactívala solo si el contenido que se oculta tiene un alto impacto en tu caso de uso.
Habilitar marcado : si tu origen utiliza una etiqueta de texto sin formato más antigua y ves problemas de formato, o quieres que el modelo lea tablas y otro contenido enriquecido, cambia a generic_simple_markup_set_id.0.3LPWBXWR.
Enrutar automatizaciones por buzón : ambas etiquetas enumeradas anteriormente registran el buzón desde el que se sincronizó cada correo electrónico como una propiedad de usuario, que las automatizaciones posteriores pueden leer, por ejemplo, para enrutar elementos de trabajo por región cuando varios buzones comparten un origen. Es posible que las etiquetas más antiguas no establezcan esta propiedad.

Aplicar una etiqueta de transformación

Integraciones de Exchange: establece la etiqueta en el origen

Los orígenes se crean automáticamente cuando añades un buzón a través de una integración de Exchange. Usa la CLI para cambiar la etiqueta de transformación de un origen existente:

re update source <project>/<source-name> --transform-tag <tag>
re update source <project>/<source-name> --transform-tag <tag>

Por ejemplo:

re update source DefaultProject/Demo --transform-tag generic_simp_mark_noop_setid.0.CHOJQ3XY
re update source DefaultProject/Demo --transform-tag generic_simp_mark_noop_setid.0.CHOJQ3XY

La actualización surte efecto inmediatamente. Los correos electrónicos ya sincronizados en el origen se vuelven a procesar con la nueva configuración, lo que puede tardar una hora o más para orígenes grandes. Consulta Advertencias antes de cambiar la etiqueta en un origen de producción.

También puedes establecer la etiqueta al crear un origen en un depósito existente:

re create source <project>/<source-name> --bucket <bucket> --transform-tag <tag>
re create source <project>/<source-name> --bucket <bucket> --transform-tag <tag>

Si especificas una etiqueta no válida, la plataforma rechaza la solicitud con un error 422 .

Cargas de API: pasa la etiqueta en la solicitud

Los puntos finales sync-raw-emails y predict-raw-emails toman un parámetro transform_tag en el cuerpo de la solicitud. Pasa la misma etiqueta de forma coherente para todas las cargas a un origen y utiliza la misma etiqueta en el momento de la predicción que se utilizó para cargar los datos de entrenamiento, de modo que los mensajes que el modelo ve en runtime coincidan con los mensajes en los que se entrenó.

Probar una nueva etiqueta de transformación

Antes de cambiar la etiqueta de transformación en una fuente de producción, prueba la nueva etiqueta en una copia de tus datos:

Crea un nuevo origen que haga referencia al mismo depósito, con la nueva etiqueta de transformación:

re create source <project>/<test-source-name> --bucket <bucket> --transform-tag <new-tag>
re create source <project>/<test-source-name> --bucket <bucket> --transform-tag <new-tag>

Crea un nuevo conjunto de datos o duplica el existente y añádele el nuevo origen.
Revisa cómo se analizan los mensajes y supervisa la validación si entrenas con los nuevos datos.

Reprocesar datos existentes en un origen de prueba no consume AI Unit.

Advertencias

Cambiar la etiqueta de transformación en un origen existente reprocesa sus datos. El reprocesamiento tarda una hora o más para orígenes grandes. Durante el reprocesamiento, el conjunto de datos contiene una combinación de mensajes analizados con la configuración antigua y la nueva, lo que puede reducir temporalmente la puntuación del modelo.
Cambiar la forma en que se analiza el texto puede afectar al rendimiento del modelo. El modelo se entrenó en mensajes analizados con la configuración antigua. Los cambios significativos, como deshabilitar la extracción de firmas o cambiar entre texto sin formato y marcado, cambian el texto que ve el modelo y las puntuaciones de validación pueden cambiar. Supervisa la validación después del cambio y vuelve a entrenar según sea necesario.
Las automatizaciones de producción pueden interrumpirse. Si una automatización de producción consume un flujo en el conjunto de datos afectado, cambiar el formato del mensaje, por ejemplo de texto sin formato a marcado, puede romper la automatización posterior. Pruebe primero el cambio en un origen y un conjunto de datos independientes, y actualice su automatización antes de cambiar el origen de producción.

En esta página

Qué controlan las etiquetas de transformación
Comprobar qué etiqueta de transformación utiliza un origen
Etiquetas de transformación disponibles
Cuándo cambiar la etiqueta de transformación
Aplicar una etiqueta de transformación
Integraciones de Exchange: establece la etiqueta en el origen
Cargas de API: pasa la etiqueta en la solicitud
Probar una nueva etiqueta de transformación
Advertencias

¿Te ha resultado útil esta página?

AnteriorUtilizar integraciones de Exchange

Sig.Comprender el entrenamiento del modelo

Guía del usuario de Communications Mining

Qué controlan las etiquetas de transformación​

Comprobar qué etiqueta de transformación utiliza un origen​

Etiquetas de transformación disponibles​

Cuándo cambiar la etiqueta de transformación​

Aplicar una etiqueta de transformación​

Integraciones de Exchange: establece la etiqueta en el origen​

Cargas de API: pasa la etiqueta en la solicitud​

Probar una nueva etiqueta de transformación​

Advertencias​