Extracción y Procesamiento Inteligentes: Extracción de campos general

ixp

latest

false

Guía del usuario de Communications Mining

Importante :

La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Extracción de campos general

Tipos de salida estructurada Communications Mining extrae de texto no estructurado, cubriendo etiquetas y campos generales con ejemplos.

Communications Mining™ extrae los siguientes tipos de salida del texto no estructurado:

Etiquetas
Campos generales

Las etiquetas describen el mensaje completo, por ejemplo, Cancelación, Fallo comercial o Urgente. Los campos generales se refieren a partes específicas del mensaje, por ejemplo, Nombre de la contraparte, ID de cliente o Fecha de cancelación.

En un proceso posterior, las etiquetas se utilizan para clasificar, priorizar y decidir qué tipo de acción se debe realizar. Los campos generales se utilizan para rellenar los campos de las solicitudes. Por ejemplo, un proceso descendente puede filtrar los mensajes a aquellos que tienen la etiqueta Cancelación, y luego utilizar los campos generales ID de cliente y Fecha de cancelación extraídos para llamar a una API para procesar automáticamente la cancelación.

Campos generales integrados

Communications Mining viene con una serie de campos generales integrados para conceptos comunes, como Organización, Código de moneda o Fecha. Puedes personalizar los campos generales integrados de Communications Mining para que se adapten a tu caso de uso específico.

Por ejemplo, Communications Mining tiene un campo general Fecha prediseñado altamente entrenado que puedes utilizar como punto de partida para un campo general más personalizado como Fecha de renovación o Fecha de cancelación. Como alternativa, puedes empezar desde cero y enseñar a Communications Mining a reconocer algo completamente nuevo.

Configurar campos generales

Utilizaremos un caso de uso de seguros como ejemplo. El buzón de la aseguradora recibe correos electrónicos de los corredores que deben clasificarse en diferentes equipos para su procesamiento. En este ejemplo, el conjunto de datos ya se ha entrenado y la taxonomía tiene el siguiente aspecto:

Figura 1. Taxonomía de ejemplo

Este buzón recibe solicitudes de renovación, cancelación y administración que ocasionalmente son Urgentes. Communications Mining™ ha sido entrenado para reconocer cada uno de estos conceptos, y las predicciones de Communications Mining pueden utilizarse para clasificar los correos electrónicos al equipo correcto creando tickets de soporte.

Para garantizar que el cliente recibe una respuesta rápida, podemos extraer algunos puntos de datos clave que ayudarán a los equipos posteriores a procesar la solicitud. En concreto, queremos extraer el número de póliza, el nombre de la organización asegurada y el nombre del corredor del correo electrónico. Para ello, podemos utilizar la extracción general de campos.

Figura 2. Campos generales configurados

Dado que el formato del número de póliza es específico de esta aseguradora en particular, configuramos el campo general para que sea entrenable desde cero. Por otro lado, la organización asegurada es un tipo de organización, por lo que la configuramos para que sea entrenable en función del campo general Organización integrado.

Por último, observamos que los intermediarios no siempre ponen su nombre en el correo electrónico, por lo que decidimos utilizar la dirección de correo electrónico del intermediario (disponible en los metadatos de los comentarios) para buscar el nombre correspondiente en una base de datos interna, en lugar de extraerlo como un campo general.

La siguiente tabla resume estos enfoques.

Configuración	Cuándo utilizarlo	Ejemplos
Campo general entrenable sin campo general base	Se utiliza con mayor frecuencia para varios tipos de ID internos, o cuando no hay un campo general base adecuado en Communications Mining.	Número de póliza, ID de cliente
Campo general entrenable con campo general base	Se utiliza para personalizar un campo general prediseñado existente en Communications Mining.	Fecha de cancelación (basada en la fecha), organización asegurada (basada en la organización)
Campos generales prediseñados (no entrenables)	Se utiliza para campos generales que deben coincidir exactamente como se definen, en los que el entrenamiento invitaría a errores.	es en
Utilizar metadatos de comentarios en lugar de campos generales	Se utiliza cuando la información necesaria ya está presente en forma estructurada en los metadatos del comentario.	Dirección del remitente, Dominio del remitente

Utilizar campos generales en tu aplicación

Communications Mining™ ofrece múltiples formas de obtener predicciones, incluidos los campos generales previstos. Consulta la descripción general de la descarga de datos para comprender qué método funcionará mejor para tu caso de uso.

Cualquiera que sea el método que elijas, debes tener en cuenta los siguientes casos límite y manejarlos en tu aplicación:

No todos los campos generales esperados están presentes en la respuesta
La respuesta contiene varias coincidencias para uno o más campos generales
No todos los campos generales presentes en la respuesta son correctos

En esta sección repasaremos cada uno de estos casos límite con más detalle.

No todos los campos generales están presentes en la respuesta

Debes esperar manejar casos en los que no todos los campos generales esperados estén presentes. En el siguiente ejemplo, el correo electrónico tiene el número de póliza, pero no tiene el nombre de la organización asegurada. Tu aplicación debe poder gestionar dicha información parcial.

Figura 3. Organización asegurada que falta

La respuesta contiene varias coincidencias para uno o más campos generales

También debes esperar manejar lo contrario del caso anterior, es decir, los casos en los que un comentario tiene más campos generales de los esperados. En el siguiente ejemplo, aunque esperamos un número de póliza y un nombre de organización asegurada por correo electrónico, el correo electrónico tiene varios números de póliza.

Figura 4. Múltiples coincidencias para el mismo campo general

Nota:

Puedes utilizar los metadatos en la respuesta al gestionar estos casos. Por ejemplo, podemos elegir elegir preferentemente los números de póliza que aparecen en el asunto del correo electrónico sobre los que aparecen en el cuerpo del correo electrónico. El siguiente ejemplo muestra la respuesta que la API devolverá para nuestro correo electrónico de ejemplo.

{
  "predictions": [
    {
      "uid": "aa05ba2250de48e3.7588b85f68f81c3b",
      "labels": [...],
      "entities": [
        {
          "id": "6a1d11118b60868e",
          "name": "policy-number",
          "span": {
            "content_part": "body",
            "message_index": 0,
            "utf16_byte_start": 200,
            "utf16_byte_end": 222,
            "char_start": 100,
            "char_end": 111
          },
          "kind": "policy-number",
          "formatted_value": "GHI-0204963"
        },
        {
          "id": "6a1d11118b60868e",
          "name": "policy-number",
          "span": {
            "content_part": "subject",
            "message_index": 0,
            "utf16_byte_start": 0,
            "utf16_byte_end": 22,
            "char_start": 0,
            "char_end": 11
          },
          "kind": "policy-number",
          "formatted_value": "GHI-0068448"
        },
        {...},
        {...},
        {...}
      ]
    }
  ],
  "model": {
    "version": 31,
    "time": "2021-07-14T15:00:57.608000Z"
  },
  "status": "ok"
}
{
  "predictions": [
    {
      "uid": "aa05ba2250de48e3.7588b85f68f81c3b",
      "labels": [...],
      "entities": [
        {
          "id": "6a1d11118b60868e",
          "name": "policy-number",
          "span": {
            "content_part": "body",
            "message_index": 0,
            "utf16_byte_start": 200,
            "utf16_byte_end": 222,
            "char_start": 100,
            "char_end": 111
          },
          "kind": "policy-number",
          "formatted_value": "GHI-0204963"
        },
        {
          "id": "6a1d11118b60868e",
          "name": "policy-number",
          "span": {
            "content_part": "subject",
            "message_index": 0,
            "utf16_byte_start": 0,
            "utf16_byte_end": 22,
            "char_start": 0,
            "char_end": 11
          },
          "kind": "policy-number",
          "formatted_value": "GHI-0068448"
        },
        {...},
        {...},
        {...}
      ]
    }
  ],
  "model": {
    "version": 31,
    "time": "2021-07-14T15:00:57.608000Z"
  },
  "status": "ok"
}

No todos los campos generales presentes en la respuesta son correctos

Por último, dado que los campos generales se extraen mediante el aprendizaje automático, debes esperar recibir coincidencias incorrectas. El número de coincidencias incorrectas dependerá del campo general que esté utilizando. La página Validación de tu conjunto de datos proporciona estadísticas de validación para comprender cómo funcionará un campo general.

Figura 5. Validación general de campos

En esta página

Campos generales integrados
Configurar campos generales
Utilizar campos generales en tu aplicación
No todos los campos generales están presentes en la respuesta
La respuesta contiene varias coincidencias para uno o más campos generales
No todos los campos generales presentes en la respuesta son correctos

¿Te ha resultado útil esta página?

AnteriorIntegración de Elasticsearch

Sig.Integración de Exchange autohospedado

Campos generales integrados​

Configurar campos generales​

Utilizar campos generales en tu aplicación​

No todos los campos generales están presentes en la respuesta​

La respuesta contiene varias coincidencias para uno o más campos generales​

No todos los campos generales presentes en la respuesta son correctos​