communications-mining
latest
false
- API 文档
- CLI
- 集成指南
- 博客
重要 :
请注意,此内容已使用机器翻译进行了本地化。
Communications Mining 开发者指南
Last updated 2024年11月19日
配置常规字段
我们将使用保险用例作为示例。 保险公司邮箱接收来自代理的电子邮件,应将其分类到不同的团队进行处理。 在此示例中,数据集已经过训练,分类如下所示:
图 1.分类示例
此邮箱偶尔会收到紧急的续订请求、取消请求和管理员请求。 Communications Mining 已经过训练,可以识别每个概念,并且 Communications Mining 预测可用于通过创建支持工单,将电子邮件分类到正确的团队。
为确保快速响应客户,我们可以提取一些关键数据点,以帮助下游团队处理请求。 具体来说,我们要从电子邮件中提取保单编号、受保组织名称和经纪人名称。 我们可以使用常规字段提取来执行此操作。
图 2.已配置的常规字段
由于保单编号格式特定于该特定保险公司,因此我们将常规字段配置为可从头开始训练。 另一方面,参保组织是一种组织,因此我们根据内置的组织常规字段将其配置为可培训。 最后,我们注意到代理并不总是将其名称输入到电子邮件中,因此我们决定使用代理电子邮件地址(可从注释元数据中获取)在内部数据库中查找相应的名称,而不是将其提取为常规字段。
下表总结了这些方法。
配置 | 何时使用 | 示例 |
---|---|---|
不含基本通用字段的可训练通用字段 | 最常用于各种内部 ID,或者在 Communications Mining 中没有合适的基本常规字段时使用。 | 保单编号、客户 ID |
具有基本通用字段的可训练通用字段 | 用于自定义 Communications Mining 中现有的预构建常规字段。 | 取消日期(基于日期)、受保组织(基于组织) |
预构建的常规字段(不可训练) | 用于应完全按照定义匹配的一般字段,否则训练会导致出错。 | 位于 |
使用注释元数据代替常规字段 | 当注释元数据中已以结构化形式显示所需信息时使用。 | 发件人地址、发件人域 |