通过非结构化复杂文档的生成式提取功能,您可以定义字段(要提取的数据点)和字段组(将字段分组到一个概念下以供处理的方法)之间的关系。
首先确定您要从文档中提取的所有数据点或字段。然后,使用字段组将字段组织为连贯结构。字段组下定义的字段可以多次预测为该字段组的不同实例,并单独称为提取。
分类,即提取架构,是提示模型提取的所有字段的集合,并使用字段组以分层方式构建这些字段。
图 1. 定义提取架构
图 2. 提取架构示例