- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
Document Understanding 活动
- 为了提高稳定性,提示的数量限制为最多 50 个。
- 响应(即提取结果,也称为完成)字数限制为 700。也就是不得超过 700 个单词。这意味着您无法从单个提示词中提取超过 700 个单词。如果您的提取要求超过此限制,您可以将文档拆分为多个页面,单独处理,然后合并结果。
使用精确的语言
假设您正在向四五个不同的人询问您想在生成式提示中提出的问题。 如果您可以想象这些人会给出略有不同的答案,则说明您的用语过于歧义,您需要重新措辞以使其更加精确。
指定输出格式
为了使您的问题更具体,请要求提取程序以标准化格式返回答案。这可以减少歧义,提高回复准确性并简化下游处理。
例如,如果您要求生成式提示获取一个日期,请指定您希望如何返回日期: return date in yyyy-mm-dd format 。 如果您只需要年份,请指定: return the year, as a four digit number 。
您也可以将此方法用于数字。例如,您可以指定:return numbers which appear in parentheses as negative 或 return number in ##,###.## format 来标准化小数分隔符和千位分隔符,以便更轻松地进行下游处理。
提供预期选项
格式化的一种特殊情况是答案是一组已知的可能答案之一。
例如,在申请表上,您可能会问:What is the applicant’s marital status? Possible answers: Married, Unmarried, Separated, Divorced, Widowed, Other.
这不仅简化了下游处理,还提高了回复的准确性。
分步操作
为了最大限度地提高准确性,请将复杂的问题分解为简单的步骤。您不应询问 What is the termination date of this contract?,而应询问 First find termination section of contract, then determine termination date, then return date in yyyy-mm-dd format.
有很多方法可以用于分解问题。您甚至可以将请求编写为小型计算机 程序,如下 所示:
Execute the following program:
1: Find termination section or clause
2: Find termination date
3: Return termination date in yyyy-mm-dd format
4: Stop
Execute the following program:
1: Find termination section or clause
2: Find termination date
3: Return termination date in yyyy-mm-dd format
4: Stop
定义所需的编程样式(甚至可能使用 JSON 或 XML 语法)会强制生成式模型使用其编程技能,从而提高遵循说明的准确性。
避免算术或逻辑问题
不要要求提取程序执行求和、乘法、减法、比较或任何其他算术运算,因为它会犯基本错误,并且处理速度非常慢且成本高昂。而简单的机器人工作流永远不会出错,并且速度更快,成本更低。
出于上述相同原因,请勿要求其执行复杂的“if-then-else”类型逻辑。机器人工作流将更加准确和高效地处理此类运算。
表格
生成提取程序当前不支持列字段。 尽管您也许能够通过常规问题提取较小的表格并解析其输出,但请注意,这只是一种解决方法,并且存在限制。 它不是为提取通用的任意大表而设计的,也不建议用于提取通用的任意大的表。
对于生成式提取程序来说,从表格中提取数据是一个挑战,因为生成式 AI 技术处理的是文本的线性字符串,并且不理解图像中的可视二维信息。但是,您仍然可以从表格中提取数据,如以下示例中概述,至少可用 2 种不同方法中进行选择:
- 一种方法是要求生成式提取程序单独返回各列,然后您在工作流中自行组合行。在这种情况下,您可能会问:
Please return the Unit Prices on this invoice, as a list from top to bottom, as a list in the format [<UnitPrice1>, <UnitPrice2>,…] - 另一种方法是要求它将每一行作为 JSON 对象单独返回。在这种情况下,您可能会问:
Please return the line items of this invoice as an JSON array of JSON objects, each object in format: {"description”: <description>, “quantity”:<quantity>, “unit_price”:<unit price>, “amount”:<amount>}。
可信度
生成式 AI 模型不就预测提供置信度级别。但是,以检测错误为目标时,置信度级别只是实现该目标的一种可能方法,并不是最佳方法。检测错误的一种更好、更可靠的方法是以多种不同的方式提出同一个问题。问题陈述的差异越大越好。如果所有答案都趋于一致,则出错的可能性非常低。如果答案不一致,则出错的可能性很高。
例如,您可以将同一个问题重复两次、三次甚至五次(具体取决于程序中避免未捕获错误的重要性),并以不同的组合方式结合上述建议。 如果所有响应都一致,则可能不需要人工审核。 但是,如果任何回复不同,则可能需要 Action Center 中的工作人员进行手动审核。