document-understanding
latest
false
- 概述
- 入门指南
- 活动
- Insights 仪表板
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 流量限制
- OCR 配置
- 管道
- OCR 服务
- 支持的语言
- 深度学习
- 许可
Document Understanding 用户指南
Last updated 2024年11月14日
数据提取验证概述
自动提取数据后,一个可选(但强烈建议)的步骤是对提取的数据进行验证。
这是一个人工审核步骤,其中知识工作者可以审核自动提取的结果,并在必要时进行更正。
使用数据提取验证可确保现在可用的结构化数据 100% 正确。
在以下情况下,强烈建议您使用数据提取验证组件:
- 您需要数据准确性达到 100%,
-
您没有其他方法可以再次检查从其他真相来源自动提取的信息,
- 例如,您可以检查某个名称或地址是否等于已确认且数据库中已存在的名称或地址等。
-
您没有足够的综合检查来用来对数据一致性进行检查
-
例如,您可以检查明细项目相加是否等于合计总额;您可以检查 ID 编号校验和是否正确等。
备注:我们强烈建议,如果您需要 100% 的准确性,请尽可能添加“验证”步骤。
如果这不是所有文档的选项,则:
- 尝试仔细检查尽可能多的信息
- 尝试确定业务用例可接受的特定字段的特定可信度阈值
- 在做出决策前,确保始终检查给定值的“提取可信度”和“OCR 可信度”。
-
验证自动提取的数据可以由人工输入通过使用验证站点来完成。
在下列情况下,可以使用“验证站点”:
- 通过使用“呈现验证站点”活动,作为 Attended 活动使用,或
- 通过使用“创建文档验证操作”和“等待文档验证操作并继续”活动,作为 Action Center 任务使用。