- 概述
- 入门指南
- 构建模型
- 使用模型
- 模型详细信息
- Public endpoints for Automation Cloud and Test Cloud
- Public endpoints for Automation Cloud and Test Cloud Public Sector
- 1040 - 文档类型
- 1040 计划 C - 文档类型
- 1040 计划 D - 文档类型
- 1040 计划 E - 文档类型
- 1040x - 文档类型
- 3949a - 文档类型
- 4506T - 文档类型
- 709 - 文档类型
- 941x - 文档类型
- 9465 - 文档类型
- ACORD125 - 文档类型
- ACORD126 - 文档类型
- ACORD131 - 文档类型
- ACORD140 - 文档类型
- ACORD25 - 文档类型
- 银行对账单 - 文档类型
- 提单 - 文档类型
- 公司注册证书 - 文档类型
- 原产地证书 - 文档类型
- 支票 - 文档类型
- 儿童产品证书 - 文档类型
- CMS 1500 - 文档类型
- 欧盟符合性声明 - 文档类型
- 财务报表 - 文档类型
- FM1003 - 文档类型
- I9 - 文档类型
- 身份证 - 文档类型
- 发票 - 文档类型
- 发票 2 - 文档类型
- 澳大利亚发票 - 文档类型
- 发票中国 - 文档类型
- 希伯来语发票 - 文档类型
- 发票印度 - 文档类型
- 日本发票 - 文档类别
- 发票运输 - 文档类型
- 装箱单列表 - 文档类型
- 工资单 - 文档类型
- 护照 - 文档类型
- 采购订单 - 文档类型
- 收据 - 文档类型
- 收据 2 - 文档类型
- 日本收据 - 文档类型
- 汇款通知书 - 文档类型
- UB04 - 文档类型
- 美国抵押贷款平交披露 - 文档类型
- 公用事业账单 - 文档类型
- 车辆标题 - 文档类型
- W2 - 文档类型
- W9 - 文档类型
- 支持的语言
- Insights 仪表板
- 数据与安全性
- 日志记录
- 许可
- 如何
- 故障排除

Document Understanding 用户指南
标注最佳实践
在开始标注流程之前,为特定类型的文档创建所有必填字段的完整列表非常重要。清楚定义每个字段,以防止混淆。根据您的偏好,您可以使用示例文档并将其作为示例进行标注,也可以创建详细的表格来解释每个字段。
一般准则
标注流程涉及对两个关键字段类型的清晰理解:
- 列字段
- 常规字段
列字段用于捕获专门在表格区域中显示的信息,而常规字段用于从文档的其余部分选取信息。
如果您发现某个字段在同一文档中多次出现且具有相同的值,请确保为此字段的每个实例添加注释。例如,如果发票编号同时出现在文档的顶部和底部,则应该同时标注这两个实例。
如果值不同,则只需标注正确的值。这也适用于同一供应商或供应商变体不同文档中的值不同的实例。在这种情况下,始终优先考虑供应商一致性是关键,即使这意味着忽略偶尔不同的值。
一个重要原则是在相似布局中添加注释时要保持一致性。这可确保数据整洁统一。
此外,请确保所有带注释的数据填写完整。仔细检查以免遗漏地址或其他关键信息中的字词。
最后,请在字段上仅保留必要的注释框。例如,如果您已将 Date: 28-11-2022 标注为日期,则确保删除 Date:。这可以使您的信息简洁而精确。
表格准则
如果您使用的是多个表格,请记住,每个表格中的每一列都需要有自己的列字段。此流程对于准确有效地捕获数据非常重要。
Figure 1. Column fields associated to each table column

为表格添加注释时,请确保将表格行分组。为此,您可以选择整个行并使用 Enter 热键。该操作会将字段绑定在一起,使系统能更有效地处理表格。
如果您的表格行拆分为多个页面,您仍然可以将所有单元格分到一行中。只需使用 CTRL+Left Click 选择属于行的所有字段,然后选择 Enter 以实现此组。这使系统能够无缝读取行,即使它们跨越多个页面也是如此。
Figure 2. Table row split across multiple pages
