document-understanding
latest
false
- 概述
- 入门指南
- 构建模型
- 使用模型
- ML 包
- 1040 - document type
- 1040 Schedule C - document type
- 1040 Schedule D - document type
- 1040 Schedule E - document type
- 1040x - document type
- 3949a - document type
- 4506T - document type
- 709 - document type
- 941x - document type
- 9465 - document type
- ACORD125 - document type
- ACORD126 - document type
- ACORD131 - document type
- ACORD140 - document type
- ACORD25 - document type
- Bank Statements - document type
- Bills Of Lading - document type
- Certificate of Incorporation - document type
- Certificate of Origin - document type
- Checks - document type
- Children Product Certificate - document type
- CMS 1500 - document type
- EU Declaration of Conformity - document type
- Financial Statements - document type
- FM1003 - document type
- I9 - document type
- ID Cards - document type
- Invoices - document type
- Invoices Australia - document type
- Invoices China - document type
- Invoices Hebrew - document type
- Invoices India - document type
- Invoices Japan - document type
- Invoices Shipping - document type
- Packing Lists - document type
- Payslips - document type
- Passports - document type
- Purchase Orders - document type
- Receipts - document type
- Remittance Advices - document type
- UB04 - document type
- Utility Bills - document type
- Vehicle Titles - document type
- W2 - document type
- W9 - document type
- 公共端点
- 支持的语言
- Insights 仪表板
- 数据与安全性
- 许可
- 如何
- 故障排除

Document Understanding 新式项目用户指南
上次更新日期 2025年5月8日
标注最佳实践
在开始标注流程之前,为特定类型的文档创建所有必填字段的完整列表非常重要。清楚定义每个字段,以防止混淆。根据您的偏好,您可以使用示例文档并将其作为示例进行标注,也可以创建详细的表格来解释每个字段。
标注流程涉及对两个关键字段类型的清晰理解:
- 列字段
- 常规字段
如果您发现某个字段在同一文档中多次出现且具有相同的值,请确保为此字段的每个实例添加注释。例如,如果发票编号同时出现在文档的顶部和底部,则应该同时标注这两个实例。
如果值不同,则只需标注正确的值。这也适用于同一供应商或供应商变体不同文档中的值不同的实例。在这种情况下,始终优先考虑供应商一致性是关键,即使这意味着忽略偶尔不同的值。
一个重要原则是在相似布局中添加注释时要保持一致性。这可确保数据整洁统一。
此外,请确保所有带注释的数据填写完整。仔细检查以免遗漏地址或其他关键信息中的字词。
最后,请在字段上仅保留必要的注释框。例如,如果您已将
Date: 28-11-2022
标注为日期,则确保删除 Date:
。这可以使您的信息简洁而精确。