- 概述
- 入门指南
- 构建模型
- 使用模型
- ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 公共端点
- 支持的语言
- Insights 仪表板
- 数据与安全性
- 许可
- 如何
复选框和签名
复选框和签名这两个元素在各种类型的文档(从合同协议到注册表单)中发挥着至关重要的作用。 了解如何正确注释复选框和签名对于充分利用模型非常重要。
- Mutually exclusive checkboxes.
- Non-mutually exclusive checkboxes, where you can select more than one option.
要考虑的一个重要方面是给定多选字段中提供的选项数量。 在某些情况下,可能有单个选项,其中复选框是否处于选中状态。 但是,在许多情况下,可能有 10、20 甚至更多选项,这些选项通常组织成网格或表格格式,这在体检表单中很常见。
在注释这些不同的多选字段时,您可以使用四种主要方法。
Let's use an example to understand how you can annotate the options.
此方法的优点是您只有一个字段,需要的数据较少。 它也不依赖于复选框检测成功。 例如,如果一个复选框被错误地检测为字母 X,模型仍可以学习识别它表示选择了它旁边的选项。
但是,一个潜在的缺点是必须确保两个选项的代表性大致相同,但情况可能并非总是如此。 例如,如果数据集中 90% 的文档都检查了“ 2018 ”,则模型的性能可能会受到影响,从而导致此方法失败。 当您有更多选项时,问题会变得更糟,因为其中一些选项几乎总是很少见。 在这些情况下,您可能需要创建虚假文档,并选中稀有选项以平衡问题。
在上一个示例中,您可能创建了两个不同的字段:一个标记为2018 ,您可以在其中一致注释该年的复选框,另一个标记为2019 ,您可以在其中连续注释 2019 的复选框(无论它是否处于选中状态)。 这种方法的积极方面是,平衡变得不那么重要。即使 90% 的情况下都选择了一个选项,模型仍然可以学习识别它们,因为复选框的位置是固定的。
缺点是您有两个字段,而不是一个字段。 虽然在处理两个选项时这可能不会造成太大的问题,但在处理 10 到 20 个选项并随后创建 10 到 20 个字段而不是单个字段时,可能会使注释过程大大复杂化。 此外,这也导致模型训练过程更具挑战性,需要更多训练数据。
另一个缺点是偶尔会错误检测复选框,这可能会导致工作流中需要更复杂的逻辑来管理所有返回的 X、V 或 K 字符。 在某些情况下,OCR 甚至可能会将复选框与其旁边的单词合并,例如X2018 ,这需要更复杂的 RPA 逻辑来处理这种情况。
多值字段可以更轻松地添加注释,并且它们不会受到已选中选项不平衡或广泛选择的影响。 但是,这些字段仍会受到复选框检测准确性的影响,并且存在复选框与相邻选项合并的潜在风险的影响。 OCR 错误很难防御。