document-understanding
latest
false
适用于新式体验的 Document Understanding 用户指南
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年10月4日

复选框和签名

复选框和签名这两个元素在各种类型的文档(从合同协议到注册表单)中发挥着至关重要的作用。 了解如何正确注释复选框和签名对于充分利用模型非常重要。

复选框

注释文档时,您可能会遇到几种使用复选框的多选字段类型:
  • Mutually exclusive checkboxes.
  • Non-mutually exclusive checkboxes, where you can select more than one option.

要考虑的一个重要方面是给定多选字段中提供的选项数量。 在某些情况下,可能有单个选项,其中复选框是否处于选中状态。 但是,在许多情况下,可能有 10、20 甚至更多选项,这些选项通常组织成网格或表格格式,这在体检表单中很常见。

在注释这些不同的多选字段时,您可以使用四种主要方法。

标注选项

Let's use an example to understand how you can annotate the options.

注意:在开始为选项添加注释之前,请确保您已为每个相关选项创建了一个常规字段。


考虑文档包含年份选项的情况。 在这些场景中,您只有一个字段,并且只需注释所选用词。 例如,如果已选中旁边的复选框,则标注2018 ;如果选中该选项,则标注2019 。 如果两个选项均未选择,则不应注释两个选项。 无法实现同时选中两个选项的场景;包含此类实例的文档应从集合中省略。


此方法的优点是您只有一个字段,需要的数据较少。 它也不依赖于复选框检测成功。 例如,如果一个复选框被错误地检测为字母 X,模型仍可以学习识别它表示选择了它旁边的选项。

但是,一个潜在的缺点是必须确保两个选项的代表性大致相同,但情况可能并非总是如此。 例如,如果数据集中 90% 的文档都检查了“ 2018 ”,则模型的性能可能会受到影响,从而导致此方法失败。 当您有更多选项时,问题会变得更糟,因为其中一些选项几乎总是很少见。 在这些情况下,您可能需要创建虚假文档,并选中稀有选项以平衡问题。

Annotate the checkboxes, with separate field for each checkbox

注意:在开始为选项添加注释之前,请确保您已为每个相关选项创建了一个常规字段。


在上一个示例中,您可能创建了两个不同的字段:一个标记为2018 ,您可以在其中一致注释该年的复选框,另一个标记为2019 ,您可以在其中连续注释 2019 的复选框(无论它是否处于选中状态)。 这种方法的积极方面是,平衡变得不那么重要。即使 90% 的情况下都选择了一个选项,模型仍然可以学习识别它们,因为复选框的位置是固定的。

缺点是您有两个字段,而不是一个字段。 虽然在处理两个选项时这可能不会造成太大的问题,但在处理 10 到 20 个选项并随后创建 10 到 20 个字段而不是单个字段时,可能会使注释过程大大复杂化。 此外,这也导致模型训练过程更具挑战性,需要更多训练数据。

另一个缺点是偶尔会错误检测复选框,这可能会导致工作流中需要更复杂的逻辑来管理所有返回的 X、V 或 K 字符。 在某些情况下,OCR 甚至可能会将复选框与其旁边的单词合并,例如X2018 ,这需要更复杂的 RPA 逻辑来处理这种情况。



仅标注具有单个多值字段的复选框

注意:要使用此方法,请创建一个用于为复选框添加注释的“多值”字段。


多值字段可以更轻松地添加注释,并且它们不会受到已选中选项不平衡或广泛选择的影响。 但是,这些字段仍会受到复选框检测准确性的影响,并且存在复选框与相邻选项合并的潜在风险的影响。 OCR 错误很难防御。



Annotate the options with a single multi-value field

注意:要使用此方法,请创建一个用于为复选框添加注释的“多值”字段。


此方法还简化了注释流程,并且对复选框检测错误不那么敏感。 但是,它可能对不平衡的选项更敏感。

在某些情况下,所有这些选项可能都适用。 最初,首选第一个选项。 随着UiPath™ 文档 OCR中复选框检测准确性的提高,第二和第三个选项为首选。



签名检测

可以使用 UiPath Document OCR 识别签名,从而允许 ML 模型直接检测签名。

您可以像注释文档中的任何其他字段一样注释签名。 一旦 UiPath Document OCR 识别出签名,ML 模型就会学习将该字段识别为签名。

在推理时,将检索文档中显示的签名。 然后,您必须使用 RPA 逻辑将其转换为布尔值字段(是/否)。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。