document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月18日

复选框和签名

复选框

有几种类型的多选字段使用复选框:

  • 互斥复选框
  • 非互斥复选框,您可以在其中选择多个选项。

另一个重要方面是给定多选字段的可用选项数量。在某些情况下,可能只有一个选项,即复选框是否处于选中状态,而在其他情况下,可能有 10、20 或更多选项,以网格或表格的形式排列,就像许多体检表单一样。

There are two major ways in which you may label these kinds of multiple choice fields.

Label the options

我们通过一个示例来了解如何为选项添加标签。表单可以包含“项目”或“策略”选项。在这种情况下,您只有一个字段,并且只需标记所选单词,即如果选中了“Project”旁边的复选框,则标记单词“Project”;如果选中“Policy”旁边的复选框,则标记单词“Policy”。如果两者均未选中,则两者均不标记。两者无法同时选中,此类文档只会从训练集中删除。



此方法的优点是您只有一个字段,需要的数据较少。它的另一个优点是不依赖于复选框的成功检测。如果复选框被检测为字母 X,则模型仍可以学习去识别这意味着它旁边的选项已被选中。

缺点是您需要确保两个选项的代表性大致相同,但情况并非总是如此。在您的训练集中,90% 的文档可能已选中“项目”。在这种情况下,模型无法正常运行,并且此方法会失败。当您有更多选项时,问题会变得更糟,因为其中一些选项几乎总是很少见。在这些情况下,您可能需要创建虚假文档,并选中稀有选项以平衡问题。

使用单个多值字段为选项添加标签

这也使添加标签更容易,对复选框检测错误不那么敏感,但可能对不平衡的选项更敏感,就像第一个选项一样。



签名检测

从 2022.4 LTS Enterprise 版本开始,可以使用 UiPath 文档 OCR 检测签名,因此机器学习模型可以直接检测签名。

像在文档中为任何其他字段添加标签一样,为签名添加标签。只要被 UiPath 文档 OCR 检测到,机器学习模型就会学习将该字段识别为签名。

注意:如果想要更深度的签名分析,您也可以使用签名比较模型(在 UiPath 图像分析 ML 包中)。
  • 复选框
  • Label the options
  • 使用单个多值字段为选项添加标签
  • 签名检测

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。