Document Understanding
2021.10
False
横幅背景图像
Document Understanding 用户指南
上次更新日期 2024年2月28日

复选框和签名

复选框

在 ML 提取模型的上下文中,复选框不是实际值,而是用于选择特定文本段的一种方式。

因此,其旁边的词语将成为焦点,而非复选框。这正是复选框的作用,即充当特定词语的锚点。

因此,要训练 ML 模型,您需要标记词语,而不是复选框。

在某些情况下,系统不会检测复选框。例如,OCR 可能会将复选框读取为 X,或者它可能只是某个手写标记,根本不会被选取。ML 模型可以学习所有这些情况,并将其与标记旁边的词语相关联。

因此,训练模型以识别词语会更可靠,而无论如何选择它:无论是使用复选框、X 还是手写标记(带圆圈和下划线等)。

单选项复选框



对于上面的示例,您可以在 Data Manager 中创建三个字段,如下所示:

  • “情况 - 就业”(标记“是”一词);
  • “情况 - 交通事故”(标记“是”一词);
  • “情况 - 其他事故”(标记“否”一词);

无论是用复选框或 X 进行标记,还是用笔圈出标记,ML 模型都会学习识别这些词语。为此,您可以使用 UiPath Document OCR,它甚至可以识别复选框。

没有标签的复选框

在有些情况下,没有任何标签与复选框相关联。例如,当复选框是表格的一部分时。

以下是一个典型示例:



在这种情况下,有必要为方框加上标签。提取程序将返回复选框的字符串值,该值是以下两个字符之一:

这两个字符可以像其他任何字符一样进行复制和粘贴,并且可以在工作流中用于验证是为复选框返回 checked 还是 unchecked。此外,“智能 OCR”框架知道如何识别这些字符,尤其是当字段定义为 Boolean 时:
  • 如果提取程序返回 ☒,则表示“是”
  • 如果提取程序返回 ☐,则表示“否”

如果为未选中的复选框返回了 O 或 D,或者为已选中的复选框返回了 X、V、K 或 R,则也可以将这些字符包含在 RPA 工作流逻辑中,以使工作流在发生这些 OCR 错误时更可靠。

签名检测

签名是任何 OCR 引擎都无法检测到的视觉特征,因此 ML 模型无法直接检测它们。

但是,UiPath ML 模型通过查看图像上的文字和像素来进行学习。可以通过使用这种方法来执行签名检测。

我们以下面的表单为例。



页面末尾的签名旁有文本“美国人的签名”。只要文本与签名足够靠近(只要签名存在),文本是什么都没有关系。处理签名类似于处理复选框 - 请参阅上面的“复选框”一节。

您可以创建一个名为“签名”的文本字段,当文档具有签名时,您可以将“美国人的签名”标记为签名字段。当文档没有签名时,请将该字段留空。

然后,您必须确保训练集中大约一半的文档带有签名,而另一半的文档没有签名。两者的比例也可以是 60/40%,但不能是 80/20% 或 90/10%。此外,每个模型至少要有 20 到 30 个样本,以便学习这一点。

这样,您可以使用 ML 模型执行签名检测。

  • 复选框
  • 单选项复选框
  • 没有标签的复选框
  • 签名检测

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.