document-understanding

2022.4

false

重要 :

新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 用户指南

适用平台：

上次更新日期 2025年4月4日

复选框和签名

在 ML 提取模型的上下文中，复选框不是实际值，而是用于选择特定文本段的一种方式。

因此，其旁边的词语将成为焦点，而非复选框。这正是复选框的作用，即充当特定词语的锚点。

因此，要训练 ML 模型，您需要标记词语，而不是复选框。

在某些情况下，系统不会检测复选框。例如，OCR 可能会将复选框读取为 X，或者它可能只是某个手写标记，根本不会被选取。ML 模型可以学习所有这些情况，并将其与标记旁边的词语相关联。

因此，训练模型以识别词语会更可靠，而无论如何选择它：无论是使用复选框、X 还是手写标记（带圆圈和下划线等）。

对于上面的示例，您可以在 Data Manager 中创建两个字段，如下所示：

无论是用复选框或 X 进行标记，还是用笔圈出标记，ML 模型都会学习识别这些词语。为此，您可以使用 UiPath Document OCR，它甚至可以识别复选框。

在有些情况下，没有任何标签与复选框相关联。例如，当复选框是表格的一部分时。

以下是一个典型示例：

在这种情况下，有必要为方框加上标签。提取程序将返回复选框的字符串值，该值是以下两个字符之一：

这两个字符可以像其他任何字符一样进行复制和粘贴，并且可以在工作流中用于验证是为复选框返回 checked 还是 unchecked。此外，“智能 OCR”框架知道如何识别这些字符，尤其是当字段定义为 Boolean 时：

如果为未选中的复选框返回了 O 或 D，或者为已选中的复选框返回了 X、V、K 或 R，则也可以将这些字符包含在 RPA 工作流逻辑中，以使工作流在发生这些 OCR 错误时更可靠。

签名是任何 OCR 引擎都无法检测到的视觉特征，因此 ML 模型无法直接检测它们。

但是，UiPath ML 模型通过查看图像上的文字和像素来进行学习。可以通过使用这种方法来执行签名检测。

我们以下面的表单为例。

页面末尾的签名旁有文本“美国人的签名”。只要文本与签名足够靠近（只要签名存在），文本是什么都没有关系。处理签名类似于处理复选框 - 请参阅上面的“复选框”一节。

您可以创建一个名为“签名”的文本字段，当文档具有签名时，您可以将“美国人的签名”标记为签名字段。当文档没有签名时，请将该字段留空。

然后，您必须确保训练集中大约一半的文档带有签名，而另一半的文档没有签名。两者的比例也可以是 60/40％，但不能是 80/20％或 90/10％。此外，每个模型至少要有 20 到 30 个样本，以便学习这一点。

这样，您可以使用 ML 模型执行签名检测。

在此页面上

前一个导出文档

下一个OCR 服务

获取您需要的帮助

了解 RPA - 自动化课程

UiPath Community 论坛