- 入门指南
- 框架组件
- ML 包
- 管道
- Data Manager
- OCR 服务
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 深度学习
- 许可
- 参考
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
复选框和签名
在 ML 提取模型的上下文中,复选框不是实际值,而是用于选择特定文本段的一种方式。
因此,其旁边的词语将成为焦点,而非复选框。这正是复选框的作用,即充当特定词语的锚点。
因此,要训练 ML 模型,您需要标记词语,而不是复选框。
在某些情况下,系统不会检测复选框。例如,OCR 可能会将复选框读取为 X,或者它可能只是某个手写标记,根本不会被选取。ML 模型可以学习所有这些情况,并将其与标记旁边的词语相关联。
因此,训练模型以识别词语会更可靠,而无论如何选择它:无论是使用复选框、X 还是手写标记(带圆圈和下划线等)。
For the above example, you can create two fields in Data Manager as follows:
- “情况 - 就业”(标记“是”一词);
- “情况 - 交通事故”(标记“是”一词);
无论是用复选框或 X 进行标记,还是用笔圈出标记,ML 模型都会学习识别这些词语。为此,您可以使用 UiPath Document OCR,它甚至可以识别复选框。
在有些情况下,没有任何标签与复选框相关联。例如,当复选框是表格的一部分时。
以下是一个典型示例:
在这种情况下,有必要为方框加上标签。提取程序将返回复选框的字符串值,该值是以下两个字符之一:
- ☒
- ☐
checked
还是 unchecked
。此外,“智能 OCR”框架知道如何识别这些字符,尤其是当字段定义为 Boolean
时:
- 如果提取程序返回 ☒,则表示“是”;
- 如果提取程序返回 ☐,则表示“否”;
如果为未选中的复选框返回了 O 或 D,或者为已选中的复选框返回了 X、V、K 或 R,则也可以将这些字符包含在 RPA 工作流逻辑中,以使工作流在发生这些 OCR 错误时更可靠。
签名是任何 OCR 引擎都无法检测到的视觉特征,因此 ML 模型无法直接检测它们。
但是,UiPath ML 模型通过查看图像上的文字和像素来进行学习。可以通过使用这种方法来执行签名检测。
我们以下面的表单为例。
页面末尾的签名旁有文本“美国人的签名”。只要文本与签名足够靠近(只要签名存在),文本是什么都没有关系。处理签名类似于处理复选框 - 请参阅上面的“复选框”一节。
您可以创建一个名为“签名”的文本字段,当文档具有签名时,您可以将“美国人的签名”标记为签名字段。当文档没有签名时,请将该字段留空。
然后,您必须确保训练集中大约一半的文档带有签名,而另一半的文档没有签名。两者的比例也可以是 60/40%,但不能是 80/20% 或 90/10%。此外,每个模型至少要有 20 到 30 个样本,以便学习这一点。
这样,您可以使用 ML 模型执行签名检测。