- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding 数字化器
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
Document Understanding 活动
基于关键词的分类器
UiPath.IntelligentOCR.Activities.DocumentClassification.KeywordBasedClassifier
此活动的功能如下:
- 包含基于关键字的文档分类算法,可针对具有重复标题的文件进行分类。
- 如果在“分类文档范围”活动中使用,则根据在指定文件中找到的给定训练集对文档进行分类。
设计器面板
- “学习文件路径”- 包含分类器数据的文件的完整路径。此字段仅支持字符串和
String
变量。备注:一次只能设置上述参数之一。 您可以使用 LearningData 字符串或 LearningFilePath 字符串。
LearningFilePath 指定从中检索分类器数据的位置。
LearningData 包含该分类器的实际信息。
属性面板
常见
- “显示名称”- 活动的显示名称。
输入
- “学习数据”- 包含序列化分类器数据的字符串。此字段仅支持字符串和
String
变量。 - “学习文件路径”- 包含分类器数据的文件的完整路径。此字段仅支持字符串和
String
变量。备注:一次只能设置上述参数之一。 您可以使用 LearningData 字符串或 LearningFilePath 字符串。
LearningFilePath 指定从中检索分类器数据的位置。
LearningData 包含该分类器的实际信息。
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
注意: 最佳做法是在该位置创建一个空的
.json
文件,然后在“学习文件路径”字段中使用其名称。
您只需访问活动的“管理学习”向导,即可在设计时配置“基于关键字的分类器”。通过使用具有更新后学习文件路径的同一向导,可以使用同一向导来审核在文档分类训练阶段收集的数据。
此向导用于配置和管理此活动用于标识文档类型的关键字。创建它是为了适应编辑文件路径的需要。如果改用带有变量的“学习数据”参数,则系统会询问您是否要编辑特定文件路径或中止此操作。
- 在工作流中添加“基于关键字的分类器”或“基于关键字的分类器训练器”活动。
- 通过添加
.json
文件的路径来配置“基于关键字的分类器”活动。配置分类器时,请考虑以下信息:- 如果系统未提供路径并且您单击了“管理学习”选项,则系统会显示一个弹出窗口,要求提供学习文件路径输入。提供路径后,系统将打开向导。
- 可以添加变量而不是
.json
文件,但是,由于向导无法将学习模式应用于学习数据变量,因此它会要求您提供可编辑的特定文件路径。
- 选择“管理学习”。
系统将打开“管理基于关键字的分类器学习”向导窗口。图 1.“管理基于关键字的分类器学习”向导概览
- 如果系统未提供路径并且您选择了“管理学习”选项,则系统会显示一个弹出窗口,要求提供学习文件路径。提供路径后,系统将打开向导。
图 2. 如果未提供路径而选择了“管理学习”选项,则会显示“警告”弹出窗口
注意:即使没有可用的.json
文件,您也可以直接将新的.json
文件的名称添加到活动中,系统会在指定的文件夹中自动创建.json
文件。
该向导包含您在分类法中定义的尽可能多的文档类型类别。您可以为每种文档类型添加单个或多个关键字。该活动学习特定文档的关键字,然后能够根据这些规则对特定类型的文档进行识别和分类。
""
(引号)之间输入,并且您可以添加单个或多个值。要添加或删除关键字,请在向导中执行以下步骤:
- 单击“添加新关键字集”会向该类别添加一个额外的字段。
- 选择 删除图标,以删除字段及其关键字。
- 选择“保存”以保存向导配置。您可以在项目的
.json
文件中找到所有添加的值。注意:根据 Visual Basic 约定(双引号),在“管理关键字”向导中作为关键字的一部分输入的双引号始终会转义,即使在 C# 风格的项目中也是如此。
“基于关键词的分类器”活动是 Document Understanding 解决方案的一部分。如需了解详情,请访问 Document Understanding 指南。