- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
训练提取程序范围
UiPath.IntelligentOCR.Activities.Training.TrainExtractors
描述
为要训练的任何提取程序活动提供作用域。您必须在此作用域内添加提取程序活动。
项目兼容性
Windows - Legacy | Windows
属性
属性面板
常见
- “显示名称”- 活动的显示名称。
输入
- “文档对象模型” - 要用于验证文档的文档对象模型。此模型存储在
Document变量中,可以从“数字化文档”活动中检索。请访问数字化文档,了解如何实现此目的。此字段仅支持Document变量。 - 文档路径 - 要验证的文档的路径。此字段仅支持字符串和
String变量。备注:该属性字段支持的文件类型包括:
.png、.gif”、.jpe”、.jpg、.jpeg、.tiff、.tif、.bmp和.pdf。 - “文档文本” - 文档本身的文本,存储在字符串变量中。可以从“数字化文档”活动中检索此值。请访问数字化文档,了解如何实现此目的。此字段仅支持字符串和
String变量。 - “人工验证的数据” - 此为“验证站点”的输出数据,存储在
ExtractionResult专有变量中。备注:如果“文档对象模型”和“人工验证的数据”文件具有不同来源,则系统会在运行时抛出错误。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
“配置提取程序”向导
-
将“训练提取程序作用域”活动添加到工作流中。
-
在“属性”面板中,在“文档对象模型”、“文档路径”、“文档文本”和“人工验证数据”字段中添加自定义配置。
-
添加提取程序训练器活动(例如机器学习提取程序训练器),或通过实施类来为提取程序训练创建自定义活动,并将其放置在“训练提取程序作用域”活动中。
-
要配置提取程序,请选择“配置提取程序” 。您现在可以看到“配置提取程序”向导。
图 1.“配置提取程序”向导概览

-
要对整个文档类型或该文档中的特定字段使用特定的提取程序,请选中文档类型或字段旁边的复选框。选择整个文档类型后,系统也将自动选择所有相应的字段。
图 2. 显示选择要提取的文档类型或相应字段的过程的动图

-
-
对于支持此功能的提取程序,选择“获取刷新提取程序功能” ,以将您的分类字段映射到可用的提取程序字段,或者在提取程序字段发生更改时刷新这些字段。配置功能后,选择“获取功能” ,以反映“配置提取程序”向导中的更改。
图 3. 显示机器学习提取程序刷新程序功能的过程的动图

-
要根据提取结果训练提取程序,请首先在“框架别名”字段中输入任意字母数字值。之后,继续在一个或多个训练器的相应“框架别名”字段中设置确切值。这将在提取程序和相应的训练器之间创建链接。
-
选择所有提取程序后,选择“保存” 。
Document Understanding 集成
训练提取程序范围活动是 Document Understanding 解决方案的一部分。如需了解详情,请访问Document Understanding 指南。