activities
latest
false
- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding 数字化器
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
Document Understanding 活动
Last updated 2024年11月14日
训练分类器范围
UiPath.IntelligentOCR.Activities.Training.TrainClassifiers
设计器面板
- “文档路径”- 要验证的文档的路径。此字段仅支持字符串和
String
变量。注意:该属性字段支持的文件类型包括“.png
”、“.gif
”、“.jpe
”、“.jpg
”、“.jpeg
”、“.tiff
”、“.tif
”、“.bmp
”和“.pdf
”。 - 文档文本 - 文档本身的文本,存储在
String
变量中。可以从“数字化文档”活动中检索此值。有关如何实现此目的的更多信息,请访问数字化文档。此字段仅支持字符串和String
变量。 - 文档对象模型 - 要用于验证文档的文档对象模型 (DOM)。此模型存储在
Document
变量中,可以从“数字化文档”活动中检索。有关如何实现此目的的更多信息,请访问数字化文档。此字段仅支持Document
变量。 - “人工验证的数据”- 验证站点的输出数据,存储在“
ExtractionResult
”专有变量中。与“经人工验证的分类数据”不兼容。备注:- 如果“文档对象模型”和“人工验证的数据”文件的来源不同,则系统会在运行时抛出错误。
- 验证站点可同时充当分类站点和验证站点。
- HumanValidatedClassificationData - 分类站点的输出,存储在
ClassificationResult[]
专有变量中。 与 HumanValidatedData不兼容。 - “分类”- 要处理的文档的分类,存储在
DocumentTaxonomy
变量中。此字段仅支持DocumentTaxonomy
变量。
属性面板
常见
- “显示名称”- 活动的显示名称。
输入
- 文档对象模型 - 要用于验证文档的文档对象模型 (DOM)。此模型存储在
Document
变量中,可以从“数字化文档”活动中检索。有关如何实现此目的的更多信息,请访问数字化文档。此字段仅支持Document
变量。 - “文档路径”- 要验证的文档的路径。此字段仅支持字符串和
String
变量。注意:该属性字段支持的文件类型包括“.png
”、“.gif
”、“.jpe
”、“.jpg
”、“.jpeg
”、“.tiff
”、“.tif
”、“.bmp
”和“.pdf
”。 - 文档文本 - 文档本身的文本,存储在
String
变量中。可以从“数字化文档”活动中检索此值。有关如何实现此目的的更多信息,请访问数字化文档。此字段仅支持字符串和String
变量。 - HumanValidatedClassificationData - 分类站点的输出,存储在
ClassificationResult[]
专有变量中。 与 HumanValidatedData不兼容。 - “人工验证的数据”- 验证站点的输出数据,存储在“
ExtractionResult
”专有变量中。与“经人工验证的分类数据”不兼容。备注:- 如果“文档对象模型”和“人工验证的数据”文件的来源不同,则系统会在运行时抛出错误。
- 验证站点可同时充当分类站点和验证站点。
- “分类”- 要处理的文档的分类,存储在
DocumentTaxonomy
变量中。此字段仅支持DocumentTaxonomy
变量。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
通过“训练分类器作用域”访问的配置分类器向导让您可以选择要针对每种文档类型训练的分类器。
请按照以下步骤配置向导:
- 将“训练分类器作用域”活动添加到工作流中。
- 将“分类器训练器”活动置于“训练分类器作用域”活动中。
- 单击“配置分类器”按钮,以配置分类器。
您现在可以看到向导。图 1.“配置分类器”向导概览
- 单击“配置分类器”按钮,以配置分类器。
- 选中要针对每种文档类型激活的分类器的复选框。根据这些复选框,分类器仅会针对为每个分类器激活的文档类型执行。
图 2. 针对两种文档类型的所选的分类器
- 在每个复选框旁边的文本字段中添加任何分类映射信息(如果分类训练器使用需要映射到项目分类的内部分类)。
- 对于支持此功能的分类器,请选择“获取刷新提取程序功能”,以便轻松地将分类字段映射到可用的文档类型,或者在文档类型发生更改时刷新这些字段。
- 选择所有分类器后,选择“保存”。
训练分类器作用域活动是 Document Understanding 解决方案的一部分。如需了解详情,请访问 Document Understanding 指南。