activities
latest
false
- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
Document Understanding 活动
上次更新日期 2026年5月5日
ExtractorCodeActivity抽象类是IExtractorActivity接口和CodeActivity抽象类的组合,是构建用于文档数据提取的CodeActivity的基数。
定义
- 命名空间:
UiPath.DocumentProcessing.Contracts.DataExtraction - 程序集:
UiPath.DocumentProcessing.Contracts
描述
实现UiPath.DocumentProcessing.Contracts.DataExtraction.IExtractorActivity接口和System.Activities.CodeActivity抽象类的抽象类。
This class is implemented in order to construct a CodeActivity for document data extraction, compatible with the Data Extraction Scope activity and the document processing infrastructure.
In order to implement this abstract class, the Execute(CodeActivityContext context) method needs to be overridden.
数据提取活动参数和结果
“数据提取作用域”活动自动为其子活动填充所有已定义的 InArguments。这些 InArguments 包含以下信息:
- 有关被提取的文档的特定详细信息。 这包括其原始文件路径、文本版本和文档对象模型。
- 提取程序活动应处理的字段的详细信息。您可通过“数据提取作用域”活动中的“配置提取程序”向导完成这些配置。
OutArgument 存储提取结果。 这由ExtractorResult对象组成,对象包含DataPoints列表,其中包含所有成功识别的输入字段的条目。
成员
构造函数
ExtractorCodeActivity() - 受保护的默认构造函数。
方法
GetCapabilities()- 获取提取程序在设计时能够为每种文档类型提取的字段列表。 此方法仅在设计时调用,因此不应使用任何 InArgumentProvidesCapabilities()- 如果提取程序能够提供功能列表,则返回 true。
属性
DocumentPathInArgument<string>- 文档的文件路径。DocumentTextInArgument<string>- 文档的文本版本。DocumentObjectModelInArgument<UiPath.DocumentProcessing.Contracts.Dom.Document>- 文档的文档对象模型。ExtractorDocumentTypeInArgument<UiPath.DocumentProcessing.Contracts.DataExtraction.ExtractorDocumentType>- 提取程序要考虑的文档类型信息。DocumentBoundsInArgument<UiPath.DocumentProcessing.Contracts.Results.ResultsDocumentBounds>- 提取程序考虑的页面范围和边界。ExtractorResultOutArgument<UiPath.DocumentProcessing.Contracts.DataExtraction.ExtractorResult>- 提取程序活动的输出。PersistenceIdstring- 作用域活动为正确跟踪和配置提取程序活动而使用的唯一不透明 ID。PredictionIdInArgument<string>- 标识在工作流中处理相同的文档。 它由DocumentId+JobId组成。