activities
latest
false
- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding 数字化器
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
Document Understanding 活动
Last updated 2024年11月21日
提取程序代码活动类
ExtractorCodeActivity
抽象类是IExtractorActivity
接口和CodeActivity
抽象类的组合,是构建用于文档数据提取的CodeActivity
的基数。
- 命名空间:
UiPath.DocumentProcessing.Contracts.DataExtraction
- 程序集:
UiPath.DocumentProcessing.Contracts
实现UiPath.DocumentProcessing.Contracts.DataExtraction.IExtractorActivity接口和
System.Activities.CodeActivity
抽象类的抽象类。
实施此类是为了构造用于文档数据提取的
CodeActivity
,与“ 数据提取作用域 ”活动和文档处理基础架构兼容。
为了实现此抽象类,需要重写
Execute
(CodeActivityContext context
) 方法。
“数据提取作用域” 活动自动为其子活动填充所有已定义的 In 参数。 这些 InArguments 包含以下信息:
- 有关被提取的文档的特定详细信息。 这包括其原始文件路径、文本版本和文档对象模型。
- 提取程序活动应处理的字段的详细信息。 这些操作可通过“ 数据提取作用域 ” 活动中的“ 配置提取 程序” 向导进行配置。
OutArgument 存储提取结果。 这由
ExtractorResult
对象组成,对象包含DataPoints
列表,其中包含所有成功识别的输入字段的条目。
构造函数
ExtractorCodeActivity()
- 受保护的默认构造函数。
方法
GetCapabilities()
- 获取提取程序在设计时能够为每种文档类型提取的字段列表。 此方法仅在设计时调用,因此不应使用任何 InArgumentProvidesCapabilities()
- 如果提取程序能够提供功能列表,则返回 true。
属性
DocumentPath
InArgument<string>
- 文档的文件路径。DocumentText
InArgument<string>
- 文档的文本版本。DocumentObjectModel
InArgument<UiPath.DocumentProcessing.Contracts.Dom.Document>
- 文档的文档对象模型。ExtractorDocumentType
InArgument<UiPath.DocumentProcessing.Contracts.DataExtraction.ExtractorDocumentType>
- 提取程序要考虑的文档类型信息。DocumentBounds
InArgument<UiPath.DocumentProcessing.Contracts.Results.ResultsDocumentBounds>
- 提取程序考虑的页面范围和边界。ExtractorResult
OutArgument<UiPath.DocumentProcessing.Contracts.DataExtraction.ExtractorResult>
- 提取程序活动的输出。PersistenceId
string
- 作用域活动为正确跟踪和配置提取程序活动而使用的唯一不透明 ID。PredictionId
InArgument<string>
- 标识在工作流中处理相同的文档。 它由DocumentId
+JobId
组成。