UiPath Documentation
activities
latest
false

Document Understanding 活动

上次更新日期 2026年5月5日

提取程序代码活动类

ExtractorCodeActivity抽象类是IExtractorActivity接口和CodeActivity抽象类的组合,是构建用于文档数据提取的CodeActivity的基数。

定义

  • 命名空间: UiPath.DocumentProcessing.Contracts.DataExtraction
  • 程序集: UiPath.DocumentProcessing.Contracts

描述

实现UiPath.DocumentProcessing.Contracts.DataExtraction.IExtractorActivity接口和System.Activities.CodeActivity抽象类的抽象类。

This class is implemented in order to construct a CodeActivity for document data extraction, compatible with the Data Extraction Scope activity and the document processing infrastructure.

In order to implement this abstract class, the Execute(CodeActivityContext context) method needs to be overridden.

数据提取活动参数和结果

“数据提取作用域”活动自动为其子活动填充所有已定义的 InArguments。这些 InArguments 包含以下信息:

  • 有关被提取的文档的特定详细信息。 这包括其原始文件路径、文本版本和文档对象模型。
  • 提取程序活动应处理的字段的详细信息。您可通过“数据提取作用域”活动中的“配置提取程序”向导完成这些配置。

OutArgument 存储提取结果。 这由ExtractorResult对象组成,对象包含DataPoints列表,其中包含所有成功识别的输入字段的条目。

成员

构造函数

ExtractorCodeActivity() - 受保护的默认构造函数。

方法
  • GetCapabilities() - 获取提取程序在设计时能够为每种文档类型提取的字段列表。 此方法仅在设计时调用,因此不应使用任何 InArgument
  • ProvidesCapabilities() - 如果提取程序能够提供功能列表,则返回 true。
属性
  • DocumentPath InArgument<string> - 文档的文件路径。
  • DocumentText InArgument<string> - 文档的文本版本。
  • DocumentObjectModel InArgument<UiPath.DocumentProcessing.Contracts.Dom.Document> - 文档的文档对象模型。
  • ExtractorDocumentType InArgument<UiPath.DocumentProcessing.Contracts.DataExtraction.ExtractorDocumentType> - 提取程序要考虑的文档类型信息。
  • DocumentBounds InArgument<UiPath.DocumentProcessing.Contracts.Results.ResultsDocumentBounds> - 提取程序考虑的页面范围和边界。
  • ExtractorResult OutArgument<UiPath.DocumentProcessing.Contracts.DataExtraction.ExtractorResult> - 提取程序活动的输出。
  • PersistenceId string - 作用域活动为正确跟踪和配置提取程序活动而使用的唯一不透明 ID。
  • PredictionId InArgument<string> - 标识在工作流中处理相同的文档。 它由DocumentId + JobId组成。
  • 定义
  • 描述
  • 数据提取活动参数和结果
  • 成员

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新