activities
latest
false
UiPath logo, featuring letters U and I in white

Document Understanding 活动

上次更新日期 2024年12月5日

提取程序代码活动类

ExtractorCodeActivity抽象类是IExtractorActivity接口和CodeActivity抽象类的组合,是构建用于文档数据提取的CodeActivity的基数。

定义

  • 命名空间: UiPath.DocumentProcessing.Contracts.DataExtraction
  • 程序集: UiPath.DocumentProcessing.Contracts

描述

实现UiPath.DocumentProcessing.Contracts.DataExtraction.IExtractorActivity接口和System.Activities.CodeActivity抽象类的抽象类。
实施此类是为了构造用于文档数据提取的 CodeActivity ,与“ 数据提取作用域 ”活动和文档处理基础架构兼容。
为了实现此抽象类,需要重写 Execute(CodeActivityContext context) 方法。

数据提取活动参数和结果

数据提取作用域” 活动自动为其子活动填充所有已定义的 In 参数。 这些 InArguments 包含以下信息:

  • 有关被提取的文档的特定详细信息。 这包括其原始文件路径、文本版本和文档对象模型。
  • 提取程序活动应处理的字段的详细信息。 这些操作可通过“ 数据提取作用域 ” 活动中的“ 配置提取 程序” 向导进行配置。
OutArgument 存储提取结果。 这由ExtractorResult对象组成,对象包含DataPoints列表,其中包含所有成功识别的输入字段的条目。

成员

构造函数
ExtractorCodeActivity() - 受保护的默认构造函数。
方法
  • GetCapabilities() - 获取提取程序在设计时能够为每种文档类型提取的字段列表。 此方法仅在设计时调用,因此不应使用任何 InArgument
  • ProvidesCapabilities() - 如果提取程序能够提供功能列表,则返回 true。
属性
  • DocumentPath InArgument<string> - 文档的文件路径。
  • DocumentText InArgument<string> - 文档的文本版本。
  • DocumentObjectModel InArgument<UiPath.DocumentProcessing.Contracts.Dom.Document> - 文档的文档对象模型。
  • ExtractorDocumentType InArgument<UiPath.DocumentProcessing.Contracts.DataExtraction.ExtractorDocumentType> - 提取程序要考虑的文档类型信息。
  • DocumentBounds InArgument<UiPath.DocumentProcessing.Contracts.Results.ResultsDocumentBounds> - 提取程序考虑的页面范围和边界。
  • ExtractorResult OutArgument<UiPath.DocumentProcessing.Contracts.DataExtraction.ExtractorResult> - 提取程序活动的输出。
  • PersistenceId string - 作用域活动为正确跟踪和配置提取程序活动而使用的唯一不透明 ID。
  • PredictionId InArgument<string> - 标识在工作流中处理相同的文档。 它由DocumentId + JobId组成。
  • 定义
  • 描述
  • 数据提取活动参数和结果
  • 成员

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。