activities
latest
false
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 活动

上次更新日期 2025年6月11日

生成式提取程序

UiPath.DocumentUnderstanding.ML.Activities.GenerativeExtractor

重要提示:

此功能当前是审核流程的一部分,在审核完成之前不应视为 FedRAMP 授权的一部分。 请在此处查看当前正在审核的功能的完整列表。

描述

允许您使用生成式模型提取文档。 生成式提取程序无法提取分类管理器中定义的表格字段,但可以从文档中提取文本和表格。

提示:有关如何使用生成式提示的良好做法,请查看生成提取程序 - 良好做法页面。
备注:

生成式模型支持的语言与所使用的 OCR 引擎相同。 有关更多信息,请查看OCR 支持的语言页面。

项目兼容性

Windows - Legacy | Windows

配置

设计器面板
  • “管理字段详细信息”- 选择此选项可打开生成式提取程序提示向导。
属性面板

身份验证

此活动的身份验证属性允许您通过内部部署机器人执行该活动。 在配置这些属性之前,请确保您已满足 “配置身份验证”页面中提到的先决条件。 完成这些步骤后,您可以继续填写活动的“身份验证”属性。

  • 运行时凭据资产- 当您需要在机器人连接到本地 Orchestrator 或来自其他租户的情况下访问 Document Understanding 生成提取功能时,请使用此字段。 您可以通过以下方式之一选择输入凭据资产以进行身份验证:
    • 从下拉列表中,从 Orchestrator 中选择UiPath™机器人连接的所需凭据资产。
    • 手动输入 Orchestrator 凭据资产的路径,您将在其中存储用于访问生成式功能的外部应用程序凭据。
      路径的格式应为: <OrchestratorFolderName>/<AssetName>
  • 运行时租户 URL - 使用该字段,与“运行时凭据资产” 字段一起使用。 输入机器人将连接到的租户的 URL,以便执行生成提取。 URL 应采用以下格式: https://<baseURL>/<OrganizationName>/<TenantName>

常见

  • “显示名称”- 活动的显示名称。

其他

  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。

服务器

  • RetryOnFailure - 自动重试机器学习模型执行,以消除暂时性网络错误。 如果选中,则活动将重试执行。
  • “超时 (以毫秒为单位)”- 指定等待时间 (以毫秒为单位),如果超出该时间服务器未响应,就会引发错误。默认值为 100000 毫秒 (100 秒)。

使用生成式提取程序向导

“生成式提取程序提示”向导允许您选择特定的文档类型和字段。您还可以选择可选值以进一步指定相应字段的详细信息。此外,该向导还可为每种文档类型分配不同的生成式提取程序类型,从而允许进行自定义以适应文档不同的大小和布局。

提示用于标识要提取的字段,以键值对形式提供,其中键表示字段的名称,值表示字段的说明,以帮助提取程序识别相应的值。相同的字段详细信息不能用于同一文档类型中的不同字段。

图 1.生成式提取程序提示

  1. 从定义的文档类型列表中选择“文档类型”和“字段” 。在“配置提取程序”向导中完成字段选择,并在“生成式提取程序提示”向导中定义提示。
  2. 或者,您可以为每种文档类型从三种类型的生成提取程序中进行选择。生成式提取程序选项包括:
    • 长文档简单布局提取程序
    • 长文档复杂布局提取程序
    • 短文档复杂布局提取程序
  3. 添加可选值以定义字段详细信息。这可以是文档类型的简短说明。允许的最大字符数为 1000。
  • 描述
  • 项目兼容性
  • 配置
  • 使用生成式提取程序向导

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2025 UiPath。保留所有权利。