document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Document Understanding 新式项目用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月12日

生成式功能

生成式 AI 是 AI 技术的一种形式,它利用机器学习 (ML) 模型创建和生成新的内容、数据或信息。

大多数生成式 AI 任务的关键是大型语言模型 (LLM)。这些是基于大量文本数据进行训练的 ML 模型,旨在生成拟人化文本。LLM 还可以通过拟人化的方式完成句子或段落来理解和回应提示。

生成式标注

这些生成式模型主要在“构建”步骤中的文档自动标注流程中应用,可加快分类设计,并帮助高效训练模型。

Document Understanding 中的预标注是根据文档类型的架构,使用生成式模型和专用模型的组合来完成的。架构明确定义了要从特定文档类型中提取的字段。

要更深入了解生成式批注的工作原理,以及如何在项目中有效地使用它,请查看“批注文档”页面。

生成式提取

生成式提取是 Document UnderstandingTM 中的一个重要功能,它利用了生成式 AI 模型的强大功能。这些模型使用活动进行配置,主要在运行时用于数据提取。

生成式提取能够从非结构化或半结构化文档中解读和提取特定信息。例如,它可以扫描发票并准确检索详细信息,例如日期、账单金额和公司名称。这样可以从各种类型的文档中快速、高效且高度准确地收集信息。

相关活动

提示:有关如何更有效地使用生成式提取活动的更多信息,请查看“生成式提取程序 - 良好做法”页面。
有几个活动可以帮助您从生成式提取功能中受益:

您还可以使用 Document Understanding API 来利用生成式提取功能。

生成式分类

生成式分类使用 AI 模型在文档上传后立即自动对文档进行分类。

此自动分类流程利用 ML 模型来“读取”文档的内容,了解其上下文,从而将其归入预定义的类别。这样,系统可以高效地处理和组织多种类型的文档。

通过准确分类非结构化或半结构化文档,生成式分类改进了文档处理工作流、节省时间并增强整体文档管理。

相关活动

提示:有关如何更有效地使用生成式分类活动的更多信息,请查看生成式分类器 - 良好实践页面。
有几项活动可以帮助您从生成式分类功能中受益:

您还可以使用 Document Understanding API 来利用生成式分类功能。

生成式验证

生成式验证是 Document Understanding 中的一个特有功能,在验证过程中扮演着重要角色。此功能主要在提取步骤之后使用,以验证使用专用模型提取的内容的置信度分数。

当 ML 模型的文档提取置信度分数较低时,系统将使用生成式验证来交叉检查输出。此验证流程涉及专用 ML 模型和生成式 ML 模型的协同工作,以确保准确性。

如果两个模型产生相同的输出,则可以绕过人工验证,从而大幅提高验证的时间效率。此流程不仅可以节省文档验证步骤中的宝贵时间,而且可以使用辅助生成模型来交叉验证输出,从而提高模型的准确性,最终提高模型的性能。

相关活动

有几项活动可以帮助您从生成式验证功能中受益:

您还可以使用 Document Understanding API 来利用生成式验证功能。

  • 生成式标注
  • 生成式提取
  • 相关活动
  • 生成式分类
  • 相关活动
  • 生成式验证
  • 相关活动

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。