document-understanding
latest
false
UiPath logo, featuring letters U and I in white
Document Understanding 新式项目用户指南
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年11月14日

生成式功能

生成式 AI 是 AI 技术的一种形式,它利用机器学习 (ML) 模型创建和生成新的内容、数据或信息。

大多数生成式 AI 任务的关键是大型语言模型 (LLM)。这些是基于大量文本数据进行训练的 ML 模型,旨在生成拟人化文本。LLM 还可以通过拟人化的方式完成句子或段落来理解和回应提示。

Generative annotation

这些生成式模型主要在“构建”步骤中的文档自动标注流程中应用,可加快分类设计,并帮助高效训练模型。

Document Understanding 中的预标注是根据文档类型的架构,使用生成式模型和专用模型的组合来完成的。 架构明确定义了要从特定文档类型中提取的字段。

要更深入了解生成式批注的工作原理,以及如何在项目中有效地使用它,请查看批注文档页面。

生成式提取

生成式提取是Document Understanding TM中的一个重要功能,它利用了生成式 AI 模型的强大功能。 这些模型使用活动进行配置,主要在运行时用于数据提取。

生成式提取能够从非结构化或半结构化文档中解读和提取特定信息。 例如,它可以扫描发票并准确检索详细信息,例如日期、账单金额和公司名称。 这样可以从各种类型的文档中快速、高效且高度准确地收集信息。

相关活动

提示:有关如何更有效地使用生成式提取活动的更多信息,请查看生成式提取程序 - 良好做法页面。
有几个活动可以帮助您从生成式提取功能中受益:

您还可以使用Document Understanding API来利用生成式提取功能。

生成式分类

生成式分类使用 AI 模型在文档上传后立即自动对文档进行分类。

此自动分类流程利用 ML 模型来“读取”文档的内容,了解其上下文,从而将其归入预定义的类别。 这样,系统可以高效地处理和组织多种类型的文档。

通过准确分类非结构化或半结构化文档,生成式分类改进了文档处理工作流、节省时间并增强整体文档管理。

相关活动

提示:有关如何更有效地使用生成式分类活动的更多信息,请查看生成式分类器 - 良好实践页面。
有几项活动可以帮助您从生成式分类功能中受益:

您还可以使用Document Understanding API来利用生成式分类功能。

Generative validation

生成式验证是 Document Understanding 中的一个显着功能,在验证过程中扮演着重要角色。 此功能主要在提取步骤之后使用,以验证使用专用模型进行的提取的置信度分数。

当 ML 模型的文档提取置信度分数较低时,系统将使用生成式验证来交叉检查输出。 此验证流程涉及专用 ML 模型和生成式 ML 模型的协同工作,以确保准确性。

如果两个模型产生相同的输出,则可以绕过人工验证,从而显着提高验证的时间效率。 此流程不仅可以节省文档验证步骤中的宝贵时间,而且可以使用辅助生成模型来交叉验证输出,从而提高模型的准确性,从而提高模型的性能。

相关活动

开展几项活动可以帮助您从生成式验证功能中受益:
  • Document Understanding 活动包:
  • “智能 OCR”活动包:

您还可以使用Document Understanding API来利用生成式验证功能。

  • Generative annotation
  • 生成式提取
  • 相关活动
  • 生成式分类
  • 相关活动
  • Generative validation
  • 相关活动

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。