document-understanding

latest

false

Document Understanding 用户指南

适用平台：

Automation Cloud Automation Cloud Public Sector Automation Suite Standalone

上次更新日期 2024年11月7日

生成式功能

重要提示：

此功能当前是审核流程的一部分，在审核完成之前不应视为 FedRAMP 授权的一部分。请在此处查看当前正在审核的功能的完整列表。

生成式 AI 是 AI 技术的一种形式，它利用机器学习 (ML) 模型创建和生成新的内容、数据或信息。

大多数生成式 AI 任务的关键是大型语言模型 (LLM)。这些是基于大量文本数据进行训练的 ML 模型，旨在生成拟人化文本。LLM 还可以通过拟人化的方式完成句子或段落来理解和回应提示。

生成式标注

这些生成式模型主要在“构建”步骤中的文档自动标注流程中应用，可加快分类设计，并帮助高效训练模型。

Document Understanding 中的预标注是根据文档类型的架构，使用生成式模型和专用模型的组合来完成的。架构明确定义了要从特定文档类型中提取的字段。

要更深入了解生成式批注的工作原理，以及如何在项目中有效地使用它，请查看“批注文档”页面。

生成式提取

生成式提取是 Document Understanding^TM 中的一个重要功能，它利用了生成式 AI 模型的强大功能。这些模型使用活动进行配置，主要在运行时用于数据提取。

生成式提取能够从非结构化或半结构化文档中解读和提取特定信息。例如，它可以扫描发票并准确检索详细信息，例如日期、账单金额和公司名称。这样可以从各种类型的文档中快速、高效且高度准确地收集信息。

生成式分类

生成式分类使用 AI 模型在文档上传后立即自动对文档进行分类。

此自动分类流程利用 ML 模型来“读取”文档的内容，了解其上下文，从而将其归入预定义的类别。这样，系统可以高效地处理和组织多种类型的文档。

通过准确分类非结构化或半结构化文档，生成式分类改进了文档处理工作流、节省时间并增强整体文档管理。

生成式验证

生成式验证是 Document Understanding 中的一个特有功能，在验证过程中扮演着重要角色。此功能主要在提取步骤之后使用，以验证使用专用模型提取的内容的置信度分数。

当 ML 模型的文档提取置信度分数较低时，系统将使用生成式验证来交叉检查输出。此验证流程涉及专用 ML 模型和生成式 ML 模型的协同工作，以确保准确性。

如果两个模型产生相同的输出，则可以绕过人工验证，从而大幅提高验证的时间效率。此流程不仅可以节省文档验证步骤中的宝贵时间，而且可以使用辅助生成模型来交叉验证输出，从而提高模型的准确性，最终提高模型的性能。

此页面有帮助吗？

前一个API 调用

下一个开箱即用模型

获取您需要的帮助

了解 RPA - 自动化课程

UiPath Community 论坛

Document Understanding 用户指南

生成式功能

生成式标注

生成式提取

相关活动

生成式分类

相关活动

生成式验证

相关活动

此页面有帮助吗？