Document Understanding 新式项目用户指南

适用平台：

上次更新日期 2025年4月17日

生成式功能

生成式 AI 是 AI 技术的一种形式，它利用机器学习 (ML) 模型创建和生成新的内容、数据或信息。

大多数生成式 AI 任务的关键是大型语言模型 (LLM)。这些是基于大量文本数据进行训练的 ML 模型，旨在生成拟人化文本。LLM 还可以通过拟人化的方式完成句子或段落来理解和回应提示。

这些生成式模型主要在“构建”步骤中的文档自动标注流程中应用，可加快分类设计，并帮助高效训练模型。

Document Understanding 中的预标注是根据文档类型的架构，使用生成式模型和专用模型的组合来完成的。架构明确定义了要从特定文档类型中提取的字段。

要更深入了解生成式批注的工作原理，以及如何在项目中有效地使用它，请查看“批注文档”页面。

生成式提取是 Document Understanding^TM 中的一个重要功能，它利用了生成式 AI 模型的强大功能。这些模型使用活动进行配置，主要在运行时用于数据提取。

生成式提取能够从非结构化或半结构化文档中解读和提取特定信息。例如，它可以扫描发票并准确检索详细信息，例如日期、账单金额和公司名称。这样可以从各种类型的文档中快速、高效且高度准确地收集信息。

“生成式预定义”项目下可用的生成式提取程序可用于下表中描述的文档：

注意：长文档复杂布局提取程序和短文档复杂布局提取程序当前在适用于公共部门环境 (FedRamp) 的 Automation Cloud ^TM中不可用。

表 1.生成式提取程序支持的场景
提取程序	推荐方案	提供程序	区域可用性
长文档简单布局提取程序	建议用于主要包含文本和标题的长表单文档。例如，您可以在租赁协议、主服务协议或其他类似文档上使用“长文档简单版式提取程序”。	Azure OpenAI	英国、澳大利亚、印度、加拿大
长文档复杂布局提取程序	建议用于具有复杂布局的长篇文档，例如图像、手写文本、表单元素或独特布局（如浮动标注框）。您可以在通常具有复杂布局的长文档（如保险单）上使用此提取程序。	Azure OpenAI	美国、欧盟、日本、新加坡
短文档复杂布局提取程序	建议用于包含图像、手写文本、表单元素或复杂布局（例如浮动标注框）的较短文档（最多 20 页）。您可以在政府签发的身份证或医疗保健申请表等文档上使用此提取程序，这些文档通常较短但布局更复杂。	Azure OpenAI	美国、欧盟、日本、新加坡