- 概述
- 入门指南
- 构建模型
- 使用模型
- ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 收据日本 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 公共端点
- 支持的语言
- Insights 仪表板
- 数据与安全性
- 许可
- 如何
Document Understanding 新式项目用户指南
生成式功能
生成式 AI 是 AI 技术的一种形式,它利用机器学习 (ML) 模型创建和生成新的内容、数据或信息。
大多数生成式 AI 任务的关键是大型语言模型 (LLM)。这些是基于大量文本数据进行训练的 ML 模型,旨在生成拟人化文本。LLM 还可以通过拟人化的方式完成句子或段落来理解和回应提示。
生成式提取是 Document UnderstandingTM 中的一个重要功能,它利用了生成式 AI 模型的强大功能。这些模型使用活动进行配置,主要在运行时用于数据提取。
生成式提取能够从非结构化或半结构化文档中解读和提取特定信息。例如,它可以扫描发票并准确检索详细信息,例如日期、账单金额和公司名称。这样可以从各种类型的文档中快速、高效且高度准确地收集信息。
您还可以使用 Document Understanding API 来利用生成式提取功能。
生成式分类使用 AI 模型在文档上传后立即自动对文档进行分类。
此自动分类流程利用 ML 模型来“读取”文档的内容,了解其上下文,从而将其归入预定义的类别。这样,系统可以高效地处理和组织多种类型的文档。
通过准确分类非结构化或半结构化文档,生成式分类改进了文档处理工作流、节省时间并增强整体文档管理。
您还可以使用 Document Understanding API 来利用生成式分类功能。
生成式验证是 Document Understanding 中的一个特有功能,在验证过程中扮演着重要角色。此功能主要在提取步骤之后使用,以验证使用专用模型提取的内容的置信度分数。
当 ML 模型的文档提取置信度分数较低时,系统将使用生成式验证来交叉检查输出。此验证流程涉及专用 ML 模型和生成式 ML 模型的协同工作,以确保准确性。
如果两个模型产生相同的输出,则可以绕过人工验证,从而大幅提高验证的时间效率。此流程不仅可以节省文档验证步骤中的宝贵时间,而且可以使用辅助生成模型来交叉验证输出,从而提高模型的准确性,最终提高模型的性能。
您还可以使用 Document Understanding API 来利用生成式验证功能。