- 概述
- 入门指南
- 构建模型
- 使用模型
- ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 公共端点
- 支持的语言
- Insights 仪表板
- 数据与安全性
- 许可
- 如何
生成式功能
生成式 AI 是 AI 技术的一种形式,它利用机器学习 (ML) 模型创建和生成新的内容、数据或信息。
大多数生成式 AI 任务的关键是大型语言模型 (LLM)。这些是基于大量文本数据进行训练的 ML 模型,旨在生成拟人化文本。LLM 还可以通过拟人化的方式完成句子或段落来理解和回应提示。
生成式提取是Document Understanding TM中的一个重要功能,它利用了生成式 AI 模型的强大功能。 这些模型使用活动进行配置,主要在运行时用于数据提取。
生成式提取能够从非结构化或半结构化文档中解读和提取特定信息。 例如,它可以扫描发票并准确检索详细信息,例如日期、账单金额和公司名称。 这样可以从各种类型的文档中快速、高效且高度准确地收集信息。
您还可以使用Document Understanding API来利用生成式提取功能。
生成式分类使用 AI 模型在文档上传后立即自动对文档进行分类。
此自动分类流程利用 ML 模型来“读取”文档的内容,了解其上下文,从而将其归入预定义的类别。 这样,系统可以高效地处理和组织多种类型的文档。
通过准确分类非结构化或半结构化文档,生成式分类改进了文档处理工作流、节省时间并增强整体文档管理。
您还可以使用Document Understanding API来利用生成式分类功能。
生成式验证是 Document Understanding 中的一个显着功能,在验证过程中扮演着重要角色。 此功能主要在提取步骤之后使用,以验证使用专用模型进行的提取的置信度分数。
当 ML 模型的文档提取置信度分数较低时,系统将使用生成式验证来交叉检查输出。 此验证流程涉及专用 ML 模型和生成式 ML 模型的协同工作,以确保准确性。
如果两个模型产生相同的输出,则可以绕过人工验证,从而显着提高验证的时间效率。 此流程不仅可以节省文档验证步骤中的宝贵时间,而且可以使用辅助生成模型来交叉验证输出,从而提高模型的准确性,从而提高模型的性能。
您还可以使用Document Understanding API来利用生成式验证功能。