- 概述
- 入门指南
- Activities (活动)
- Insights 仪表板
- Document Understanding 流程
- 快速入门教程
- 框架组件
- 模型详细信息
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 流量限制
- OCR 配置
- 管道
- OCR 服务
- 支持的语言
- 深度学习
- 数据与安全性
- 许可和计费逻辑

Document Understanding 传统用户指南
一键分类
现在,您可以在 Document Understanding TM界面中使用一键分类功能,直接轻松训练文档分类器。借助 Document Understanding 中的新用户体验,此功能可实现无需在 AI Center 中手动创建数据集、管道和 ML 技能。
在使用此功能之前,请确保您的 Document Understanding 项目已链接到 AI Center 。
分类选项
您可以将“一键分类”与 Document Manager 和/或 Forms AI 一起使用,并可以通过“分类”按钮进行识别。
要使用“一键分类”,请在“文档类型”会话中上传您的文档。单击“新建”按钮,然后选择以下选项之一: “使用 Forms AI(固定布局表单)”或“使用半结构化 AI” 。这两个选项都会打开一个会话,您可以在其中上传文档。在各自的“文档类型”会话中上传文档后,您可以使用“新分类器”按钮打开“一键分类”对话框。
分类按钮将打开一个下拉列表,其中包含两个选项: “自动训练”和“手动训练” 。在使用其中任何选项之前,请确保已创建至少两个 Document Understanding 会话,每个会话至少包含十个示例。不符合要求会导致错误,如下所示。

自动化训练
使用“自动训练”选项直接在 Document Understanding 中训练分类数据集。选择此选项后,您必须添加一个分类器名称,选择首选的文档类型,然后选择文档分类器模型的版本。完成后,单击“训练”按钮。

此功能会自动在 AI Center 中使用您之前在“训练分类数据集”弹出窗口的“分类器名称”字段中指定的名称创建一个新的数据集。
详细信息
您可以通过单击分类器页面中的分类器名称,或单击操作菜单并选择详细信息选项来查看有关创建的自动训练操作的更多详细信息。
以下是“详细信息”选项提供的所有信息的列表:
- 训练集 - 指定已处理的文档数和页数。
- 已分类文档 - 指定已分类文档的数量。
- F1 分数- 提供数据集的准确性分数百分比。
- 状态 - 提供分类操作的状态。
- 文档类型 - 提供用于操作的文档类型列表。
- 包名称 - 提供所用 ML 包的名称。
- 包版本 - 提供文档分类器模型的已使用版本。
- ML 技能详细信息 - 提供为数据集创建的 ML 技能的 URL。您可以复制此 URL 并在工作流中使用。
- 数据集链接 - 提供已创建(公共)数据集的公共端点 URL。
- 管道详细信息 - 提供为数据集创建的管道的 URL。
- 分数详细信息 - 指定数据集的准确性分数。
- 查看/隐藏日志 - 提供包含已创建数据集的所有日志的列表。您可以复制此列表并在需要时使用。
备注:
“分数详细信息”和“分数”百分比选项适用于使用 DocumentClassifier 23.1 或更高版本运行的数据集。
手动训练
使用“手动训练”选项将分类数据集导出到 AI Center,然后在 AI Center 中进行训练。选择此选项后,您必须添加数据集名称并选择首选的文档类型。完成后,单击“导出”按钮。

详细信息
您可以从项目页面中选择“分类器”选项卡,单击操作菜单,然后选择“详细信息”选项,以查看有关已创建的手动训练操作的更多详细信息。
以下是“详细信息”选项提供的所有信息的列表:
- 训练集 - 指定已处理的文档数和页数。
- 已分类文档 - 指定已分类文档的数量。
- F1 分数- 提供数据集的准确性分数百分比。
- 状态 - 提供分类操作的状态。
- 文档类型 - 提供用于操作的文档类型列表。
- 包名称 - 提供所用 ML 包的名称。
- 包版本 - 提供文档分类器模型的已使用版本。
- ML 技能详细信息 - 提供为数据集创建的 ML 技能的 URL。您可以复制此 URL 并在工作流中使用。
- 数据集链接 - 提供已创建(公共)数据集的公共端点 URL。
- 管道详细信息 - 提供为数据集创建的管道的 URL。
- 分数详细信息 - 指定数据集的准确性分数。
- 查看/隐藏日志 - 提供包含已创建数据集的所有日志的列表。您可以复制此列表并在需要时使用。
分类器状态
您可以使用项目页面中的“分类器”选项卡检查所有分类操作的状态。
概述
选择“分类器”选项卡后,您可以看到四个不同的列,每个列都显示有关已创建的分类操作的信息。您可以按字母顺序升序或降序对它们单独排序,也可以将它们保留为默认状态,按创建日期整理,让最新的在顶部:
- 名称 - 显示分类操作的名称。
- 类型 - 显示分类操作的类型(导出或训练)。
- 创建日期 - 显示创建日期。
- 状态 - 显示操作的状态。每个操作都有多个可用状态。有关更多详细信息,请查看下表。
- 刷新 - 刷新所有操作的状态,显示最新的操作。
| 状态 | 描述 | 分类选项 |
|---|---|---|
| 可用 | 操作已成功执行。 | 自动化训练 |
| 正在进行 | 该操作仍在执行中。 | 自动化训练 |
| 导出已完成 | 操作已成功执行。 | 手动训练 |
| 正在导出 | 该操作仍在执行中。 | 手动训练 |
| 未启动 | 尚未开始执行操作。 | 自动化培训手动培训 |
| 不同步 | Document Understanding 中的状态与 AI Center 中的状态不同步。 | 自动化培训手动培训 |
| 已暂停 | 操作已暂停。 | 自动化培训手动培训 |
操作菜单
操作菜单位于右侧,打开后提供以下选项:
- 复制 URL - 允许您复制使用“自动化训练”操作创建的公共端点的 URL。
- 详细信息 - 提供有关已创建的操作的信息。
- 删除 - 从 Document Understanding 和 AI Center 中删除已创建的操作。
- 停用 ML 技能 - 停用“自动化训练”操作的 ML 技能。