document-understanding
latest
false
- 概述
- 入门指南
- 构建模型
- 使用模型
- 模型详细信息
- Automation Cloud 和 Test Cloud 的公共端点
- Automation Cloud 和 Test Cloud 公共部门的公共端点
- 1040 - 文档类型
- 1040 计划 C - 文档类型
- 1040 计划 D - 文档类型
- 1040 计划 E - 文档类型
- 1040x - 文档类型
- 3949a - 文档类型
- 4506T - 文档类型
- 709 - 文档类型
- 941x - 文档类型
- 9465 - 文档类型
- ACORD125 - 文档类型
- ACORD126 - 文档类型
- ACORD131 - 文档类型
- ACORD140 - 文档类型
- ACORD25 - 文档类型
- 银行对账单 - 文档类型
- 提单 - 文档类型
- 公司注册证书 - 文档类型
- 原产地证书 - 文档类型
- 支票 - 文档类型
- 儿童产品证书 - 文档类型
- CMS 1500 - 文档类型
- 欧盟符合性声明 - 文档类型
- 财务报表 - 文档类型
- FM1003 - 文档类型
- I9 - 文档类型
- 身份证 - 文档类型
- 发票 - 文档类型
- 发票 2 - 文档类型
- 澳大利亚发票 - 文档类型
- 发票中国 - 文档类型
- 希伯来语发票 - 文档类型
- 发票印度 - 文档类型
- 日本发票 - 文档类别
- 发票运输 - 文档类型
- 装箱单列表 - 文档类型
- 工资单 - 文档类型
- 护照 - 文档类型
- 采购订单 - 文档类型
- 收据 - 文档类型
- 收据 2 - 文档类型
- 日本收据 - 文档类型
- 汇款通知书 - 文档类型
- UB04 - 文档类型
- 美国抵押贷款平交披露 - 文档类型
- 公用事业账单 - 文档类型
- 车辆标题 - 文档类型
- W2 - 文档类型
- W9 - 文档类型
- 支持的语言
- Insights 仪表板
- 数据与安全性
- 日志记录
- 许可
- 如何
- 故障排除
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
Document Understanding 用户指南
训练模型的时间由您决定。进行足够的批注或分类后,您可以通过单击“开始训练”按钮来开始运行训练。训练不会在后台自行开始。
按钮所在的位置
每个可训练模型都有一个“开始训练”按钮。
分类器
-
旧版分类器:在分类器的“模型训练”状态药丸中,显示在“构建”页面上的“建议”区域中。
-
Helix Classifier: 在分类器的“模型训练”状态药丸中,位于“拆分和分类”页面上。
提取程序:每种文档类型的批注页面,位于标头栏(右上角区域)。
此外, “模型训练”状态药丸包含“开始训练”操作。药丸会显示在应用程序中每个可训练的模型或文档类型旁边,这意味着您无需导航到其批注页面即可开始提取程序训练。
该按钮未在“构建”主页上作为独立控件显示,但每个文档类型卡片上的状态药丸确实包含该操作。
如何开始训练
- 导航到您要训练的模型。选项:
- 打开“拆分和分类”页面(仅适用于 Helix Classifier)。
- 打开分类器的批注流程(“旧版分类器”)。
- 打开该文档类型的“批注”页面(提取程序)。
- 或者,找到该模型的“模型训练”状态药丸(例如,在“构建”主页或“度量概述”上),然后使用其“开始训练”操作。
- 查看“开始训练”按钮旁边或药丸内部的更改计数器。这将显示自上次训练以来累积的注释或分类数量。
- 选择“开始训练” 。状态将更改为“已加入队列” 。
- 系统选取排队的训练并开始运行。这可能需要几分钟…
- 运行完成后,状态将更改为“已训练” ,并显示更新的分数、上次训练日期、持续时间和基本模型版本。
按钮状态
按钮的启用状态取决于自上次训练后发生的更改,以及训练是否已在进行中。
| 状态 | 按钮 | 弹出窗口消息 |
|---|---|---|
| 进行足够的更改 | 已启用 | 无弹出窗口。选择此字段可将训练加入队列。 |
| 低于最小更改阈值 | 已禁用 | “至少需要 N 次更改才能开始新的训练。” |
| 自上次训练后无变化 | 已禁用 | “自上次训练后,未进行任何更改。” |
| 训练已加入队列或正在进行 | 已禁用 | “此模型的训练已加入队列或正在进行中。” |
什么构成变更
每次批注或分类修改都算作一次更改。例如,对文档中的字段进行批注或对页面进行分类都适用。成功运行训练后,更改计数器将重置。文档类型架构或基本模型更改被视为重大更改,会绕过所需的更改阈值。
状态药丸
状态药丸显示在应用程序中每个可训练模型或文档类型的旁边。药丸反映了该模型的当前训练状态,并(如适用)显示了“开始训练”操作。
| 状态 | 您所看到的内容 |
|---|---|
| 尚未接受训练 | 更改计数器。达到阈值后,系统将启用“开始训练” 。 |
| 已加入队列 | 消息:“正在准备训练,即将自动开始。这可能需要几分钟。” |
| 训练进行中 | 正在进行的指示器未显示“开始训练” 。 |
| 失败 | 错误消息、警告图标以及用于将训练重新加入队列的“重试”按钮。 |
| 已训练 | 上次训练日期、持续时间和使用的基本模型版本。自上次运行以来的更改计数器。如果新更改足够多,则会启用“开始训练” 。 |
建议和警告
- 当累积大量更改时,状态药丸会显示警告图标,提醒您开始新的训练。
- 更改文档类型架构时,在您开始新的训练之前,经过训练的模型不会包含此更改。系统将显示警告。
- 当基本模型版本发生变化时,现有的经过训练的模型不会自动重新对齐。系统显示一条警告,您在准备就绪后开始新的训练。
异常
- Zip 导入。当您将 zip 导入项目时,训练会自动排队。您不需要选择“开始训练” 。
- 一次一个训练。当一个训练已排队或正在运行时,您无法将同一模型的第二个训练加入队列。等待它完成(或失败),然后再开始另一个。