
非结构化复杂文档用户指南
常见问题
访问和可用性
该功能正式全面推出的适用地区
“非结构化复杂文档”功能在以下区域提供:
- 欧洲
- 美国
- 美国(延迟区域)
- 日本
- 加拿大
- 澳大利亚
- 英国
您还可以在“全局 Cloud 服务”中找到区域列表。
社区用户是否可使用此功能?
智能提取处理 (IXP) 提供哪些部署选项?此功能是否支持本地部署?
目前,IXP Communications Mining 以及非结构化复杂文档功能仅支持在 UiPath™ Automation Cloud™ 中使用。
Document Understanding 可在 Automation Cloud、Automation Suite 和独立部署中使用。 有关 Document Understanding 部署选项的更多信息,请查看 “选择部署类型”。
该功能是否在所有区域都可用?
目前,非结构化复杂文档功能已面向美国和欧洲租户发布了正式版,在加拿大、日本和澳大利亚地区发布了个人预览版。
该功能支持哪些语言?
用户可使用 IXP 中选定模型支持的任意语言上传文档并构建模型。
该功能支持哪些文件格式?
目前,该功能支持 PNG、JPG 或 JPEG、PDF 和 TIF 或 TIFF 文件格式。
数据与安全性
智能提取处理 (IXP) 使用专用 AI 还是生成式 AI?
Communications Mining 使用专用的 AI 和生成式 AI 功能,如有需要,可以禁用所有生成式 AI 功能。
Document Understanding 使用专业的 AI 和生成式 AI 功能,如有需要,可以禁用所有生成式 AI 功能。
非结构化复杂文档的生成式提取通过第三方 LLM 使用生成式 AI。没有生成式 AI,无法使用此功能。
UiPath Helix 在智能提取处理 (IXP) 中是否可用?
当使用生成式提取功能时,UiPath Helix Extractor 1.0 (IXP-Comms) 可在 Communications Mining 中使用。
UiPath Helix Extractor 1.0 (IXP-Docs) 和 UiPath Helix Extractor 2.0 (IXP-Docs) 在 Document Understanding 中可用,但仅在新式体验中可用。 它在 Document Understanding 传统体验中不可用。
在非结构化复杂文档的生成式提取功能中,这两者都不可用。
智能提取处理 (IXP) 是否会通过 AI Trust Layer (AITL)?
是的,使用第三方 LLM 的所有智能提取处理 (IXP) 功能都必须通过 UiPath AITL。UiPath Helix 是 UiPath 的专有系列模型,来自 Helix 的调用不会通过 AITL,因为它们是 UiPath 环境的内部调用。
该功能使用哪些 LLM?
非结构化复杂文档功能支持 GPT4-o 视觉模型和 Gemini 模型。Gemini 模型可作为智能预处理功能,用于表格数据和驱动基于模型的归因。
该功能是否启用 BYO(自带)订阅?
目前不支持,但在未来的版本中将支持 BYO 订阅。
迁移
我是否可以将我的用例从 Document Understanding 经典版体验迁移到 IXP 非结构化复杂文档功能?
目前还不能,但未来版本将支持导入和导出功能。
我是否可以将我的用例从 Document Understanding 新式体验迁移到 IXP 非结构化复杂文档功能?
目前还不能,但未来版本将支持导入和导出功能。
我是否可以将我的用例从 Document Understanding 生成式提取程序活动迁移到 IXP 非结构化复杂文档功能?
目前还不能,但未来版本将支持导入和导出功能。
设计时
该功能是否有任何设计时间限制?
设计时限制包括:
- 每个字段组的字段数量:最多 32 个字段。
- 每个字段名称的字符数:最多 128 个字符。
- 每个提示指令的字符数:最多 2048 个字符。这适用于所有提示,包括总体指令、字段组指令、字段指令和字段类型指令。
我可以在文档功能中创建通用字段吗?
不,IXP 中没有通用字段的概念。 所有字段都需要属于字段组。 每个字段组表示一个单独的表格,其中字段即为表格中的列。但是,您可以通过定义父级字段组来表示文档类型,并在此字段组下以表格的形式添加更多通用字段。
智能提取处理 (IXP) 非结构化复杂文档模型能否通过加标签或批注的方式来提高性能?
不会,模型还无法直接从用户标注中学习。目前,提高模型性能的方法是修改您的提示指令或模型配置。 从注释中学习的可微调模型将在未来的版本推出。
如果无法提高模型性能,我为什么需要对文档进行批注?
验证和批注文档仍然很重要,因为您需要为模型性能评估建立基础事实,通过“度量”页面内置的性能指标体现。
我需要上传多少个文档才能测试我的提示指令?
您应上传文档的代表性示例,以涵盖所有可能的变化。这应至少为 20-30 个不同的文档。 建议您先查看 2 到 3 个文档的初始预测,决定是否需要修改提示指令,随后再逐步将测试样本量增加至 10、20、30 乃至 X 份文档,这将是一个迭代的过程。
我需要批注多少个文档,才能获得可靠的性能指标?
建议您为每个字段至少验证 10 个文档或 10 个示例,或两者兼而有之,以便模型为您提供有意义的验证统计信息。这是标注的最低数量,将取决于特定用例要求。
运行时
非结构化复杂文档模型是否通过 Robot 或独立的 Document Understanding API 使用?
非结构化复杂文档模型既可以通过机器人,也可以通过独立的 Document Understanding Automation Cloud API 使用。
如何使用非结构化复杂文档输出?
模型输出可以通过 API、Document Understanding 活动或 IntelligentOCR 活动使用。 请务必:
- 安装 IOCR 包 v6.23.2 预览版或更高版本,然后选择“Document Understanding 项目提取程序”活动
- 安装 Document Understanding 包 v2.13.2 预览版或更高版本,然后选择“提取文档数据”活动
智能提取处理 (IXP) 非结构化复杂文档功能是否提供置信度分数?它们是如何计算的?
是的,我们在模型响应和 Action Center(运行时)中提供置信度分数,但未在 IXP 用户界面(设计时)提供置信度分数。我们使用 LLM 返回的令牌概率估计字段和提取级别的置信度。
混合部署(即本地 Orchestrator 或 Automation Suite 和 Cloud IXP 模型)中的非结构化复杂文档模型输出是否可以使用?
是的,这可以通过外部应用程序支持。 有关更多详细信息,请查看 “OAuth 应用程序”。
智能提取处理 (IXP) 非结构化复杂文档模型的输出是否可供其他生产、开发或 UAT 组织或租户使用?
是的,这可以通过外部应用程序支持。 有关更多详细信息,请查看 “OAuth 应用程序”。
验证站点是否与非结构化复杂文档功能配合使用?
是的,它的工作方式与 Document Understanding 新式或经典项目相同。但是,全部提取数据均需以表格形式进行验证。
非结构化复杂文档模型是否通过 Action Center 中的 HITL 验证获得?
没有,目前 Action Center 与非结构化复杂文档模型之间没有反馈循环。 后续版本计划支持该功能,且将同时推出可微调模型。
文档处理限制
在实践中,智能提取处理 (IXP) 可以为每个文档可靠地提取约 1,200 个字段值。
这意味着,如果文档需要提取 1,200 个以上的字段值,则模型可能会达到其令牌上限。 即使文档完全处于本部分列出的页面限制内,也可能会发生这种情况。 研究和开发工作正在进行,以支持在未来版本中更高的字段值上限。
如果超过令牌上限,则无论页面数如何,预测都可能不完整或为空。 例如,一个已提取 1,400 个字段值的 80 页文档可能会在用户界面中触发令牌上限警告。在运行时,当超出令牌上限时,API 响应将通过返回 0 的出现和提取置信值来显示此情况。
如果超过页面限制,则仅会处理以下指定限制内的页面。 这些行为都适用于 Gemini 和 GPT-4o。
Runtime / runtime 限制包括:
-
每个文档的页数:
- 对于 Gemini,最多 500 页。
- 对于 GPT-4o,使用迭代调用专用预览功能时,最多可达 150 个页面。
-
令牌限制- 如果每次提取的字段数量达到典型值,则对于提取次数超过 200 次的数据量大的文档(例如很长的表格),则可能会达到令牌限制。如果 GPT-4 达到其限制,您可以使用迭代调用个人预览功能来增加字段输出。但是,默认情况下,Gemini 有更高的输出令牌限制,因此两个模型都可以通过单次调用返回相似数量的字段值:Gemini 通过多次调用返回 GPT。
备注:要请求访问迭代调用个人预览功能,请联系您的客户经理。
维护和监控
该功能是否提供任何监控工具? 这些项目与 Document Understanding 新式项目不同吗? 是否对 Insights 有依赖项?
目前,“非结构化复杂文档”功能无法提供任何监控功能,例如新式项目中的 “监控” 页面。有关监控功能的其他详细信息将在未来的版本中分享。
我们是否可以监控非结构化复杂文档项目的 AI Unit 消耗量?
是的,您可以通过 Insights 智能提取处理 (IXP) AI Unit 仪表板和 AI Unit 租户仪表板执行此操作。有关更多详细信息,请选中“智能提取处理 (IXP) AI Unit 消耗仪表板”。
我们能否自动检测性能下降,例如数据漂移、F1 分数降低等?
目前,我们不提供任何模型性能通知或警报。
用户需要更新模型或提示指令的频率?
这取决于具体用例,但您应在提取性能不符合预期时随时改进提示指令。