document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月12日

流量限制

提取和分类 ML 包需要大量计算资源,这意味着随着文档大小和/或每分钟文档数量的吞吐量的增长,会受到一些限制。

大于 100 页的文档预计会遇到计算或延迟限制,从而导致 ML 技能不稳定或返回 HTTP 错误。很难定义确切的上限,因为文档的文本密度和图像分辨率具有很大的动态范围,而文本密度(每页的字数)会影响所需的计算和 RAM 资源以及延迟。此外,ML 技能的容量取决于用于部署该技能的硬件的大小,这由 AI Center 控制。例如,可以将 ML 技能部署在 GPU 或 CPU 上,这对 ML 技能的容量和速度有很大影响。

关于吞吐量,ML 技能一次只能处理一个文档,这意味着您需要等待一个文档完成才能发送下一个文档。文档越大,单位时间内可处理的文档就越少。

为了缓解这些问题,如果您需要处理非常大的文档,请记住,在许多情况下,相关数据可能位于较小的页面子集上,并且可以使用智能关键字分类器拆分出这个子集。这可能是一个很好的策略,因为它可以消除 ML 技能错误/失败/超时,提高吞吐量和响应能力,通过减少误报来提高提取准确性,并通过消除不必要的 AI Unit 消耗来降低成本。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。