Document Understanding
2023.4
False
  • 发行说明
    • 2023.4
      • 2023.4.0
      • 2023.4.1
      • 2023.4.2
      • 2023.4.3
      • 2023.4.5
      • 2023.4.6
横幅背景图像
Document Understanding 发行说明
上次更新日期 2024年4月19日

2023.4.0

2023 年 4 月 26 日| LTS 版本

通过查看自上次发布 LTS 到现在为止发生更改的下一个列表,及时了解有关 ML 包的所有最新消息。

新增功能

现在可以将七个新的开箱即用预训练 ML 包用于一般用途。以下是上述七个新模型的列表:

  • 公司注册证书/良好声誉证明书
  • 原产地证书
  • 儿童产品证书
  • CMS1500
  • 欧盟符合性声明
  • 发货发票
  • 工资单
所有管道的总分现在表示准确度,以前表示 F1 分数。为了保持向后兼容性,AI Center 中的评估工件仍同时包含准确度和 F1 分数。

A new version of the Out-of-the-box Pre-trained ML Packages (23.1.0) and their public endpoints has been released, now using cutting edge LayoutLM Transformers based architecture, which is more powerful and increases accuracy overall, especially on column fields (tables).

我们向“发票”(Invoices) 模型添加了新的提取字段,这些字段现在包含“发货日期”、“供应商电子邮件地址”、“银行名称”、“银行账号”、“IBAN”、“SWIFT 代码”、“银行地址”、“银行汇款路线号码”和“税率”。

AI Center 中由训练/评估/完整管道显示的主要分数不再表示 F1 分数,而表示准确度。这定义为正确预测的百分比。通常,“准确度”的数值高于 F1,但更容易理解和解释。此外,您现在可以查看每个列字段的详细分数,而在旧版本中,仅提供为所有列字段汇总的单个分数。F1 分数仍可在每个管道的 artifacts/eval_metrics 文件夹中找到,以保持与以前版本的连续性。

改进

“计划导出”功能(预览版)已更新,新的最短重复周期为 7 天。所有现有的计划导出都已更新,以反映新的最短重复周期(7 天)。

UiPath 文档 OCR 公共端点已更新,现在为德语和法语提供手写语言支持,并为丹麦语、芬兰语、挪威语和瑞典语提供打印语言支持。

我们将在 10 个位置(可能在同一页面上)标记数据的要求更改为 10 个不同的页面,从而提高了“导出数据”的准确性。

For all situations where latency is critical (e.g.: attended scenarios) we recommend deploying the models as ML Skills using a GPU.

我们删除了 Document Manager 类型导入的导入页面限制,但每次导入的大小限制为 4000 MiB。

已知问题

当前已禁用从 AI Center 导入项目的功能。我们正在积极处理此问题,预计很快会重新启用该功能。

弃用时间表

我们建议您定期查看弃用时间表,以获取有关针对即将弃用和删除功能的任何更新。

2023 年 5 月 8 日勘误

错误修复

我们修复了一个错误,该错误在运行完整管道或训练管道时导致 Fatal Python error: Segmentation fault 。 现在一切正常。
  • 2023 年 4 月 26 日| LTS 版本
  • 新增功能
  • 改进
  • 已知问题
  • 弃用时间表
  • 2023 年 5 月 8 日勘误

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.