- 发行说明
2022 年 3 月
DocumentUnderstanding + DocumentClassifier + Data Extraction ML 包在 AI Center Cloud 中发布,包版本 22.1.6
错误修复
- 修复了一个错误,该错误导致 AI Center 中的训练管道或完整管道由于空行数据预处理中的 ML 包问题而失败。
UiPathDocumentOCR - 在 AI Center Cloud 中发布,包版本 22.2.3
卓越的能力
将手写识别 OCR 集成到 UiPath 文档 OCR 中。在许多情况下,会混合使用字段。通过集成手写读取功能,我们能够将正确的识别应用于每个字段:打印识别应用于打印文本,手写识别应用于手写文本。
虽然手写识别 OCR 可以检测任何手写内容,但请注意,它仅针对英语进行了训练和优化。
改进
字数限制从每页 1600 增加到 10000。
μ
、≤
、≥
、<
、>
。
DocumentUnderstanding + DocumentClassifier + Data Extraction ML 包在 AI Center Cloud 中发布,包版本 22.1.4
新增功能
水电费账单 ML 包现已正式发布。
改进
总体而言,性能和可扩展性得到了改进。
与以前的版本相比,在新版 DocumentUnderstanding ML 包上训练时的分数有了显着提高。
现在可以正确解析列字段中的日期。
日期解析现在可以识别土耳其语月份名称。
更改
在 GPU 与 CPU 上训练时,更改了训练管道和完整管道的行为。21.10.x在 CPU 上训练的模型更小,因此训练速度比以前的版本更快,但准确性比以前略低。
此版本已逆转此行为,因此在 GPU 和 CPU 上训练的模型是完全相同的模型,并且训练速度已恢复到 2021.10 之前的水平,这意味着在 CPU 上的训练速度再次比在 GPU 上的训练速度慢 10 到 20 倍。
改进
添加了有关“训练”、“验证”和“评估”文档类型的更多描述性工具提示。
错误修复
- 修复了一个已知问题,该问题导致搜索或下载文档时,如果文件名中含有需要 URL 编码的字符(
&
、,
、+
、#
、'
),则查询失败。 - 修复了导致“预测”功能在文本非常密集的文档上失败的错误。
改进
Ctrl
+ Shift
+ F
访问。
使用“预测”功能时,将删除手动标记的数据,并使用模型中的新值覆盖文档。
split.csv
。文件中的数据现在已集成到数据集中最新文件夹的 JSON 文件中,更确切地说,是在“子集”字段中。因此,如果您手动修改文件或将其从数据集中完全删除,则不会对模型的训练产生影响。但是,请注意,对于 21.10 ML 包版本或更低版本,该文件仍会保留以用于文档级别导出。
添加了永久删除单个文件的选项。此选项可以在文档名称旁边的下拉列表中找到,旁边是下载选项。