activities
latest
false
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
UiPath logo, featuring letters U and I in white
Document Understanding 活动
Last updated 2024年11月14日

发行说明

v.6.9.8

发布日期:2024 年 10 月 22 日

我们通过将常见依赖项更新为最新版本来提高产品稳定性。 此升级是自动的,不需要您执行任何操作。

v6.14.3

发布日期:2024 年 10 月 21 日

错误修复

此版本解决了“AI Unit 使用概述”仪表板中因数据缺失而显示“未知”部分的问题。

v6.19.7

发布日期:2024 年 10 月 14 日

错误修复

此版本解决了“AI Unit 使用概述”仪表板中因数据缺失而显示“未知”部分的问题。

v6.22.0

发布日期:2024 年 10 月 3 日

注意:此包版本与 24.10.0 或更高版本的 UIAutomation.Activities 版本兼容。

新增功能

支持本地部署设置中的活动

现在,即使机器人已连接到本地 Orchestrator,您也可以在“对分类文档作用域”中和“数据提取作用域”中使用以下活动:

具体来说,对于“数据提取作用域”活动,我们已实现使用来自不同组织或租户的自动验证功能。

我们已在之前的活动中添加了“运行时租户 URL”和“运行时凭据资产”属性。借助这些属性,您现在可以直接使用外部应用程序中存储在 Orchestrator 中的凭据,在运行时访问 Document Understanding 资源。为此,请确保所选租户启用了 Document Understanding 并分配了 AI Unit。

此外,在“Document Understanding 项目分类器”和“Document Understanding 项目提取程序”活动的“获取功能”向导中,我们还添加了“应用程序 ID”、“应用程序密钥”和“租户 URL”等属性。这些属性可促进在设计阶段访问不同组织和租户的资源。

适用于新式项目的智能 OCR 支持

IntelligentOCR.Activities 现在通过一组针对新式 Document Understanding 项目使用情况的新活动来支持使用新式 Document Understanding 项目。现在,您可以使用以下活动来使用新式 Document Understanding 项目和版本:

扩展语言 OCR

使用现已正式发布 (GA) 的 UiPath 扩展语言 OCR,增强项目处理文档的能力。

错误修复

  • 解决了为同一文档类型同时启用基于键盘的分类器和智能键盘分类器时遇到“文本长度为零”错误的问题。
  • ML 提取程序返回了空值,从而导致验证任务由于 null 值属性而失败。
  • 未根据分类设置 Action Center 的验证站点中手动添加的字段值的格式,从而导致导出的结果显示不正确的数据。
  • 解决了阻止您在验证站点中标记图像文件内表格的问题。

即将弃用

自 2025 年 1 月起,我们将弃用 UiPath 中文、日语、韩语 OCR。我们建议改用 UiPath 扩展语言 OCR。查看弃用时间线,详细了解即将弃用和删除的内容。

v6.19.6

发行日期:2024 年 8 月 13 日

我们升级了一些内部依赖项以提高性能。

v6.19.5

发行日期:2024 年 7 月 31 日

错误修复

  • 在“数字化文档”活动期间,尝试对特定文件内容进行数字化会导致出现“System.InvalidOperation”异常以及“已满”消息。
  • 使用生成分类器和生成提取程序活动时,输入以空格开头或结尾的提示会导致“KeyNotFoundException”错误,并显示“字典中没有给定的键”消息。

v6.0.2

发布日期:2024 年 7 月 29 日

我们通过将常见依赖项更新为最新版本来提高产品稳定性。 此升级是自动的,不需要您执行任何操作。

v6.5.4

发布日期:2024 年 7 月 29 日

我们通过将常见依赖项更新为最新版本来提高产品稳定性。 此升级是自动的,不需要您执行任何操作。

v6.19.3

发行日期:2024 年 6 月 20 日

我们一直在不断努力改善您的 UiPath Document Understanding 体验。 即使此发行版没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。

v6.14.2

发行日期:2024 年 6 月 5 日

我们通过将常见依赖项更新为最新版本来提高产品稳定性。 此升级是自动的,不需要您执行任何操作。

v6.19.2

发行日期:2024 年 6 月 5 日

错误修复

如果先前未配置预签名 URL,则“创建文档分类”操作会引发错误。

v6.19.1

发行日期:2024 年 5 月 27 日

错误修复

  • 解决了为同一文档类型同时启用基于键盘的分类器和智能键盘分类器时遇到“文本长度为零”错误的问题。
  • ML 提取程序返回了空值,从而导致验证任务由于 null 值属性而失败。

v6.19.0

发布日期:2024 年 4 月 29 日

这些发行说明包含 2023 年 11 月至 2024 年 3 月之间进行的所有更新。

新增功能

验证程序说明

您现在可以为 分类管理器 中的每个字段启用“ 验证器注释 ”。启用后,您可以在这些字段上设置注释,系统会将注释显示给人工验证者。 如果将注释设置为可编辑,则验证程序可以通过新的ExtractionResult对象属性对其进行编辑,并将信息传达回自动化。

注意:请注意,验证程序说明将随 Automation Suite 2024.10 版本一起在 Action Center 中提供,并且大约会按照 2024.10 时间表,在 Automation Cloud 中为 Action Center 提供。查看 Action Center 发布说明,了解最新信息。

数据提取作用域的生成式验证

您可以对“ 数据提取范围 ”活动使用 生成验证 ,通过生成提取交叉检查来调整置信度。查看“数据提取作用域”活动中的“应用自动验证”和“自动验证置信度阈值”属性。

改进

  • 安装UiPath™.IntelligentOCR.Activities包时,系统会自动安装UiPath™.DocumentUnderstanding.ML.Activities包。 您无需单独安装。

错误修复

  • 修复了转换为 JPG 时无法识别日语字体的问题。
  • 修复了“验证站点”中希伯来语数字顺序颠倒的问题。
  • 修复了与提取双向(从左到右和从右到左)文本值相关的问题,该问题导致标点符号的顺序错误。

已知问题

在 Windows 项目上的 Studio 2023.4.4 中使用 Document Understanding 流程模板版本 2022.10.2 时,存在一个已知问题。 打开分类管理器会导致错误,指出您必须安装缺少的 .NET Framework。 无论您是否选择安装 .NET,都会出现另一条错误消息:“UiPath™ Studio 和分类管理器之间的通信意外结束。”

解决方法:手动安装 .NET 6.0 运行时。

v6.14.1

发行日期:2023 年 10 月 24 日

新特性和改进功能

为以下活动添加了新属性“提取的字段验证置信度 (%)”:
  • 呈现验证站点
  • 创建文档验证操作
向以下活动添加了新属性发送文档
  • 表单提取程序
  • 智能关键词分类器

数字化文档”活动现在可以检测原生 PDF 单选按钮。

数字化文档”的内容类型检测功能得到了改进。

分类管理器现在支持在业务规则中定义多个数学表达式。

v6.9.5

发布日期:2023 年 9 月 19 日

我们修复了一个错误,该错误会在从 Action Center 完成文档验证后继续作业时触发 You are not authorized 错误。

v6.9.4

发布日期:2023 年 8 月 28 日

我们修复了一个错误,该错误会在文档包含大型表格时降低验证站点的速度。

v6.9.3

发行日期:2023 年 6 月 8 日

我们修复了一个错误,当金额为负数时,该错误会导致格式化值出现不一致。

v6.9.2

发行日期:2023 年 6 月 7 日

使用表单提取程序活动时,可以使用一个新选项 发送文档以改进算法,允许您在运行工作流之前启用或禁用该选项。 默认值为 启用

我们对整个 UiPath.IntelligentOCR.Activities 包进行了次要错误修复和辅助功能修复。

v6.5.3

发布日期:2023 年 9 月 19 日

我们修复了一个错误,该错误会在从 Action Center 完成文档验证后继续作业时触发 You are not authorized 错误。

v6.5.2

发行日期:2023 年 6 月 7 日

我们一直在不断努力改善您的 UiPath Document Understanding 体验。 即使此发行版没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。

v6.9.1

发行日期:2023 年 5 月 2 日

错误修复

我们修复了一个错误,该错误会导致除第一个子文档以外的所有子文档完成提取时,“ 数据提取作用域”活动崩溃。 当使用分类器执行文档拆分并且从“分类文档范围”返回多个分类结果时,会发生这种情况。

v6.9.0

发行日期:2023 年 4 月 26 日

新特性和改进功能

  • UiPath Document OCR 是以下活动的新默认 OCR 引擎:智能 Kewword 分类器、智能 Kewword 分类器训练器和表单提取程序。
  • 我们在“ 等待文档验证 Actions”“等待文档分类 Actions” 活动中添加了重试功能。 您可以使用新的“重试”选项,并将其设置为“已启用”/“已禁用”,默认值为“已启用”。 如果启用,HTTP 调用将在失败时重试。
  • UiPath.IntelligentOCR.Activities 包现在可以与从右到左的语言一起使用。
  • 通过将页面匹配信息包含到提取算法中,提高了“表单提取程序”活动的提取准确性。
  • 我们更新了可在分类管理器中设置的字段规则的设计。
  • 现在,您可以使用加载分类活动的分类管理器向导将数学表达式应用于字段规则。
  • 验证站点向导已更新,可用于查看应用于字段的规则。 此外,当手动更新字段时,字段规则也会自动更新。
  • “数字化文档”活动已得到改进,现在消耗的系统内存更少。
  • 图章微件现已在原生 PDF 中数字化。
  • 改进了“ 数字化文档”活动的 PDF 文件支持。

2023 年 9 月勘误:拆分高级功能可用于智能关键字分类器活动。

错误修复

  • 我们更新了包依赖项,并修复了将 “调用代码” 活动添加到工作流时引发的“找不到方法”错误。
  • 我们修复了一个错误,该错误会在所用 Orchestrator 实例的身份验证令牌过期时阻止自动填充 API 密钥。 UiPath 文档 OCR中文、日语、韩语 API 密钥字段的 OCR 都发生错误。

弃用时间表

我们建议您定期查看弃用时间表,以获取有关针对即将弃用和删除功能的任何更新。

v6.5.1

发行日期:2023 年 3 月 27 日

新特性和改进功能

我们一直在不断努力改进 UiPath.IntelligentOCR.Activities 包。 即使此补丁版本没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。

v6.6.0

发行日期:2022 年 12 月 15 日

新特性和改进功能

  • 现在,已为以下活动预填充 Document Understanding API 密钥:UiPath 文档 OCR、中文、日语和韩语 OCR、机器学习提取程序、机器学习分类器和表单提取程序活动的模板管理器。
  • Task Capture 用户界面现已提供繁体中文版本。
  • 现在,您可以受益于为 UiPath.IntelligentOCR.Activities 包中包含的以下活动预填充的 API 密钥字段:智能关键字分类器和表单提取程序。
  • “键盘快捷方式”菜单现在包含新的热键,这些热键已添加到单独的“辅助功能”部分中。 它们可用于“当前验证站点”和“当前分类站点”活动。

错误修复

修复了一个错误,该错误会在所用 Orchestrator 实例的身份验证令牌过期时阻止自动填充 API 密钥。 UiPath 文档 OCR中文、日语、韩语 API 密钥字段的 OCR 均发生错误。

v6.5.0

发行日期:2022 年 10 月 24 日

新特性和改进功能

  • 新的操作对象可用于“ 等待文档分类操作” 和“继续”等待文档验证操作和“继续” 活动。
  • 数字化文档” 活动已升级,现在随附默认的预选 OCR 引擎,即 UiPath 文档 OCR 引擎。 由于此更改, UiPath.OCR.Activities 包已成为 UiPath.IntelligentOCR.Activities 包的依赖项。
  • “数字化文档”活动收到新参数 Detect Checkboxes,该参数可在数字化文档时启用复选框检测。
  • 可以为“ 验证站点”中的选定字段单独更新 OCR 置信度级别。
  • 已更新置信度筛选器设计,并在表格级别为 OCR 和提取的每个条目添加了置信度分数。 现在,您可以检查已手动验证的字段的原始置信度级别。 通过单击显示的置信度,可以使用这两个值。
  • 已对“ 验证站点 ”向导进行了更新。 现在,您可以为置信度级别设置阈值,并根据设置的限制对其进行排序。
  • 分类管理器 向导界面已更新,使其更加易于使用。 新功能包括适用于所有组、字段、类别的额外“ 删除 ”选项,或“ 切换键盘快捷方式 ”选项。
  • 复选框检测现在应用于未嵌入原生复选框字符或控件的原生 PDF 页面。
  • PDF 处理功能已获得重大更新,包括处理基于矢量的文本的功能、忽略不可见文本对象的功能、单词检测的改进、徽标处理的改进、字符重复问题的修复以及其他改进。
  • 从 PDF 文件中提取文本已升级,从而优化了提取流程,在该流程中,可同时检索原生文本和扫描文本,并且 OCR 仅应用于 PDF 文件中识别的图像。 仅当“ 应用 OCROnPDF” 选项设置为 “自动” 时,此改进才可用。
  • Document Understanding Process Studio 模板已升级到新版本。 UiPath.IntelligentOCR.Activities包是此模板的依赖项。

错误修复

  • 通过升级 PDF 库并使用混合 OCR 功能,修复了在使用数字化器时导致提取错误的错误。
  • 修复了“ 数字化文档” 活动中发生的错误,该错误会导致在某些 PDF 上提取复选框,即使 DetectCheckboxes 选项设置为 False 也是如此。
  • 修复了“ 分类文档作用域” 活动中发生的错误,当在作用域中使用两个分类器并处理特定文档时,该错误会为 documentText 参数引发空错误。
  • 手动验证 验证站点 中的字段时,置信度未更新为 100%。 此错误已修复,现在,当用户手动验证字段时,置信度百分比会自动更新。
  • 修复了将鼠标光标移至“文档视图” 部分时,“ 分类站点 ” 向导和 分类管理器 中发生的错误。 现在,一切正常。
  • 在文本视图中对包含特殊字符的文档使用 验证站点 时,发生错误。 此错误已修复,现在您也可以在文本视图中查看包含特殊字符的文档。

2022 年 12 月 8 日

已知问题

UiPath.IntelligentOCR.Activities 包 v6.5.0 无法与低于 2021.10 的 Studio 版本一起运行。

v6.0.1

发行日期:2022 年 5 月 9 日

新特性和改进功能

  • 我们一直在努力为一些向导赋予新的面貌,因此,“ 验证站点”、“ 分类站点”和“ 分类管理器 ”现在都具有全新的界面,该界面非常用户友好,并提供了多种新功能。
  • 验证站点 中值得一提的一些功能是为每个提取的字段显示的置信度分数。 它们可以按 OCR 或提取程序排序,并准确显示每个提取字段的置信度分数。 置信度分数应仅用于指导目的。 您始终可以通过手动验证数据来提高该分数。
  • “验证站点”向导在 PDF 查看器中也有一个重新样式化的标头,您可以在其中选择从左向右滑动文档视图、隐藏提取的令牌来清晰地查看文档,或将键盘快捷方式可视化。立即尝试一下吧。
  • “分类站点”向导在 PDF 查看器中显示重新样式化的标头,与其对等站点“验证站点”向导相同。在这里,您还可以选择在屏幕的左侧或右侧显示文档,也可以查看可用的键盘快捷方式。新标头中还提供了旋转选项,使文档操作比以往更加容易。
  • 除其他改进外,“ 分类管理器 ”向导还进行了一项特别有用的新改进,即文档类型标头中的“删除”选项,该选项还可以启用批量删除。
  • UiPath.IntelligentOCR.Activities 包已升级到 .NET5 便携包,您可以在 Linux 机器人上运行它们。
  • UiPath Studio MSI 大小已优化, UiPath.IntelligentOCR.Activities 包不再是 UiPath Studio MSI 的核心包,而是可选包。 所有功能保持不变。 唯一的变化是您需要在 UiPath Studio 中手动安装包。
  • 数字化文档” 活动和“ 智能关键字分类 器”活动已更新,“强制应用 OCR”选项已替换为“ 应用 OcrOnPdf” 选项。 “ 在 PDF 上应用 OCR” 在下拉列表中提供三个选项: TrueFalseAuto。 如果设置为 True,则 OCR 将应用于文档的所有 PDF 页面;如果设置为 False,则仅提取数字输入的文本。 默认值为“ 自动”,根据输入文档确定文档是否需要应用 OCR 算法。
  • 分类站点 向导中,“未分类”组的值现在设置为“不适用”。
  • 计划于 2022 年 10 月弃用 智能表单提取 程序活动。 我们建议使用“ 表单提取程序 ”活动。
  • 表单提取 程序”活动现在可以处理检测到签名的文档。

错误修复

  • 修复了“验证站点”向导中发生的错误。 验证站点的 PDF 查看器中未正确显示某些亚洲字体。
  • 修复了在 UiPath Studio v19.10 和 v20.10 中使用“ 数字化文档” 活动时发生的错误。 尝试处理 .tiff 文件时引发错误。 现在,一切正常。
  • 修复了使用 TAB 快捷键时验证站点上发生的错误。 TAB 键不是保存更改,而是将字段还原为以前的值。 现在,一切正常。
  • 修复了“ 表单提取程序 ”活动中发生的错误。 导入模板时显示错误消息。

已知问题

如果您使用 Intel Xe GPU,且分类管理器验证站点分类站点未正确显示,我们建议将图形驱动程序更新到最新版本。如需了解详情,请访问 Intel 支持

v5.0.2

发布日期:2021 年 10 月 19 日

改进

  • 分类管理器 进行了全面检修,改进了用户界面和用户体验。 现在,您可以添加不带组或类别的文档类型,为字段配置颜色和热键等。 有关完整说明,请参阅文档。
  • UiPath.IntelligentOCR.Activities 包已升级到 .NET5。 虽然继续支持这两个 .NET 版本,但 .NET5 项目只能在 64 位体系结构上运行。
  • 通过 Document UnderstandingData Manager改进了整个框架的数字化流程。
  • 已进行改进,以优化扫描文档的 OCR 结果。 通过将倾斜角度保持在 +/- 20 度之间,可以获得最佳结果。
  • 改进了图像处理尺寸,以获得更好的结果。要成功对图像进行数字化/处理,图像的宽度和高度尺寸应在 50 到 10000 像素之间。系统会拒绝不在此范围内的任何图像,并显示异常消息。如果图像经验证具有前述尺寸且总大小大于 1400 万像素,则该图像将缩小到 1400 万像素,同时保持纵横比(宽度与高度之比)。
  • 验证站点 错误消息系统已得到改进,现在,如果用户拒绝文档,则会引发 DocumentRejectedByUserException 类型的异常,并停止流程。
  • 缩短了适用于具有大型分类的文档类型的验证站点的加载时间。
  • 对于 Validation Station中的派生零件,小数点后两位以上的数字不再四舍五入。
  • 由于图像处理算法的改进,某些文档的数字化过程可能会发生变化。
  • “模板管理器”向导中添加了一个新的复选框,使您可以选择添加的同义词是否区分大小写。
  • 已对可从“ 智能表单提取 程序”和 “表单提取 程序”活动访问的“模板管理器”向导进行设计更新。
  • 如果由于处理时间长而导致超时,现在可以为表单提取程序智能表单提取程序使用新添加的超时参数来增加服务调用超时。
  • 如果在“智能表单提取程序”活动的“模板管理器”向导的“签名”框和“手写”框中都选中了某个字段,则会显示一条弹出消息,告知您只能在一个框中添加字段,而不能同时在两个框中添加。
  • 可用于“ 智能关键字分类 器” 活动的向导已收到更新,这意味着单击已导出向量消息的“ 确定 ” 按钮现在可将用户返回到向导,而不是关闭向导。
  • 创建文档验证操作” 和“提交 验证站点 ” 活动收到了一个新参数 ShowOnlyRelevantPageRange。这使您可以配置活动,使其仅显示在提取结果的分类部分中捕获的页面范围。
  • 数字化文档” 活动中的性能和内存改进。
  • CefSharp 参考已更新至版本 92.0.260。

错误修复

  • 修复了在不同操作系统区域格式上运行 OCR 时发生的错误。现在,无论使用哪种操作系统区域格式,OCR 都可以按预期运行,并且所有结果都可以正确生成。
  • 修复了“ 导出提取结果 ”活动中的一个错误,该错误会在将字段标记为手写时删除提取的表格。 现在,整个提取结果已按预期导出。
  • 修复了与验证站点相关的问题,该问题在读取派生部分值时导致意外的数字格式。
  • 修复了“ 自动提取结果 ”参数设置为空时“等待验证操作”活动中返回错误的错误。 现在,活动按预期运行,没有任何错误。
  • 修复了在没有向“ 当前验证站点 ”活动提供任何提取结果时引发运行时错误的问题。
  • 修复了“ 数字化文档” 活动中的一个问题,该问题导致将“ 强制应用 OCR” 参数设置为 False时活动崩溃。
  • 修复了“ 模板管理器 ”向导中的一个问题,该问题导致将表格选择与 “表单提取程序”一起使用时无法提取数据。
  • 修复了导致在处理特定文档时无法为日期字段提取派生部分的问题。
  • 修复了“ 模板管理器 ”向导中的一个问题,该问题导致标记表格后锚点未高亮显示。
  • 修复了以下问题:尽管已从作用域中删除了提取器,但当指出无法在分类中找到提取器配置中的字段时,“ 数据提取作用域 ”活动会引发错误。
  • 修复了一个问题,该问题导致“ 模板管理器 ” 向导在尝试保存添加了某些单词作为页面证据的模板时引发错误。
  • 修复了以下问题:当“ 自动 提取结果”参数为空时,无法显示对数据输入进行完全手动处理的空验证站点。
  • 修复了以下任何活动的文件或存储桶名称中包含特殊字符时发生的错误: 创建文档分类操作等待文档分类操作创建文档验证操作等待文档验证操作。 现在,文件/存储桶名称中的所有特殊字符都已按预期进行编码。
  • 修复了由于背景对比度而导致无法提取签名和手写字段的问题。 现在,无论背景颜色如何,所有字段都已正确提取。
  • 修复了导致 OCR 引擎在某些离线系统上返回错误的错误。
  • 修复了将“ 数字化文档” 活动与 UiPath 文档 OCR 引擎一起使用时合并提取的内容的错误。 现在,将分别提取每个项目。

已知问题

  • 如果要在 Studio v2019.10 中使用此包中的任何 OCR 活动, 请安装版本 2.0.1 或更高版本的 UiPath.CoreIPC 包。
  • 如果您在使用 Windows N/KN 作为操作系统的计算机上安装“UiPath.IntelligentOCR.Activities”包 v5.0.0,则还需要“Media Feature”包。有关 Media Feature 包的安装说明,请访问 Windows N 版本的 Media Feature Pack 列表

v4.13.2

发行日期:2021 年 5 月 28 日

改进

缩短了适用于具有大型分类的文档类型的验证站点的加载时间。

v4.13.1

发布日期:2021 年 4 月 16 日

改进

如果由于处理时间长而导致超时,现在可以为表单提取程序智能表单提取程序使用新添加的超时参数来增加服务调用超时。

v4.13.0

发布日期:2021 年 3 月 29 日

新特性和改进功能

  • 通过添加基于字段级锚点的提取规则,扩展了“表单提取程序”和“智能表单提取程序”功能。除了页面级锚点外,现在还可以在“模板编辑器”中定义字段级锚点。这种编辑器是一种新选项,用于定义要从中提取数据的自定义区域的边界。与定义相对于整个页面内容的数据位置的页面级别配置相反,基于锚点的配置现在允许基于字段级别配置来定向数据提取,从而实现更大的灵活性。
  • 验证站点的性能改进。
  • 更新了验证站点分类站点设计系统,以获得更好的用户体验。
  • “验证站点”、“分类站点”和“模板管理器”现在在“文档视图”侧有一个三态按钮,允许用户在不同的文档交互模式之间进行选择:“令牌”(单词选择)、“自定义区域”(区域选择)和“选项选择”(用户可以在每次选择时在“令牌”和“自定义区域”之间进行选择)。
  • 用户界面、验证站点分类站点模板管理器已通过文本视图中的新选择模式进行了改进,现在允许用户以与原始版本相同的交互方式从文档的文本版本中进行选择。还添加了一个新的热键 d + s,以帮助在原始文档视图和文本视图模式之间进行切换。
  • 现在,当您为选定的报告文本值下方的数据字段分配值时,“验证站点”将显示原始文档中的“裁剪”。这有助于根据文档中的值区域查找和验证特定字段值。
  • 更改了“智能关键字分类器”的置信度计算,使其可随单词向量的长度扩展。
  • 在“导出提取结果”活动的属性面板中添加了“包括 OCR 置信度”复选框。如果选中,则导出的信息还将包含每个值的 OCR 置信度。
  • 改进了字母和单词处理算法,以避免在某些情况下报告重复的字符或单词。
  • “对文档范围进行分类”和“训练分类器范围”现在支持分类器功能。
  • 对“对文档范围进行分类”进行了优化,以对其范围内的分类器执行顺序调用,仅使用先前提取程序尚未分类的页面范围。

错误修复

  • 修复了在特定情况下,当“表单提取程序”活动和“智能表单提取程序”活动位于同一“数据提取作用域”内时引发运行时错误的问题。
  • 修复了防止在特定情况下引发分类器错误,但分类无提示失败的问题。
  • 修复了导致在处理特定文档时无法为数字字段提取派生部分的问题。
  • 修复了“数字化文档”中的一个问题,该问题会导致即使在报告异常之后,活动也会处理文档页面,从而增加了失败情况下的总体执行时间。
  • 修复了一个错误,该错误会导致无法在“基于正则表达式的提取程序”中、C#项目以及其他非常特殊的情况下正确配置正则表达式。
  • 修复了在文档类型包含 200 多个字段时,“验证站点”和“模板编辑器”中出现的性能问题。
  • 修复了在某些情况下将数字合并为单个报告数字值的错误。
  • 修复了在某些情况下,与存储桶进行通信时,“等待文档验证操作和恢复”活动将引发异常的问题。

已知问题

“创建文档分类操作”、“创建文档验证操作”、“等待文档分类和恢复”和“等待文档验证和恢复”活动不适用于已启用“通过 Orchestrator 访问数据”的存储桶。

v4.10.5

发行日期:2021 年 5 月 28 日

改进

缩短了适用于具有大型分类的文档类型的验证站点的加载时间。

v4.10.4

发行日期:2021 年 2 月 3 日

改进

验证站点的性能改进。

v4.10.3

发行日期:2021 年 1 月 11 日

改进

通过 AWS 托管存储桶上的创建文档验证操作创建文档分类操作改进了文件上传。

v4.10.2

发行日期:2020 年 11 月 12 日

新特性和改进功能

  • CefSharp 参考已更新至版本 84.4.10。
  • 更新了端点,如下所示:
    • 表单提取程序:从 https://formextractor.uipath.comhttps://du.uipath.com/svc/formextractor
    • 智能表单提取器:从 https://intelligentforms.uipath.comhttps://du.uipath.com/svc/intelligentforms
    • 智能关键词分类器:从 https://intelligentkeywords.uipath.comhttps://du.uipath.com/svc/intelligentkeywords
  • 在标记表模式下对验证站点进行了改进。

错误修复

修复了与持有者令牌到期有关的分类文档分类操作问题。

v4.10.1

发行日期:2020 年 10 月 20 日

改进

表单提取器智能表单提取器智能关键词分类器的更详细的错误记录。

错误修复

  • 改进了地址解析。
  • 修复了表单提取器智能表单提取器智能关键词分类器活动无法使用所有 ML 技能的问题。

v4.10.0

发行日期:2020 年 10 月 5 日

新特性和改进功能

新活动

此包中添加了五个新活动:

验证站点

为便于识别验证站点中的信息,将颜色代码添加到了字段卡、令牌或自定义区域中。默认情况下,每个字段卡都有一个颜色代码,而令牌或自定义区域获得的颜色代码与将它们分配到的字段卡颜色代码相同。

新的快捷方式已添加到验证站点中,允许用户从表格中向上、向下、向左或向右移动所选行。此外,在验证站点中进行选择时,可以使用字段级快捷方式将其分配给特定字段。每个字段卡都有一个与之关联的密钥。如果未进行选择,则可以使用字段级快捷方式从一个字段卡跳到另一个字段卡。

对于验证站点表格字段,添加了行级复选标记。现在,您可以通过选中复选标记来勾选一行中的所有字段,或者您也可在访问所有字段时,让系统自动勾选。

验证站点中的令牌已更新。因此,突出显示的令牌会具有红底边框,而选定的令牌会具有虚线边框。

验证站点现在支持无引用的字段值。用户可以将值分配给文档中没有引用的字段。为此,当用户在分类管理器中创建一个字段时,需要取消勾选“需要引用”复选框。

分类站

分类站创建了新的快捷方式,允许用户浏览文档类型;添加、更改、删除或突出显示参考;向上或向下移动所有页面;在选定页面后拆分;放弃更改;保存;报告为异常。

除了使用文档类型菜单外,现在还可以通过将鼠标悬停在页面并单击右下角的蓝色图标以在页面级别删除引用。该图标还允许用户突出显示引用。

分类站和验证站点中的 PDF 查看器

“旋转”按钮已添加到 PDF 查看器中。通过单击此按钮,当前文档页面将顺时针旋转。

PDF 查看器中会默认启用选择模式。

其他活动

现在,智能表单提取器表单提取器活动可以合并导入的模板,这些模板具有相同的名称,但内容与现有模板不同。分析每个模板,并为每种情况显示警告消息。

现在,创建文档验证操作活动中的“操作优先级”属性支持表达式和变量。

创建文档验证操作等待文档验证操作然后继续活动的术语“存储桶文件夹路径”与“目录文件夹路径”已分别更改为“存储桶目录路径”和“下载目录路径”。其背后的原因是要与 Orchestrator 的“文件夹”概念明确区分开。

v4.5.2

发行日期:2020 年 8 月 24 日

错误修复

  • 修复了在某些情况下为 Kerberos 或 NTLM 身份验证请求返回 407ProxyAuthenticationRequired 错误消息的问题。这适用于表单提取器、智能表单提取器和智能关键词分类器。
  • 修复了导致智能表单提取器无法正确显示超时错误的问题。
  • 为某些验证站点字符串添加了缺失的翻译。
  • 修复了取消选择表格字段时导致数据提取作用域引发错误的问题。

v4.5.1

发行日期:2020 年 6 月 24 日

错误修复

  • 修复了导致等待文档验证操作然后继续活动的配置窗口与“属性”面板之间无法同步的问题。
  • 修复了在某些情况下表格字段在分类法中错误保存为多值的问题。

v1.3.2

发行日期:2020 年 6 月 2 日

改进

UiPath.IntelligentOCR.Activities 软件包已更新,能够引用最新的 Uipath 视觉库。

v4.5.0

发行日期:2020 年 5 月 4 日

新特性和改进功能

  • 此版本带来了许多激动人心的新活动,例如创建文档验证操作等待文档验证操作然后继续,可用于在 UiPath Action Center 中创建、暂停和恢复编排工作流。
  • 两个新的提取程序可以为您提供帮助。 您可以在“ 表单提取 程序”和 “智能表单提取程序”的名称下找到它们。 这两个活动都可以根据预定义的模板从固定表单文档中提取信息,不同之处在于 智能表单提取 程序也可以配置为解释签名或手写的字段。 您可以使用“ 模板管理器 ”向导从任何类型的字段(包括表格)中提取信息,并可以创建自定义表格提取规则。
  • 在使用智能表单提取器活动时,如果可能已经超出了手写字段的数量,那么将直接在工作流中显示警告。这不会阻止用户运行工作流。
  • 基于正则表达式的提取器活动获得了一个名为 UseVisualAlignment 的新选项,该选项可用于复杂的布局,方便用户根据文字在行上的视觉组织方式来编写正则表达式,而忽略文档中标识出的其他任何句子、段落或布局组。
  • 您可以定义用于标识表格区域的正则表达式、用于标识该区域表行的正则表达式,以及用于标识表行中特定列的正则表达式。
  • “呈现验证站点”及其向导具有许多新功能和改进功能。
  • 验证站点向导现在具有一个名为放弃更改的新按钮。您可以使用它确认或取消在验证站点中所做的任何更改。可以在每种文档类型上单独使用该功能。
  • 该向导还有一个名为“显示建议”的新选项,如果使用的提取器报告多个可能的值,该选项可让您从多个候选值中选择一个值。
  • “验证站点”中可用的快捷方式列表已增加了一个新的快捷方式 f+a,允许您在多个值字段中添加一个新值。
  • 将文档数字化活动已得到改进,现在可以更好地标识文档中的复选框。
  • “数字化文档”活动还有一个名为“强制应用 OCR”的新选项。选中后,它将 OCR 引擎应用于文档的所有页面,包括本机 PDF。
  • 如果提取程序声明了“ 数据提取作用域 ”活动,则现在可以自动读取提取程序功能(内部分类)。 这通过公开提取程序的已知字段来简化配置步骤。 机器学习提取 程序现在支持此新功能,使其非常易于使用和配置。
  • 导出提取结果 ”活动收到一个名为“包含 置信度”的新选项。 如果选中,则提供置信度级别。
  • 提取和配置向导现在支持文档类型和表格字段的批量字段选择。

v4.0.1

发行日期:2020 年 1 月 14 日

错误修复

  • 修复了一个问题,该问题导致 验证站点 向导在使用“ 提取新表格 ”选项时无法正确显示表格首选项。
  • 修复了以下问题:在运行“ 验证站点 ”向导时,在其之前或之后链接 标注 活动时返回错误。 现在,活动按预期运行。
  • 修复了一个问题,该问题导致“ 数据提取作用域 ”活动在使用自定义的计算机区域性并选择“如果可能的 格式” 选项运行时引发错误。 现在,活动按预期运行。
  • 修复了在“ 验证站点 ”向导的“文本视图”选项中选择大量文本时导致某些性能问题的问题。 现在,“ 文本视图” 选项将按预期显示文本。
  • 修复了以下问题:当使用未设置内部分类的提取程序运行“ 数据提取作用域 ”活动时,该活动会引发错误,并且在项目的分类中添加了新字段。 现在,活动按预期运行。
  • 在某些计算机上,使用“验证站点”时,旋转的文档无法正确显示。

v4.0.0

发行日期:2019 年 12 月 6 日

重大变更

已知问题

  • UiPath.Abbyy.Activities 包不能与版本低于 v19.11 的 UiPath.UIAutomation.Activities 包和版本低于 v4.0.0 的 UiPath.IntelligentOCR.Activities 包一起使用。
  • 如果在将工作流更新到新的 UiPath.IntelligentOCR.Activities v4.0.0 和 UiPath.Abbyy.Activities v1.0.0 时,您遇到运行时验证错误,请通过对 .xaml 文件进行较小的更改然后还原,强制对其执行新的操作操作。使用 FlexiCapture 活动的工作流可能会发生这种情况。
  • 创建的工作流或升级到 UiPath.IntelligentOCR.Activities v4.0.0 的工作流无法降级到较低的 UiPath.IntelligentOCR.Activities 版本。

错误修复

将“ 数字化文档” 活动与 OmniPage OCR 一起用于扩展引擎包中包含特殊字符的文档时,引发异常。 此问题已修复,现在活动已按预期执行。

v2.0.2

发行日期:2019 年 11 月 25 日

改进

针对 UiPath.IntelligentOCR.Activities 包在文档处理框架中处理文件的性能得到了改进。

v1.3.1

发行日期:2019 年 11 月 25 日

改进

针对 UiPath.IntelligentOCR.Activities 包在文档处理框架中处理文件的性能得到了改进。

v3.1.0

发行日期:2019 年 11 月 8 日

新特性和改进功能

  • 提供了一个旨在帮助您更好地组织和管理可训练分类器的新活动:基于关键字的分类器训练器。该活动只能与训练分类器范围活动一起使用。
  • 验证站点 向导获得了重要升级,现在可供您 Explore 其最大潜力。 仅当在工作流中使用“ 呈现验证站点 ” 活动时,此向导才可用。 您可以使用升级版享受用户友好的新界面,使用键盘快捷方式浏览文档,或者选择一个或多个单词或自定义区域。 您可以轻松地将字段标记为缺失,提取新数据,编辑表格或提取新表格。 所有这些了不起的事情都可以在使用深色主题时通过“ 验证站点 ”向导完成。
  • 此版本中的一项改进是“ 基于关键字的分类 器”活动收到了一个名为 “学习数据”的新参数。 除了指定学习文件数据的位置外,您现在还可以使用包含序列化分类器数据的字符串。 此活动已通过名为“ 管理基于关键字的分类器学习 ” 的向导得到增强,该向导可用于配置和管理用于识别特定文档类型的关键字。
  • 基于关键字的分类 器”和“ 基于关键字的分类器训练 器”活动现在都可以管理多个关键字。 选择关键字集后,系统将根据所选单词的完全匹配进行提取。
  • 另一个重大改进是,除了单词水平框外,“ 数字化文档” 活动中包含的 DocumentObjectModel 输出现在可以支持单词多边形。
  • 分类管理器 ”向导收到了一个新的滚动条,其中包含所有用户界面元素,可提供更好的用户体验。
  • 现在,数据提取范围训练提取程序范围训练分类器范围对文档范围进行分类活动会按水平顺序排列提取程序和分类器,代替了先前的垂直顺序。
  • “基于正则表达式的提取程序”活动已得到改进,现在可以处理和返回多个值。仅当该活动与“验证站点”一起使用时,输出才可见。
  • UiPath.IntelligentOCR.Activities 包提供四种新语言,分别是土耳其语 (TR)、葡萄牙语 (PT)、西班牙语 (ES) 和西班牙语-墨西哥 (ES-MX)。

已知问题

仅当您之前打开过 .xaml 文件时,才能访问分类管理器。 如果在访问分类管理器时未打开任何文件,则会显示一个录制窗口,并且仅在关闭录制窗口后才会显示分类管理器。

错误修复

  • 数据提取范围活动与“尝试捕获活动一起使用时,会引发异常。该问题已解决,现在该活动已按预期执行。
  • 当“验证站点”中的“ 布尔值 ”字段设置为 “否 ”时,输出文件应将结果显示为“ 否” ,但将其显示为缺失。 此问题已修复,现在输出文件显示正确的结果。
  • 修复了“ 数据提取作用域 ” 尝试使用与文档文化不同的数字格式解析文档中的数字时发生的错误数字解析。
  • 使用多个 验证站点时,派生零件的顺序在验证结果中未得到遵守。 此问题已修复,现在结果将按照派生零件的引入顺序显示派生零件。
  • 验证站点 的结果通过第二个 验证站点运行时,具有自定义选择的框之间会出现差异。 此问题已修复,现在具有自定义选择的框之间没有区别。
  • 当将“ 数字化文档” 活动与 Microsoft Azure Computer Vision OCR 引擎一起使用时,当 手写 识别参数设置为 True时,旋转不起作用。 此问题已修复,现在可以正确处理信息。
  • 使用 “数字化文档” 活动时,尝试处理包含大量文本的图像时发生错误。 已通过改进扩展流程修复了此错误。
  • 修复了尝试在训练范围内训练基于关键字的分类器活动时以及在没有分类参考的情况下运行提取时程序会抛出错误的问题。该问题已修复,现在仅记录没有学习信息这一事实,而不是将其作为错误抛出。
  • 使用 FlexiCapture 提取 程序活动时引发错误,并且为表格列和字段提供了相同的名称。 此问题已修复,现在可以按预期处理 .fcdot 文件。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。