活动
最新
False
横幅背景图像
Document Understanding 活动
上次更新日期 2024年4月10日

关于“智能 OCR”活动包

此包包含使用完整、开放、可扩展的方法启用文档处理流的基础架构。

重要

UiPath.IntelligentOCR.ActivitiesUiPath.DocumentUnderstanding.ML.Activities兼容性

v6.18.0 预览版开始,在项目中安装UiPath.IntelligentOCR.Activities包时,系统还会自动安装UiPath.DocumentUnderstanding.ML.Activities包,您无需单独安装。

UiPath Studio 2023.4.4 兼容性

如果您使用的是 UiPath Studio 2023.4.4 或更早版本,请确保安装最新版本的 Windows .NET 6.0 Desktop Runtime。

版本兼容性

更新 UiPath.IntelligentOCR.Activities 时,还需要更新 UiPath.UIAutomation.Activities 包和 UiPath.OCR.Activities 包(前提是项目中包含这些包)。

UiPath.IntelligentOCR.ActivitiesUiPath.DocumentUnderstanding.Activities不应在同一项目中一起使用。 UiPath.IntelligentOCR.Activities包应用于 Windows(或旧版)工作流,而UiPath.DocumentUnderstanding.Activities包应用于跨平台工作流。

支持的格式

  • IntelligentOCR 活动包可以支持以下任何文件类型: .png、.gif、.jpe、.jpg、.jpeg、.tiff、.tif、.bmp、 和 .pdf

C# 项目风格支持

  • 从版本 4.10.0 开始, 此活动包已经过验证,可在 C# 项目中使用。

Docotic.Pdf 库

  • 如果在运行时遇到提及 Docotic.Pdf 库的错误,则应将 UiPath.IntelligentOCR.Activities 包升级到版本 3.1.0 或更高版本。
  • UiPath.IntelligentOCR.Activities 版本 3.0 及更高版本与低于 3.0UiPath.PDF.Activities 版本不兼容, UiPath.PDF.Activities 版本 3.0 或更高版本与低于 3.0UiPath.IntelligentOCR.Activities版本不兼容。如果在同一个项目中使用这两个包,请使用兼容版本。
  • 如果您在项目中使用以下任一包: UiPath.DocumentUnderstanding.ML.Activities 版本 1.7.0UiPath.IntelligentOCR.Activities 版本 4.13.0UiPath.PDF.Activities 版本 3.4.0, 那么您需要将其余包更新为上述版本。

CefSharp 依赖项

  • 如果在同一工作流中使用,则 UiPath.IntelligentOCR.Activities 版本 4.10.2 仅与 UiPath.Form.Activities 版本 1.1.8 到版本 1.1.10(含)兼容。
  • 如果在同一工作流中使用,则 UiPath.IntelligentOCR.Activities 版本 4.13.0 仅与 UiPath.Form.Activities 版本 1.1.11 或更高版本兼容。
  • UiPath.IntelligentOCR.Activities 从低于 4.10.2 的版本更新到高于或等于 4.10.2的版本时,可能会引发错误。 这是一个计划修复的已知问题,可以忽略。

艾比活动

  • UiPath.UIAutomation.Activities 版本 4.0.0 开始,所有与 Abbyy 相关的活动都已移至单独的包中。如果要将其活动用于 OCR、Cloud OCR、分类和数据提取,请安装 UiPath.Abbyy.Activities 包。

其他说明

  • Studio v20.10 暂时不支持验证站点和分类站点。 请使用任何其他 Studio 版本运行“验证站点”和“分类站点”向导。

功能

UiPath.IntelligentOCR.Activities 包允许您:

将文档数字化

您可以使用“ 数字化文档” 活动来实现此目的。 这将 仅在必要时使用您选择的 OCR 引擎从任何 PDF 或图像中检索文本。

  • 在逐个处理文档时,它们会经历数字化流程。 非数字(扫描)文档的区别在于,您需要应用所选的 OCR 引擎。 此步骤的输出是文档对象模型和包含所有文档文本的字符串变量,并将传递到后续步骤。

分类文档

您可以使用“ 对 文档进行分类” 活动来实现此目的。 这允许使用任何分类算法来识别文件的文档类型。

  • 数字化后,文档将进行分类。 如果您在同一个项目中使用多种文档类型,则要正确提取数据,您需要知道正在使用的文档类型。 重要的是,您可以在同一作用域中使用多个分类器,可以配置分类器,并稍后在框架中训练它们。 分类结果有助于在提取中应用正确的策略。
  • 基于关键字的分类 器”活动是此类分类器中的第一个,用于对已命名的文档进行分类。
  • 智能关键字分类 器”活动不仅可以对包含多种文档类型的文件进行分类,还可以“拆分”文件。
  • 我们的产品中还包含嵌入 Abbyy FlexiCapture 技术的 FlexiCapture 分类器。 此活动是 UiPath.Abbyy.Activities 包的一部分。

验证自动分类

您可以使用“ 呈现 Attended 的 站点分类 ”活动来实现此目的,该活动会提供一个特定于文档处理的用户界面,用于验证和更正自动分类输出。

  • 特别是对于涉及文件拆分的用例,强烈建议使用人工分类验证步骤,以确保用于数据提取的下游处理正常工作。
  • Attended 活动的替代方案是使用长时间运行的工作流,该工作流旨在以最佳方式实现人机协作。 “ 创建文档分类 Actions ” 和“ 等待文档分类 Actions 然后继续” 活动用于实现此场景。

训练分类器

您可以使用“ 训练分类器作用域 ”活动来实现此目的。 这使反馈循环能够关闭任何能够学习的分类算法。 将分类器训练器拖放到此“作用域”活动中,并使用“ 配置分类 器”向导启用它们,以确保分类器使用人工通过 分类站点验证站点 验证的信息来提高自身性能。

  • 分类与所使用的分类器一样有效。 如果文档未正确分类,则表示活动分类器未知该文档。 该框架提供了训练分类器的机会,以提高对文档类的识别。
  • 基于关键字的分类器训练 器” 是与“ 基于关键字的分类器” 配对的训练器活动。
  • 智能关键字分类器训练 器为 智能关键字分类器启用反馈循环。

从文档中提取数据

您可以使用“ 数据提取作用域 ”活动来实现此目的。 这允许使用任何数据提取算法来识别分类文档中的不同字段。

  • 提取只是从给定的文档类型中获取您感兴趣的数据。 例如,如果要使用字符串操作来从 5 页文档中提取特定数据,则非常麻烦。 在此框架中,您可以在同一数据提取作用域内针对不同的文档结构使用不同的提取程序。 提取结果将进一步传递以进行验证。
  • 基于正则表达式的提取程序 是一个基本的数据提取程序,它应用正则表达式匹配来识别特定字段的最佳候选者。
  • 表单提取 程序使用预定义的模板来处理结构化的固定表单文档。
  • 智能表单提取 程序是 表单 提取程序的扩展,具有与处理文档上的手写表单和签名相关的扩展功能。
  • 机器学习提取程序利用 AI 和机器学习的功能,通过使用 UiPath 的公共数据提取服务之一或调用可以在AI Center中构建和托管的经过自定义训练的机器学习模型,识别结构化或半结构化文档中的信息。 此活动是UiPath.DocumentUnderstanding.ML.Activities包的一部分。
  • FlexiCapture 提取 程序将 Abbyy FlexiCapture 技术纳入我们的产品中,并且是 UiPath.Abbyy.Activities 包的一部分。

验证自动数据提取结果

您可以使用呈现 Attended 的 验证站点 活动来实现此目的,该活动提供了一个特定于文档处理的用户界面,用于数据验证和更正。

  • 人类用户可以通过 验证站点验证提取的数据。 最佳实践是围绕是否添加人工验证步骤的决策构建逻辑,并根据要实施的特定用例使用规则。 然后可以导出验证结果,并将其用于进一步的自动化活动。
  • 您还可以通过长时间运行的工作流启用人工验证,从而优化人机协作。 创建文档验证 Actions等待文档验证 Actions 然后继续

火车提取器

您可以使用“ 训练提取程序作用域 ”活动来实现此目的。 这使任何能够学习的数据提取算法都可以关闭反馈循环。 将提取程序训练器拖放到此“作用域”活动中,并使用“ 配置提取 程序”向导启用,以确保提取程序使用人工通过“ 验证站点 ”验证的信息来提高自身性能。

  • 与所使用的提取器一样,提取效率很高。 如果未正确提取字段值,则表示活动的提取程序不知道这些字段值。 该框架提供了培训提取程序的机会,以提高对字段值的识别。
  • 机器学习提取程序训练器通过收集重新训练AI Center中托管的机器学习模型所需的数据,关闭了基于 ML 的数据提取的反馈循环。 此活动是机器学习提取程序的配套活动,并且属于UiPath.DocumentUnderstanding.ML.Activities包。

导出提取的信息

您可以使用“ 导出提取结果 ”活动来实现此目的。 这使您可以将提取的数据的复杂结构导出到简单的数据集(数据表集合)。

  • 获得经过验证的信息后,您可以按原样使用它,也可以将其保存为数据表格式,该格式可以很容易地转换为 Excel 文件。

UiPath.IntelligentOCR.Activities 包与基于公共 UiPath.DocumentProcessing.Contracts 包构建的任何自定义分类或数据提取活动兼容。 它提供了充分的灵活性,让您可以构建特定于用例的算法,并将其与任何第三方解决方案集成以进行文档分类和数据提取。

以下版本的包已从官方订阅源中删除。 如果您有任何问题,请联系我们的支持团队。

已删除的版本

推荐版本

4.3.0-预览版 | 4.4.0 预览版

4.5.2

2.1.0 | 2.2.0 | 2.3.0

4.0.1

1.4.0 | 1.5.0 | 1.6.0 | 1.6.1 | 2.0.0 | 2.0.1

2.0.2

1.2.0 | 1.2.1 | 1.3.0

1.3.2

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.