document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月12日

“智能 OCR”活动

借助“智能 OCR”活动,您可以全面处理文档,不仅可以对文档进行数字化、提取、分类和验证,还可以针对特定数据训练提取程序和分类器,提升提取速度与准确性。 使用智能 OCR 活动创建Document Understanding TM流程涉及的步骤如下:

  1. 创建分类:定义文档类型,并使用“加载分类”活动将其转换为文档对象模型变量。
  2. 将文档数字化:准备文档,以便机器人可以使用 OCR 引擎处理这些文档,方法是将其文本存储在字符串变量中,并将有关它们的基本信息存储在文档对象模型文件中。
  3. 对文档进行分类:使用特定的分类器准备文档,以便机器人识别要处理的文件类型。
  4. 验证文档的分类:核实并验证文档是否已正确分类。
  5. 训练分类器:验证分类时根据收到的输入配置分类器
  6. 从文档中提取数据:使用各种提取程序从文档中识别并提取特定信息,然后将其发送以进行验证。
  7. 验证提取文档:使用 Action Center 中团队成员的输入核实和验证您处理、分类和提取的文档。
  8. 训练提取程序:验证提取时根据收到的输入配置提取程序。
  9. 消耗导出数据:验证提取的数据后,您可以按原样使用数据,也可以使用“导出提取结果”活动将其导出为数据集变量。

在开始之前

在开始使用 IntelligentOCR.Activities 之前,请检查以下特征:

  • 高可配置性,这也涉及较高的学习曲线。
  • 存在多个对象和活动,旨在满足灵活性。
  • 由于以下复杂性,可重用性降低:
    • 您需要在工作流中进行多种配置。
    • 您需要将显式参数从一个活动重复传递到另一个活动,例如:
      • 分类
      • 文档对象模型
      • 文本
      • 分类结果
      • 提取结果
  • 在开始之前

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。