document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月18日

“智能 OCR”活动

With Intelligent OCR activities you can process documents in a comprehensive manner, allowing you to not only digitize, extract, classify, and validate documents, but also train your extractor and classifiers on your specific data, so they can be faster and more accurate. The steps involved in creating Document UnderstandingTM processes using Intelligent OCR activities are:

  1. 创建分类:定义文档类型,并使用“加载分类”活动将其转换为文档对象模型变量。
  2. 将文档数字化:准备文档,以便机器人可以使用 OCR 引擎处理这些文档,方法是将其文本存储在字符串变量中,并将有关它们的基本信息存储在文档对象模型文件中。
  3. 对文档进行分类:使用特定的分类器准备文档,以便机器人识别要处理的文件类型。
  4. 验证文档的分类:核实并验证文档是否已正确分类。
  5. 训练分类器:验证分类时根据收到的输入配置分类器
  6. 从文档中提取数据:使用各种提取程序从文档中识别并提取特定信息,然后将其发送以进行验证。
  7. 验证提取文档:使用 Action Center 中团队成员的输入核实和验证您处理、分类和提取的文档。
  8. 训练提取程序:验证提取时根据收到的输入配置提取程序。
  9. 消耗导出数据:验证提取的数据后,您可以按原样使用数据,也可以使用“导出提取结果”活动将其导出为数据集变量。

在开始之前

在开始使用 IntelligentOCR.Activities 之前,请检查以下特征:

  • 高可配置性,这也涉及较高的学习曲线。
  • 存在多个对象和活动,旨在满足灵活性。
  • 由于以下复杂性,可重用性降低:
    • 您需要在工作流中进行多种配置。
    • 您需要将显式参数从一个活动重复传递到另一个活动,例如:
      • 分类
      • 文档对象模型
      • 文本
      • 分类结果
      • 提取结果
  • 在开始之前

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。