Document Understanding
最新
False
横幅背景图像
适用于新式体验的 Document Understanding 用户指南
上次更新日期 2024年5月16日

基本功能

要自动执行文档处理,需要四项基本功能:数字化、分类和拆分、提取以及验证。

图 1. 基本功能 docs image

数字化

数字化将物理文档转换为机器可读文本,然后可以对文本进行数字化处理。尽管光学字符识别 (OCR) 是数字化的重要组成部分,但数字化流程更加复杂,涉及各个步骤,包括 OCR。

例如,在处理 PDF 文档时,数字化算法可以区分扫描 PDF 和原生 PDF,或者包含扫描图像和原生文本的混合 PDF。大多数文本可以直接从原生 PDF 文档中提取,但在某些情况下,可能需要使用 OCR 读取一些徽标。数字化流程可以处理所有这些情况,以确保文本检测具有最高的准确性,同时快速高效地运行。

分类

In most use cases, documents need to be sorted into logical categories so different processing methods can be applied to them.

分类的目的是扫描文档并确定其所属的文档类型。了解文档的类型非常重要,因为不同的文档类型需要不同的处理技术。例如,发票需要由发票提取模型处理,以确保提取所有相关字段。

Figure 2. Document classifier docs image

提取

数据提取是指从文档中仅选择和检索相关信息的过程。 使用字符串操作从长文档中提取特定数据可能具有挑战性。 但是, Document Understanding TM为不同的文档类型和格式提供了各种提取方法。 例如,我们只想从发票中提取“供应商名称”、“账单名称”、“到期日期”和“总计”字段。

Figure 3. Data extraction docs image

验证

在分类和提取中,软件机器人使用置信度概念,该概念用于衡量良好执行特定任务的确定性级别。此任务可能是识别文档类型、识别字段或读取其中的数据。在这些情况下,Document Understanding 框架允许您让人类用户来审核和验证机器人的输出。在最佳情况下,系统会使用人工输入,通过机器学习来训练机器人的准确性。

  • 数字化
  • 分类
  • 提取
  • 验证

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.