document-understanding
latest
false
适用于新式体验的 Document Understanding 用户指南
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年9月12日

关键概念

熟悉 UiPath™ Document UnderstandingTM 的核心概念。

主动学习

主动学习是我们为 Document UnderstandingTM 创建模型的新式方法。

主动学习提供了一种交互式体验,其中学习算法可以查询用户,以使用所需的输出标记数据。此流程有助于将训练机器学习模型所需的时间和数据减少多达 80%。AI 用于指导流程,其中包括自动标注,这通常是最耗时的任务。该模型还使用内容丰富的数据集提供专家建议,以提高准确性。

图 1. 主动学习的工作原理

使用主动学习,您还可以通过分析功能监控自动化。

文档类型

文档类型是指根据文档的内容、格式、目的或其他区别因素对文档进行的分类。相关示例包括发票、收据、合同、报告、医疗记录、法律文档等。

某些文档类型具有高度结构化的内容,而其他文档类型则主要包含自由文本。基于此,文档分为三种主要格式:
  • 结构化:旨在以特定格式收集信息的文档。例如,调查、税表、护照或许可证都属于结构化文档。
  • 半结构化:不遵循严格格式,也不绑定到指定数据字段的文档。半结构化文档包括发票、收据、水电费账单、银行对账单等。
  • 非结构化:不遵循特定或组织模式的文档。例如,合同、租约或新闻文章都属于非结构化文档。

要了解有关文档类型的更多信息,请查看文档类型部分。

生成式 AI

生成式 AI 是 AI 技术的一种形式,它利用机器学习 (ML) 模型创建和生成新的内容、数据或信息。

大多数生成式 AI 任务的关键是大型语言模型 (LLM)。这些是基于大量文本数据进行训练的 ML 模型,旨在生成拟人化文本。LLM 还可以通过拟人化的方式完成句子或段落来理解和回应提示。

Document UnderstandingTM 的上下文中,生成式 AI 有助于:
  • 信息提取:生成式 AI 模型可用于从非结构化或半结构化文档中提取特定信息。例如,它可以浏览发票以检索日期、账单金额和公司名称等详细信息。
  • 文档分类:ML 模型用于根据文档内容对文档进行自动分类。这些算法会“读取”文档,了解其上下文,并可将其归入预定义的类别。
  • 数据验证:每当置信度分数过低时,生成式 AI 都可以检查 ML 模型的输出。如果两个 ML 模型(生成式模型和专用化模型)具有相同的输出,则人工可以跳过验证该文档的步骤。这可以通过在第二个生成模型的帮助下检查输出来减少用于验证文档的时间,并提高模型的性能。

ML 模型

ML 模型就像虚拟助理,经过训练,可以从数据中学习并做出预测或决策。这些模型本质上是学习根据历史数据识别模式的算法。它们接触的数据越多,随着时间推移,就越能改进自己的预测或决策。

您可以在 Document UnderstandingTM 中找到几个开箱即用的 ML 模型。这些模型可帮助您从半结构化或非结构化文档中分类和提取任何经常出现的数据点,而无需任何设置。

请查看“开箱即用模型”页面,以获取预训练模型及其字段的完整列表。

只要 OCR 能够以高置信度识别文档和文本,就可以在大多数语言上训练 ML 模型。

光学字符识别

光学字符识别 (OCR) 是一种特殊技术,用于将不同类型的文档(例如扫描的纸质文档、PDF 文件或数码相机拍摄的图像)转换为可编辑和可搜索的数据。

OCR 引擎的准确性通常取决于原始文档的质量。采用可读字体的清晰且格式良好的文本通常会产生最佳输出。

有关 UiPath™ 提供的 OCR 引擎选项支持的语言的更多信息,请查看“OCR 支持的语言”页面。

  • 主动学习
  • 文档类型
  • 生成式 AI
  • ML 模型
  • 光学字符识别

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。