活动
最新
False
横幅背景图像
Document Understanding 活动
上次更新日期 2024 年 4 月 10 日

将文档数字化

UiPath.IntelligentOCR.Activities.Digitization.DigitizeDocument

将文档数字化,提取其“文档对象模型”(DOM) 和文本,并将提取内容存储在相应类型的变量中。

注意:您必须为此活动分配 OCR 引擎,方法是将其拖动到活动主体中。仅当传入文档需要 OCR 处理时,才会使用所选 OCR 引擎。可以在此处找到可用的 OCR 引擎。所选 OCR 引擎的输入和输出参数由将文档数字化”活动自动设置。

属性

常见
  • “显示名称”- 活动的显示名称。
输入
  • OCR 应用于 PDF - 确定是否应将 OCR 流程应用于 PDF 文档。 如果设置为 “是”,则 OCR 将应用于文档的所有 PDF 页面。 如果设置为 “否”,则仅提取以数字方式键入的文本。 默认值为“ 自动”,根据输入文档确定文档是否需要应用 OCR 算法。
  • “并行度” - 指定要并行分析的页面数量(如果有)。 -1 值使用“计算机上的核心数 - 1”(意味着它尝试并行处理与核心数 - 1 值一样多的页面),而指定正值则使用该特定数量的逻辑处理器. 默认情况下,此属性设置为 -1
  • 检测复选框 - 将文档数字化时检测文档中的可用复选框。 默认值为 True
  • 文档路径- 要数字化的文档的文件路径。此字段仅支持字符串和字符串变量。

    备注:
    • 如果无法对具有足够数据的文档进行分类,请在“ 数字化文档”活动中将“ 将 OCR 应用于 PDF”属性设置为“是”。
    • 从 PDF 文件中提取文本已升级,从而优化了提取流程,在该流程中,可同时检索原生文本和扫描文本,并且 OCR 仅应用于 PDF 文件中识别的图像。 仅当“应用 OCROnPDF” 选项设置为“自动”时,此改进才可用。
    注意:此属性字段支持的文件类型包括.png.jpe.jpg.jpeg.tiff.tif.pdf
其他
  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
输出
  • DocumentObjectModel - 文件的文档对象模型 (DOM),存储在 Document 变量中。 此字段仅支持 Document 变量。
  • 文档文本- 从指定文档中提取的文本。该变量随后可用于呈现验证站点活动。此字段仅支持字符串变量。

    注意: 从 UiPath.IntelligentOCR.Activities 包 v6.3.0-preview 开始,“数字化文档”活动附带一个默认的预选 OCR 引擎,即 UiPath 文档 OCR 引擎。

这两个输出变量(按依赖项配对)可在整个文档处理框架(分类、数据提取、人工验证等)的文档处理中进一步使用

重要

如果 UiPath.IntelligentOCR.Activities 包已更新到 v5.1.0, 则 ForceApplyOCR 参数已替换为 ApplyOcrOnPDF。 以下是新旧参数之间的兼容性:

  • “强制应用 OCR = True”正在替换为“将 OCR 应用于 PDF = Yes”

  • ForceApplyOCR = False 正在替换为 ApplyOcrOnPDF = Auto • ForceApplyOCR = Empty 正在替换为 ApplyOcrOnPDF = Auto

  • ForceApplyOCR = <用户定义的变量> 正在替换为 ApplyOcrOnPDF = Auto

注意: “数字化文档”活动从 PDF 文件中提取文本,对于复杂的文档,它会应用预处理和后处理算法。 此活动可与其他 Document Understanding 活动一起使用。

文档对象模型

文档对象模型此处记录的专有对象中捕获。

备注:

要成功对图像进行数字化/处理,图像的宽度和高度尺寸应在 50 到 10000 像素之间。系统会拒绝不在此范围内的任何图像,并显示异常消息。如果图像经验证具有前述尺寸且总大小大于 1400 万像素,则该图像将缩小到 1400 万像素,同时保持纵横比(宽度与高度之比)。

已改进扫描文档的 OCR 结果,现在,将倾斜角度保持在 +/- 20 度之间可获得最佳结果。

使用“数字化文档”活动的示例

您可以查看包含多个活动的示例,了解如何使用将文档数字化活动。

您可在此处查看和下载该示例。

  • 属性
  • 重要
  • 文档对象模型
  • 使用“数字化文档”活动的示例

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.