activities
latest
false
重要 :
请注意此内容已使用机器翻译进行了部分本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 活动

上次更新日期 2024年12月5日

活动

下表显示了 UiPath.IntelligentOCR.Activities 包中的可用活动。

表 1. IntelligentOCR 包中的可用活动
 描述
加载分类将借助“分类管理器”创建的 taxonomy.json 文件转变为可进一步与其他活动配合使用的变量。
将文档数字化将文档数字化,提取其“文档对象模型”(DOM) 和文本,并将提取内容存储在相应类型的变量中。
分类文档作用域为分类器活动提供作用域,并提供执行文档分类所需的所有必要文件。
基于关键词的分类器使用基于关键字的文档分类算法,该算法专为具有可重复标题的文件而设计,并在“对文档范围进行分类”活动中使用时,可根据指定文件中的给定训练集对文档进行分类。
Document Understanding 项目分类器通过在特定 Document Understanding 新式项目和版本中使用经过训练的分类器对来自该版本的文档进行分类。
智能关键词分类器使您可以对文档包进行分类并将其拆分为单独的文档类型。
显示分类站点打开“ 分类站点” ,用户可以在此手动将文件分隔为文档类型,并根据需要验证和更正基于文档类型对文件进行的自动分类和分隔。
创建文档分类操作在 Action Center 中创建类型为“文档分类”的操作。
等待文档分类操作然后继续此活动可用于暂停当前工作流的执行,直到指定的文档分类操作完成为止。
训练分类器范围为要训练的任何分类器活动提供作用域。
基于关键词的分类训练器包含基于关键字的文档分类算法,可针对具有重复标题的文件进行分类。
智能关键词分类训练器训练作为变量添加的学习数据。使用的关键字可以由用户或学习的向量定义。
数据提取作用域为提取程序活动提供作用域,让您能够根据分类中定义的文档类型配置这些活动。
Document Understanding 项目提取程序使用特定的新式项目和版本从文档中提取数据。
基于正则表达式的提取程序让您能够创建和使用自定义的基于正则表达式的提取程序来从文档中提取信息。
表单提取程序表单提取程序最适合通过分析单词在文档中的位置或检测签名来提取、匹配和报告特定信息。
智能表单提取程序考虑到单词的位置,包括手写和签名字段,从文档中分析、提取、匹配和报告所需信息。
呈现验证站点打开验证站点,能够帮助用户检查并更正文档分类和数据自动提取结果。
创建文档验证操作在 Action Center 中创建类型为 Document Validation 的操作。
等待文档验证操作然后继续此活动可用于暂停当前工作流的执行,直到指定的文档验证操作完成为止。
训练提取程序范围为要训练的任何提取程序活动提供作用域。
导出提取结果通过将 ExtractionResult 变量的结果导出至 DataSet 变量(可进行进一步处理),使您能够轻松访问提取结果。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。