activities
latest
false
- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding 数字化器
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
新发布内容的本地化可能需要 1-2 周的时间才能完成。
Document Understanding 活动
上次更新日期 2024年12月5日
验证站点
要从相同类型的文档中自动提取和验证数据时,可以使用这些活动。发票或采购订单非常适合此类任务。
以下工作流重点关注对发票使用“数字化文档”活动,然后使用“呈现验证站点”活动来验证信息。 为此工作流选择的 OCR 引擎是“UiPath™文档 OCR ”,但您可以将其替换为我们的任何其他 OCR 引擎。 系统将使用根据所选发票单据创建的简单分类。 请访问分类概述,查看如何创建分类。
- 打开 Studio,并新建一个默认命名为“主要”的“流程”。
- 将序列容器拖动至工作流设计器。
- 选择“序列”容器并创建以下变量:
- 变量名称:
taxonomy
; - 变量类型:文档分类;
- 默认值:无。
- 变量名称:
- 在“序列”容器中添加“加载分类”活动。
在“分类”字段中添加“
taxonomy
”变量。 - 在“加载分类”活动之后的“序列”容器内添加“遍历循环”活动。
- 在遍历循环字段中添加表达式
doc
。 - 在输入字段中添加表达式
directory.GetFiles("TestData\InputDocs\")
。 - 在“ 属性 ”面板中,从“ 类型参数” 下拉列表中选择“字符串”选项。
- 在遍历循环字段中添加表达式
- 选择“遍历循环”活动的“正文”容器,并创建下表中显示的变量:
表 1. 要创建的变量 变量类型
默认值
docName
泛型值
不适用 dom
文档
不适用 text
字符串
不适用 extractionResults
提取结果
不适用 validatedResults
提取结果
不适用 - 在“ 正文 ” 容器中添加“分配”活动。
- 在“收件人”字段中添加“
docName
”变量。 - 在“值”字段中添加表达式“
System.IO.Path.GetFileNameWithoutExtension(doc)
”。
- 在“收件人”字段中添加“
- 在“分配”活动下添加“写入行”活动。
在“文本”字段中添加表达式
"Digitizing "+docName
。 - 在“分配”活动之后添加“写入行”活动。
- 将 DocumentPath 设置为
doc
。 - 在“文档文本”字段中添加“
text
”变量。 - 在“ 文档对象 模型”字段中添加变量
dom
。
- 将 DocumentPath 设置为
- 将 OCR 引擎拖动到“ 数字化文档” 活动中。 本示例使用UiPath 文档 OCR 。
- 在“ 数字化文档” 活动之后添加“ 写入行 ”活动。
在“文本”字段中添加表达式
docName+" was digitized."
。 - 在“写入行”活动之后添加“写入行”活动。
在“文本”字段中添加表达式
"Opening the Validation Station"
。 - 在“写入行”活动之后添加“Try Catch”活动。
- 在“ 尝试 ”部分中添加“序列”容器。
- 在“ 序列 ” 容器中添加“演示验证站点”活动。
- 在“ 文档路径” 字段中添加
doc
作为值。 - 在“文档文本”字段中添加“
text
”变量。 - 在“ 文档对象 模型”字段中添加变量
dom
。 - 在“分类”字段中添加“
taxonomy
”变量。 - 在“ 自动提取 结果” 字段中添加变量
extractedResults
。 - 在“ 已验证 的提取结果”字段中添加变量
validatedResults
。
- 在“ 文档路径” 字段中添加
- 在“显示验证站点”活动后添加“写入文本文件”活动。
- 运行流程。 机器人自动提取数据,对文档进行分类,提取特定字段,准备数据以进行验证,并显示提取的文档。
请访问以下链接,下载示例的
ZIP
存档:示例。