- 概述
- 文档处理合同
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding 数字化器
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding 流程:Studio 模板
- Document Understanding 活动
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
验证站点
当需要从相同类型的文档中自动提取和验证数据时,您可以使用这些活动。 发票或采购订单非常适合此类任务。
以下工作流重点介绍对发票使用“ 数字化文档” 活动,然后使用“ 当前验证站点 ”活动验证信息。 为此工作流选择的 OCR 引擎是 UiPath Document OCR ,但您也可以将其替换为我们的任何其他 OCR 引擎。
分类也很简单,是根据所使用的发票单据创建的。有关如何创建分类的更多详细信息,请参见此处。
创建工作流
此自动化流程的构建方法如下:
- 打开 Studio,并新建一个默认命名为“主要”的“流程”。
- 将序列容器拖动至工作流设计器。
-
选择“序列”容器并创建以下变量:
变量名称
变量类型
默认值
taxonomy
DocumentTaxonomy
-
将“ 加载分类 ”活动拖动到“ 序列 ”容器内。
- 在“分类”字段中添加“
taxonomy
”变量。
- 在“分类”字段中添加“
-
将遍历循环活动拖动至加载分类活动下方。
- 在遍历循环字段中添加表达式
doc
。 - 在输入字段中添加表达式
directory.GetFiles("TestData\InputDocs\")
。 - 在“ 属性 ”面板中,从“ 类型参数” 下拉列表中选择“字符串”选项。
- 在遍历循环字段中添加表达式
-
选择遍历行活动的正文容器并创建以下变量:
变量名称
变量类型
默认值
docName
泛型值
dom
文档
text
字符串
extractionResults
提取结果
validatedResults
提取结果
-
在“ 正文 ” 容器中添加“分配”活动。
- 在“收件人”字段中添加“
docName
”变量。 - 在“值”字段中添加表达式“
System.IO.Path.GetFileNameWithoutExtension(doc)
”。
- 在“收件人”字段中添加“
-
在赋值活动下添加写入行活动。
- 在“文本”字段中添加表达式
"Digitizing "+docName
。
- 在“文本”字段中添加表达式
-
在“ 写入行 ”活动下方添加“数字化文档”活动。
- 将 DocumentPath 设置为
doc
。 - 在“文档文本”字段中添加“
text
”变量。 - 在“ 文档对象 模型”字段中添加变量
dom
。
- 将 DocumentPath 设置为
- 将 OCR 引擎拖动到“ 数字化文档” 活动中。 本示例使用UiPath 文档 OCR 。
-
在“ 数字化文档” 活动下方添加“写入行”活动。
- 在“文本”字段中添加表达式
docName+" was digitized."
。
- 在“文本”字段中添加表达式
-
在写入行活动下添加写入行活动。
- 在“文本”字段中添加表达式
"Opening the Validation Station"
。
- 在“文本”字段中添加表达式
- 在写入行活动下添加Try Catch活动。
- 在“ 尝试 ”部分中添加“序列”容器。
-
在“ 序列 ” 容器中添加“演示验证站点”活动。
- 在“ 文档路径” 字段中添加
doc
作为值。 - 在“文档文本”字段中添加“
text
”变量。 - 在“ 文档对象 模型”字段中添加变量
dom
。 - 在“分类”字段中添加“
taxonomy
”变量。 - 在“ 自动提取 结果” 字段中添加变量
extractedResults
。 - 在“ 已验证 的提取结果”字段中添加变量
validatedResults
。
- 在“ 文档路径” 字段中添加
- 在“ 当前验证站点 ”活动下方添加“写入文本文件”活动。
- 运行流程。 机器人自动提取数据,对文档进行分类,提取特定字段,准备数据以进行验证,并显示提取的文档。
从此处下载示例。
使用“验证站点”
运行工作流将打开“ 验证站点 ”向导。 您可以在此处验证提取的信息,也可以使用“ 令牌 ”或 “自定义区域 ”选项自行提取信息。 如果您将分类中的字段设置为多值,则可以为该字段提取多个值。 这对于具有多个地址、不同货币等的文档非常有用。
我们来看看如何在“ 令牌 ” 或 “自定义区域 ” 选项之间切换。
以下示例说明了如何向字段添加额外值。
有关如何使用和自定义验证站点的更多信息,请参见 此处。