- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
验证站点
This page shows you how to create a workflow that includes activities such as Digitize Document, Data Extraction Scope, and Present Validation Station.
要从相同类型的文档中自动提取和验证数据时,可以使用这些活动。发票或采购订单非常适合此类任务。
The following workflow focuses on using the Digitize Document activity on an invoice, followed by validating the information with the use of the Present Validation Station activity. The OCR engine chosen for this workflow is UiPath® Document OCR, but you can replace it with any other of our OCR engines. A simple taxonomy is used, created based on the chosen invoice document. Visit Taxonomy overview to check how to create your taxonomy.
创建工作流
-
打开 Studio,并新建一个默认命名为“主要”的“流程”。
-
Drag a Sequence container into the Workflow Designer.
-
选择“序列”容器并创建以下变量:
- Variable Name:
taxonomy; - Variable Type: DocumentTaxonomy;
- Default Value: None.
- Variable Name:
-
Add a Load Taxonomy activity inside the Sequence container.
Add the variable
taxonomyin the Taxonomy field. -
Add a For Each activity after the Load Taxonomy activity, and inside the Sequence container.
- Add the expression
docin the ForEach field. - Add the expression
directory.GetFiles("TestData\InputDocs\")in the In field. - In the Properties panel, select the option String from the TypeArgument dropdown list.
- Add the expression
-
Select the Body container of the For Each activity and create the variables showed in the following table:
Table 1. The variables to be created
变量类型 默认值 docName泛型值 不适用 dom文档 不适用 text字符串 不适用 extractionResults提取结果 不适用 validatedResults提取结果 不适用 -
Add an Assign activity inside the Body container.
- 在“收件人”字段中添加“
docName”变量。 - 在“值”字段添加表达式
System.IO.Path.GetFileNameWithoutExtension(doc)。
- 在“收件人”字段中添加“
-
Add a Write Line activity after the Assign activity.
在“文本”字段中添加表达式
"Digitizing "+docName。 -
Add a Digitize Document activity after the Write Line activity.
- Set the DocumentPath as
doc. - Add the variable
textin the DocumentText field. - Add the variable
domin the DocumentObjectModel field.
- Set the DocumentPath as
-
Drag an OCR engine into the Digitize Document activity. UiPath Document OCR is used for this example.
-
Add a Write Line activity after the Digitize Document activity.
在“文本”字段中添加表达式
docName+" was digitized."。 -
Add a Write Line activity after the Write Line activity.
在“文本”字段中添加表达式
"Opening the Validation Station"。 -
Add a Try Catch activity after the Write Line activity.
-
Add a Sequence container in the Try section.
-
Add a Present Validation Station activity inside the Sequence container.
- Add
docas value in the DocumentPath field. - Add the variable
textin the DocumentText field. - Add the variable
domin the DocumentObjectMOdel field. - Add the variable
taxonomyin the Taxonomy field. - Add the variable
extractedResultsin the AutomaticExtractionResults field. - Add the variable
validatedResultsin the ValidatedExtractionResults field.
- Add
-
Add a Write Text File activity after the Present Validation Station activity.
-
运行流程。 机器人自动提取数据,对文档进行分类,提取特定字段,准备数据以进行验证,并显示提取的文档。
Visit the following link to download a ZIP archive of the example: Example.
使用“验证站点”
Running the workflow opens the Validation Station wizard. Here you can verify the extracted information or extract it yourself by using the Tokens or Custom Area options. If you set a field in the taxonomy as multi-value, then multiple values can be extracted for that field. This can be useful for documents with multiple addresses, different currencies, etc.