activities
latest
false
- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding 数字化器
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
Document Understanding 活动
Last updated 2024年10月29日
手动验证数字化文档
下面的示例说明了如何从图像中手动提取数据并在单独的文件中显示输出。 它显示了诸如“ 数字化文档” 或“ 显示 验证站点”之类的活动。 您可以在 UiPath.IntelligentOCR.Activities 包中找到这些活动。
注意: 此工作流使用旧版本的 UiPath.IntelligentOCR.Activities 包。
Steps:
- 打开 Studio,并新建一个默认命名为“主要”的“流程”。
注意: 确保在项目文件夹中添加所有需要的文件(
.json
文件和所有图像)。 - 在“工作流设计器”中添加一个“序列”容器并创建下表中显示的变量:
表 1. 要创建的变量 变量名称
变量类型
默认值
Text
字符串
DOM
UiPath.DocumentProcessing.Contracts.Dom.Document
Data
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
DocumentTaxonomy
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
TaxonomyJSON
字符串
HumanValidated
UiPath.DocumentProcessing.Contracts.Results.ExtractionResult
- 在序列中添加“读取文本文件”活动。
- 在“属性”面板中,添加文件名,在本示例中,该文件为“
"taxonomy.json"
”。 - 在“内容”字段中添加“
TaxonomyJSON
”变量。
- 在“属性”面板中,添加文件名,在本示例中,该文件为“
- 将“分配”活动拖动至“读取文本文件”活动后面。
- 在“ 目标” 字段中添加变量
Data
,在“ 值 ” 字段中添加表达式DocumentTaxonomy.Deserialize(TaxonomyJSON)
。 此活动构建用于提取的分类。
- 在“ 目标” 字段中添加变量
- 在“分配”活动之后添加“数字化文档”活动。
- 在“属性”面板中,向“并行度”字段添加“
1
”值。 - 在“文档路径”字段中添加表达式
"Input\Invoice01.tif"
。 - 在“ 文档对象 模型”字段中添加变量
DOM
。 - 在“文档文本”字段中添加“
Text
”变量。
- 在“属性”面板中,向“并行度”字段添加“
- 在“数字化文档”活动中添加 Google OCR 引擎。
- 在“属性”面板中,向“图像”字段添加“
Image
”变量。 - 选中“ 提取词” 选项对应的复选框。 此选项提取所有检测到的单词在屏幕上的位置。
- 在“语言”字段中添加表达式“
"eng"
”。 - 在“配置文件”下拉列表中选择“
Legacy
”选项。 - 在“缩放比例”字段中添加值“
2
”。
- 在“属性”面板中,向“图像”字段添加“
- 在“数字化文档”活动之后添加“显示验证站点”活动。
- 在“ 属性 ”面板的“ 文档对象 模型”字段中添加变量
DOM
。 - 在“文档路径”字段中添加表达式
"Input\Invoice01.tif"
。 - 在“文档文本”字段中添加“
Text
”变量。 - 在“分类”字段中添加“
Data
”变量。 - 在“ 已验证 的提取结果”字段中添加变量
HumanValidated
。
- 在“ 属性 ”面板的“ 文档对象 模型”字段中添加变量
- 在“显示验证站点”活动下方添加“遍历循环”活动。
- 在“属性”面板中,从“类型参数”下拉列表中选择
UiPath.DocumentProcessing.Contracts.Results.ResultsDataPoint
选项。 - 在“值”字段中添加表达式“
HumanValidated.ResultsDocument.Fields
”。
- 在“属性”面板中,从“类型参数”下拉列表中选择
- 在“遍历循环”活动的 正文 中添加“日志消息 ” 活动。
- 在“级别”下拉列表中选择“
Info
”选项。 - 在“行”字段中添加表达式“
item.FieldName
”。
- 在“级别”下拉列表中选择“
- 将“日志消息”活动拖动到“调用代码”活动下方。
- 在“级别”下拉列表中选择“
Info
”选项。 - 在“行”字段中添加表达式“
item.Values(0).Value.ToString
”。
- 在“级别”下拉列表中选择“
- 在“日志消息”活动下添加“写入行”活动。
- 在文本字段中添加
""
值。
- 在文本字段中添加
- 运行流程。 机器人使用智能 OCR 活动手动处理数据并显示结果。
请访问以下链接,将该示例下载为
ZIP
文件:示例。