activities
latest
false
- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- 内容验证数据类
- 字段值类的评估业务规则
- 已评估业务规则详细信息类
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- 字段值类
- 字段值结果类
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- 规则类
- 规则结果类
- 规则集类
- 规则集结果类
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- 字段值详情类
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding 数字化器
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 活动
上次更新日期 2025年3月3日
提取文档数据
“提取文档数据”活动从输入文件或文档数据对象中提取数据,作为“分类文档”活动的输出。“提取文档数据”活动还会将提取的结果存储到“文档数据”对象中。您可以使用“提取文档数据”活动的结果对提取的结果执行操作,或在 Action Center 中发送结果以进行验证。
先决条件
“提取文档数据”活动需要“文档数据”或“文件”类型的输入对象。使用此活动的一个可能用例是在该活动之前使用“分类文档”活动,后者会生成类型为文档数据的对象。
输入选项
“提取文档数据”活动接收以下选项之一作为输入:
- 文档数据 - 来自“分类文档”活动
- 文件 - 来自“获取文件/文件夹”或“获取最新的电子邮件”活动
生成式模型支持的语言
生成式模型支持的语言与所使用的 OCR 引擎相同,这取决于项目。对于生成式预定义项目和预定义项目,使用的 OCR 引擎为 UiPath Document OCR。有关更多信息,请访问“OCR 支持的语言”页面。
活动使用的模型
“提取文档数据”活动使用以下内容:- 基于 DocPath 的预训练专用模型,开箱即用。
- 部署在 Document Understanding 新式和传统项目中的自定义预训练模型。
- 生成式提取模型。
开始阅读“提取文档数据”活动的可用配置。配置信息分为两个单独的页面,每个页面都对应于各自的体验:
- 提取文档数据 – 描述作为 GA 版发布的最新活动包版本的配置信息。
- 提取文档数据 - 预览版 – 描述作为预览版发布的最新活动包版本的配置信息。