- 概述
- 入门指南
- Activities (活动)
- Insights 仪表板
- Document Understanding 流程
- 快速入门教程
- 框架组件
- 模型详细信息
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 流量限制
- OCR 配置
- 管道
- OCR 服务
- 支持的语言
- 深度学习
- 数据与安全性
- 许可和计费逻辑

Document Understanding classic user guide
机器学习提取程序
什么是机器学习提取程序
机器学习提取程序是一种数据提取工具,使用机器学习模型来识别和报告执行数据提取的目标数据。
This activity is the companion of UiPath® Document UnderstandingTM models, as the means to consume such models within your workflows.
The ML approach is strongly recommended for structured or semi-structured documents in which layouts of different document providers vary greatly. Given its machine learning approach, the extractor uses a trained machine learning model, that learns and can then infer values for the targeted fields, even from documents and layouts it has never seem before. In other words, if documents do not follow a text or layout pattern, the Machine Learning Extractor may be a good option for your use case.
机器学习模型的使用方式有多种:
- 如果您希望使用针对某些文档类型的通用模型,可使用 UiPath 的其中一个公共 Document Understanding 端点;或
- 从 UiPath Document Understanding 的可用模型开始,使用经过训练的自定义机器学习模型。
This extractor can be trained / re-trained. Check the Machine Learning Extractor Trainer section for details.
无法处理分辨率低于 50 x 50 像素的图像,因而产生错误。
特殊要求
您需要使用
- UiPath 的其中一个公共 Document Understanding 端点执行数据提取,或
- 在 Automation Cloud 的 AI Center 中托管的计算机学习模型,或
- 在内部部署版 AI Center 中托管但通过 Automation Cloud 许可的机器学习模型,您需要使用 Automation Cloud Document Understanding API 密钥。
要使用通过内部部署许可的机器学习提取程序,您需要在 AI Center 内部部署(气密安装)实例中托管 Document Understanding 模型。
如何配置
Activity configuration
如果您正在使用的端点是通过 Automation Cloud 获得许可,则需要提供 Cloud Document Understanding API 密钥。
如果您在使用机器学习提取程序时用的是 UiPath Document Understanding 公共端点或 AI Center 中的公共 ML 技能,则需要使用相应的 URL 配置活动的“端点”参数。
如果您在使用机器学习提取程序时用的是已部署的 ML 技能,则需要使用从 AI Center 中托管的 ML 技能列表中选择的正确参数来配置活动的 ML 技能参数。
如果您尝试同时设置这两个选项,则系统会在“配置向导”或直接在工作流中显示错误。