- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 管道
- Data Manager
- OCR 服务
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 参考
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
机器学习提取程序
机器学习提取程序是一种数据提取工具,使用机器学习模型来识别和报告执行数据提取的目标数据。
此活动是 UiPath Document Understanding 模型的附带内容,可作为在工作流中使用此类模型的方法。
强烈建议对不同文档提供程序的布局有很大差异的结构化或半结构化文档使用 ML 方法。鉴于其机器学习方法,提取程序会使用经过训练的机器学习模型,该模型可学习并随后推断目标字段的值,甚至是根据从未见过的文档和布局推断值。换句话说,如果文档未遵循某一文本或布局模式,对您的用例而言,机器学习提取程序可能是很好的选择。
机器学习模型的使用方式有多种:
- 如果您希望使用针对某些文档类型的通用模型,可使用 UiPath 的其中一个公共 Document Understanding 端点;或
- 从 UiPath Document Understanding 的可用模型开始,使用经过训练的自定义机器学习模型。
您可以训练/重新训练此提取程序。有关详细信息,请参阅“如何训练”部分。
您需要使用
- UiPath 的其中一个公共 Document Understanding 端点执行数据提取,或
- 在 Automation Cloud 的 AI Center 中托管的计算机学习模型,或
- 在内部部署版 AI Center 中托管但通过 Automation Cloud 许可的机器学习模型,您需要使用 Automation Cloud Document Understanding API 密钥。
要使用通过内部部署许可的机器学习提取程序,您需要在 AI Center 内部部署(气密安装)实例中托管 Document Understanding 模型。
如果您正在使用的端点是通过 Automation Cloud 获得许可,则需要提供 Cloud Document Understanding API 密钥。
如果您在使用机器学习提取程序时用的是 UiPath Document Understanding 公共端点或 AI Center 中的公共 ML 技能,则需要使用相应的 URL 配置活动的“端点”参数。
如果您在使用机器学习提取程序时用的是已部署的 ML 技能,则需要使用从 AI Center 中托管的 ML 技能列表中选择的正确参数来配置活动的 ML 技能参数。
如果您尝试同时设置这两个选项,则系统会在“配置向导”或直接在工作流中显示错误:
如需了解有关机器学习提取程序的更多信息,请访问此页面。