ai-center
latest
false
- 入门指南
- 通知
- 项目
- 数据集
- 数据标签
- ML 包
- 开箱即用包
- 管道
- ML 技能
- ML 日志
- AI Center 中的 Document Understanding™
- AI Center API
- 许可
- AI 解决方案模板
- 如何
- 将自定义命名实体识别与持续学习结合使用
- 基本故障排除指南
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。
新发布内容的本地化可能需要 1-2 周的时间才能完成。
AI Center 用户指南
上次更新日期 2026年5月8日
背景信息
本示例用于按研究论文中提及的类别提取化学物。按照此过程提取化学物并将其分类为 ABBREVIATION、FAMILY、FORMULA、IDENTIFIER、MULTIPLE、SYSTEMATIC、TRIVIAL 和 NO_CLASS。
先决条件
此过程使用“自定义命名实体识别”包。有关此包的工作原理及其用途的更多信息,请查看“自定义命名实体识别”页面。
对于此过程,我们提供了如下示例文件:
- CoNLL 格式的预标记训练数据集。您可以从以下链接下载训练数据集:训练数据集。
- 预标记的测试数据集。您可以从以下链接下载测试数据集:测试数据集。
- 用于提取研究论文中提到的化学物类别的工作流示例。您可以从以下链接下载它:示例工作流。
备注:
确保填写示例文件中的以下变量:
in_emailAdress- Action Center 任务将分配到此电子邮件地址in_MLSkillEndpoint- ML 技能的公共端点in_MLSkillAPIKey- ML 技能的 API 密钥in_labelStudioEndpoint- 可选,用于启用连续标记:提供 Label Studio 项目的 导入 URL
程序
使用以下步骤按研究论文中的类别提取化学物。
- 在UiPath™ AI Center中导入示例数据集。为此,请转到“数据集”菜单,并上传示例中的
train和test文件夹。 - 从“ML 包”>“开箱即用包”>“UiPath 语言分析”中选择所需的自定义命名实体识别包并创建。
- 转到“管道”菜单,然后为上一步中创建的包创建一个新的完整管道运行。指向示例文件中提供的训练数据集和测试数据集。 完成后,管道的结果将显示在“工件”下。您可以下载分类报告以评估测试结果。
- 使用上一步中的管道运行生成的包创建新的 ML 技能并进行部署。
- 部署技能后,即可在提供的UiPath TM Studio工作流中利用该技能。要捕获具有弱预测的数据,请部署 Label Studio 实例,并在工作流的 Label Studio 活动中提供实例 URL 和 API 密钥。
Label Studio 入门
-
在本地计算机或云实例上安装 Label Studio。为此,请按照“Label Studio”页面中的说明进行操作。
-
根据命名实体识别模板创建一个新项目,并定义“标签名称”。
-
确保标签名称没有特殊字符或空格。例如,使用
Set Date代替SetDate。 -
请确保
<Text>标签的值为"$text"。 -
使用“Label Studio API”页面中的 API 上传数据。cURL 请求示例:
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]'curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]' -
标注数据。
-
以 CoNLL 2003 格式导出数据,并将其上传到 AI Center。
-
在提供的示例工作流中提供了 Label Studio 实例 URL 和 API 密钥,以捕获错误的预测和低可信度预测。