AI Center
最新
False
横幅背景图像
AI Center
上次更新日期 2024年4月18日

将自定义命名实体识别与持续学习结合使用

背景信息

本示例用于按研究论文中提及的类别提取化学物。按照以下过程提取化学物,并将其分类为 ABBREVIATION、FAMILY、FORMULA、IDENTIFIER、MULTIPLE、SYSTEMATIC、TRIVIAL 和 NO_CLASS。

先决条件

此过程使用“自定义命名实体识别”包。有关此包的工作原理及其用途的更多信息,请参见自定义命名实体识别

对于此过程,我们提供了如下示例文件:

  • CoNLL 格式的预标记训练数据集。可以从此处下载它。
  • 预标记的测试数据集。可以从此处下载它。
  • 用于提取研究论文中提到的化学物类别的工作流示例。可以从此处下载它。
    注意:确保填写示例文件中的以下变量:
    • in_emailAdress - Action Center 任务将分配到此电子邮件地址
    • in_MLSkillEndpoint - ML 技能的公共端点
    • in_MLSkillAPIKey - ML 技能的 API 密钥
    • in_labelStudioEndpoint - 可选,用于启用连续标记:提供 Label Studio 项目的 导入 URL

程序

按照以下步骤,按研究论文中的类别提取化学物。
  1. UiPath AI Center™ 中导入示例数据集。为此,请转到“数据集”菜单,并上传示例中的 traintest 文件夹。
  2. “ML 包”>“开箱即用包”>“UiPath 语言分析”中选择所需的自定义命名实体识别包并创建。
  3. 转到“管道”菜单,然后为上一步中创建的包创建一个新的完整管道运行。指向示例文件中提供的训练数据集和测试数据集。

    完成后,管道的结果将显示在“工件”下。您可以下载分类报告以评估测试结果。

  4. 使用上一步中的管道运行生成的包创建新的 ML 技能并进行部署。
  5. 部署技能后,即可在提供的 UiPath Studio 工作流中利用该技能。 要捕获具有弱预测的数据,请部署 Label Studio 实例,并在工作流的 Label Studio 活动中提供实例 URL 和 API 密钥。

Label Studio 入门

要开始使用 Label Studio 并将数据导出至 AI Center,请按照以下说明操作。

  1. 在本地计算机或云实例上安装 Label Studio。 为此,请按照此处的说明进行操作。
  2. 根据命名实体识别模板创建一个新项目,并定义“标签名称”


  3. 确保标签名称没有特殊字符或空格。例如,使用 SetDate 代替 Set Date
  4. 请确保 <Text> 标签的值为 "$text"


  5. 使用此处的 API 上传数据。

    cURL 请求示例:

    curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\)
    --header 'Content-Type: application/json' \)\)
    --header 'Authorization: Token <Token>' \)\)
    --data-raw '[
        {
          "data": {
            "text": "<Text1>"
          },
        },
        {
          "data": {
            "text": "<Text2>"
           }
        }
    ]'curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\)
    --header 'Content-Type: application/json' \)\)
    --header 'Authorization: Token <Token>' \)\)
    --data-raw '[
        {
          "data": {
            "text": "<Text1>"
          },
        },
        {
          "data": {
            "text": "<Text2>"
           }
        }
    ]'
  6. 标注数据。
  7. 以 CoNLL 2003 格式导出数据,并将其上传到 AI Center。
  8. 在提供的示例工作流中提供了 Label Studio 实例 URL 和 API 密钥,以捕获错误的预测和低可信度预测。
  • 背景信息
  • 先决条件
  • 程序
  • Label Studio 入门

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.