- 基本情報
- 通知
- プロジェクト
- データセット
- データのラベル付け
- ML パッケージ
- すぐに使えるパッケージ
- 概要
- English Text Classification (英語テキスト分類)
- French Text Classification (フランス語テキスト分類)
- Japanese Text Classification (日本語テキスト分類)
- Object Detection (オブジェクト検出)
- Text Classification (テキスト分類)
- TPOT AutoML Classification (TPOT AutoML分類)
- TPOT AutoML Regression (TPOT AutoML 回帰)
- TPOT XGBoost Classification (TPOT XGBoost 分類)
- TPOT XGBoost Regression (TPOT XGBoost 回帰)
- AI Computer Vision
- Communications Mining
- UiPath Document Understanding
- パイプライン
- ML スキル
- ML ログ
- AI Center の Document UnderstandingTM
- AI Center API
- ライセンス
- AI ソリューション テンプレート
- 使い方
- 基本的なトラブルシューティング ガイド
AI Center ガイド
バックグラウンド情報
この例は、研究論文で言及されているカテゴリ別に化学物質を抽出するために使用されます。この手順に従って、化学物質を抽出し、ABBREVIATION、FAMILY、FORMULA、IDENTIFIER、MULTIPLE、SYSTEMATIC、TRIVIAL、およびNO_CLASSとして分類します。
前提条件
この手順では、 Custom Named Entity Recognition (カスタム固有表現抽出 ) パッケージを使用します。このパッケージの仕組みと用途について詳しくは、「 Custom Named Entity Recognition (カスタム固有表現抽出 )」をご覧ください。
この手順は、以下のサンプル ファイルを使用して実行します。
- CoNLL 形式の事前にラベル付けされたトレーニング データセット。トレーニング データセットは、 こちらのリンクからダウンロードできます。
- 事前にラベル付けされたテスト データセット。テスト データセットはこちらのリンクからダウンロードできます。
- 研究論文で言及されている化学物質をカテゴリ別に抽出するためのサンプル ワークフロー。サンプル ワークフローはこちらのリンクからダウンロードできます。
注:
サンプル ファイルに以下の変数が入力されていることを確認してください。
in_emailAdress- Action Center タスクが割り当てられるメール アドレスin_MLSkillEndpoint- ML スキルのパブリック エンドポイントin_MLSkillAPIKey- ML スキルの API キーin_labelStudioEndpoint- (任意) 継続的なラベル付けを可能にします。Label Studio プロジェクトのインポート URL を指定します。
手順
次の手順を使用して、研究論文から化学物質をカテゴリ別に抽出します。
- UiPath® AI Center にサンプル データセットをインポートします。そのためには、[ データセット ] メニューに移動し、サンプルから
trainフォルダーとtestフォルダーをアップロードします。 - [ML パッケージ] > [すぐに使えるパッケージ] > [UiPath Language Analysis (UiPath 言語分析)] から目的のカスタム NER パッケージを選択して作成します。
- [パイプライン] メニューに移動して、前の手順で作成したパッケージの新しいフル パイプライン実行を作成します。サンプル ファイルで提供されているトレーニングおよびテスト データセットを指定します。 完了すると、パイプラインの結果が [成果物] に表示されます。分類レポートをダウンロードして、テスト結果を評価できます。
- 前の手順のパイプライン実行で生成されたパッケージを使用して新しい ML スキルを作成し、デプロイします。
- スキルをデプロイしたら、提供される UiPath® Studio のワークフローでスキルを活用します。弱い予測を含むデータのキャプチャを有効化するには、Label Studio インスタンスをデプロイし、ワークフロー内の Label Studio アクティビティでインスタンスの URL と API キーを指定します。
Label Studio の使用を開始する
-
ローカル マシンまたはクラウド インスタンスに Label Studio をインストールします。それには、 Label Studio のページの手順を実行します。
-
Named Entity Recognition (固有表現抽出) テンプレートから新しいプロジェクトを作成して、ラベル名を指定します。
-
ラベル名に 特殊文字やスペースが含まれていないことを確認してください。たとえば、
Set Dateの代わりにSetDateを使用します。 -
<Text>タグの値が"$text"であることを確認します。 -
Label Studio の API ページから API を使用してデータをアップロードします。cURL リクエストの例:
curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]'curl --location --request POST 'https://<label-studio-instance>/api/projects/<id>/import' \)\) --header 'Content-Type: application/json' \)\) --header 'Authorization: Token <Token>' \)\) --data-raw '[ { "data": { "text": "<Text1>" }, }, { "data": { "text": "<Text2>" } } ]' -
データに注釈を付けます。
-
データを CoNLL 2003 形式でエクスポートし、AI Center にアップロードします。
-
不正確で信頼度の低い予測をキャプチャするために、提供されているサンプル ワークフローで Label Studio インスタンスの URL と API キーを入力します。