- リリース ノート
- 基本情報
- 通知
- プロジェクト
- データセット
- データのラベル付け
- ML パッケージ
- すぐに使えるパッケージ
- 概要
- English Text Classification (英語テキスト分類)
- French Text Classification (フランス語テキスト分類)
- Japanese Text Classification (日本語テキスト分類)
- Object Detection (オブジェクト検出)
- Text Classification (テキスト分類)
- TPOT AutoML Classification (TPOT AutoML分類)
- TPOT AutoML Regression (TPOT AutoML 回帰)
- TPOT XGBoost Classification (TPOT XGBoost 分類)
- TPOT XGBoost Regression (TPOT XGBoost 回帰)
- AI Computer Vision
- Communications Mining
- UiPath Document Understanding
- パイプライン
- ML スキル
- ML ログ
- AI Center の Document UnderstandingTM
- AI Center API
- ライセンス
- AI ソリューション テンプレート
- 使い方
- 基本的なトラブルシューティング ガイド
概要
UiPath AI Center にはUiPath®、すぐに使えるマシン ラーニング機能が多数用意されています。たとえば、 Document UnderstandingTM が利用できます。 また、AI Center には、UiPath が構築したモデルやオープンソース モデル (サービング専用で再トレーニング可能) が継続的に追加されています。
class
、break
、from
、finally
、global
、None
などの Python の予約語を含めることはできません。必ず別の名前を選択してください。なお、パッケージ名は class <pkg-name>
および import <pck-name>
で使用されるため、前述の予約語は一例であり他の予約語も存在します。
現在、プラットフォームでは以下のパッケージが利用可能です。
モデル |
カテゴリ (Category) |
入力 |
利用可能状況 |
---|---|---|---|
Image Classification (画像分類) | UiPath Image Analysis (UiPath 画像分析) | カスタム トレーニング | プレビュー |
Signature Comparison (署名の比較) | UiPath Image Analysis (UiPath 画像分析) | 事前トレーニング済み | 一般提供 (GA) |
Custom Named Entity Recognition (カスタム固有表現抽出) | UiPath Language Analysis (UiPath 言語分析) | カスタム トレーニング | 一般提供 (GA) |
Light Text Classification (ライト テキスト分類) | UiPath Language Analysis (UiPath 言語分析) | カスタム トレーニング | 一般提供 (GA) |
Multilingual Text Classification (多言語テキスト分類) | UiPath Language Analysis (UiPath 言語分析) | カスタム トレーニング | 一般提供 (GA) |
Semantic similarity (意味的類似性) | UiPath Language Analysis (UiPath 言語分析) | 事前トレーニング済み | プレビュー |
Multilabel Text Classification (マルチラベル テキスト分類) | UiPath Language Analysis (UiPath 言語分析) | カスタム トレーニング | プレビュー |
TM Analyzer Model (TM 分析モデル) | UiPath Task Mining | カスタム トレーニング | 一般提供 (GA) |
Image Moderation (画像のモデレーション) | Open-Source Packages - Image Analysis | 事前トレーニング済み | N/A |
Object Detection (オブジェクト検出) | Open-Source Packages - Image Analysis | 事前トレーニング済みおよびカスタム トレーニング | N/A |
English Text Classification (英語テキスト分類) | Open-Source Packages - Language Analysis | カスタム トレーニング | N/A |
French Text Classification (フランス語テキスト分類) | Open-Source Packages - Language Analysis | カスタム トレーニング | N/A |
Japanese Text Classification (日本語テキスト分類) | Open-Source Packages - Language Analysis | カスタム トレーニング | N/A |
Language Detection (言語検出) | Open-Source Packages - Language Analysis | 事前トレーニング済み | N/A |
Named Entity Recognition (固有表現抽出) | Open-Source Packages - Language Analysis | 事前トレーニング済み | N/A |
Sentiment Analysis (感情分析) | Open-Source Packages - Language Analysis | 事前トレーニング済み | N/A |
Text Classification (テキスト分類) | Open-Source Packages - Language Analysis | カスタム トレーニング | N/A |
Question Answering (質問回答) | Open-Source Packages - Language Comprehension | 事前トレーニング済み | N/A |
Semantic similarity (意味的類似性) | Open-Source Packages - Language Comprehension | 事前トレーニング済み | N/A |
Text Summarization (テキストの要約) | Open-Source Packages - Language Comprehension | 事前トレーニング済み | N/A |
English To French Translation (英語からフランス語への翻訳) | Open-Source Packages - Language Translation | 事前トレーニング済み | N/A |
English To German Translation (英語からドイツ語への翻訳) | Open-Source Packages - Language Translation | 事前トレーニング済み | N/A |
English To Russian Translation (英語からロシア語への翻訳) | Open-Source Packages - Language Translation | 事前トレーニング済み | N/A |
German To English Translation (ドイツ語から英語への翻訳) | Open-Source Packages - Language Translation | 事前トレーニング済み | N/A |
MultilingualTranslator (多言語翻訳) | Open-Source Packages - Language Translation | 事前トレーニング済み | N/A |
Russian To English Translation (ロシア語から英語への翻訳) | Open-Source Packages - Language Translation | 事前トレーニング済み | N/A |
TPOT Tabular Classification (TPOT 表形式データ分類) | Open-Source Packages - Tabular Data | カスタム トレーニング | N/A |
TPOT Tabular Regression (TPOT 表形式データ回帰) | Open-Source Packages - Tabular Data | カスタム トレーニング | N/A |
XGBoost Tabular Classification (XGBoost 表形式データ分類) | Open-Source Packages - Tabular Data | カスタム トレーニング | N/A |
XGBoost Tabular Regression (XGBoost 表形式データ回帰) | Open-Source Packages - Tabular Data | カスタム トレーニング | N/A |
すぐにデプロイして RPA ワークフローに追加できるパッケージの例を示します。本製品には、ほかにも数多くのパッケージが含まれています。
これは、一般に Inception V3 と呼ばれる深層学習のアーキテクチャに基づく、画像コンテンツのモデレーションのためのモデルです。モデルに画像を与えると、「explicit (露骨)」、「explicit-drawing (露骨な絵)」、「neutral (中立)」、「pornographic (ポルノ)」の4 つの分類のいずれかが、各分類の正規化された信頼度とともに出力されます。
Google によりオープン ソース化されている論文「Rethinking the Inception Architecture for Computer Vision (コンピュータ ビジョンのための開始アーキテクチャの再考)」(Szegedy 他) に基づいています。
このモデルは、英語で書かれたテキストの感情を予測します。Facebook Research によりオープン ソース化されたモデルです。可能な予測は、「非常に否定的」、「否定的」、「中立」、「肯定的」、「非常に肯定的」のいずれかです。モデルは、Amazon の製品レビュー データを使用してトレーニングされたため、異なる分布のデータについては、予想外の予測結果となる可能性があります。一般的なユース ケースは、構造化されていない言語コンテンツ (電子メールなど) をテキストの感情に基づいて転送する処理です。
Joulin 他による研究論文「Bag of Tricks for Efficient Text Classification」(効率的なテキスト分類のための各種手法) に基づいています。
このモデルは、英語で書かれた質問に対する回答を、何かしらの段落の文脈に基づいて予測します。ONNX によりオープン ソース化されたモデルです。一般的なユース ケースは、KYC や、財務レポートの処理です。一般的な質問を標準化された一連の半構造化文書に適用できる場合に適しています。最先端の BERT (Bidirectional Encoder Representations from Transformers) (Transformer による双方向のエンコード表現) に基づいています。このモデルは、広く使用されている注意モデル Transformer を言語モデリングに適用し、入力をエンコードしたうえで、質問回答のタスクに対するトレーニングを行います。
研究論文「BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding」(BERT: 言語理解のための深層双方向 Transformer のプリトレーニング) に基づいています。
このモデルは、テキスト入力の言語を予測します。以下の 176 の言語に対する予測が可能です。
言語 |
---|
af als am an ar arz as ast av az azb ba bar bcl be bg bh bn bo bpy br bs bxr ca cbk ce ceb ckb co cs cv cy da de diq dsb dty dv el eml en eo es et eu fa fi fr frr fy ga gd gl gn gom gu gv he hi hif hr hsb ht hu hy ia id ie ilo io is it ja jbo jv ka kk km kn ko krc ku kv kw ky la lb lez li lmo lo lrc lt lv mai mg mhr min mk ml mn mr mrj ms mt mwl my myv mzn nah nap nds ne new nl nn no oc or os pa pam pfl pl pms pnb ps pt qu rm ro ru rue sa sah sc scn sco sd sh si sk sl so sq sr su sv sw ta te tg th tk tl tr tt tyv ug uk ur uz vec vep vi vls vo wa war wuu xal xmf yi yo yue zh |
Facebook Research によりオープン ソース化されたモデルです。このモデルは、Creative Commons Attribution-Share-Alike License 3.0 の下で使用される、Wikipedia、Tatoeba、および SETimes のデータに基づいてトレーニングされました。一般的なユース ケースは、構造化されていない言語コンテンツ (電子メールなど) を、テキストに使用されている言語に基づいて適切な回答者に転送することです。
Joulin 他による研究論文「Bag of Tricks for Efficient Text Classification」(効率的なテキスト分類のための各種手法) に基づいています。
このモデルは、200 +言語の任意のペア間で直接翻訳を提供します。 言語の完全なリストと、各言語を使用するための対応するコードについては、 こちらをご覧ください。
これは、Meta AI Researchによってオープンソース化されたNo Language Left BehindモデルのHuggingFace統合です。 モデルは次のライセンスの下で公開されました: ライセンス。
入力の説明
text
:翻訳するテキスト。from_lang
:翻訳するテキストの言語コード。to_lang
: ターゲット テキストの言語コードです。
{"text" : "UN Chief says there is no military solution in Syria", "from_lang" : "eng_Latn", "to_lang" : "fra_Latn" }"
{"text" : "UN Chief says there is no military solution in Syria", "from_lang" : "eng_Latn", "to_lang" : "fra_Latn" }"
出力の説明
"Le chef de l'ONU dit qu'il n'y a pas de solution militaire en Syrie"
"Le chef de l'ONU dit qu'il n'y a pas de solution militaire en Syrie"
これは、英語をフランス語に翻訳する、seq2seq 機械翻訳モデルです。Facebook AI Research (FAIR) によりオープン ソース化されています。
Gehring 他による論文「Convolutional Sequence to Sequence Learning」(畳み込みシーケンス ツー シーケンス学習) に基づいています。
これは、英語をドイツ語に翻訳する、seq2seq 機械翻訳モデルです。Facebook AI Research (FAIR) によりオープン ソース化されています。
Ng 他による論文「Facebook FAIR's WMT19 News Translation Submission」(Facebook FAIR による WMT19 ニュース翻訳送信」に基づいています。
これは、英語をロシア語に翻訳する、seq2seq 機械翻訳モデルです。Facebook AI Research (FAIR) によりオープン ソース化されています。
Ng 他による論文「Facebook FAIR's WMT19 News Translation Submission」(Facebook FAIR による WMT19 ニュース翻訳送信」に基づいています。
これは、英語をロシア語に翻訳する、seq2seq 機械翻訳モデルです。Facebook AI Research (FAIR) によりオープン ソース化されています。
Ng 他による論文「Facebook FAIR's WMT19 News Translation Submission」(Facebook FAIR による WMT19 ニュース翻訳送信」に基づいています。
これは、英語をロシア語に翻訳する、seq2seq 機械翻訳モデルです。Facebook AI Research (FAIR) によりオープン ソース化されています。
Ng 他による論文「Facebook FAIR's WMT19 News Translation Submission」(Facebook FAIR による WMT19 ニュース翻訳送信」に基づいています。
このモデルは、テキストで認識されたエンティティのリストを返します。認識された 18 種類の名前付きエンティティは、学会でこの作業のベンチマークに一般的に使用されている OntoNotes5 と同じ出力クラスを使用します。このモデルは、2018 年の Borchmann 他による論文「Approaching nested named entity recognition with parallel LSTM-CRFs (Parallel LSTM-CRF による入れ子の固有表現抽出へのアプローチ)」に基づいています。
以下に、18 種類のクラスを示します。
エンティティ |
説明 |
---|---|
PERSON |
People, including fictional. |
NORP |
Nationalities or religious or political groups. |
FAC |
Buildings, airports, highways, bridges, etc. |
ORG |
Companies, agencies, institutions, etc. |
GPE |
Countries, cities, states. |
LOC |
Non-GPE locations, mountain ranges, bodies of water. |
PRODUCT |
Objects, vehicles, foods, etc. (Not services.) |
EVENT |
Named hurricanes, battles, wars, sports events, etc. |
WORK_OF_ART |
Titles of books, songs, etc. |
LAW |
Named documents made into laws. |
LANGUAGE |
Any named language. |
DATE |
Absolute or relative dates or periods. |
TIME |
Times smaller than a day. |
PERCENT |
Percentage, including ”%“. |
MONEY |
Monetary values, including unit. |
QUANTITY |
Measurements, as of weight or distance. |
ORDINAL |
“first”, “second”, etc. |
CARDINAL |
Numerals that do not fall under another type. |
AI Center のストレージにデータを追加してパイプラインを開始することでトレーニングできるパッケージの例です。本製品には、ほかにも数多くのモデルが含まれています。
これは、英語テキスト分類のための一般的で再トレーニング可能なモデルです。一般的なユースケースとして、メール分類、サービス チケット分類、カスタム感情分析などがあります。詳しくは、「英語テキスト分類」をご覧ください。
これは、フランス語テキストの分類のための一般的で再トレーニング可能なモデルです。一般的なユースケースとして、メール分類、サービス チケット分類、カスタム感情分析などがあります。詳しくは、「French Text Classification (フランス語テキスト分類)」をご覧ください。
これは、テキスト分類のための一般的で再トレーニング可能なモデルのプレビュー バージョンです。 ここにリストされている上位100のウィキペディア言語をサポートしています。この ML パッケージはトレーニングする必要があります。デプロイする前にトレーニングしていないと、モデルがトレーニングされていないことを示すエラーが表示され、デプロイが失敗します。 また、自然言語処理システムを事前にトレーニングするための自己教師あり学習の手法である BERT に基づいています。 トレーニング中は特に GPU が推奨されます。 GPUは、速度を~5〜10倍向上させます。
このプレビュー モデルでは、抽出するエンティティでタグ付けされた独自のデータセットを使用できます。トレーニングおよび評価データセットは、CoNLL 形式である必要があります。
これは、表形式 (例: CSV、Excel) データの分類のための一般的で再トレーニング可能なモデルです。つまり、列の表とターゲット列を指定すると、そのデータのモデルを探します。詳しくは、「TPOT AutoML Classification (TPOT AutoML 分類)」をご覧ください。
これは、表形式 (例: CSV、Excel) データの分類のための一般的で再トレーニング可能なモデルです。つまり、列の表とターゲット列を指定すると、そのデータのモデル (XGBoost に基づく) を探します。「TPOT XGBoost Classification (TPOT XGBoost 分類)」をご覧ください。
- すぐにデプロイ可能
- Image Moderation (画像のモデレーション)
- Sentiment Analysis (感情分析)
- Question Answering (質問回答)
- Language Identification (言語識別)
- 多言語翻訳者
- English To French (英語からフランス語)
- English To German (英語からドイツ語)
- German To English (ドイツ語から英語)
- English To Russian (英語からロシア語)
- Russian To English (ロシア語から英語)
- Named Entity Recognition (名前付きエンティティ認識)
- Re-trainable
- English Text Classification (英語テキスト分類)
- French Text Classification (フランス語テキスト分類)
- Multilingual Text Classification (多言語テキスト分類)
- Custom Named Entity Recognition (カスタム固有表現抽出)
- Tabular Classification AutoML - TPOT (表形式データ分類 AutoML - TPOT)
- Tabular Classification - TPOT XGBoost (表形式データ分類 - TPOT XGBoost)