Communications Mining
最新
バナーの背景画像
Communications Mining ガイド
最終更新日 2024年2月29日

多言語のソースとデータセット

Communications Mining が多言語ソースデータセットをサポートするようになりました。つまり、モデルは、サポートされている複数の異なる言語を含むソースを、実際に翻訳することなく理解できます。

現在、多言語のソースとデータセット内で「一般提供」されている言語は、英語、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、オランダ語です (このリストは順次拡大予定です)。

これが実際に何を意味するかというと、ユーザーがこのプラットフォームでサポートされている複数の言語で作業や業務を行う場合、すべてを 1 つの言語に翻訳するのではなく、その言語で逐語データをトレーニングできます。

その他の多数の言語は「プレビュー版」としてサポートされています (この記事の末尾に記載)。つまり、お客様やパートナーが各言語を使い始めるのに応じて、徐々に微調整していく予定です。とは言え、これらの言語の大部分のパフォーマンスは非常に強力であり、UiPath のチームがほとんどまたはまったく微調整しなくても高いパフォーマンスを達成します。

多言語のソースとデータセットを使用する際の重要な考慮事項は次のとおりです。

  • データセットが多言語である場合、ユーザーは (翻訳されたデータセットに対して提供される) 逐語データの翻訳を確認できません。そのため、モデルを効果的にトレーニングするには、データセット内の言語をすべて理解できる必要があります。
  • 複数の言語を理解することは、マシン ラーニングの問題として、単一の言語を理解することよりも複雑です。そのため、多言語のデータセットでは、単一言語のデータセットと比較してパフォーマンスがわずかに低下する可能性があります。
  • このプラットフォームで理解できる言語は、上記のサポートされている言語の 1 つの言語だけです。データセット内に他の言語が存在する場合、その言語の逐語データに、サポートされている言語の逐語データで使用されているラベルをタグ付けすると、プラットフォームが混乱します。このような逐語データにラベル付けする場合は、その言語をラベルとしてキャプチャする特定の専用ラベルとしてラベル付けすることをお勧めします。ただし、このプラットフォームは、サポートされていない言語の詳細は解釈できません。

多言語のソースとデータセットの作成方法

データ ソースとデータセットのどちらについても、言語ファミリ作成時に選択し、作成後に変更することはできません

[ソースを作成] または [Create Dataset] モーダルの言語ファミリのドロップダウンから [多言語] を選択するだけです (通常は最後に選択する設定です)。

注: 多言語のデータセットには、プラットフォームがサポートする任意の言語ファミリのソースを含めることができます。

UI でのソースの作成について詳しくは、こちらをご覧ください。

データセットの作成について詳しくは、 こちらをご覧ください

一般提供 (GA) 言語

  • English
  • オランダ語
  • フランス語
  • ドイツ語
  • イタリア語
  • ポルトガル語
  • スペイン語

サポートされている言語 (プレビュー版)

  • アフリカーンス語
  • アルバニア語
  • アムハラ語
  • アラビア語
  • アルメニア語
  • アッサム語
  • アゼルバイジャン語
  • バスク語
  • ベラルーシ語
  • ベンガル語
  • ベンガル語 (ローマ字)
  • ボスニア語
  • ブルトン語
  • ブルガリア語
  • ビルマ語
  • ビルマ語
  • カタロニア語
  • 中国語 (簡体)
  • 中国語 (繁体)
  • クロアチア語
  • チェコ語
  • デンマーク語
  • エスペラント語
  • エストニア語
  • フィリピン語
  • フィンランド語
  • ガリシア語
  • グルジア語
  • ギリシャ語
  • グジャラート語
  • ハウサ語
  • ヘブライ語
  • ヒンディー語
  • ヒンディー語 (ローマ字)
  • ハンガリー語
  • アイスランド語
  • インドネシア語
  • アイルランド語
  • 日本語
  • ジャワ語
  • カンナダ語
  • カザフ語
  • クメール語
  • 韓国語
  • クルド語 (クルマンジー)
  • キルギス語
  • ラオ語
  • ラテン語
  • ラトビア語
  • リトアニア語
  • マケドニア語
  • マダガスカル語
  • マレー語
  • マラヤーラム語
  • マラーティー語
  • モンゴル語
  • ネパール語
  • ノルウェー語
  • オリヤー語
  • オロモ語
  • パシュトー語
  • ペルシャ語
  • ポーランド語
  • パンジャブ語
  • ルーマニア語
  • ロシア語
  • サンスクリット語
  • スコットランド ゲール語
  • セルビア語
  • シンド語
  • シンハラ語
  • スロバキア語
  • スロベニア語
  • ソマリ語
  • スンダ語
  • スワヒリ語
  • スウェーデン語
  • スイス ドイツ語
  • タミール語
  • タミル語 (ローマ字)
  • テルグ語
  • テルグ語 (ローマ字)
  • タイ語
  • トルコ語
  • ウクライナ語
  • ウルドゥ語
  • ウルドゥー語 (ローマ字)
  • ウィグル語
  • ウズベク語
  • ベトナム語
  • ウェールズ語
  • 西フリジア語
  • コサ語
  • イディッシュ語
  • サポートされている言語 (プレビュー版)

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.