Communications Mining™ は多言語のソースとデータセットをサポートします。つまり、各モデルはサポートされている複数の異なる言語を含むソースを理解することができ、実際に翻訳する必要はありません。
The languages that are currently in General Availability within multilingual sources and datasets are: English, French, German, Spanish, Italian, Portuguese, Dutch, and Japanese.
ユーザーがこのプラットフォームでサポートされている複数の言語で作業や業務を行う場合、すべての言語を 1 つの言語に翻訳しなくても、各言語で書かれたメッセージを使用してトレーニングできます。
- If a dataset is multilingual, users will not be able to see translations of any messages (as provided for translated datasets), so they will need to be able to understand all of the languages in the dataset to effectively train their model.
- Understanding multiple languages is a more complex machine-learning problem than understanding a single language, so these datasets may potentially experience a slight drop in performance compared to datasets in a single language.
- The platform supports the following languages: English, French, German, Spanish, Italian, Portuguese, Dutch, and Japanese. If the dataset contains other languages, applying labels used for supported languages may cause confusion. Instead, annotate these instances with language-specific labels. Note that the platform will not process or understand the content of unsupported languages.
データ ソースとデータセットのどちらの場合も、言語ファミリは作成時に選択します。作成後に変更することはできません。
Simply select multilingual from the language family drop-down list on the create source or create dataset modal (it's typically the last setting to select).
For more detail on creating a source in the UI, check the Create a data source in the GUI page.
For more detail on creating a dataset, check the Create a new dataset page.
フィードバックを送信したり問題を報告したりするには、Insider Portal に登録してください。
We currently support a wide range of additional languages in Preview mode. This means our team will be continuously refining them based on your usage. Many of these languages are expected to perform very well and may require minimal to no fine-tuning to achieve optimal performance.
- アフリカーンス語
- アルバニア語
- アムハラ語
- アラビア語
- アルメニア語
- アッサム語
- アゼルバイジャン語
- バスク語
- ベラルーシ語
- ベンガル語
- ベンガル語 (ローマ字)
- ボスニア語
- ブルトン語
- ブルガリア語
- ビルマ語
- ビルマ語
- カタロニア語
- 中国語 (簡体)
- 中国語 (繁体)
- クロアチア語
- チェコ語
- デンマーク語
- エスペラント語
- エストニア語
- フィリピン語
- フィンランド語
- ガリシア語
- グルジア語
- ギリシャ語
- グジャラート語
- ハウサ語
- ヘブライ語
- ヒンディー語
- ヒンディー語 (ローマ字)
- ハンガリー語
- アイスランド語
- インドネシア語
- アイルランド語
- ジャワ語
- カンナダ語
- カザフ語
- クメール語
- 韓国語
- クルド語 (クルマンジー)
- キルギス語
- ラオ語
- ラテン語
- ラトビア語
- リトアニア語
- マケドニア語
- マダガスカル語
- マレー語
- マラヤーラム語
- マラーティー語
- モンゴル語
- ネパール語
- ノルウェー語
- オリヤー語
- オロモ語
- パシュトー語
- ペルシャ語
- ポーランド語
- パンジャブ語
- ルーマニア語
- ロシア語
- サンスクリット語
- スコットランド ゲール語
- セルビア語
- シンド語
- シンハラ語
- スロバキア語
- スロベニア語
- ソマリ語
- スンダ語
- スワヒリ語
- スウェーデン語
- スイス ドイツ語
- タミール語
- タミル語 (ローマ字)
- テルグ語
- テルグ語 (ローマ字)
- タイ語
- トルコ語
- ウクライナ語
- ウルドゥ語
- ウルドゥ語 (ローマ字)
- ウィグル語
- ウズベク語
- ベトナム語
- ウェールズ語
- 西フリジア語
- コサ語
- イディッシュ語