- 基本情報
- 管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining
- ライセンス情報
- よくある質問など
データセットのステータス
ラベルを適用するか、またはデータセット内の一般フィールドを確認すると、そのたびにモデルが再トレーニングされ、新しいモデル バージョンが作成されます。異なるモデル バージョンの使用について詳しくは、こちらをご覧ください。
再トレーニング時に、モデルは提供された最新の情報を取得し、データセット全体にわたってすべての予測を再計算します。このプロセスはトレーニングの開始時に始まり、多くの場合、Communications Mining が 1 つのモデル バージョンの予測を適用し終えたときには、既に新しいモデル バージョンの予測の再計算を進めています。一定時間後にトレーニングを停止すると、Communications Mining はすぐに追いつき、データセット内で完了した最新のトレーニングを反映した予測を適用します。
このプロセスは、完了するトレーニングの量、データセットのサイズ、タクソノミー内のラベルの数によっては時間がかかる場合があります。Communications Mining には便利なステータス機能があり、モデルが最新の状態になった場合や、モデルが再トレーニング中かどうかとその予想所要時間を把握できます。
データセットを使用している場合、次の 2 つのアイコンのいずれかがページの上部に表示され、現在のステータスを示します。
データセットが最新の状態であり、最新のモデル バージョンからの予測が適用されていることを示します。 | |
モデルが再トレーニング中であり、予測が最新の状態ではない可能性があることを示します。 |
アイコンにホバーすると、以下に示すようにステータスの詳細が表示されます。
- モデルのトレーニング
このプロセスでは、現在のモデル バージョンを再トレーニングして新しいモデル バージョンを作成し、タクソノミーの更新やデータ アノテーションなどの最近の変更を組み込みます。モデルのトレーニングは一般的に高速ですが、いくつかの要因によって所要時間が変わる場合があります。
- 予測を適用する
このプロセスはモデルのトレーニング後に実行されます。トレーニング済みのモデル バージョンから予測が取得されて各メッセージに適用されます。通常、予測の適用は通常より低速であり、その所要時間は主にデータセットのサイズと複雑さの影響を受けます。
- ラベルとフィールドのタクソノミーの複雑さ
影響: データセット内のラベルとフィールドが多いほど、モデルをトレーニングしたり、メッセージ全体に予測を適用したりするのにかかる時間が長くなります。
- 生成 AI による抽出の使用
影響: 生成 AI による抽出では、ラベルとフィールドの複雑な関係を理解する必要があり、より大規模で強力なモデルが必要になります。このため、トレーニングの速度が低下する可能性があります。
- データセットのサイズ (アノテーションありのデータとアノテーションなしのデータ)
影響: アノテーション済みのメッセージが大量にあると、モデルがトレーニング中に考慮しなければならないデータ ポイントが増加し、プロセスにかかる時間が長くなります。同様に、アノテーションなしのメッセージが大量にあると、予測の適用に要する時間が長くなる可能性があります。
注: 予測は利用可能になるとすぐに表示されるため、アノテーションを行う際に適用が完了するまで待つ必要はありません。以前のバージョンの予測が完了する前にトレーニングを行うと、トレーニング済みの最新のモデル バージョンからの予測を適用するように切り替わります。 - 同時にトレーニングするデータセットの数
影響: Communications Mining 環境で複数のモデルを同時にトレーニングしている場合、必要なサービスの負荷が分散されるため、一時的に速度が低下する可能性があります。
- サポートに問い合わせるべき状況
- トレーニング: 上記のどの理由からもトレーニングが遅い原因の説明が付かず、その状況が 4 時間以上続いている場合は、サポートにお問い合わせください。
- 予測の適用: 大規模で複雑なデータセットの場合、予測の適用には長い時間がかかることを見込んでください。このプロセスが 1 つのモデル バージョンで 24 時間以上続いている場合にのみ、サポートにお問い合わせください。
注: これにより、データのアノテーションが妨げられることはありません。新しい予測が利用可能になったら常にその予測のメリットを利用できます。
トレーニングをトリガーする操作 (メッセージにラベルやフィールドでアノテーションを行うなど) が完了してから 1 時間以内にモデルのトレーニングが開始されない場合は、サポートにお問い合わせください。
トレーニングのステータスを確認する: データセット内の任意のページの右上隅にあるデータセットのステータスをチェックすると、モデルがトレーニング中かどうかを確認できます。