- 基本情報
- 管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining
- ライセンス情報
- よくある質問など
モデルのトレーニングとアノテーションを行う際のベスト プラクティス
モデルのトレーニングを開始する前に、次のヒントを読み、陥りやすい落とし穴を回避することが重要です。これにより、トレーニング時間を短く抑え、モデルのパフォーマンスを改善できます。
Communications Mining モデルをトレーニングするときに覚えておくべき最も重要なことは、次の 3 つです。
適用されるラベルをすべて追加する: メッセージに適用されるラベルは、必ずすべて追加します。新しいユーザーは、メッセージに部分的にアノテーションを行うという落とし穴に陥りがちです。つまり、自分が注目しているラベルだけを適用し、適用するべき他のすべてのラベルを追加するのを忘れてしまいます。ラベルを適用しないことには、ラベルを適用することと同じように大きな影響があります。モデルに対し、メッセージが何であるかを伝えるのと同じように、何ではないかを伝えることになるからです。したがって、すべてのラベルを適用することが重要です。そうしないと、後でモデルを混乱させ、パフォーマンスの低下を招く可能性があります。
一貫性を持ってラベルを適用する: ラベルを追加する際には、一貫性を保つようにします。たとえば、あるメッセージに「部屋 > サイズ」というラベルを追加し、そのラベルを追加すべき別のメッセージにラベルを追加し忘れると、モデルが混乱します。前述のヒントで説明したように、ラベルを適用しないことには、ラベルを適用することと同じように大きな影響があります。
直接確認できるものにアノテーションを行う: 思い込みで業務知識を適用しないでください。ラベルを適用すべき情報がメッセージの件名や本文にない場合は、ラベルを適用しないでください。そうしないと、モデルはラベルが適用される理由を理解できなくなります。
追加のヒント:
ラベル名を決めるのに長時間かけない: ラベルに適した名前を考えるのに時間をかけすぎないようにしてください。ラベル名は、トレーニング プロセス中にいつでも変更できます。
ラベルに名前を付けるときは具体的にする: ラベルに名前を付けるときはできるだけ具体的にし、最初はタクソノミーをできるだけフラットに保ちます。ラベル名は後でいつでも変更・再構成できるため、最初はできるだけ具体的にすることをお勧めします。
たとえば、客室の清潔さを表すラベルを適用する場合、「客室の清潔さ」を適用できます。後で変更し、清潔さをサブラベルとして使用することにした場合は、「客室 > 清潔さ」に変更できます。いつでも操作をやり直してラベルを結合できるので、この段階ではできる限り多くのラベルをメッセージに追加する必要があります。