- 基本情報
- 管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 分析と監視を使用する
- オートメーションと Communications Mining
- よくある質問など
エンティティの検証
プラットフォームの [検証] ページには、有効化されているエンティティの検証の統計情報、警告、および推奨されるアクションが表示されます。これはタクソノミー内のすべてのラベルの場合と同様です。
これらを確認するには、次の図に示すように、[検証] ページに移動して上部の [エンティティ] タブを選択します。
エンティティを正しく予測する能力をプラットフォームが検証するプロセスは、ラベルの場合と非常によく似ています。
メッセージを初めてデータセットに追加すると、トレーニング セットとテスト セット (各メッセージのメッセージ ID でランダムに決定) に分割されます (80 対 20)。割り当てられたエンティティ (承認または修正された予測) は、そのエンティティが含まれるメッセージが最初にトレーニング セットまたはテスト セットのどちらに割り当てられていたかに基づいて、どちらかのセットに分類されます。
場合によっては、1 件のメッセージに大量のエンティティが存在していて、メッセージがトレーニング セットまたはテスト セットのどちらに含まれるかを保証できないため、各セット内のエンティティの数に大きな差が見られることがあります。
割り当てられたエンティティがすべてトレーニング セットに分類されることもあります。検証スコアを計算するには、テスト セットに少なくとも 1 つの例が必要であるため、このようなエンティティでは、テスト セットに例がいくつか存在するようになるまで、割り当てられた例を追加する必要があります。
十分なトレーニング データがある各エンティティの個々の適合率と再現率の統計情報は、ラベルの統計情報と非常によく似た方法で計算されます。
適合率 = 一致するエンティティの数 / 予測されたエンティティの数
再現率 = 一致するエンティティの数 / 実際のエンティティの数
「一致するエンティティ」とは、プラットフォームがエンティティを正確に予測した (部分一致のない) 場所です。
F1 スコアは、単に適合率と再現率の両方の調和平均です。
このページに示す適合率と再現率の統計情報は、プラットフォームで常時トレーニング可能なエンティティ (上の 2 番目の段で説明) で最も役に立ちます。これらのエンティティの種類について確認されたすべてのエンティティは、プラットフォームがそのエンティティを予測する機能に直接影響するためです。
したがって、可能な限り、正しいエンティティを承認し、誤ったエンティティを修正または却下する必要があります。
事前トレーニング済みのエンティティの場合、検証の統計情報にパフォーマンスを正確に反映させるには、かなりの量の正しい予測を承認することに加え、誤った予測を確実に修正する必要があります。
誤った予測を修正しただけでは、トレーニング セットとテスト セットは、プラットフォームがエンティティの予測に苦労した事例だけでいっぱいになってしまい、プラットフォームがより適切に予測できる事例は提供されず不自然です。このようなエンティティの間違った予測を修正してもエンティティはリアルタイムに更新されないため (定期的にオフラインで更新されます)、検証の統計情報がしばらくの間変わらず、不自然に低くなる可能性があります。
正しい予測を大量に承認しても必ずしも便利であるとは限りません。このようなエンティティは多くの場合、正しく予測されるためです。ただし、エンティティの予測の大部分が正しい場合は、[検証] ページの適合率と再現率の統計情報について心配する必要はないと考えられます。
統計情報の概要 (平均適合率、平均再現率、平均 F1 スコア) とは、単に個々のエンティティ スコアそれぞれの平均値です。
ラベルの場合と同様に、十分なトレーニング データがあるエンティティのみが平均スコアに含まれます。十分なトレーニング データがなく、スコアに含めることができないエンティティには、名前の横に警告アイコンが表示されます。
[エンティティの検証] ページには、エンティティの平均パフォーマンスの統計情報、および各エンティティの平均 F1 スコアとトレーニング セットのサイズを示すグラフが表示されます。また、このグラフでは、琥珀色または赤色のパフォーマンス警告があるラベルにフラグが付けられています。
表示されるエンティティのパフォーマンスの統計情報は次のとおりです。
- 平均 F1 スコア: パフォーマンスを正確に推測するのに十分なデータがあるすべてのエンティティの F1 スコアの平均値です。このスコアでは、再現率と適合率が均等に重み付けされています。F1 スコアが高いモデルでは偽陽性と偽陰性が少なくなります。
- 平均適合率: パフォーマンスを正確に推定するのに十分なデータを含むすべてのエンティティの適合率スコアの平均値です。適合率の高いモデルでは偽陽性が少なくなります。
- 平均再現率: パフォーマンスを正確に推定するのに十分なデータを持つすべてのエンティティの再現率スコアの平均値です。再現率の高いモデルでは偽陰性が少なくなります。
[検証] ページの [メトリック] タブに表示されるエンティティのパフォーマンスのグラフ (上記を参照) は、個々のエンティティのパフォーマンスを即座に視覚的に示します。
このグラフにエンティティを表示するには、検証中にプラットフォームによって使用されるトレーニング セットに、ピン留めされた例が 20 個以上含まれている必要があります。そのためには、25 件の異なるメッセージで、エンティティ 1 個につき 25 個以上 (多くの場合それ以上) のピン留めされた例があるようにする必要があります。
各エンティティは、エンティティのパフォーマンスについてのモデルの理解に基づいて、3 色のいずれかでプロットされます。色の意味については、以下のセクションで説明します。
エンティティのパフォーマンス インジケーター
- グラフに青でプロットされているエンティティは、パフォーマンス レベルが十分なエンティティです。これは、例の数と種類、そのエンティティの平均適合率など、多様な要因に基づいています。
- 琥珀色でプロットされたエンティティは、十分なパフォーマンスをわずかに下回ります。平均適合率が比較的低いか、トレーニング例が十分でない可能性があります。このようなエンティティは、パフォーマンスを改善するためにトレーニング/修正が少し必要です。
- 赤でプロットされたエンティティは、パフォーマンスの低いエンティティです。平均適合率が非常に低いか、トレーニング例が十分でない可能性があります。このようなエンティティは、パフォーマンスを十分なレベルに引き上げるために、さらにかなりのトレーニング/修正が必要である可能性があります。