- 基本情報
- 管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 分析と監視を使用する
- オートメーションと Communications Mining
- よくある質問など
エンティティを確認および適用する
必要なユーザー権限:「ソースの表示」および「確認とラベル付け」
予測されたエンティティは、以下のメッセージの 1 行目のように、色で強調表示されたテキストとして表示されます。異なるエンティティの種類は異なる色で表示されます。ユーザーがエンティティを手動で適用するか、予測を受け入れてエンティティを確認すると、そのエンティティは、以下のように、太く暗い枠線で強調表示されたテキストとして表示されます。
段落内に、割り当てられたエンティティ、却下されたエンティティ、適用されたエンティティがある場合、その段落は、以下のメッセージの本文のように灰色で強調表示されます。
トレーニング可能なエンティティを確認する際に留意すべき重要な点は、このプラットフォームは、ユーザーが割り当てたエンティティの値と、コミュニケーション内でその値が出現する場所のコンテキスト (値そのものの周囲で使用されている他の言語) の両方から学習するという点です。
このプラットフォームでは、エンティティの値と同じ段落内にある言語のコンテキストと、エンティティが存在する段落の直前・直後にある 1 つの段落 (改行で示される) が考慮されます。
注: [トレーニング可能] に設定されていないエンティティの場合、プラットフォームの予測は、プラットフォーム内でそのエンティティに対して定義されているルールに完全に基づきます。これは、エンティティが必ず下流のオートメーションの所定の形式に従う必要があり、値が正しくないと失敗や例外が発生する場合に便利です。
このプラットフォームは、コミュニケーションに適用されるエンティティを予測する際に、各予測に信頼度スコア (%) を割り当てて、強調表示されたテキスト範囲にどの程度の信頼度でエンティティが適用されているかを示します。エンティティの信頼度スコアを表示するには、エンティティ上でホバーします。
この信頼度スコアは API 経由でも利用できるため、下流で実行される自動化アクションに情報を提供できます。
エンティティが有効化されると (こちらを参照)、自動的にデータセット全体でメッセージ内のエンティティの予測が開始されます。その後、ユーザーは予測が正しければ承認し、正しくなければ拒否できます。これらの各操作を実行することでトレーニング シグナルを送り、このシグナルを使用して、そのエンティティに対するプラットフォームの理解を改善します。
オフラインでトレーニングされる事前トレーニング済みのエンティティ (例: 金額、URL など) の場合、改善の観点から、ユーザーが正しい予測を承認することよりも、間違った予測を却下または修正することのほうが重要です。
プラットフォーム内でライブでトレーニングされるエンティティの場合は、正しい予測を承認することと、誤った予測を拒否することは等しく重要です。ただし、間違って予測されたものが見つからなければ、同じ種類の一意のエンティティそれぞれについて正しい例をいくつも承認し続ける必要はありません (たとえば、Example Bank Ltd. は一意の組織エンティティです)。
この場合の重要な注意点として、段落内のエンティティを 1 つでも確認した場合は、同じ段落内の他のエンティティをすべて確認する必要があります。
エンティティの予測を確認するには、予測の上にホバーすると、以下の例に示すようにエンティティの確認モーダルが表示されます。承認するには [確定] をクリックし、却下するには [却下] をクリックします。
エンティティとラベルは、互いに独立してトレーニングできます。メッセージのラベルを確認しても、同じメッセージ内のエンティティを確認する必要はありません。ただし、モデル トレーニング中に時間を最も効率的に使うために、両方を同時に行うことをお勧めします。
注: エンティティをトレーニングする際には、以下で説明するベスト プラクティス (特に、段落を部分的にラベル付けしないことに関するベスト プラクティス) に従うことが非常に重要です。
データセットに対して有効化されている各エンティティ (特にトレーニング可能なエンティティ) を、プラットフォームがどの程度適切に予測できるかを理解するには、こちらをご覧ください。
エンティティの誤った予測を却下することは重要ですが、強調表示されたテキストが実際には別のエンティティ内にあった場合 (日付関連のエンティティでよくあります)、後で正しいエンティティを適用します (エンティティの適用方法については、以下をご覧ください)。
予測されなかった可能性があるテキストにエンティティを適用するには、コピーする場合と同じように、テキストのセクションを強調表示します。
以下に示すように、データセットに対して有効化したすべてのエンティティを含むドロップダウン メニューが表示されます。正しいエンティティをクリックして適用するか、対応するキーボード ショートカットを押します。
各エンティティの既定のキーボード ショートカットは、そのエンティティの先頭の文字です。複数のエンティティが同じ文字で始まる場合、もう一方のエンティティにはランダムな文字が割り当てられます。
エンティティが適用されると、色と太い枠線付きで強調表示されます (以下を参照)。エンティティの種類ごとに独自の色があります。
特定のエンティティの種類の値を複数の段落に分割することはできません。1 つのエンティティの値として抽出するには、値全体が 1 つの段落内に含まれている必要があります。
メッセージ内のエンティティを承認、却下、適用する際に留意すべき非常に重要なベスト プラクティスは 2 つあります。
1. 単語を分割しない
単語を分割しないことが重要です。強調表示されたエンティティは、対象となる単語の一部だけでなく、単語全体 (または複数の単語) をカバーする必要があります (下の左側にある誤った例と、右側にある正しい適用例をご覧ください)。
2. 段落を部分的にラベル付けしない
ラベル付けの際に、あるメッセージに 1 つのラベルを割り当てた場合、そのメッセージに適用できるラベルを「すべて」適用する必要があります。そうしないと、他のラベルは適用する必要がないとモデルに教えることになります。エンティティについても同じことが当てはまります。ただし、エンティティをメッセージ全体ではなく段落レベルで確認または適用する場合を除きます。
メッセージ内の段落は改行で区切られます。メールのメッセージの件名は、それ自体が 1 つの段落と見なされます。
段落内のいずれかのエンティティを確認または適用した場合は、必ず、同じ段落内のすべてのエンティティを確認または適用してください。段落内のエンティティを適用、承認、却下すると、その段落は、エンティティの観点からは「確認済み」として扱われます。したがって、その段落の「すべて」の予測を承認または却下することが重要です。
以下の例は、メール メッセージ内で確認されたさまざまな段落を示しています。
以下に示すメッセージは同じ例を示していますが、こちらではユーザーが 1 つの段落内にあるすべてのエンティティの予測を承認または却下していません。モデルが金額エンティティを不正確な予測として扱うことになるため、これは間違いです。