communications-mining
latest
false
- API ドキュメント
- CLI
- 連携ガイド
- ブログ
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining による注釈バイアスの修正
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 会話型データ インテリジェンスのための Communications Mining と Google AutoML の比較
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
Communications Mining 開発者ガイド
Last updated 2024年11月19日
一括削除
CLI では、期間に基づいてコメントを削除できます(たとえば、2 年以上経過したすべてのコメント)。 これは、履歴データをクリーンアップする場合に便利です。 この期間は、コメントが Communications Mining にアップロードされた日付ではなく、コメントの
timestamp
フィールドに基づきます。
コメントを削除または変更する前に、必要に応じて注釈付きコメントをバックアップして、モデルトレーナーの手動作業を誤って失わないようにすることができます。
re get comments \
<project_name/source_name> \
--dataset <project_name/dataset_name> \
--reviewed-only true \
--file <output_file_name.jsonl>
re get comments \
<project_name/source_name> \
--dataset <project_name/dataset_name> \
--reviewed-only true \
--file <output_file_name.jsonl>
ソースが複数のデータセットに追加されている場合は、それらのデータセットごとに上記のコマンドを実行する必要があります。
警告:
注釈を削除するとモデルのパフォーマンスが変更されます
削除するコメントが、注釈が付けられている可能性のある 1 つ以上のデータセットに追加された場合、注釈付きコメントを削除すると、今後、それらのデータセットのモデルのパフォーマンスが変化します (ピン留めされたモデルは影響を受けません)。 オプションで、注釈付きコメントをスキップするように CLI に指示できます。
以下のコマンドは、注釈付きコメントを除いて、
FROM_TIMESTAMP
から TO_TIMESTAMP
の間のソース内のすべてのコメントを削除します。 タイムスタンプは RFC 3339 形式である必要があります。 1970-01-02T03:04:05Z
。
re delete bulk \
--source <project_name/source_name> \
--include-annotated=false \
--from-timestamp FROM_TIMESTAMP \
--to-timestamp TO_TIMESTAMP
re delete bulk \
--source <project_name/source_name> \
--include-annotated=false \
--from-timestamp FROM_TIMESTAMP \
--to-timestamp TO_TIMESTAMP
注釈付きのコメントを削除する場合は、
--include-annotated=true
を設定できます。