ixp
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Communications Mining 用户指南
上次更新日期 2026年3月13日
批量删除
CLI 允许您根据时间段删除注释,例如,所有超过两年的注释。这对于清理历史数据非常有用。
备注:
时间段基于注释的timestamp字段,而不是基于注释上传到 Communications Mining™ 的日期时间。
备注:
本节假定您已安装并配置 CLI 。
备份带注释的数据
在删除或修改注释之前,您可能需要备份带注释的注释,以免意外丢失模型训练器的手动工作:
re get comments \
<project_name/source_name> \
--dataset <project_name/dataset_name> \
--reviewed-only true \
--file <output_file_name.jsonl>
re get comments \
<project_name/source_name> \
--dataset <project_name/dataset_name> \
--reviewed-only true \
--file <output_file_name.jsonl>
如果已将源添加到多个数据集,则应为每个数据集运行前面提到的命令。
删除数据
警告:
删除批注会改变模型性能。
如果要删除的注释已添加到一个或多个本可批注的数据集,则删除已批注的注释将导致以后这些数据集中的模型性能发生变化。已固定的模型不受影响。
(可选)您可以将 CLI 配置为跳过带批注的注释。
以下命令将删除来源中FROM_TIMESTAMP和TO_TIMESTAMP之间的所有注释,但带注释的注释除外。时间戳应采用RFC 3339 格式,例如1970-01-02T03:04:05Z 。
re delete bulk \
--source <project_name/source_name> \
--include-annotated=false \
--from-timestamp FROM_TIMESTAMP \
--to-timestamp TO_TIMESTAMP
re delete bulk \
--source <project_name/source_name> \
--include-annotated=false \
--from-timestamp FROM_TIMESTAMP \
--to-timestamp TO_TIMESTAMP
如果确定要删除带注释的注释,则可以设置--include-annotated=true 。