communications-mining
latest
false
- API 文档
- CLI
- 集成指南
- 博客
重要 :
请注意,此内容已使用机器翻译进行了本地化。
Communications Mining 开发者指南
上次更新日期 2024年12月20日
批量删除
CLI 允许您根据时间段删除注释,例如两年前的所有注释。 这对于清理历史数据非常有用。 请注意,时间段基于注释的
timestamp
字段,而不是注释上传到 Communications Mining 的日期时间。
在删除或修改注释之前,您可能需要备份带注释的注释,以免意外丢失模型训练器的手动工作:
re get comments \
<project_name/source_name> \
--dataset <project_name/dataset_name> \
--reviewed-only true \
--file <output_file_name.jsonl>
re get comments \
<project_name/source_name> \
--dataset <project_name/dataset_name> \
--reviewed-only true \
--file <output_file_name.jsonl>
如果源已添加到多个数据集,则应为每个数据集运行上述命令。
警告:
删除标注会改变模型性能
如果您要删除的注释已添加到一个或多个本可注释的数据集中,则删除带注释的注释将导致以后这些数据集中的模型性能发生变化(已固定的模型不受影响)。 您可以选择告诉 CLI 跳过带注释的注释。
re delete bulk \
--source <project_name/source_name> \
--include-annotated=false \
--from-timestamp FROM_TIMESTAMP \
--to-timestamp TO_TIMESTAMP
re delete bulk \
--source <project_name/source_name> \
--include-annotated=false \
--from-timestamp FROM_TIMESTAMP \
--to-timestamp TO_TIMESTAMP
如果确定要删除带注释的注释,则可以设置
--include-annotated=true
。