训练数据清洗工程
训练数据清洗是SuperMap iDesktopX 提供的一项高效管理、编辑和准备 AI 模型训练样本数据的功能模块。它旨在帮助用户对大规模影像训练数据集进行系统化地组织、分类、标注和修正,以提升数据质量,为后续的模型训练奠定坚实基础。
在遥感影像智能解译工作流中,高质量的训练数据是模型成功的关键。本功能通过可视化交互界面,将零散的训练数据(影像与对应的标签文件)整合为统一管理的工程,为您带来以下关键价值:
- 系统化管理:将海量训练数据按正负样本、修改状态等进行分类,结构化存储于工程中,便于浏览与追溯。
- 快速筛选与修正:通过快捷键对样本进行快速分类,并支持对标签进行可视化绘制编辑(如新增正样本区域、标记负样本区域),精准修正错误标注。
- 高效扩充与导出:便捷地添加新影像数据以扩充样本集,并可将处理完成的样本按类别导出为标准格式,无缝衔接后续的模型训练任务。
在以下场景中,您可能会用到训练数据清洗工程。
- 地物分类/二元分类模型训练前:对已有的初步标注结果进行人工复查与清洗,剔除错误样本,修正不精确的标签边界。
- 变化检测模型训练前:管理双时相影像对及其标签,确保变化区域标注的准确性。
- 持续迭代模型时:在模型产出新预测结果后,将其作为训练数据导入本工程,进行人工修正与确认,形成高质量的新增训练集。
在本小节中,我们将为您介绍训练数据清洗工程的全流程操作:
- 基础词汇:介绍功能涉及的核心概念与术语。
-
新建工程:介绍如何创建新工程。
-
打开工程:介绍如何加载已有工程。
- 训练数据管理:介绍如何添加新影像数据,以及导出已清洗的训练数据。
- 样本分类与标签编辑:介绍如何通过快速分类与可视化标注功能完成数据清洗。
- 样本标签风格设置:介绍如何自定义标签的显示样式,以获得更佳的可视化编辑体验。
SuperMap iDesktopX 2026 版本开始提供。