训练数据生成
使用说明
在没有模型的情况下,可通过训练数据生成工具,基于原始遥感影像数据和矢量标注数据,生成模型训练需要使用的训练数据。由于遥感影像数据体量较大,且卷积神经网络对于运行内存的要求较高,因此需要先把影像处理成适合机器学习模型训练的数据。训练数据生成工具的目的就是把影像数据和标签数据同步切分成一张张小图片和标签,生成适合神经网络模型训练的数据。
若训练数据用途为“超分辨率重建”,则只需要输入低分辨率的样本影像,无需样本标签。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
训练数据用途 | 目标检测 | 指定训练数据用途 | Object |
文件类型 | 数据集 | 指定文件类型,若训练用途为“通用变化检测”,可选择数据集或文件清单;其他训练用途,可选择数据集或文件夹 | String |
样本影像-数据源 | 指定样本影像数据源,支持文件型数据源 | DataSource | |
样本影像-数据集 | 指定样本影像数据集,若训练用途为“通用变化检测”,仅支持影像数据集;其他训练用途,则支持影像数据集和镶嵌数据集 | Dataset | |
样本影像-文件夹 | 指定样本影像文件夹路径 | String | |
样本影像-清单路径 | 指定样本影像清单路径,支持txt和csv格式,清单中每一行对应一个影像文件路径,与对比影像清单中的每一行一一对应 | String | |
样本标签-数据源 | 指定样本标签数据源 | DataSource | |
样本标签-数据集 | 指定样本标签数据集 | Dataset | |
类别字段 | 指定类别字段 | String | |
对比影像-数据源 | 指定对比影像数据源,支持文件型数据源 | DataSource | |
对比影像-数据集 | 指定对比影像数据集,若训练用途为“通用变化检测”,仅支持影像数据集;其他训练用途,则支持影像数据集和镶嵌数据集 | Dataset | |
对比影像-清单路径 | 指定对比影像清单路径,支持txt和csv格式,清单中每一行对应一个对比影像文件路径,与样本影像清单中的每一行一一对应 | String | |
行数/列数 | 1024 | 指定生成训练数据的切片大小 | Integer |
其他参数数设置 (可选) |
False | 勾选可设置图片的格式、偏移、索引起始值。 | Boolean |
图片格式 | 训练数据的图片格式,支持 TIFF、JPEG、PNG 三种格式 | String | |
垂直/水平偏移 | 0 | 有时为了扩充训练数据并保证每个标签都可以完整的参与训练而不被切分,图片需要重叠切分,该值为重叠切分时不同方向上偏移的大小。如需偏移,则建议设置偏移距离为切片大小的1/2 | Integer |
索引起始值 | -1 | 默认值为-1,表示如果选择的输出路径及数据名称文件夹下存在已经产生的训练数据,则默认向其中追加新生成的训练数据 | Integer |
保存无标签数据 | False | 勾选时可保存无标签的切片,用于补充负样本或平衡正负样本 | Boolean |
输出路径 | 指定结果数据生成路径 | String | |
数据名称 | training_data | 指定生成数据文件夹名称 | String |
输出结果
训练数据文件夹。