均值偏移聚类
使用说明
均值偏移聚类(Means Shift算法)是一种基于聚类中心迭代求解的聚类算法,与K均值聚类不同的是不需要事先确定聚类个数K。均值偏移聚类的原理为:从初始聚类中心点开始,沿着带宽内点群密度上升的方向不断寻找新的聚类中心点,直到满足终止条件。终止条件为迭代过程中前后两次聚类的中心移动距离几乎不变 或者达到最大迭代次数(默认迭代次数:300)。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
源数据集 | 设置待分析的矢量数据集,支持点数据集。 | DatasetVector | |
目标数据源 | 指定的存储结果的数据集所在的数据源。 | Datasource | |
结果数据集名 | 指定的结果数据集名称。 | String | |
带宽 | -1 | 带宽值为以某个聚类中心点为核心时的搜索半径,单位与坐标系一致,取值大于0,默认值为-1,系统会自动计算一个默认带宽值。聚类结果受带宽的影响,若带宽设置太小,收敛较慢,簇类个数过多;带宽设置太大,一些簇类可能会丢失。 | double |
自定义初始化聚类中心种子点 | 自定义初始聚类中心。默认不设置。填写形式为[{"x":0.0,"y":0.0},{"x":9.0,"y":9.0}] 。 | Point2Ds |
输出结果
1、在源数据集中增加了一个 Cluster_ID 字段表示结果聚类类别;
2、结果矢量数据集表示最终聚类的聚类中心点。