相似位置筛选

使用说明

相似位置筛选用于根据要素属性筛选出与参考数据最相似的要素。返回相似位置筛选结果数据集(FeatureRDD),结果数据集中新增sim字段,表示相似程度,该值越小表示属性越相似,0表示完全相同。

SearchSimilarLocations

应用场景

  • 根据疾病感染最严重的村庄所具有的特征,从而确定其他哪些村庄具有较高的感染风险。
  • 根据产量高的某农作物生长环境(土壤、气候等),判断还有哪些地方可能适合该农作物的种植。

参数说明

参数名 默认值 参数释义 参数类型
输入数据集 提供参考位置的数据集,支持点、线和面数据集。 FeatureRDD
搜索数据集 待进行相似位置搜索的要素数据集,简单来说即从搜索数据集中搜索出与输入数据集属性相似的对象。 FeatureRDD
分析字段 用于计算相似度的字段集合,即根据这里设置的属性字段集合来判定要素是否相似,需要输入数据集和搜索数据集同时具备该字段,且为数值型字段。当输入数据集有多个参考对象时,相似性取决于指定字段的平均值。 JList[String]
结果数量 指定相似度最高的对象数目,如果为0,则返回所有对象。 Int