使用说明
相似位置筛选用于根据要素属性筛选出与参考数据最相似的要素。返回相似位置筛选结果数据集(FeatureRDD),结果数据集中新增sim字段,表示相似程度,该值越小表示属性越相似,0表示完全相同。
应用场景
- 根据疾病感染最严重的村庄所具有的特征,从而确定其他哪些村庄具有较高的感染风险。
- 根据产量高的某农作物生长环境(土壤、气候等),判断还有哪些地方可能适合该农作物的种植。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
输入数据集 | 提供参考位置的数据集,支持点、线和面数据集。 | FeatureRDD | |
搜索数据集 | 待进行相似位置搜索的要素数据集,简单来说即从搜索数据集中搜索出与输入数据集属性相似的对象。 | FeatureRDD | |
分析字段 | 用于计算相似度的字段集合,即根据这里设置的属性字段集合来判定要素是否相似,需要输入数据集和搜索数据集同时具备该字段,且为数值型字段。当输入数据集有多个参考对象时,相似性取决于指定字段的平均值。 | JList[String] | |
结果数量 | 指定相似度最高的对象数目,如果为0,则返回所有对象。 | Int |