线轨迹相似度度量
使用说明
线轨迹数据集相似度度量,使用搜索数据集,从轨迹数据集中,找到与搜索轨迹最相似的轨迹线。 返回与搜索轨迹最相似的轨迹数据。结果数据集将会保留轨迹数据的所有属性字段,还会增加“QueryFeatureID”、“SimilarityFeatureID”和“Similarity” 字段, “QueryFeatureID” 字段用于表示搜索轨迹对象的要素字段值;“SimilarityFeatureID” 字段用于表示结果轨迹对象的要素字段值;“Similarity” 字段用于表示轨迹之间的相似度或距离,同属于一个搜索对象查询出的一条轨迹的所有点对象的相似度值相同。
提供的轨迹相似度度量方法包括:
- 豪斯多夫距离 HausdorffDistance:基于轨迹形状的度量方法,通过计算两条轨迹之间最近点距离的最大值确定相似性,条件为两条轨迹之间点的个数不能相差太多。
- 弗雷歇距离FrechetDistance:基于轨迹动态规划的思想,类似狗绳距离,通过计算两条轨迹在同一时刻对应位置的最长距离确定相似性,对噪音比较敏感。
- 动态时间规整 DTW:基于点的度量方法,对轨迹长度无限制,且效果较好,但对噪音比较敏感。
- 最大相似长度 MaxSimilarLength:该方法带有时间约束,只查找与搜索轨迹相同时间内的轨迹。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
线轨迹数据集 | 轨迹数据集,从轨迹数据集中找到与搜索轨迹最相似的轨迹,必须为线数据集,且必须有唯一要素ID。 | FeatureRDD | |
搜索数据集 | 作为参考数据集,从轨迹数据集中找到与搜索轨迹最相似的轨迹,必须为线数据集,且必须有唯一要素ID。 | FeatureRDD | |
轨迹相似度度量方法 (可选) |
最大相似长度 | 轨迹相似度度量方法,可参考使用说明。 | JavaSimilarityAlgorithm |
返回最相似的轨迹数目 (可选) |
5 | 返回最相似的轨迹数目,必须大于0。 | Int |
空间距离容差 (可选) |
50 米 | 如果轨迹度量方法为 最大相似长度 ,空间距离容差表示为两个点之间的最大误差距离,也就是当两个的距离大于容差值, 则不可能相似。对其他轨迹度量方法,容差表示轨迹对象最小外接矩形的误差,即当两条轨迹的最小外接矩形在容差误差下相交,则计算轨迹之间的距离,否则不计算。 | JavaDistance |