轨迹预处理

使用说明

轨迹预处理是用于处理轨迹数据中的异常点,包括轨迹分段,处理偏移点、重复点、尖角等异常情形 (如下图所示)。通常是许多轨迹数据挖掘任务的基本步骤。返回处理后的轨迹点数据集(FeatureRDD)。

TrajectoryPreprocessing

参数说明

参数名 默认值 参数释义 参数类型
待处理的点数据集 待处理的轨迹点数据集 FeatureRDD
点标识字段 点标识字段,具有相同标识的点划分为一组,例如,手机号 String
用于标识要素时间的字段 用于标识要素时间的字段,时间字段没有设置时,将会默认从要素数据集中找默认的时间字段,如果没有默认的时间字段,将会抛出异常。 String
轨迹分割对象
(可选)
轨迹分割对象可以通过 CreateTrackSplitter 算子构造 TrackSplitter
轨迹点误差值
(可选)
30.0 轨迹点误差值,比如 GPS 误差值,单位为米。需要根据数据的质量指定一个合适的误差值。 Double
尖角角度值
(可选)
40.0 尖角角度值,单位为角度,当连续时间段内三个不想等的点的夹角小于指定的尖角角度值时,中间的点将会被纠偏处理成首尾两个点的中点。当值小于等于0时,将不处理尖角。 Double
是否去除空间位置相等的重复点
(可选)
true 当为true时,当相邻时间的两个点空间位置也相同时,将会删除一个点。 Boolean