使用说明
轨迹预处理是用于处理轨迹数据中的异常点,包括轨迹分段,处理偏移点、重复点、尖角等异常情形 (如下图所示)。通常是许多轨迹数据挖掘任务的基本步骤。返回处理后的轨迹点数据集(FeatureRDD)。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
待处理的点数据集 | 待处理的轨迹点数据集 | FeatureRDD | |
点标识字段 | 点标识字段,具有相同标识的点划分为一组,例如,手机号 | String | |
用于标识要素时间的字段 | 用于标识要素时间的字段,时间字段没有设置时,将会默认从要素数据集中找默认的时间字段,如果没有默认的时间字段,将会抛出异常。 | String | |
轨迹分割对象 (可选) |
轨迹分割对象可以通过 CreateTrackSplitter 算子构造 | TrackSplitter | |
轨迹点误差值 (可选) |
30.0 | 轨迹点误差值,比如 GPS 误差值,单位为米。需要根据数据的质量指定一个合适的误差值。 | Double |
尖角角度值 (可选) |
40.0 | 尖角角度值,单位为角度,当连续时间段内三个不想等的点的夹角小于指定的尖角角度值时,中间的点将会被纠偏处理成首尾两个点的中点。当值小于等于0时,将不处理尖角。 | Double |
是否去除空间位置相等的重复点 (可选) |
true | 当为true时,当相邻时间的两个点空间位置也相同时,将会删除一个点。 | Boolean |