距离解释变量

使用说明

距离解释变量,通过计算输入数据集与距离数据集的最近距离,自动创建一列解释变量(距离解释变量名称可在模型中的explanatory_index中获取)。 例如在进行房价预测时,需要学校、地铁站、高速公路等数据作为解释变量,此时输入相应解释变量数据集,会自动计算与小区点数据之间的最近距离作为距离解释变量。

在机器学习模型的训练过程中均需要先设置此参数类,也可使用默认,此时表示不设置距离解释变量。

需要注意,如果输入了距离解释变量数据集,则在利用模型进行预测时,必须输入预测距离解释变量数据集,且与训练模型时创建的解释变量名称对应(见【预测数据的距离解释变量映射】,预测距离解释变量数据集使用同一个搜索距离。

参数说明

参数名 默认值 参数释义 参数类型
创建的解释变量字段名称 创建的训练距离解释变量字段名称 String
训练距离解释变量数据集 训练距离解释变量数据集 FeatureRDD
最大搜索距离 最大搜索距离。距离单位默认Meter,可选值:Meter, Centimeter, Millimeter, Decimeter, Kilometer, Yard, Inch, Foot, Mile JavaDistance