使用说明
距离解释变量,通过计算输入数据集与距离数据集的最近距离,自动创建一列解释变量(距离解释变量名称可在模型中的explanatory_index中获取)。 例如在进行房价预测时,需要学校、地铁站、高速公路等数据作为解释变量,此时输入相应解释变量数据集,会自动计算与小区点数据之间的最近距离作为距离解释变量。
在机器学习模型的训练过程中均需要先设置此参数类,也可使用默认,此时表示不设置距离解释变量。
需要注意,如果输入了距离解释变量数据集,则在利用模型进行预测时,必须输入预测距离解释变量数据集,且与训练模型时创建的解释变量名称对应(见【预测数据的距离解释变量映射】,预测距离解释变量数据集使用同一个搜索距离。
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
创建的解释变量字段名称 | 创建的训练距离解释变量字段名称 | String | |
训练距离解释变量数据集 | 训练距离解释变量数据集 | FeatureRDD | |
最大搜索距离 | 最大搜索距离。距离单位默认Meter,可选值:Meter, Centimeter, Millimeter, Decimeter, Kilometer, Yard, Inch, Foot, Mile | JavaDistance |