朴素贝叶斯分类预测

使用说明

该方法根据朴素贝叶斯分类训练得到的模型或已有模型进行数据的预测。结果返回要素数据集(FeatureRDD)。

参数说明

参数名 默认值 参数释义 参数类型
模型保存目录
模型指定的保存目录。 String
预测数据的映射字段
(可选)
预测数据的映射字段。表示模型的解释字段名称和预测数据集字段名称的对应关系,每一个解释字段都应该在预测数据集中有对应的字段。如果没有设置对应关系,则预测数据集中必须存在 explanatory(解释变量数组)中所有的字段。 JavaExplanatoryFieldMatching
预测数据的距离解释变量映射
(可选)
表示模型根据距离解释变量数据集创建的距离解释变量名称和预测距离解释变量数据集的对应关系。如果训练模型时输入了训练距离解释变量数据集,必须输入预测距离解释变量数据集,每一个距离解释变量字段都应该对应一个预测距离解释变量数据集。且预测距离解释变量数据集使用的搜索距离为距离解释变量的搜索距离。解释变量名称为输入的 distanceFieldName ,也可在模型训练结果 JSON 字符串中 explanatoryIndex 中获取。 ExplanatoryDistanceRDDMatching
预测数据集
预测数据集。访问数据的连接信息,需要包含数据类型,连接参数,数据集名字等信息。使用’—key=value’的方式设置,多个值使用’ ‘空格分隔。如连接HBase数据为 —providerType=hbase —hbase.zookeepers=192.168.12.34:2181 —hbase.catalog=demo —dataset=dltb; 连接dsf数据为—providerType=dsf —path=hdfs://ip:9000/dsfdata ; 本地数据为—providerType=dsf —path=/home/dsfdata String
结果数据集
结果数据集。访问数据的连接信息,需要包含数据类型,连接参数,数据集名字等信息。使用’—key=value’的方式设置,多个值使用’ ‘空格分隔。如连接HBase数据为 —providerType=hbase —hbase.zookeepers=192.168.12.34:2181 —hbase.catalog=demo —dataset=dltb; 连接dsf数据为—providerType=dsf —path=hdfs://ip:9000/dsfdata ; 本地数据为—providerType=dsf —path=/home/dsfdata String
数据查询条件
(可选)
数据查询条件,支持属性条件和空间查询, 如 SmID<100 and BBOX(the_geom, 120,30,121,31) String