使用说明
构建区域格网就是根据输入的区域面数据,按照给定的格网的宽和高,生成可以完全覆盖区域面的格网面数据集,生成的每一个格网必定与区域面是相交的关系。然后可以传入点数据来进行格网内部的统计,将每个格网内的点的统计值写到格网面的属性中,同时可以通过点的ID来限制是否统计相同ID的值。比如可以用于统计每平方公里内有多少便利店。结果返回要素数据集(FeatureRDD)。
当计算规则区域的人口密度、附近某种基础设施数时,可通过此算子来进行统计并纳入网格区域的属性中,也可用于后期复杂分析中,作为影响因子之一。
属性统计字段信息
通过设置属性统计字段信息对格网内的数据进行属性统计,输入格式为srcField,Mode,outField。其中,srcField为输入的数据集中待统计的字段,outField为统计结果字段名,Mode为统计方法,支持的统计方法为:Sum, Min, Max,Average,Variance, VariancePopulation,StdDeviation,StdDeviationPopulation, RecordCount, ModalValue。 如下表所示:
统计方法 | 含义 | 统计方法 | 含义 |
---|---|---|---|
Sum | 求和 | Min | 最小值 |
Max | 最大值 | Average | 平均值 |
Variance | 样本方差 | VariancePopulation | 全样本方差 |
StdDeviation | 样本标准差 | StdDeviationPopulation | 全样本标准差 |
ModalValue | 众数值统计 | RecordCount | 记录数目 |
参数说明
参数名 | 默认值 | 参数释义 | 参数类型 |
---|---|---|---|
区域面数据集 | 区域面数据集 | FeatureRDD | |
生成网格的宽度 | 生成网格的宽度,如“1 KiloMeter” | JavaDistance | |
生成网格的高度 | 生成网格的高度,如“1 KiloMeter” | JavaDistance | |
统计点数据集 (可选) |
统计点数据集,可选参数,如果设置了统计点数据集,将会用生成的格网面对象对点对象进行属性统计,并把统计结果写到结果格网面对象中 | FeatureRDD | |
属性统计字段信息 (可选) |
属性统计字段信息,输入格式为srcField,Sum,outField,统计方式支持Sum, Min, Max,Average,Variance, VariancePopulation,StdDeviation,StdDeviationPopulation, RecordCount, ModalValue | JavaFieldStat | |
统计点 ID 字段名称 (可选) |
统计点 ID 字段名称 | String | |
是否统计相同ID (可选) |
false | 是否统计相同ID,如果为 false,则对有相同 ID 的点对象将做去重处理,否则,所有的点都将被进行属性统计。 | Boolean |