属性汇总

使用说明

属性汇总用于对属性信息进行分组统计分析。输入数据类型是点、线、面或属性数据。其特点是支持设置多个分组字段,并支持设置多个统计字段。 返回一个只有属性信息的要素数据集(FeatureRDD),包含属性统计的结果和原始分组字段值。

SummarizeAttributes

属性统计字段信息

通过设置属性统计字段信息对格网内的数据进行属性统计,输入格式为srcField,Mode,outField。其中,srcField为输入的数据集中待统计的字段,outField为统计结果字段名,Mode为统计方法,支持的统计方法为:Sum, Min, Max,Average,Variance, VariancePopulation,StdDeviation,StdDeviationPopulation, RecordCount, ModalValue。 如下表所示:

统计方法 含义 统计方法 含义
Sum 求和 Min 最小值
Max 最大值 Average 平均值
Variance 样本方差 VariancePopulation 全样本方差
StdDeviation 样本标准差 StdDeviationPopulation 全样本标准差
ModalValue 众数值统计 RecordCount 记录数目

应用场景如现有某城市管理案卷数据,可以先以城市网格作为分组字段,再以案卷类型为分组字段,统计每个城市网格内,每种案卷的发案数目,涉案金额总和等信息。
在土地利用分析中也应用广泛,例如分析一个地区的土地利用类型变化情况,则需要对叠加后的土地利用数据按不同年份的地类编码字段进行图斑的面积汇总,得到这两个年份地类编码发生变化的面积总量。属性统计字段设置:面积字段名称,Sum,outField;分组字段为地类编码字段名。

参数说明

参数名 默认值 参数释义 参数类型
要素数据集 要素数据集 FeatureRDD
属性统计字段信息
(可选)
属性统计字段信息,输入格式为srcField,Sum,outField,统计方式支持Sum, Min, Max,Average,Variance, VariancePopulation,StdDeviation,StdDeviationPopulation, RecordCount, ModalValue JavaFieldStat
分组字段
(可选)
分组字段,如果为空,将对所有对象进行属性汇总,如果有有效值,则先对对象进行分组后,每组分别进行属性汇总 String