查找热点

使用说明

通过将点数据聚集在格网中,进行热点区域的查找。待分析的数据集必须具备ID。返回的结果类型为要素数据集(FeatureRDD)。

查找热点工具会根据事件点疏密程度,计算合适的网格大小,创建网格面数据集,生成的网格面数据集以面网格单元的点计数将作为分析字段执行热点分析。网格会覆盖在输入事件点的上方,并将计算每个面网格单元内的点数目。如果未提供事件点发生区域的边界面数据,则会利用输入事件点数据集范围划分网格,并且会删除不含点的面网格单元,仅会分析剩下的面网格单元;如果提供了边界面数据,则只会保留并分析在边界面数据集范围内的面网格单元。

HotSpotMeshAnalyst1

分析原理

在衡量高低值聚类的时候,通常需要用 General G 指数。在热点分析工具中,z 得分和 p 值都是统计显著性的度量,用于逐要素地判断是否拒绝零假设。置信区间(Gi_Bin字段) +3 到 -3 中的要素反映置信度为 99% 的统计显著性,置信区间 +2 到 -2 中的要素反映置信度为 95% 的统计显著性,置信区间 +1 到 -1 中的要素反映置信度为 90% 的统计显著性;而置信区间 0 中要素的聚类则没有统计学意义。

如果要素的 z 得分高且 p 值小,则表示有一个高值的空间聚类。如果 z 得分低并为负数且 p 值小,则表示有一个低值的空间聚类。z 得分越高(或越低),聚类程度就越大。如果 z 得分接近于零,则表示不存在明显的空间聚类。

应用案例

查找热点用于识别具有统计显著性的高值(热点)和低值(冷点)的空间聚类。它自动聚合事件数据,识别适当的分析范围,并纠正多重测试和空间依赖性。该工具对数据进行查询,以确定用于生成查找冷点和热点结果的设置。

返回结果

查找热点和冷点的结果数据集为一个面数据集,结果数据集中包括z得分(GIZSCORE)、P值(GIPVALUE)、置信区间(GICONFINVL)和 聚合点数目(AGGECOUNT)。结果类型为要素数据集(FeatureRDD)。

  • AGGE_COUNT 统计了对应分析区域包含的点个数。如果要素的z得分高且p值小,则表示有一个高值的空间聚类。如果z分低并为负数且 p 值小,则表示有一个低值的空间聚类。z得分越高(或越低),聚类程度就越大。如果z 得分接近于零,则表示不存在明显的空间聚类。
  • 在具有空间聚集性的前提下,z得分为负值,则表示该处为一个冷点区域,对应的 GICONFINVL 字段为负数;z得分为正值,则表示该处为一个热点区域,对应的 GICONFINVL 字段为正数。
  • GICONFINVL 字段会识别统计显著性的热点和冷点。GICONFINVL 为+3 和-3 的要素反映置信度为 99%的统计显著性;GICONFINVL 为+2 和-2 的要素反映置信度为 95% 的统计显著性;GiConfInvl 为+1 和-1 的要素反映置信度为 90%的统计显著性;而GI_CONFINVL 为 0 的要素的聚类则没有统计意义。

如下表所示:

z得分(标准差) P值(概率) 置信度 GI_CONFINVL值
< -1.65 或 > 1.65 < 0.10 90% -1 , 1
< -1.96 或 > 1.96 < 0.05 95% -2 , 2
< -2.58 或 > 2.58 < 0.01 99% -3 , 3

参数说明

参数名 默认值 参数释义 参数类型
被分析的点数据 被分析的点数据 FeatureRDD
格网类型 格网类型,支持方形格网和蜂窝(六边形)格网,Grid、Hexagon JavaMeshType
网格大小 网格大小 JavaDistance
搜索距离 搜索距离 JavaDistance
时间周期对象
(可选)
时间周期对象 JavaTimeCycle
要素对象的开始时间字段
(可选)
要素对象的开始时间字段,如果不指定开始时间字段,将会在要素数据集中查找可用的时间字段 String
要素对象的终止时间字段
(可选)
要素对象的终止时间字段,如果不指定终止时间字段,将会在要素数据集中查找可用的时间字段 String