时空地理加权回归分析

时空地理加权回归是经过拓展和改进的地理加权回归，能够分析带有时间属性的空间坐标点，解决了模型总的时空非平稳性问题。

应用场景：

研究城市住宅在时间和空间方面的变化趋势。
研究省域经济发展因素及其时空规律。

功能入口

桌面提供了两个功能入口，如下所述：

在 工具箱 -> 空间统计分析 -> 空间关系建模 ->双击 时空地理加权回归分析 。

主要参数

源数据 ：设置待分析的矢量数据集及所在数据源，支持点、线、面三种类型的数据集。
目标数据源 ：设置结果数据集所在数据源。
结果数据集名 ：设置结果数据集名称。
带宽确定方式 ：设置分析带宽范围的确定方式，支持以下三种确定方式：
- AICc：使用Akaike 信息准则 (AICc)确定带宽范围，适用于不确定距离或相邻要素的数目参数的情况下使用。
- CV：使用交叉验证的方式确定带宽范围，交叉验证在回归系数估计时，不包括回归点本身，即只根据回归点周围的数据点进行回归计算。该值就是每个回归点在交叉验证中得到的估计值与实际值之差，它们的平方和为CV值。适用于不确定距离或相邻要素的数目参数的情况下使用。
- BANDWIDTH：根据固定距离或固定相邻数确定带宽范围，必须设置距离或相邻要素数量的值。
源数据 ：设置待分析的矢量数据集及所在数据源，支持点、线、面三种类型的数据集。
源数据 ：设置待分析的矢量数据集及所在数据源，支持点、线、面三种类型的数据集。
解释字段名称 ：解释变量是自变量，即回归方程里面的X，用于对因变量的值进行建模或预测。例如，我们想研究肥胖的诸多原因，想找到肥胖与收入、健康食品摄入、教育水平等因素是否有关联。在这个例子中，肥胖就是因变量（Y），收入、健康食品摄入、教育水平等这些因素即为解释变量（X）。
核函数类型 ：设置两点之间距离权重的计算函数类型，支持以下五种核函数类型，各函数计算公式中：Wij为点i和点j之间的权重。dij为点i和点j之间的距离，b为带宽范围。
- BISQUARE：二次核函数,如果dij≤b，Wij=(1-(dij/b)^2))^2；否则 Wij=0。
- BOXCAR：盒状核函数,如果dij≤b， Wij=1；否则 W_ij=0。
- GAUSSIAN：高斯核函数,计算公式为：Wij=e^(-((dij/b)^2)/2)。
- TRICUBE：立方体核函数,如果dij≤b， Wij=(1-(dij/b)^3))^3；否则 Wij=0。
建模字段 ：因变量，即待研究、预测的变量，只支持数值字段。
时间字段 ：设置表示时间的字段。
时间间隔单位 ：设置时间间隔单位。时间距离是 TimeField 字段内两条记录的差值，时间距离单位需要统一转换到指定的时间距离单位下，支持 Seconds、Minutes 、Hours 、Days 、Weeks 、Months 、Years，默认值为：Days 。比如：时间间隔为60分钟，则相应的时间距离为， Minutes ：60，Hours ：1，Days ：1/24 等，即单位可以根据需要选择，时间间隔单位越小，时间间隔距离就越大，根据设置的不同核函数，反应到权重中，权重就越大或越小。
带宽类型 ：提供了固定型带宽和可变型带宽两种：
- 固定型带宽：若用户选择的带宽方式是固定距离或相邻数，则需要设置 带宽范围 ，指定一个值为固定距离；若用户选择的带宽方式是AICc或交叉验证，用户不需要指定距离，程序可根据数据计算一个固定距离值。
- 可变型带宽：若用户选择的带宽方式是固定距离或相邻数，则需要设置 相邻数目 ，应用程序会根据回归点与最近相邻点之间的距离作为带宽范围；若用户选择的带宽方式是AICc或交叉验证，用户不需要指定相邻数目，程序可根据数据找到相邻点并计算一个固定距离值。
预测数据集 ：设置要进行预测的数据的数据集及所在数据源。
指定的保存预测数据集结果的数据源 ：设置保存预测数据集结果的数据源。
指定的预测结果数据集名称 ：设置保存预测数据集结果的数据源。
预测数据集中的时间字段 ：设置预测数据集表示时间的字段。
预测数据的字段映射 ：表示模型的解释字段名称和预测数据集字段名称的对应关系，每一个解释字段都应该在预测数据集中有对应的字段。如果没有设置对应关系，则预测数据集中必须存在解释变量数组中所有的字段。

结果输出

设置好以上参数后，单击对话框中的“确定”按钮，即可执行时空地理加权回归分析，结果数据集包含结果属性字段：交叉验证(CVScore)、预测值(Predicted)、回归系数(Intercept、C1/解释字段名)、残差(Residual)、标准误差(StdError)、系数标准误差(SE/Intercept、SE1/解释字段名)、伪t值(TVIntercept、TV1_解释字段名)和Studentised残差(StdResidual)。如下图所示：

交叉验证(CVScore)：该值就是每个回归点在交叉验证中得到的估计值与实际值之差，它们的平方和为CV值。作为一个模型性能指标。
预测值(Predicted)：这些值是时空地理加权回归得到的估计值（或拟合值）。
回归系数(Intercept)：它是时空地理加权回归模型的回归系数，为回归模型的回归截距，表示所有解释变量均为零时因变量的预测值。
回归系数（C1_ _解释字段名）：它是解释字段的回归系数，表示解释变量与因变量之间的关系强度和类型。如果回归系数为正，则解释变量与因变量之间的关系为正向的；反之，则存在负向关系。如果关系很强，则回归系数也相对较大；关系较弱时，则回归系数接近于0。
残差（Residual）：这些是因变量无法解释的部分，是估计值和实际值之差，标准化残差的平均值为0，标准差为1。残差可用于确定模型的拟合程度，残差较小表明模型拟合效果较好，可以解释大部分预测值，说明这个回归方程是有效的。
标准误差(StdError)：估计值的标准误差，用于衡量每个估计值的可靠性。较小的标准误差表明拟合值与实际值的差异程度越小，模型拟合效果越好。
系数标准误差（SEIntercept、SE1 _解释字段名）:这些值用于衡量每个回归系数估计值的可靠性。系数的标准误差与实际系数相比较小时，估计值的可信度会更高。较大的标准误差可能表示存在局部多重共线性问题。
伪t值(TVIntercept、TV1 _解释字段名)：是对各个回归系数的显著性检验。当T值大于临界值时，拒绝零假设，回归系数显著即回归系估计值是可靠的；当T值小于临界值时，则接受零假设，回归系数不显著。
Studentised 残差（StdResidual）：残差和标准误差的比值，该值可用来判断数据是否异常，若数据都在（-2，2）区间内，表明数据具有正态性和方差齐性；若数据超出（-2，2）区间，表明该数据为异常数据，无方差齐性和正态性。

功能入口

主要参数

结果输出

相关主题