空间计量方法模型
空间经济计量模型主要解决回归模型中复杂的空间相互作用与空间依存性结构问题(Anselin,1988)。长期以来,在主流的经济学理论中,空间事物无关联及均质性假定的局限,以及普遍使用忽视空间效应的普通最小二乘法 (OLS)进行模型估计,使得在实际应用中往往存在模型的设定偏差问题,进而导致经济学研究得出的各种结果和推论不够完整、科学,缺乏应有的解释力(吴玉鸣,2007)。空间计量经济学 (Anselin,1988)理论认为一个地区空间单元上的某种经济地理现象或某一属性值与邻近地区空间单元上同一现象或属性值是相关的。几乎所有的空间数据都具有空间依赖性或空间自相关性的特征,空间依赖的存在打破了大多数经典统计和计量分析中相互独立的基本假设。也就是说,各区域之间的数据存在与时间序列相关、相对应的空间相关。
根据空间计量经济学方法原理,空间计量分析的思路如下:首先采用空间统计分析Moran指数法检验因变量是否存在空间自相关性;如果存在空间自相关性,则以空间计量经济学理论方法为基础,建立空间计量经济模型,进行空间计量估计和检验。
1.空间自相关性
检验空间相关性存在与否,实际应用研究中常常使用空间自相关指数Moran’I,其计算公式如下所示:
nn
Moran,IWi1j1ij(YiY)(YjY)
nn (3) S2Wij
i1j1
1n1n
其中,S(YiY);YYi,Yi表示第i地区的观测值;n为地区总ni1ni12
数(本文为28);Wij为二进制的邻接空间权值矩阵,表示其中的任一元素,采用邻接标准或距离标准,其目的是定义空间对象的相互邻接关系,便于把地理信息系统(GIS)数据库中的有关属性放到所研究的地理空间上来对比。一般邻接标准的Wij为:
1当区域i和区域j相邻; Wij0当区域i和区域j不相邻;
式中i1,2,,n;j1,2,,m;mn或nm。习惯上,令W的所有对角线元素Wii=0。
Mroan’s I指数可看作各地区观测值的乘积和,其取值范围在-1到1之间,若各地区间经济行为为空间正相关,其数值应当较大;负相关则较小。具体到空间依赖性问题上,当目标区域数据在空间区位上相似的同时也有相似的属性值时,
空间模式整体上就显示出正的空间自相关性;而当在空间上邻接的目标区域数据不同寻常地具有不相似的属性值时,就呈现为负的空间自相关性;零空间自相关性出现在当属性值的分布与区位数据的分布相互独立时。
根据Mroan’s I指数的计算结果,可采用正态分布假设进行检验n个区域是否存在空间自相关关系,其标准化形式为:
Z(d)Moran's IE(I) (4) (I)
根据空间数据的分布可以计算正态分布Moran’I指数的期望值及方差:
En(I)
1n1
2n2w1nw23w02VARn(I)E(I)n22w0(n1)
nn (5) n1nn2 式中,w0wij,w1(wijwji),w2(wi.wj.),wi.和wj.分2i1j1i1j1i12
别为空间权值矩阵中i行和j列之和。
公式(4)、(5)可以用于检验n个区域是否存在空间自相关关系。如果Mroan’s I指数的正态统计量的Z值大于正态分布函数在0.05水平下的临界值
1.96,表明在空间分布上具有明显的正向相关关系,正的空间相关代表相邻地区的类似特征值出现集群趋势。
2.空间计量模型及估计技术
空间计量经济学模型有多种类型,本文所要用到的空间计量模型主要是纳入了空间效应(空间相关和空间差异),适用于截面数据的空间常系数回归模型,包括空间滞后模型(Spatial Lag Model,SLM)与空间误差模型(Spatial Error Model,SEM)两种。
(1)空间滞后模型(SLM)
空间滞后模型主要探讨各变量在一个地区是否有扩散现象(溢出效应),其表达式为:
YWyX (6)
式中,Y为因变量;X为nk的外生解释变量矩阵;为空间回归关系数;反映了样本观测值中的空间依赖作用,即相邻区域的观测值Wy对本地区观察值y的影响方向和程度;W为nn阶的空间权值矩阵,一般用邻接矩阵(Contiguity
参数反映了自变量X对因变量Y的影响,空间滞后因变量Wy是一内生变Matrix);Wy为空间滞后因变量,为随机误差项向量。 量,反映了空间距离对区域行为的作用。区域行为受到文化环境与空间距离有关的迁移成本的影响,具有很强的地域性。
(2)空间误差模型(SEM)
空间误差模型的数学表达式为:
YX (7)
W (8)
式中,为随机误差项向量,为n1的截面因变量向量的空间误差系数,为正态分布的随机误差向量。
参数衡量了样本观察值中的空间依赖作用,即相邻地区的观察值有Y对本地区观察值Y的影响方向和程度,参数反映了自变量X对因变量Y的影响。SEM 的空间依赖作用存在于扰动误差项之中,度量了邻接地区关于因变量的误差冲击对本地区观察值的影响程度。
(3)估计技术
对于上述两种模型的估计如果仍然采用最小二乘法,系数估计值会有偏或者无效,需要通过工具变量法、极大似然法或广义最小二乘估计等其他方法来进行估计。本文采用了Anselin(1988)的建议,采用极大似然法估计SEM和SLM的参数。
3.空间自相关检验及SLM、SEM的选择
判断空间相关性是否存在,以及SLM和SEM哪个模型更恰当,一般可通过包括Moran’s I检验、两个拉格朗日乘数(Lagrange Multiplier)形式LMERR、LMLAG和稳健(Robust)的R-LMERR、R-LMLAG等来实现。
由于事先无法根据先验经验推断在SLM和SEM模型中是否存在空间依赖性,有必要构建一种判别准则,以决定哪种空间模型更加符合客观实际。Anselin 等(2004)提出了如下判别准则:如果在空间依赖性的检验中发现,LMLAG较之LMERR在统计上更加显著,且R-LMLAG显著而R-LMERR不显著,则可以断定适合的模型是空间滞后模型;相反,如果LMERR比LMLAG在统计上更加显著,且R-LMERR显著而R-LMLAG不显著,则可以断定空间误差模型是恰当的模型。除了拟合优度R2检验以外,常用的检验准则还有:自然对数似然函数值(Log likelihood,LogL),似然比率(Likelihood Ratio,LR)、赤池信息准则(Akaike information criterion,AIC),施瓦茨准则(Schwartz criterion,SC)。对数似然值越大,AIC和SC值越小,模型拟合效果越好。这几个指标也用来比较OLS估计的经典线性回归模型和SLM、SEM,似然值的自然对数最大的模型最好。
空间计量方法模型
空间经济计量模型主要解决回归模型中复杂的空间相互作用与空间依存性结构问题(Anselin,1988)。长期以来,在主流的经济学理论中,空间事物无关联及均质性假定的局限,以及普遍使用忽视空间效应的普通最小二乘法 (OLS)进行模型估计,使得在实际应用中往往存在模型的设定偏差问题,进而导致经济学研究得出的各种结果和推论不够完整、科学,缺乏应有的解释力(吴玉鸣,2007)。空间计量经济学 (Anselin,1988)理论认为一个地区空间单元上的某种经济地理现象或某一属性值与邻近地区空间单元上同一现象或属性值是相关的。几乎所有的空间数据都具有空间依赖性或空间自相关性的特征,空间依赖的存在打破了大多数经典统计和计量分析中相互独立的基本假设。也就是说,各区域之间的数据存在与时间序列相关、相对应的空间相关。
根据空间计量经济学方法原理,空间计量分析的思路如下:首先采用空间统计分析Moran指数法检验因变量是否存在空间自相关性;如果存在空间自相关性,则以空间计量经济学理论方法为基础,建立空间计量经济模型,进行空间计量估计和检验。
1.空间自相关性
检验空间相关性存在与否,实际应用研究中常常使用空间自相关指数Moran’I,其计算公式如下所示:
nn
Moran,IWi1j1ij(YiY)(YjY)
nn (3) S2Wij
i1j1
1n1n
其中,S(YiY);YYi,Yi表示第i地区的观测值;n为地区总ni1ni12
数(本文为28);Wij为二进制的邻接空间权值矩阵,表示其中的任一元素,采用邻接标准或距离标准,其目的是定义空间对象的相互邻接关系,便于把地理信息系统(GIS)数据库中的有关属性放到所研究的地理空间上来对比。一般邻接标准的Wij为:
1当区域i和区域j相邻; Wij0当区域i和区域j不相邻;
式中i1,2,,n;j1,2,,m;mn或nm。习惯上,令W的所有对角线元素Wii=0。
Mroan’s I指数可看作各地区观测值的乘积和,其取值范围在-1到1之间,若各地区间经济行为为空间正相关,其数值应当较大;负相关则较小。具体到空间依赖性问题上,当目标区域数据在空间区位上相似的同时也有相似的属性值时,
空间模式整体上就显示出正的空间自相关性;而当在空间上邻接的目标区域数据不同寻常地具有不相似的属性值时,就呈现为负的空间自相关性;零空间自相关性出现在当属性值的分布与区位数据的分布相互独立时。
根据Mroan’s I指数的计算结果,可采用正态分布假设进行检验n个区域是否存在空间自相关关系,其标准化形式为:
Z(d)Moran's IE(I) (4) (I)
根据空间数据的分布可以计算正态分布Moran’I指数的期望值及方差:
En(I)
1n1
2n2w1nw23w02VARn(I)E(I)n22w0(n1)
nn (5) n1nn2 式中,w0wij,w1(wijwji),w2(wi.wj.),wi.和wj.分2i1j1i1j1i12
别为空间权值矩阵中i行和j列之和。
公式(4)、(5)可以用于检验n个区域是否存在空间自相关关系。如果Mroan’s I指数的正态统计量的Z值大于正态分布函数在0.05水平下的临界值
1.96,表明在空间分布上具有明显的正向相关关系,正的空间相关代表相邻地区的类似特征值出现集群趋势。
2.空间计量模型及估计技术
空间计量经济学模型有多种类型,本文所要用到的空间计量模型主要是纳入了空间效应(空间相关和空间差异),适用于截面数据的空间常系数回归模型,包括空间滞后模型(Spatial Lag Model,SLM)与空间误差模型(Spatial Error Model,SEM)两种。
(1)空间滞后模型(SLM)
空间滞后模型主要探讨各变量在一个地区是否有扩散现象(溢出效应),其表达式为:
YWyX (6)
式中,Y为因变量;X为nk的外生解释变量矩阵;为空间回归关系数;反映了样本观测值中的空间依赖作用,即相邻区域的观测值Wy对本地区观察值y的影响方向和程度;W为nn阶的空间权值矩阵,一般用邻接矩阵(Contiguity
参数反映了自变量X对因变量Y的影响,空间滞后因变量Wy是一内生变Matrix);Wy为空间滞后因变量,为随机误差项向量。 量,反映了空间距离对区域行为的作用。区域行为受到文化环境与空间距离有关的迁移成本的影响,具有很强的地域性。
(2)空间误差模型(SEM)
空间误差模型的数学表达式为:
YX (7)
W (8)
式中,为随机误差项向量,为n1的截面因变量向量的空间误差系数,为正态分布的随机误差向量。
参数衡量了样本观察值中的空间依赖作用,即相邻地区的观察值有Y对本地区观察值Y的影响方向和程度,参数反映了自变量X对因变量Y的影响。SEM 的空间依赖作用存在于扰动误差项之中,度量了邻接地区关于因变量的误差冲击对本地区观察值的影响程度。
(3)估计技术
对于上述两种模型的估计如果仍然采用最小二乘法,系数估计值会有偏或者无效,需要通过工具变量法、极大似然法或广义最小二乘估计等其他方法来进行估计。本文采用了Anselin(1988)的建议,采用极大似然法估计SEM和SLM的参数。
3.空间自相关检验及SLM、SEM的选择
判断空间相关性是否存在,以及SLM和SEM哪个模型更恰当,一般可通过包括Moran’s I检验、两个拉格朗日乘数(Lagrange Multiplier)形式LMERR、LMLAG和稳健(Robust)的R-LMERR、R-LMLAG等来实现。
由于事先无法根据先验经验推断在SLM和SEM模型中是否存在空间依赖性,有必要构建一种判别准则,以决定哪种空间模型更加符合客观实际。Anselin 等(2004)提出了如下判别准则:如果在空间依赖性的检验中发现,LMLAG较之LMERR在统计上更加显著,且R-LMLAG显著而R-LMERR不显著,则可以断定适合的模型是空间滞后模型;相反,如果LMERR比LMLAG在统计上更加显著,且R-LMERR显著而R-LMLAG不显著,则可以断定空间误差模型是恰当的模型。除了拟合优度R2检验以外,常用的检验准则还有:自然对数似然函数值(Log likelihood,LogL),似然比率(Likelihood Ratio,LR)、赤池信息准则(Akaike information criterion,AIC),施瓦茨准则(Schwartz criterion,SC)。对数似然值越大,AIC和SC值越小,模型拟合效果越好。这几个指标也用来比较OLS估计的经典线性回归模型和SLM、SEM,似然值的自然对数最大的模型最好。