空间统计及计量方法学习笔记

空间统计及计量方法学习笔记

1. 背景及文献综述 ....................................................... 2

2. 空间效应 ............................................................. 4

2.1. 空间相关性: .................................................... 4

2.2. 空间异质性 ...................................................... 5

3. 空间自相关性分析 ..................................................... 5

3.1. 空间权重矩阵 .................................................... 6

3.2. 空间自相关性检验 ................................................ 7

4. 空间计量经济模型的建立 .............................................. 10

4.1. 空间横截面数据模型 ............................................. 10

4.1.1. 空间自回归模型(SLM ) .................................... 11

4.1.2. 空间误差模型(SEM ) ...................................... 12

4.1.3. 变系数地理加权回归模型(GWR ) ............................ 13

4.2. 空间面板数据模型 ............................................... 14

4.2.1. 空间回归面板计量模型 ..................................... 14

4.2.2. 空间误差面板计量模型 ..................................... 14

5. 学习总结 ............................................................ 15

1. 背景及文献综述

空间计量经济学是在基于对空间效应恰当设定的基础上,对于空间经济计量模型进行一系列的设定、估计、检验与预测的计量经济学方法。空间计量经济学由美国经济学家Paelinck 和Klaassen 首次提出,他们认为空间计量经济学的研究领域主要包括:

- 计量模型中的空间相关性问题

- 空间关系的非对称性问题

- 空间距离解释因子问题

- 事前事后联系的差异问题

- 空间建模问题

空间计量经济学着重处理计量经济学模型中由于变量的空间特性而导致的一些特殊问题,例如当模型设定中存在空间相关性问题,就会违反经典的

Markov-Gausse 变量之间相互独立的假设,从而导致传统的计量经济学估计方法与检验方法失效。这就要求发展新的空间计量经济模型设定、估计与检验方法,以使计量经济模型可以有效地处理空间效应问题。

近年来空间统计分析技术已经在广泛的领域内得到应用,国外学者已将空间统计分析方法和理念广泛运用到经济学研究。例如Chakrabarti 1(2003)运用空间统计和空间计量的工具对FDI 的空间分布进行了理论分析,为我国学者之后研究对外贸易的空间集聚效应提供了参考;Ping 2等(2004)利用全局和局部的自相关统计方法对棉花产量的空间相关性及其模式变化进行了研究;Gallo 和Ertur 3(2005)对1980-1995年期间对138个欧洲地区人均GDP 的时空动态变化进行了研究,认为存在全局和局部空间自相关,地区分布具有空间异质性和不均等性;Cabrer-Borras 4等(2007)分析了西班牙地区的创新空间模式、地区的相互依赖性及其演进,发现当地能力、空间创新溢出都与当地的创新有关。

与国外学者相比,国内学者将空间统计及计量的方法应用到经济研究还为数不多。胡健(2012)5就空间计量经济学理论体系进行了总结,重点对空间计量经济模型的设立包括空间横截面数据模型、空间面板数据模型以及空间离散数据模型进行讨论,并给出对模型参数估计方法如,最大似然估计法,两阶段最小二

乘法和矩估计法等进行分析,并提出使用Moran´s I及LM/RS对模型进行检验,最后展望了该理论研究未来的发展趋势。但文章中对于空间面板数据模型介绍简略,并且也没有给出相应的参数估计及模型检验方法。

李刚(2009)6使用空间统计分析方法,对2007年美国次贷危机和1997年东南亚金融危机的空间集聚性和传染路径进行了实证分析,主要采用空间回归面板模型及MoranI´指数检验发现,客观的地缘关系是金融危机传染路径,政治经济条件过去不是金融危机的传染路径,而目前在金融危机中所担任的角色也越来越明显;贸易关系和资本项目也是金融危机传染的重要路径。但对于在传染路径不只一个时,究竟哪一条传染路径是最重要的以及各种传染路径之间的关系还有待研究。

杜小娟(2010)7、白晶(2010)8利用空间统计的知识,通过Moran`指数及LISA 的检验,分析了地区区域经济间的相关性,但都没有建立空间计量模型进行影响因素间的分析。

张锦宗(2009)9利用基于时间序列的历史数据采用改进了的BP 网络,以地市行政区域为研究单元,对山东省未来人口进行预测,然后通过Moran`指数进行全局及局部自相关检验,对未来人口空间分布模式进行预测分析。

文骁飞(2011)10提出将空间统计分析技术与GIS 应用于区域经济分析,可以揭示区域经济发展的空间自相关和空间集聚特征,但仅应用了Moran 全局及局部检验,没有引入空间计量模型的建立。

吴拥政(2009)11在传统同一空间尺度实证研究的基础上,使用空间面板数据模型,在空间与时间整合的维度上揭示金融发展与经济增长的关系,探索经济金融活动的空间自相关性与空间集群性。结果表明:中部六省的金融发展与经济增长的空间依赖关系是统计显著的,并为深入进行整合时空特征的区域金融与经济增长关系的统计与计量建模分析提供了有利的证据支持。

魏浩(2011)12利用空间统计分析和空间计量分析方法,对我国部分省区市对外贸易的空间集聚效应及其影响因素进行了实证分析。首先运用空间统计分析Moran`s I指数对中国1978-2007年间各省份对外贸易的空间相关性进行分析,形象地揭示出改革开放以来我国各省份对外贸易的地区分布情况,然后分别运用

SAR 和SEM 两种空间计量分析方法研究了影响我国各地区对外贸易发展的因素及其空间影响效应。

张红历(2010)13、任家强(2010)14通过使用Moran`s I指数对所选数据所进行的全局及局域自相关检验,分别对对 1998-2007年间西部12省市64个主要地级市和2008年辽宁省44个县城的经济增长水平的差异,空间分布特征及其演变进行了分析,通过研究各样本经济增长的空间相关性和空间异质性特征有了深入认识,揭示地区政策实施后区域经济空间联系的结构和演变。

田成诗(2012)15采用Moran 散点图和LISA 散点图对我国省域商品房价格进行了分析,得出我国省域商品房价格具有空间溢出效应,存在显著的空间自相关,表现出空间集聚特征

2. 空间效应

空间计量经济学与传统计量经济学的最大区别就是引入了空间效应,Anselin 将空间效应区分为空间相关性和空间异质性

2.1. 空间相关性:

空间相关性是指空间中各变量之间存在相互影响。空间相关性可能会由多种因素引起,例如,空间样本的简单线性化、空间样本的简单归并、空间外部性以及空间溢出效应等。空间相关性可以用数学公式表示为:

y i =f (yj ) , (j=1,2,...,n,j i)

空间相关性主要表现在两个方面:

- 空间实质相关性:由于空间外部性、邻近效应等因素造成的计量模型中解释

变量的空间相关性。

处理及方法:需要在模型的设定方法上做相应改进。可以用空间自回归模型分析

- 空间扰动相关性:由于忽视了一定的空间影响,例如存在空间影响的区域没

有被考虑在模型中,造成的模型残差存在空间相关性。

处理及方法:在不考虑空间结构的情况下,可以运用传统的处理异方差性、样本截面相关性等问题的方法进行解决;当需要考虑空间结构时,就要对相

应的空间相关性进行特殊处理。对于空间结构进行处理存在的困难是,如何正确判定空间结构的存在形式,并且正确的设定模型。可以用空间误差模型分析

2.2. 空间异质性

空间异质性主要是指空间中各变量由于所处的区位位臵不同而存在的差异性。在区域分析中,中心-外围效应等因素的存在导致了空间异质性的产生。 空间差异性可以用模型表示为:

y i =Xβi +εi

空间差异性主要反映在参数βi 之上,当存在空间差异性时,参数βi 在个空间单元上有所变异,而若βi 对所有空间单元都相等时,则个空间体之间便不存在空间差异性。

在空间计量经济模型中,空间异质性主要反映在模型结构性的差异上,它可以用传统计量经济学的基本方法进行处理,例如面板数据模型的变系数方法、随机系数方法以及系数扩展方法等,也可以直接通过面板数据模型的方差协方差矩阵来处理空间异质性的问题。

在处理空间异质性时,主要存在的问题是空间计量经济模型结构性差异可能由于空间相关性引起,也可能是由于空间异质性引起,而现有的技术对于区分这两种空间效应仍然显得十分不足。

3. 空间自相关性分析

根据空间统计和空间计量经济学原理方法,进行空间分析的思路是:首先采用空间统计分析指数检验变量间是否存在空间自相关性,如果存在,则需要在空间计量经济学理论方法支持下,将空间影响纳入其中,建立空间计量经济模型,进行空间计量估计和检验。

所以进行空间分析的主要任务是对变量间空间自相关存在性的检验,如何确定空间自相关性的存在的标准步骤是:

空间权重矩阵的构建

● 空间自相关程度的测度

● 空间自相关的检验

3.1. 空间权重矩阵

空间权重矩阵W= (Wij ) nxn 主要用于表达空间的相互依赖性,它是外生信息。W 中对角线上的元素被设定为0,而W ij (i j )表示区域i 和区域j 空间上的紧密程度,为了减少或者消除区域间的外生影响,权重矩阵在进行其他运算前通常被标准化,矩阵W 的行和为1,标准化意味着每一个矩阵元素仅仅表示邻接空间的加权平均数。

空间权重矩阵W 由多种选择的方法,一般可将现实的地理空间关联或者经济联系考虑到模型中来。最主要的方式有以下两种:邻近指标和距离指标。具体方法解释如下:

(1)基于邻近概念的空间权重矩阵

这种方法采用邻接标准,其目的是定义空间对象的邻接关系。一般相邻标准的W ij 为

Wij= 1 区域i 和j 相邻; 0 区域i 和j 不相邻

基于邻近概念的空间权重矩阵又有一阶邻近矩阵和高阶邻近矩阵之分。

(2)基于距离概念的空间权重矩阵

这种方法采用距离标准,一般基于距离标准的W ij 为

Wij= 1 区域i 和j 在距离d 之内; 0 区域i 和j 在距离d 之外;

这种方法实质上是假定空间相互作用的强度与区域距离之间关系密切,这种方法简单方便,实践中经常使用。这种方法的关键是要预先设定一个门槛距离,若在门槛距离之内,则认为区域之间存在关联,若超过门槛距离,则区域间的没有相互作用。

(3)基于经济社会现象的空间权重矩阵

在基于距离概念的空间权重矩阵中,除了使用真实的地理距离计算外,还包括经济和社会因素的更为复杂的权重矩阵设定方法。经济距离矩阵的设定需满足有意义、有限性和非负性三大条件。经济距离矩阵可以依据区域间交通网密度、贸易流动量、通讯量等设定。

3.2. 空间自相关性检验

将空间效应考虑进来以后,在建立计量模型进行分析研究之前,我们必须先进行空间相关性的检验,为后面分析采用空间经济计量方法做好准备。

在计算和检验区域经济空间相关存在性时, 空间统计学较常使用到两个类似于相关系数的统计量:Moran(1950)提出的空间相关指数Moran`I和Geary(1954)所定义的Gearyc 。尽管任一统计指标都能基本上获得空间自相关的特征,而且在许多分析中两者大致上可以相互替代,但与Gearyc 相比,Moran`I不易受偏离正态分布的影响,因此在大多数应用中,Moran`I更为常用。Moran`I在功用上大致可以分为两大类:全域空间自相关Moran`I和局域空间自相关Moran`I。

(1)全域空间自相关Moran`I指数

全域空间自相关是从区域空间的整体上刻画区域经济活动分布的集群状况,Cliff 和Ord (1981)给出的全局空间自相关度量指标为:

n j−Y n1i−Y Yi=1 j=1wij YMoran`I=∗ i−Y i=1j=1iji=1Yn ni=1Yi

n =式中:YY i 空间第i 单元的属性值,w if (i,j=1,2,…,n) 是空间权重矩阵

W 的元素,空间权重矩阵可以基于以上所说的三种标准进行构建。

Moran`I系数反映出孔内的区域单元的属性值的相关程度。与相关系数一样,Moran`I系数的取值区间为[-1,1]。符号代表着相似程度的方向性,而绝对值大小意味着关联的强弱性。通常认为两个空间单元的距离越近,他们之间的关联性越强,表现为属性值的正相关或负相关。正相关和负相关可通过空间相关系数Moran`I散点图的方式坐标图在四大象限呈现。

Moran 散点图的四个象限分别对应区域单元与其邻居之间四种类型的局部空间联系形式,第一、三象限代表正的空间联系,第二、四象限代表负的空间联系。

其中第一象限代表了高观测值的区域单元为同是高值的区域所包围的空间联系形式(高-高);第二象限代表了低观测值的区域单元为高值的区域所包围的空间联系形式(低-高);第三象限代表了低观测值的区域单元为同是低值的区域所包围的空间联系形式(低-低);第四象限代表了高观测值的区域单元为低值的区域所包围的空间联系形式(高-低)。与局部Moran 指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、高值和低值、低值和低值、低值和高值之中的哪种空间联系形式。并且对应于Moran 散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。

对于Moran`I指数的计算结果,可以分析采用渐进正态分布和随机分布两种假设进行检验,以评价区域间是否存在空间自相关关系。

检验的标准化形式为:

Moran′I−E(I) Z d =根据地理空间数据的分布情况,可以计算出在正态假设条件下,全域空间自相关Moran`I指数的期望值E N (I)、方差Var (I )分别为:

EN(I)=−1 (n−1)

VarN I =12 22 nw−nw+3w−E(I) 120N0在随机假设条件下,Moran`I的期望值E R (I )、Var R (I )分别为:

ER(I)=−1 (n−1)

2 2n (n2−3n+3) w1−nw2+3w0−K( n2−n w1−2nw2+6w02VarR I =−ER(I) w0n−1(n−2)(n−3)

nn22其中,w0= nw1= nw2= ni=1 j=1wij ,i=1 j=1(wij+wji ) ,i=1(wi∙+wj∙) , 1

2

K = ) 4n n(yi−y

n ) 2 i=1(yi−y, wi∙和wj∙分别为空间权重矩阵中i 行和j 列之和。

(2)局域空间自相关Moran`I指数

全域空间自相关指数呈现的只是区域空间整体上经济活动分布的集群状况,而对存在于全域地理范围内不同区域的空间关联模式却无能为力,因此全域空间自相关Moran`I指数在有些条件难以反映局部区域的情况,有时甚至“颠倒”区

域空间关联的正确模式,因此我们还需要新的指标去揭示局部区域之间空间关联模式的证据,此时通常采用局域空间关联指标来分析空间关联的局域特性。

局域空间自相关Moran`I指数作为空间探索技术的重要组成部分,其功能如下:其一为每个观测单元周围的局部空间集聚状况作显著性评估;其二可以揭示出对全局联系影响大的样本单元以及不同的空间联系形式。

根据Anselin(1995)的定义,一般而言,局域空间自相关指标需要满足两个条件:每个区域空间观测单元的空间关联局域指标描述了围绕该区域单元显著的相似值空间单元之间空间集群程度;所有空间单元的空间关联局域指标之和与对应的全域空间关联指标成比例。

在满足了以上两个条件前提下,区域局域空间自相关Moran`I指数的计算公式可以定义为:

Xi−X′ ), (i=1,2, …, n) MoranI= Wij(Xj−Xi=1n

12 ) 2, S= (Xi−Xi=1n =X Xi 其中符号含义与全局Moran`I指数相同,因局部Moran`I指数由全局指数各分量的n 倍定义,取值可以超出一1与1间的范围。该指标形成的正态分布统计量表明相邻单元值的彼此关联情况,可以揭示空间聚集的重要关联点。故局域空间自相关Moran`I指数是区域空间单元与其相邻近观测单元观测值加权平均的乘积。正的Moran`I值表示该区域单元周围相似值的空间集群,负的Moran`I值表示非相似值之间的空间集群。

对于局域空间自相关Moran`I指数的计算结果,我们同样可以采用标准化形 式对局部空间相关性进行检验:

Moran′I−E(I) Z d = 在随机假设条件下,Moran`I的期望值E R (I )、Var R (I )分别为:

n

EN I =− wij (n−1)

i=1

VarN I =wi 2 (n−b2) wi kℎ (2b2−n) 2+−EN(I) 2式中,b2=m4 m2,m 2和m 4分别表示二阶样本距和四阶样本距,

nn2wi 2 = nj, j≠iwif,wi kℎ = k, k≠i ℎ, ℎ≠iwikwjℎ

(3) LISA

若Moran 散点图没有给出显著性水平的指标,因此需要计算LISA ,来进一步探究这些空间分析的结果.

LISA 可以揭示某一区域单元的属性值与其空间邻近区域单元属性值之间的相似性或相关性,识别空间集聚和空间孤立,探测空间异质等,LISA 包括局部Moran`指数和局部Geary 指数

4. 空间计量经济模型的建立

目前虽然理论上都可以通过空间计量经济学的建模方法对空间效应进行理论分析,但一方面从计量经济学处理的难易程度考虑,不是所有的模型都适合将空间效应直接引入;另一方面,由于在部分模型中,其原有的设定形式已经反映了经济变量的空间结构,所以不需要再进行特别的建模处理。目前主流的空间计量经济模型包括空间横截面数据模型、空间面板数据模型和离散数据的空间计量模型,其他的模型姓社,诸如空间动态模型、空间非线性模型等,其模型估计方法和检验方法正在发展过程中。

4.1. 空间横截面数据模型

在空间横截面数据模型中,空间相关性可以通过两种方法处理,一是在回归模型中引入空间滞后相关变量;二是在回归模型中加入残差结构特殊形式。空间相关性被处理成空间滞后变量形式就会形成空间滞后模型,适于测度空间互动关系的存在性及强度;空间相关性被处理成回归误差项就称为空间误差模型,适于处理空间自回归的偏差影响。

4.1.1. 空间自回归模型(SLM )

空间自回归模型主要是探讨各变量在区域内是否存在扩散现象。它以空间自回归依赖变量外加外生变量的形式构成,其模型表达式为:

y = ρW y + Xβ + ε

式中:y 为因变量;X 为n ⨯k 的外生解释变量矩阵;ρ为空间自回归系数,反映了样本观测值中的空间依赖作用,即相邻区域的观测值W y 对本地区观测值y 的影响方向和程度,W 为空间权重矩阵,参数β反映了自变量X 对因变量y 的影响。

这种建模方法表明当经济变量存在空间相关性时,仅仅考虑其自身的解释变量X 不足以很好的估计和预测该变量的变化趋势。例如一个区域的技术创新能力不仅受自身技术投入水平的影响,还会受到邻近区域溢出水平的影响,因此测度该区域技术创新能力时,必须加入表示空间滞后的变量W y 。

空间自回归变量W y 是一内生变量,空间自回归项W y 与干扰项ε 相关,甚至当ε 是零均值误差也如此,这可以从方程的简化式中看出:

y=(1−ρW) Xβ+(1−ρW) −1−1ε

鉴于空间自回归模型中W y 的内生性,因此模型估计若采用最小二乘法

(OLS ),系数估计值必将有偏或者无效。所以一般常用Anselin (1988)提议的极大似然估计法来估计空间自回归模型的参数。其过程如下:

; (1) 对模型y = X β0 + ε0 作OLS 估计,求出β0

; (2) 对模型W y = X βL + εL 作OLS 估计,求出βL

X 和e L = Wy -β X (3) 分别计算上述两个OLS 估计的残差e 0= y-β0L

(4) 由e 0和e L 值,通过对数极大似然函数L c 得到参数ρ的估计值ρ :

e0−ρeL +ln I−ρW Lc= −n 2 ln (n 1) e0−ρeL ´

(5) 空间自回归模型的最大对数似然函数为:

lnL=−2ln 2π −2lnσ2+ln I−ρW −2σ Y−ρWY−Xβ ′(Y−ρWY−Xβ)

NN1

和σ由ρ 值及上式的最大似然函数可以计算出β ε2:

2 = β−ρβ β ,σ eL ′ e0−ρ eL ε= 1 n e0−ρ0L

4.1.2. 空间误差模型(SEM )

当误差项遵循一个空间自回归过程,即每个位臵上的随机误差为所有其他位臵上的随机误差的函数,我们可以利用空间误差模型探讨邻近地区关于因变量的误差冲击对本地区观察值的影响程度。Cliff (1971)认为误差项之间的空间自回归可能意味着:自变量和因变量之间存在着非线性关系;回归模型中遗漏了一个或多个回归自变量;回归模型应该由于一个自回归结构。空间误差模型的表达式如下:

y =Xβ + ε ε=λW+με式中:符号λ 表示自回归参数,W 是空间权重矩阵,假定μ为标准正态分布的随机误差向量。这个模型结合了一个标准回归模型和一个误差项ε 中的空间自回归模型,同时假设误差项μ 满足条件E(μ) =0、Cov(μ) =σ2I,即方差固定且误差项是不相关的。由于误差项ε 的均值为0,不管λ 的数值如何,因变量y 的均值不受空间误差相关的影响。

由上述公式可得:ε=(I−λW) −1μ ,因此:

(I−λW) y=(I−λW) Xβ+μ

即:y =λWy+Xβ−λWXβ+μ

可以看出,空间误差模型就转化为含有外生空间滞后变量WX的空间滞后模型,一般把WX成为空间之后权重矩阵。

对于空间误差模型,Anselin(1988)16同样建议采用极大似然估计空间误差模型(SEM)的参数,其估计过程如下:

; (1) 对模型y =Xβ +μ 作OLS 估计,得到β 的无偏估计量β

X; (2) 计算OLS 估计的残差为e =y −β

; (3) 由e 值,通过对数极大似然函数L c 得到参数λ的估计值λ

I−λW ´ I−λW e n +ln I−λW Lc= −n 2 1+ln2π −(n 2) ln e´

(4) 空间误差模型的最大对数似然函数为:

lnL=−2ln 2π −2lnσ2+ln I−λW −2σ Y−Xβ ′ I−λW ´(Y−Xβ) I−λW NN1

值和空间误差模型的最大对数似然函数计算其余参数的估计值, 由λ

We ′ e−λ We σ ε2= 1 n e0−λ

在具体运用空间模型的过程中,究竟选择空间误差模型还是选择空间回归模型,要在测试、诊断的过程中,逐步确定。Anselinhe Florax(1995)提出了如下的判别准则:首先,运用OLS 方法对模型进行回归,并进行相应拉格朗日检验。如果空间回归模型和空间误差模型都不显著,则保持OLS 结果;如果空间回归模型和空间误差模型都显著,则继续运行稳健性检验了如果Robust LM- Error显著,则运行空间误差模型;如果Robust LM-Lag显著,则运行空间回归模型。

4.1.3. 变系数地理加权回归模型(GWR )

常系数空间回归模型可能忽略了一个问题,即:各种数据在不同空间上表现的复杂性、和变异性。如果数据在空间上表现平稳,则OLS 全局分析方法完全适用,而若数据在空间上表现出了不平稳特性,则可能需要采用局部分析技术来应对。在经济社会现实中,空间数据的复杂特点使得经济地理解释变量对被解释变量的影响在不同区域之间多数是不稳态性,此时,利用常系数空间回归模型估计得到的参数可能是有偏的、无效的,因此,在分析此类问题时,假定不同区域之间的经济行为在空间上存在异质性可能更加符合现实。局域空间计量经济学中的地理加权回归空间变系数回归模型中(GWR)是解决此类问题的一种有效途径,变系数地理加权回归模型的核心思想是“离经济体近的观察数据比那些离经济体远的观察数据对经济体的参数估计有更多的影响”。

GWR 模型是从全域回归模型扩展而来,在全域回归模型中,我们通常假定有i=1,2,...,m和j=1,2,...,n的系列解释变量观测值 xij 及系列被解释变量 yj ,经典的全域线性回归模型如下式:

n

yi=β0+ xijβj+εi i=1,2, …, m

j=1

上述模型中,ε是整个回归模型的随机误差项,满足球星扰动假设,回归系数β被假定是一个常数。模型参数βj的估计一般采用普通最小二乘法(OLS )。

4.2. 空间面板数据模型

以上空间横截面数据模型使用的数据集主要面向截面数据,模型中仅考虑了空间单元之间的相关性,而未顾及具有时空演变特征的时间尺度之间的相关性。当观测量既具有空间特性,又具有时间特性,截面数据模型就无法处理这类数据,必须引入面板数据模型。

根据以上空间经济计量分析工具,结合面板数据计量经济学的理论方法,我们可以构建一个综合考虑变量时空二维特征和信息的空间面板数据计量经济模型,这里主要介绍基于固定效应模型的空间回归面板计量模型和空间误差面板计量模型。

4.2.1. 空间回归面板计量模型

首先考虑一个带固定效应的空间自回归模型:

Yt=ρWYt+Xtβ+μ+ εt t=1,2,...,T εt~N(0,σ2In)

在上式中:

- Yt为 y1t, y2t, …, yNt ´,表示第t 个时间点的N 个横截面数据的被解释变

- Xt为 x1t, x2t, …, xNt ´,表示第t 个时间点的N 个横截面数据的解释变量 - μ为 μ1t, μ2t, …, μNt ´,表示回归方程中的个体效应

- εt为 ε1t, ε2t, …, εNt ´,表示服从正态分布的随机误差项

- W 为空间权重矩阵

- β为解释变量Xt的回归系数

- ρ为反映空间影响程度的参数,它代表邻近地区间因变量y 之间的影响程

4.2.2. 空间误差面板计量模型

另外一个带固定效应的空间误差模型:

Yt=Xtβ+μ+φt φ=λW+ε t = 1,2,...,T εt~N(0,σ2In) tφtt

- Yt为 y1t, y2t, …, yNt ´,表示第t 个时间点的N 个横截面数据的被解释变

- Xt为 x1t, x2t, …, xNt ´,表示第t 个时间点的N 个横截面数据的解释变量 - μ为 μ1t, μ2t, …, μNt ´,表示回归方程中的个体效应

- εt和φt为随机误差项,其中φt=λWφt+εt,εt为 ε1t, ε2t, …, εNt ´是服从

正态分布的随机误差项

- W 为空间权重矩阵

- β为解释变量Xt的回归系数

- λ为反映空间误差影响程度的参数

5. 学习总结

通过以上对于空间统计及计量分析方法的学习,初步掌握空间计量经济学知识体系的基本框架,了解了空间计量分析的思路,即:

1. 采用空间统计分析指数检验变量是否存在空间自相关性;自相关检验步骤如下:

(1) 空间权重矩阵的构建

(2) 空间自相关程度的测度

(3) 空间自相关的检验(Moran`s I指数及Moran 散点图)

2. 如果存在,在空间计量经济学理论方法支持下,将空间影响纳入其中,建立空间计量经济模型。空间计量经济模型主要分为两类:

(1)空间横截面数据模型

—— SAR/SLM/GWE模型

(2)空间面板数据模型

3. 进行空间计量的估计和检验

结合文献综述可以看出,目前国内外学者对于空间统计及计量的应用主要体现在一方面应用空间统计研究变量间的相关性,证明存在空间聚集及溢出效应;

另一方面通过建立空间横截面数据模型或空间面板数据模型,对样本区际关联问题进行实证分析。

但目前虽理出了知识体系框架,但具体细节还没有掌握,尤其是还不具备等实证分析的能力,对于一些模型及方法并没有透彻的理解。

在下一步学习中,应结合文献中的实证分析,详细学习空间计量方法的使用,首先应掌握空间统计即空间自相关检验的有关内容,根据文献中的研究问题及研究对象,学习如何进行样本的选取,如何实际进行空间自相关的检验,同时学习Matlab 软件中有关空间统计工具的应用,结合《基于空间依赖效应的区域性互联网金融的关联性研究》一题目探索互联网金融是否具有区域关联性;之后可就互联网金融风险是否能引发系统性区域风险做进一步研究。

1 Chakrabarti,A. A Theory of the Spatial Distribution of foreign Direct Investment[J],

International Review Economics and Finance, 2003(12),149-169

2 Ping,J.L., Green, C.J., Zartman,R.E., Bronson,K.F., Expoling Spatial Dependence of Cotton

Gallo,J.L., Ertur,C. Exploratory Spatial Data Analysis of the Distribution of Reiginal Per Capital Cabrer-Borras, B. Innovation and R&D Spillover Effects in Spanish Regions: A Spatial

胡健. 空间计量经济学理论体系的解析及其展望[J].,统计与信息论坛,V ol.27 No.1,2012 李刚. 金融危机传染路径的空间统计分析[J].,统计研究,2009

杜小娟. 基于GIS 的湖北省区域经济差异空间统计分析[J].,测绘信息与工程,2010 白晶. 区域经济中的空间统计分析[J].现代商业.2010

张锦宗. 基于BP 网络与空间统计分析的山东人口空间分布模式预测研究[J].测绘科学,2009 文骁飞. 基于空间统计与GIS 的区域经济空间关联性分析方法[J].现代服务,2011

吴拥政. 中部六省地级市区金融发展与经济增长的空间面板分析[J].统计与信息论坛,2009 魏浩. 中国对外贸易空间集聚效应及其影响因素分析[J].数量经济技术经济研究, 2011 Yield Using Globaland Local Autocorrelation Statistcs[J].Field Crops Research,2004(89),219-236 3GDP in Europe, 1980-1995[J], Regional Science, 2005, 2(82),175-201 4Approch[J], Research Policy, 2007, 9(36),1357-1371 [1**********]

13 张红历. 我国西部区域经济增长差异的空间统计分析[J].统计观察,2010

14

15

16 任家强. 基于空间统计分析的辽宁省县域经济空间差异研究[J].经济地理,2010 田成诗. 基于空间统计分析的中国省域房地产价格差异研究[J].数学的实践与认识,2012 Anselin,Spatial Economet Rics:Methods and Models[M],Dordrecht:Kluwer Academic,1988

空间统计及计量方法学习笔记

1. 背景及文献综述 ....................................................... 2

2. 空间效应 ............................................................. 4

2.1. 空间相关性: .................................................... 4

2.2. 空间异质性 ...................................................... 5

3. 空间自相关性分析 ..................................................... 5

3.1. 空间权重矩阵 .................................................... 6

3.2. 空间自相关性检验 ................................................ 7

4. 空间计量经济模型的建立 .............................................. 10

4.1. 空间横截面数据模型 ............................................. 10

4.1.1. 空间自回归模型(SLM ) .................................... 11

4.1.2. 空间误差模型(SEM ) ...................................... 12

4.1.3. 变系数地理加权回归模型(GWR ) ............................ 13

4.2. 空间面板数据模型 ............................................... 14

4.2.1. 空间回归面板计量模型 ..................................... 14

4.2.2. 空间误差面板计量模型 ..................................... 14

5. 学习总结 ............................................................ 15

1. 背景及文献综述

空间计量经济学是在基于对空间效应恰当设定的基础上,对于空间经济计量模型进行一系列的设定、估计、检验与预测的计量经济学方法。空间计量经济学由美国经济学家Paelinck 和Klaassen 首次提出,他们认为空间计量经济学的研究领域主要包括:

- 计量模型中的空间相关性问题

- 空间关系的非对称性问题

- 空间距离解释因子问题

- 事前事后联系的差异问题

- 空间建模问题

空间计量经济学着重处理计量经济学模型中由于变量的空间特性而导致的一些特殊问题,例如当模型设定中存在空间相关性问题,就会违反经典的

Markov-Gausse 变量之间相互独立的假设,从而导致传统的计量经济学估计方法与检验方法失效。这就要求发展新的空间计量经济模型设定、估计与检验方法,以使计量经济模型可以有效地处理空间效应问题。

近年来空间统计分析技术已经在广泛的领域内得到应用,国外学者已将空间统计分析方法和理念广泛运用到经济学研究。例如Chakrabarti 1(2003)运用空间统计和空间计量的工具对FDI 的空间分布进行了理论分析,为我国学者之后研究对外贸易的空间集聚效应提供了参考;Ping 2等(2004)利用全局和局部的自相关统计方法对棉花产量的空间相关性及其模式变化进行了研究;Gallo 和Ertur 3(2005)对1980-1995年期间对138个欧洲地区人均GDP 的时空动态变化进行了研究,认为存在全局和局部空间自相关,地区分布具有空间异质性和不均等性;Cabrer-Borras 4等(2007)分析了西班牙地区的创新空间模式、地区的相互依赖性及其演进,发现当地能力、空间创新溢出都与当地的创新有关。

与国外学者相比,国内学者将空间统计及计量的方法应用到经济研究还为数不多。胡健(2012)5就空间计量经济学理论体系进行了总结,重点对空间计量经济模型的设立包括空间横截面数据模型、空间面板数据模型以及空间离散数据模型进行讨论,并给出对模型参数估计方法如,最大似然估计法,两阶段最小二

乘法和矩估计法等进行分析,并提出使用Moran´s I及LM/RS对模型进行检验,最后展望了该理论研究未来的发展趋势。但文章中对于空间面板数据模型介绍简略,并且也没有给出相应的参数估计及模型检验方法。

李刚(2009)6使用空间统计分析方法,对2007年美国次贷危机和1997年东南亚金融危机的空间集聚性和传染路径进行了实证分析,主要采用空间回归面板模型及MoranI´指数检验发现,客观的地缘关系是金融危机传染路径,政治经济条件过去不是金融危机的传染路径,而目前在金融危机中所担任的角色也越来越明显;贸易关系和资本项目也是金融危机传染的重要路径。但对于在传染路径不只一个时,究竟哪一条传染路径是最重要的以及各种传染路径之间的关系还有待研究。

杜小娟(2010)7、白晶(2010)8利用空间统计的知识,通过Moran`指数及LISA 的检验,分析了地区区域经济间的相关性,但都没有建立空间计量模型进行影响因素间的分析。

张锦宗(2009)9利用基于时间序列的历史数据采用改进了的BP 网络,以地市行政区域为研究单元,对山东省未来人口进行预测,然后通过Moran`指数进行全局及局部自相关检验,对未来人口空间分布模式进行预测分析。

文骁飞(2011)10提出将空间统计分析技术与GIS 应用于区域经济分析,可以揭示区域经济发展的空间自相关和空间集聚特征,但仅应用了Moran 全局及局部检验,没有引入空间计量模型的建立。

吴拥政(2009)11在传统同一空间尺度实证研究的基础上,使用空间面板数据模型,在空间与时间整合的维度上揭示金融发展与经济增长的关系,探索经济金融活动的空间自相关性与空间集群性。结果表明:中部六省的金融发展与经济增长的空间依赖关系是统计显著的,并为深入进行整合时空特征的区域金融与经济增长关系的统计与计量建模分析提供了有利的证据支持。

魏浩(2011)12利用空间统计分析和空间计量分析方法,对我国部分省区市对外贸易的空间集聚效应及其影响因素进行了实证分析。首先运用空间统计分析Moran`s I指数对中国1978-2007年间各省份对外贸易的空间相关性进行分析,形象地揭示出改革开放以来我国各省份对外贸易的地区分布情况,然后分别运用

SAR 和SEM 两种空间计量分析方法研究了影响我国各地区对外贸易发展的因素及其空间影响效应。

张红历(2010)13、任家强(2010)14通过使用Moran`s I指数对所选数据所进行的全局及局域自相关检验,分别对对 1998-2007年间西部12省市64个主要地级市和2008年辽宁省44个县城的经济增长水平的差异,空间分布特征及其演变进行了分析,通过研究各样本经济增长的空间相关性和空间异质性特征有了深入认识,揭示地区政策实施后区域经济空间联系的结构和演变。

田成诗(2012)15采用Moran 散点图和LISA 散点图对我国省域商品房价格进行了分析,得出我国省域商品房价格具有空间溢出效应,存在显著的空间自相关,表现出空间集聚特征

2. 空间效应

空间计量经济学与传统计量经济学的最大区别就是引入了空间效应,Anselin 将空间效应区分为空间相关性和空间异质性

2.1. 空间相关性:

空间相关性是指空间中各变量之间存在相互影响。空间相关性可能会由多种因素引起,例如,空间样本的简单线性化、空间样本的简单归并、空间外部性以及空间溢出效应等。空间相关性可以用数学公式表示为:

y i =f (yj ) , (j=1,2,...,n,j i)

空间相关性主要表现在两个方面:

- 空间实质相关性:由于空间外部性、邻近效应等因素造成的计量模型中解释

变量的空间相关性。

处理及方法:需要在模型的设定方法上做相应改进。可以用空间自回归模型分析

- 空间扰动相关性:由于忽视了一定的空间影响,例如存在空间影响的区域没

有被考虑在模型中,造成的模型残差存在空间相关性。

处理及方法:在不考虑空间结构的情况下,可以运用传统的处理异方差性、样本截面相关性等问题的方法进行解决;当需要考虑空间结构时,就要对相

应的空间相关性进行特殊处理。对于空间结构进行处理存在的困难是,如何正确判定空间结构的存在形式,并且正确的设定模型。可以用空间误差模型分析

2.2. 空间异质性

空间异质性主要是指空间中各变量由于所处的区位位臵不同而存在的差异性。在区域分析中,中心-外围效应等因素的存在导致了空间异质性的产生。 空间差异性可以用模型表示为:

y i =Xβi +εi

空间差异性主要反映在参数βi 之上,当存在空间差异性时,参数βi 在个空间单元上有所变异,而若βi 对所有空间单元都相等时,则个空间体之间便不存在空间差异性。

在空间计量经济模型中,空间异质性主要反映在模型结构性的差异上,它可以用传统计量经济学的基本方法进行处理,例如面板数据模型的变系数方法、随机系数方法以及系数扩展方法等,也可以直接通过面板数据模型的方差协方差矩阵来处理空间异质性的问题。

在处理空间异质性时,主要存在的问题是空间计量经济模型结构性差异可能由于空间相关性引起,也可能是由于空间异质性引起,而现有的技术对于区分这两种空间效应仍然显得十分不足。

3. 空间自相关性分析

根据空间统计和空间计量经济学原理方法,进行空间分析的思路是:首先采用空间统计分析指数检验变量间是否存在空间自相关性,如果存在,则需要在空间计量经济学理论方法支持下,将空间影响纳入其中,建立空间计量经济模型,进行空间计量估计和检验。

所以进行空间分析的主要任务是对变量间空间自相关存在性的检验,如何确定空间自相关性的存在的标准步骤是:

空间权重矩阵的构建

● 空间自相关程度的测度

● 空间自相关的检验

3.1. 空间权重矩阵

空间权重矩阵W= (Wij ) nxn 主要用于表达空间的相互依赖性,它是外生信息。W 中对角线上的元素被设定为0,而W ij (i j )表示区域i 和区域j 空间上的紧密程度,为了减少或者消除区域间的外生影响,权重矩阵在进行其他运算前通常被标准化,矩阵W 的行和为1,标准化意味着每一个矩阵元素仅仅表示邻接空间的加权平均数。

空间权重矩阵W 由多种选择的方法,一般可将现实的地理空间关联或者经济联系考虑到模型中来。最主要的方式有以下两种:邻近指标和距离指标。具体方法解释如下:

(1)基于邻近概念的空间权重矩阵

这种方法采用邻接标准,其目的是定义空间对象的邻接关系。一般相邻标准的W ij 为

Wij= 1 区域i 和j 相邻; 0 区域i 和j 不相邻

基于邻近概念的空间权重矩阵又有一阶邻近矩阵和高阶邻近矩阵之分。

(2)基于距离概念的空间权重矩阵

这种方法采用距离标准,一般基于距离标准的W ij 为

Wij= 1 区域i 和j 在距离d 之内; 0 区域i 和j 在距离d 之外;

这种方法实质上是假定空间相互作用的强度与区域距离之间关系密切,这种方法简单方便,实践中经常使用。这种方法的关键是要预先设定一个门槛距离,若在门槛距离之内,则认为区域之间存在关联,若超过门槛距离,则区域间的没有相互作用。

(3)基于经济社会现象的空间权重矩阵

在基于距离概念的空间权重矩阵中,除了使用真实的地理距离计算外,还包括经济和社会因素的更为复杂的权重矩阵设定方法。经济距离矩阵的设定需满足有意义、有限性和非负性三大条件。经济距离矩阵可以依据区域间交通网密度、贸易流动量、通讯量等设定。

3.2. 空间自相关性检验

将空间效应考虑进来以后,在建立计量模型进行分析研究之前,我们必须先进行空间相关性的检验,为后面分析采用空间经济计量方法做好准备。

在计算和检验区域经济空间相关存在性时, 空间统计学较常使用到两个类似于相关系数的统计量:Moran(1950)提出的空间相关指数Moran`I和Geary(1954)所定义的Gearyc 。尽管任一统计指标都能基本上获得空间自相关的特征,而且在许多分析中两者大致上可以相互替代,但与Gearyc 相比,Moran`I不易受偏离正态分布的影响,因此在大多数应用中,Moran`I更为常用。Moran`I在功用上大致可以分为两大类:全域空间自相关Moran`I和局域空间自相关Moran`I。

(1)全域空间自相关Moran`I指数

全域空间自相关是从区域空间的整体上刻画区域经济活动分布的集群状况,Cliff 和Ord (1981)给出的全局空间自相关度量指标为:

n j−Y n1i−Y Yi=1 j=1wij YMoran`I=∗ i−Y i=1j=1iji=1Yn ni=1Yi

n =式中:YY i 空间第i 单元的属性值,w if (i,j=1,2,…,n) 是空间权重矩阵

W 的元素,空间权重矩阵可以基于以上所说的三种标准进行构建。

Moran`I系数反映出孔内的区域单元的属性值的相关程度。与相关系数一样,Moran`I系数的取值区间为[-1,1]。符号代表着相似程度的方向性,而绝对值大小意味着关联的强弱性。通常认为两个空间单元的距离越近,他们之间的关联性越强,表现为属性值的正相关或负相关。正相关和负相关可通过空间相关系数Moran`I散点图的方式坐标图在四大象限呈现。

Moran 散点图的四个象限分别对应区域单元与其邻居之间四种类型的局部空间联系形式,第一、三象限代表正的空间联系,第二、四象限代表负的空间联系。

其中第一象限代表了高观测值的区域单元为同是高值的区域所包围的空间联系形式(高-高);第二象限代表了低观测值的区域单元为高值的区域所包围的空间联系形式(低-高);第三象限代表了低观测值的区域单元为同是低值的区域所包围的空间联系形式(低-低);第四象限代表了高观测值的区域单元为低值的区域所包围的空间联系形式(高-低)。与局部Moran 指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、高值和低值、低值和低值、低值和高值之中的哪种空间联系形式。并且对应于Moran 散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。

对于Moran`I指数的计算结果,可以分析采用渐进正态分布和随机分布两种假设进行检验,以评价区域间是否存在空间自相关关系。

检验的标准化形式为:

Moran′I−E(I) Z d =根据地理空间数据的分布情况,可以计算出在正态假设条件下,全域空间自相关Moran`I指数的期望值E N (I)、方差Var (I )分别为:

EN(I)=−1 (n−1)

VarN I =12 22 nw−nw+3w−E(I) 120N0在随机假设条件下,Moran`I的期望值E R (I )、Var R (I )分别为:

ER(I)=−1 (n−1)

2 2n (n2−3n+3) w1−nw2+3w0−K( n2−n w1−2nw2+6w02VarR I =−ER(I) w0n−1(n−2)(n−3)

nn22其中,w0= nw1= nw2= ni=1 j=1wij ,i=1 j=1(wij+wji ) ,i=1(wi∙+wj∙) , 1

2

K = ) 4n n(yi−y

n ) 2 i=1(yi−y, wi∙和wj∙分别为空间权重矩阵中i 行和j 列之和。

(2)局域空间自相关Moran`I指数

全域空间自相关指数呈现的只是区域空间整体上经济活动分布的集群状况,而对存在于全域地理范围内不同区域的空间关联模式却无能为力,因此全域空间自相关Moran`I指数在有些条件难以反映局部区域的情况,有时甚至“颠倒”区

域空间关联的正确模式,因此我们还需要新的指标去揭示局部区域之间空间关联模式的证据,此时通常采用局域空间关联指标来分析空间关联的局域特性。

局域空间自相关Moran`I指数作为空间探索技术的重要组成部分,其功能如下:其一为每个观测单元周围的局部空间集聚状况作显著性评估;其二可以揭示出对全局联系影响大的样本单元以及不同的空间联系形式。

根据Anselin(1995)的定义,一般而言,局域空间自相关指标需要满足两个条件:每个区域空间观测单元的空间关联局域指标描述了围绕该区域单元显著的相似值空间单元之间空间集群程度;所有空间单元的空间关联局域指标之和与对应的全域空间关联指标成比例。

在满足了以上两个条件前提下,区域局域空间自相关Moran`I指数的计算公式可以定义为:

Xi−X′ ), (i=1,2, …, n) MoranI= Wij(Xj−Xi=1n

12 ) 2, S= (Xi−Xi=1n =X Xi 其中符号含义与全局Moran`I指数相同,因局部Moran`I指数由全局指数各分量的n 倍定义,取值可以超出一1与1间的范围。该指标形成的正态分布统计量表明相邻单元值的彼此关联情况,可以揭示空间聚集的重要关联点。故局域空间自相关Moran`I指数是区域空间单元与其相邻近观测单元观测值加权平均的乘积。正的Moran`I值表示该区域单元周围相似值的空间集群,负的Moran`I值表示非相似值之间的空间集群。

对于局域空间自相关Moran`I指数的计算结果,我们同样可以采用标准化形 式对局部空间相关性进行检验:

Moran′I−E(I) Z d = 在随机假设条件下,Moran`I的期望值E R (I )、Var R (I )分别为:

n

EN I =− wij (n−1)

i=1

VarN I =wi 2 (n−b2) wi kℎ (2b2−n) 2+−EN(I) 2式中,b2=m4 m2,m 2和m 4分别表示二阶样本距和四阶样本距,

nn2wi 2 = nj, j≠iwif,wi kℎ = k, k≠i ℎ, ℎ≠iwikwjℎ

(3) LISA

若Moran 散点图没有给出显著性水平的指标,因此需要计算LISA ,来进一步探究这些空间分析的结果.

LISA 可以揭示某一区域单元的属性值与其空间邻近区域单元属性值之间的相似性或相关性,识别空间集聚和空间孤立,探测空间异质等,LISA 包括局部Moran`指数和局部Geary 指数

4. 空间计量经济模型的建立

目前虽然理论上都可以通过空间计量经济学的建模方法对空间效应进行理论分析,但一方面从计量经济学处理的难易程度考虑,不是所有的模型都适合将空间效应直接引入;另一方面,由于在部分模型中,其原有的设定形式已经反映了经济变量的空间结构,所以不需要再进行特别的建模处理。目前主流的空间计量经济模型包括空间横截面数据模型、空间面板数据模型和离散数据的空间计量模型,其他的模型姓社,诸如空间动态模型、空间非线性模型等,其模型估计方法和检验方法正在发展过程中。

4.1. 空间横截面数据模型

在空间横截面数据模型中,空间相关性可以通过两种方法处理,一是在回归模型中引入空间滞后相关变量;二是在回归模型中加入残差结构特殊形式。空间相关性被处理成空间滞后变量形式就会形成空间滞后模型,适于测度空间互动关系的存在性及强度;空间相关性被处理成回归误差项就称为空间误差模型,适于处理空间自回归的偏差影响。

4.1.1. 空间自回归模型(SLM )

空间自回归模型主要是探讨各变量在区域内是否存在扩散现象。它以空间自回归依赖变量外加外生变量的形式构成,其模型表达式为:

y = ρW y + Xβ + ε

式中:y 为因变量;X 为n ⨯k 的外生解释变量矩阵;ρ为空间自回归系数,反映了样本观测值中的空间依赖作用,即相邻区域的观测值W y 对本地区观测值y 的影响方向和程度,W 为空间权重矩阵,参数β反映了自变量X 对因变量y 的影响。

这种建模方法表明当经济变量存在空间相关性时,仅仅考虑其自身的解释变量X 不足以很好的估计和预测该变量的变化趋势。例如一个区域的技术创新能力不仅受自身技术投入水平的影响,还会受到邻近区域溢出水平的影响,因此测度该区域技术创新能力时,必须加入表示空间滞后的变量W y 。

空间自回归变量W y 是一内生变量,空间自回归项W y 与干扰项ε 相关,甚至当ε 是零均值误差也如此,这可以从方程的简化式中看出:

y=(1−ρW) Xβ+(1−ρW) −1−1ε

鉴于空间自回归模型中W y 的内生性,因此模型估计若采用最小二乘法

(OLS ),系数估计值必将有偏或者无效。所以一般常用Anselin (1988)提议的极大似然估计法来估计空间自回归模型的参数。其过程如下:

; (1) 对模型y = X β0 + ε0 作OLS 估计,求出β0

; (2) 对模型W y = X βL + εL 作OLS 估计,求出βL

X 和e L = Wy -β X (3) 分别计算上述两个OLS 估计的残差e 0= y-β0L

(4) 由e 0和e L 值,通过对数极大似然函数L c 得到参数ρ的估计值ρ :

e0−ρeL +ln I−ρW Lc= −n 2 ln (n 1) e0−ρeL ´

(5) 空间自回归模型的最大对数似然函数为:

lnL=−2ln 2π −2lnσ2+ln I−ρW −2σ Y−ρWY−Xβ ′(Y−ρWY−Xβ)

NN1

和σ由ρ 值及上式的最大似然函数可以计算出β ε2:

2 = β−ρβ β ,σ eL ′ e0−ρ eL ε= 1 n e0−ρ0L

4.1.2. 空间误差模型(SEM )

当误差项遵循一个空间自回归过程,即每个位臵上的随机误差为所有其他位臵上的随机误差的函数,我们可以利用空间误差模型探讨邻近地区关于因变量的误差冲击对本地区观察值的影响程度。Cliff (1971)认为误差项之间的空间自回归可能意味着:自变量和因变量之间存在着非线性关系;回归模型中遗漏了一个或多个回归自变量;回归模型应该由于一个自回归结构。空间误差模型的表达式如下:

y =Xβ + ε ε=λW+με式中:符号λ 表示自回归参数,W 是空间权重矩阵,假定μ为标准正态分布的随机误差向量。这个模型结合了一个标准回归模型和一个误差项ε 中的空间自回归模型,同时假设误差项μ 满足条件E(μ) =0、Cov(μ) =σ2I,即方差固定且误差项是不相关的。由于误差项ε 的均值为0,不管λ 的数值如何,因变量y 的均值不受空间误差相关的影响。

由上述公式可得:ε=(I−λW) −1μ ,因此:

(I−λW) y=(I−λW) Xβ+μ

即:y =λWy+Xβ−λWXβ+μ

可以看出,空间误差模型就转化为含有外生空间滞后变量WX的空间滞后模型,一般把WX成为空间之后权重矩阵。

对于空间误差模型,Anselin(1988)16同样建议采用极大似然估计空间误差模型(SEM)的参数,其估计过程如下:

; (1) 对模型y =Xβ +μ 作OLS 估计,得到β 的无偏估计量β

X; (2) 计算OLS 估计的残差为e =y −β

; (3) 由e 值,通过对数极大似然函数L c 得到参数λ的估计值λ

I−λW ´ I−λW e n +ln I−λW Lc= −n 2 1+ln2π −(n 2) ln e´

(4) 空间误差模型的最大对数似然函数为:

lnL=−2ln 2π −2lnσ2+ln I−λW −2σ Y−Xβ ′ I−λW ´(Y−Xβ) I−λW NN1

值和空间误差模型的最大对数似然函数计算其余参数的估计值, 由λ

We ′ e−λ We σ ε2= 1 n e0−λ

在具体运用空间模型的过程中,究竟选择空间误差模型还是选择空间回归模型,要在测试、诊断的过程中,逐步确定。Anselinhe Florax(1995)提出了如下的判别准则:首先,运用OLS 方法对模型进行回归,并进行相应拉格朗日检验。如果空间回归模型和空间误差模型都不显著,则保持OLS 结果;如果空间回归模型和空间误差模型都显著,则继续运行稳健性检验了如果Robust LM- Error显著,则运行空间误差模型;如果Robust LM-Lag显著,则运行空间回归模型。

4.1.3. 变系数地理加权回归模型(GWR )

常系数空间回归模型可能忽略了一个问题,即:各种数据在不同空间上表现的复杂性、和变异性。如果数据在空间上表现平稳,则OLS 全局分析方法完全适用,而若数据在空间上表现出了不平稳特性,则可能需要采用局部分析技术来应对。在经济社会现实中,空间数据的复杂特点使得经济地理解释变量对被解释变量的影响在不同区域之间多数是不稳态性,此时,利用常系数空间回归模型估计得到的参数可能是有偏的、无效的,因此,在分析此类问题时,假定不同区域之间的经济行为在空间上存在异质性可能更加符合现实。局域空间计量经济学中的地理加权回归空间变系数回归模型中(GWR)是解决此类问题的一种有效途径,变系数地理加权回归模型的核心思想是“离经济体近的观察数据比那些离经济体远的观察数据对经济体的参数估计有更多的影响”。

GWR 模型是从全域回归模型扩展而来,在全域回归模型中,我们通常假定有i=1,2,...,m和j=1,2,...,n的系列解释变量观测值 xij 及系列被解释变量 yj ,经典的全域线性回归模型如下式:

n

yi=β0+ xijβj+εi i=1,2, …, m

j=1

上述模型中,ε是整个回归模型的随机误差项,满足球星扰动假设,回归系数β被假定是一个常数。模型参数βj的估计一般采用普通最小二乘法(OLS )。

4.2. 空间面板数据模型

以上空间横截面数据模型使用的数据集主要面向截面数据,模型中仅考虑了空间单元之间的相关性,而未顾及具有时空演变特征的时间尺度之间的相关性。当观测量既具有空间特性,又具有时间特性,截面数据模型就无法处理这类数据,必须引入面板数据模型。

根据以上空间经济计量分析工具,结合面板数据计量经济学的理论方法,我们可以构建一个综合考虑变量时空二维特征和信息的空间面板数据计量经济模型,这里主要介绍基于固定效应模型的空间回归面板计量模型和空间误差面板计量模型。

4.2.1. 空间回归面板计量模型

首先考虑一个带固定效应的空间自回归模型:

Yt=ρWYt+Xtβ+μ+ εt t=1,2,...,T εt~N(0,σ2In)

在上式中:

- Yt为 y1t, y2t, …, yNt ´,表示第t 个时间点的N 个横截面数据的被解释变

- Xt为 x1t, x2t, …, xNt ´,表示第t 个时间点的N 个横截面数据的解释变量 - μ为 μ1t, μ2t, …, μNt ´,表示回归方程中的个体效应

- εt为 ε1t, ε2t, …, εNt ´,表示服从正态分布的随机误差项

- W 为空间权重矩阵

- β为解释变量Xt的回归系数

- ρ为反映空间影响程度的参数,它代表邻近地区间因变量y 之间的影响程

4.2.2. 空间误差面板计量模型

另外一个带固定效应的空间误差模型:

Yt=Xtβ+μ+φt φ=λW+ε t = 1,2,...,T εt~N(0,σ2In) tφtt

- Yt为 y1t, y2t, …, yNt ´,表示第t 个时间点的N 个横截面数据的被解释变

- Xt为 x1t, x2t, …, xNt ´,表示第t 个时间点的N 个横截面数据的解释变量 - μ为 μ1t, μ2t, …, μNt ´,表示回归方程中的个体效应

- εt和φt为随机误差项,其中φt=λWφt+εt,εt为 ε1t, ε2t, …, εNt ´是服从

正态分布的随机误差项

- W 为空间权重矩阵

- β为解释变量Xt的回归系数

- λ为反映空间误差影响程度的参数

5. 学习总结

通过以上对于空间统计及计量分析方法的学习,初步掌握空间计量经济学知识体系的基本框架,了解了空间计量分析的思路,即:

1. 采用空间统计分析指数检验变量是否存在空间自相关性;自相关检验步骤如下:

(1) 空间权重矩阵的构建

(2) 空间自相关程度的测度

(3) 空间自相关的检验(Moran`s I指数及Moran 散点图)

2. 如果存在,在空间计量经济学理论方法支持下,将空间影响纳入其中,建立空间计量经济模型。空间计量经济模型主要分为两类:

(1)空间横截面数据模型

—— SAR/SLM/GWE模型

(2)空间面板数据模型

3. 进行空间计量的估计和检验

结合文献综述可以看出,目前国内外学者对于空间统计及计量的应用主要体现在一方面应用空间统计研究变量间的相关性,证明存在空间聚集及溢出效应;

另一方面通过建立空间横截面数据模型或空间面板数据模型,对样本区际关联问题进行实证分析。

但目前虽理出了知识体系框架,但具体细节还没有掌握,尤其是还不具备等实证分析的能力,对于一些模型及方法并没有透彻的理解。

在下一步学习中,应结合文献中的实证分析,详细学习空间计量方法的使用,首先应掌握空间统计即空间自相关检验的有关内容,根据文献中的研究问题及研究对象,学习如何进行样本的选取,如何实际进行空间自相关的检验,同时学习Matlab 软件中有关空间统计工具的应用,结合《基于空间依赖效应的区域性互联网金融的关联性研究》一题目探索互联网金融是否具有区域关联性;之后可就互联网金融风险是否能引发系统性区域风险做进一步研究。

1 Chakrabarti,A. A Theory of the Spatial Distribution of foreign Direct Investment[J],

International Review Economics and Finance, 2003(12),149-169

2 Ping,J.L., Green, C.J., Zartman,R.E., Bronson,K.F., Expoling Spatial Dependence of Cotton

Gallo,J.L., Ertur,C. Exploratory Spatial Data Analysis of the Distribution of Reiginal Per Capital Cabrer-Borras, B. Innovation and R&D Spillover Effects in Spanish Regions: A Spatial

胡健. 空间计量经济学理论体系的解析及其展望[J].,统计与信息论坛,V ol.27 No.1,2012 李刚. 金融危机传染路径的空间统计分析[J].,统计研究,2009

杜小娟. 基于GIS 的湖北省区域经济差异空间统计分析[J].,测绘信息与工程,2010 白晶. 区域经济中的空间统计分析[J].现代商业.2010

张锦宗. 基于BP 网络与空间统计分析的山东人口空间分布模式预测研究[J].测绘科学,2009 文骁飞. 基于空间统计与GIS 的区域经济空间关联性分析方法[J].现代服务,2011

吴拥政. 中部六省地级市区金融发展与经济增长的空间面板分析[J].统计与信息论坛,2009 魏浩. 中国对外贸易空间集聚效应及其影响因素分析[J].数量经济技术经济研究, 2011 Yield Using Globaland Local Autocorrelation Statistcs[J].Field Crops Research,2004(89),219-236 3GDP in Europe, 1980-1995[J], Regional Science, 2005, 2(82),175-201 4Approch[J], Research Policy, 2007, 9(36),1357-1371 [1**********]

13 张红历. 我国西部区域经济增长差异的空间统计分析[J].统计观察,2010

14

15

16 任家强. 基于空间统计分析的辽宁省县域经济空间差异研究[J].经济地理,2010 田成诗. 基于空间统计分析的中国省域房地产价格差异研究[J].数学的实践与认识,2012 Anselin,Spatial Economet Rics:Methods and Models[M],Dordrecht:Kluwer Academic,1988


相关文章

  • 医学统计学笔记12
  • 医学统计学笔记 统计学:是收集.分析.解释与阐述数据资料的一门科学.通过收集.分类.分析来处理数据变化的科学与艺术,获得可信结果. 医学统计学:将概率论和数理统计的原理和方法应用于医疗卫生实践和医学科研,研究其数据的搜集.整理与分析的一门科 ...查看


  • 2014二建施工管理笔记第17讲施工成本控制与施工成本分析(二)
  • 2Z102044掌握施工成本分析的方法 一.施工成本分析的依据 施工成本分析,就是根据会计核算.业务核算和统计核算提供的资料,对施工成本的形成过程和影响成本升降的因素进行分析,以寻求进一步降低成本的途径:另一方面,通过成本分析,可从账簿.报 ...查看


  • 经济学考研大纲解析
  • 经济学考研大纲解析 本内容凯程崔老师有重要贡献 随着社会的发展和经济在国家地位的重要性,报考经济学的学生越来越多.经济学是一个大的学科门类,为了让2018年考研的同学对于经济学有一个的了解.在此凯程为大家做了以下整理和分析,供考生参考. 经 ...查看


  • 医学统计学_总结_重点_笔记_复习资料
  • 第一章 2选1 总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合.可分为有限总体和无限总体.总体中的所有单位都能够标识者为有限总体,反之为无限总体. 总体population根据 ...查看


  • 小学数学作业个性化研究论文
  • 小学数学作业个性化研究论文 康和实验小学 朱晓娟 爱因斯坦说:"当你把学过的知识都忘掉了,剩下的就是教育."这句话意味着我们的数学教学要从知识本位转向学生本位.课堂教学如此,作为反馈课堂教学效果之一的作业也应如此.但平日 ...查看


  • 空间计量方法模型
  • 空间计量方法模型 空间经济计量模型主要解决回归模型中复杂的空间相互作用与空间依存性结构问题(Anselin,1988).长期以来,在主流的经济学理论中,空间事物无关联及均质性假定的局限,以及普遍使用忽视空间效应的普通最小二乘法 (OLS)进 ...查看


  • 美国大学生的生活
  • 美国的大学生生活 为什么全球最好的大学大半在美国?看看美国的孩子是怎么念书的 转自网络日志 国内教育界总是在提改革高考制度,我们的高校应 该实行西方那种宽进严出的政策,我在国内也听了多年了,但是对于"宽进严出"的印象只是 ...查看


  • 探索性空间数据分析模型研究_张学良
  • 2007年4月第29卷第2期 当代经济管理 CONTEMPORARYECONOMY&MANAGEMENT Apr.2007Vol.29No.2 ■ 理论研究 TheoriesResearch 探索性空间数据分析模型研究 张学良 (上 ...查看


  • 浅议空间相关性的度量
  • 窒嫂型Q璺整箜塑塑 文章编号:1001-148X(2006)08-0015-02 壹些堑窒-』丝丝丝墅墼丝垒型查型堡丝 浅议空间相关性的度量 陈安全,夏帆 (厦门大学经济学院,福建厦f-1 361005) 摘要:在经济和社会学的学者研究的领 ...查看


热门内容