空间数据分析报告
—使用Moran's I 统计法实现空间自相关的测度
1、实验目的
(1)理解空间自相关的概念和测度方法。
(2)熟悉ArcGIS 的基本操作,用Moran's I 统计法实现空间自相关的测度。
2、实验原理
2.1空间自相关
空间自相关的概念来自于时间序列的自相关,所描述的是在空间域中位置S 上的变量与其邻近位置Sj 上同一变量的相关性。对于任何空间变量(属性)Z ,空间自相关测度的是Z 的近邻值对于Z 相似或不相似的程度。如果紧邻位置上相互间的数值接近,我们说空间模式表现出的是正空间自相关;如果相互间的数值不接近,我们说空间模式表现出的是负空间自相关。
2.2空间随机性
如果任意位置上观测的属性值不依赖于近邻位置上的属性值,我们说空间过程是随机的。
Hanning 则从完全独立性的角度提出更为严格的定义,对于连续空间变量Y,
若下式成立,则是空间独立的:
式中,n 为研究区域中面积单元的数量。若变量时类型数据,则空间独立性
的定义改写成
式中,a,b 是变量的两个可能的类型,i ≠j 。
2.3Moran's I 统计
Moran's I 统计量是基于邻近面积单元上变量值的比较。如果研究区域中邻近面积单元具有相似的值,统计指示正的空间自相关;若邻近面积单元具有不相似的值,则表示可能存在强的负空间相关。
设研究区域中存在n 个面积单元,第i 个单位上的观测值记为y i ,观测变量在n 个单位中的均值记为y ,则Moran's I 定义为
I =n ∑∑W (yij
i =1j =1n n i -y )(yj -y )
ij ∑(y
i =1
n n i -y ) 2∑∑W i =1j =1
i j n n 式中,等号右边第二项∑∑W (y-y )(y-y ) ij
i =1j =1n 类似于方差,是最重要的项,事
的乘积相当于规定(yi -y )(yj -y ) 实上这是一个协方差,邻接矩阵W 和(yi -y )(yj -y )
对邻接的单元进行计算,于是I 值的大小决定于i 和j 单元中的变量值对于均值的偏离符号,若在相邻的位置上,y i 和y j 是同号的,则I 为正;y i 和y j 是异号的,
ˆ(h)=C 1ˆ}{Z(sj ) -u ˆ}{Z(si ) -u ∑N(h)相联则I 为负。在形式上Moran's I 与协变异图
系。
Moran's I 指数的变化范围为(-1,1)。如果空间过程是不相关的,则I 的期望接近于0,当I 取负值时,一般表示负自相关,I 取正值,则表示正的自相关。用I 指数推断空间模式还必须与随机模式中的I 指数作比较。
通过使用Moran's I 工具,会返回Moran's I Index 值以及Z Score 值。如果Z score 值小于-1.96获大于1.96,那么返回的统计结果就是可采信值。如果Z score 为正且大于1.96,则分布为聚集的;如果Z score 为负且小于-1.96,则分布为离散的;其他情况可以看作随机分布。
3、实验准备
3.1实验环境
本实验在Windows 7的操作系统环境中进行,使用ArcGis 9.3软件。
3.2实验数据
此次实习提供的数据为以湖北省为目标区域的bount.dbf 文件。.dbf 数据中包括第一产业增加值,第二产业增加值万元,小学在校学生数,医院、卫生院床位数,乡村人口万人,油料产量,城乡居民储蓄存款余额,棉花产量,地方财政一般预算收入,年末总人口(万人) ,粮食产量,普通中学在校生数,肉类总产量,规模以上工业总产值现价(万元)等属性,作为分析的对象。
4、实验步骤
本报告用Moran's I 检验湖北省各区域规模以上工业总产值现价(万元) 的空间分布的空间自相关性。
(1)Feature to Points
对于线类要素和多边形要素,程序会计算要素的几何中心点,然后对几何中心点进行分析。这就会造成有些要素的几何中心点不在几何要素内部,如果想达到此目的,需要先用Feature to Points 工具进行转换后再进行分析。
在ArcToolbox 中选择Data Management Tools----->Features----->FeatureTo Point ,在Input Features 选项中选择bount.shp
文件。
图1转换对话框
图2转换结果
(2)Moran's I 指数计算
在ArcToolbox 中选择Spatial Statistics Tools----->AnalyzingPatterns
----->SpatialAutocorrelation (Moran'sI) ,在Input Features Class 选项中选择
bount_FeatureToPoint2.shp文件,在Input Filed 中选择属性“规模以上工”,在Conceptualization of Spatial Relationships 中选择Inverse Distance Squared 。
图3Spatial Statistics
Tools
图4Spatial Autocorrelation
对话框
图5Moran's I 结果展示
(3)Anselin Local Moran's I 指数计算
在ArcToolbox 中选择Spatial Statistics Tools----->Mappingclusters ------>Cluster and Outlier Analysis(AnselinLocal Moran's I) ,在Input Features Class 选项中选择bount.shp 文件,在Input Filed 中选择属性“规模以上工”,在Conceptualization of Spatial Relationships 中选择Inverse Distance Squared
。
图6Anselin Local Moran's I
对话框
图7Anselin Local Moran's I 结果展示
图8Anselin Local Moran's I 结果一览
图9新增要素
使用该工具会输出一个新的要素类。该要素类在原要素类上添加了两个字
LMi ZScore和IMi 段,分别为LMi Index、
PValue ,前两个分别代表各个要素的索引值I 和Z score 值。如果索引值I 为正,则要素值与其相邻的要素值相近,如果索引I 值为负值,则与相邻要素值有很大的不同。如果Z score 为正且越大,则要素越与相邻要素值相近,相反,如果Z scor e 值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。
5、结果分析
(1)Moran's I 结果分析
图10Moran's I 指数结果图
Moran's I 指数的变化范围为(-1,1)。如果空间过程是不相关的,则I 的期望接近于0,当I 取负值时,一般表示负自相关,I 取正值,则表示正的自相关。用I 指数推断空间模式还必须与随机模式中的I 指数作比较。
上图显示Moran's I 的值为0.09,接近于0,可以认为整体上湖北省各区域的
规模以上总产值的空间分布是不相关的。
图11湖北省地图
从上述湖北省地形图可以知道,湖北省地形复杂,且东西地形差异大,导致
交通要素的差异(西部山区交通不便,而东部尤其是武汉城市圈交通十分便捷);地理区位差异大,资源丰富度不同(如大冶市拥有丰富的铁矿资源),经济发展起步不同及各区域的经济地位的不同,导致各区域经济发展差异且无规律分布,因而呈现出空间自相关模式中的随机模式。
(2)Anselin Local Moran's I 结果分析
图12Z Score 值图示
图13Anselin Local Moran's I 结果视图
图14原因分析
z score 为正且越大,根据聚集及分析特例工具的原理,则要素越与相邻要素
值相近,相反,如果z score 值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。图12显示,颜色越红表示要素与相邻要素值越接近,颜色越蓝,表示与相邻要素值差异越大。
而通过下图使用Graduated symbols 所展示出来的结果显然和上面所呈现出
的结果是一样的。
图15Z Score 值图示
图16Anselin Local Moran's I
结果视图
图17相关性
结合本实验分析对象,即京山、应城市、天门市、汉川市、仙桃市五个地区的规模以上工业总产值比较相近;而大冶市则与其相邻的咸宁市、江夏区、鄂州市、黄冈市、阳新等地区的规模以上工业总产值差异较大。
分析原因,京山、应城市、天门市、汉川市、仙桃市地形地势因素接近,最主要的是都位于武汉城市圈的辐射圈内,交通区位、市场潜力等因武汉市发展所带动的相关地方经济的机遇是类似的,因此其规模以上工业总产值空间分布呈现出较强的空间相关性。
对于大冶市,大冶市的大冶矿产丰富,素有“百里黄金地,江南聚宝盆”之美誉。已发现和探明的大小矿床273处,金属矿、非金属矿53种是全国6大铜矿生产基地,10大铁矿生产基地和建材重点产地。黄金、白银产量居湖北省之
冠,硅灰石储量居世界第二。其工业发展起步早,发展快,丰富的矿产资源推动了大冶市的经济发展,因而其工业总产值明显高于周围其他市县。导致其周围地区的规模以上工业总产值的空间分布的相关性较弱。
空间数据分析报告
—使用Moran's I 统计法实现空间自相关的测度
1、实验目的
(1)理解空间自相关的概念和测度方法。
(2)熟悉ArcGIS 的基本操作,用Moran's I 统计法实现空间自相关的测度。
2、实验原理
2.1空间自相关
空间自相关的概念来自于时间序列的自相关,所描述的是在空间域中位置S 上的变量与其邻近位置Sj 上同一变量的相关性。对于任何空间变量(属性)Z ,空间自相关测度的是Z 的近邻值对于Z 相似或不相似的程度。如果紧邻位置上相互间的数值接近,我们说空间模式表现出的是正空间自相关;如果相互间的数值不接近,我们说空间模式表现出的是负空间自相关。
2.2空间随机性
如果任意位置上观测的属性值不依赖于近邻位置上的属性值,我们说空间过程是随机的。
Hanning 则从完全独立性的角度提出更为严格的定义,对于连续空间变量Y,
若下式成立,则是空间独立的:
式中,n 为研究区域中面积单元的数量。若变量时类型数据,则空间独立性
的定义改写成
式中,a,b 是变量的两个可能的类型,i ≠j 。
2.3Moran's I 统计
Moran's I 统计量是基于邻近面积单元上变量值的比较。如果研究区域中邻近面积单元具有相似的值,统计指示正的空间自相关;若邻近面积单元具有不相似的值,则表示可能存在强的负空间相关。
设研究区域中存在n 个面积单元,第i 个单位上的观测值记为y i ,观测变量在n 个单位中的均值记为y ,则Moran's I 定义为
I =n ∑∑W (yij
i =1j =1n n i -y )(yj -y )
ij ∑(y
i =1
n n i -y ) 2∑∑W i =1j =1
i j n n 式中,等号右边第二项∑∑W (y-y )(y-y ) ij
i =1j =1n 类似于方差,是最重要的项,事
的乘积相当于规定(yi -y )(yj -y ) 实上这是一个协方差,邻接矩阵W 和(yi -y )(yj -y )
对邻接的单元进行计算,于是I 值的大小决定于i 和j 单元中的变量值对于均值的偏离符号,若在相邻的位置上,y i 和y j 是同号的,则I 为正;y i 和y j 是异号的,
ˆ(h)=C 1ˆ}{Z(sj ) -u ˆ}{Z(si ) -u ∑N(h)相联则I 为负。在形式上Moran's I 与协变异图
系。
Moran's I 指数的变化范围为(-1,1)。如果空间过程是不相关的,则I 的期望接近于0,当I 取负值时,一般表示负自相关,I 取正值,则表示正的自相关。用I 指数推断空间模式还必须与随机模式中的I 指数作比较。
通过使用Moran's I 工具,会返回Moran's I Index 值以及Z Score 值。如果Z score 值小于-1.96获大于1.96,那么返回的统计结果就是可采信值。如果Z score 为正且大于1.96,则分布为聚集的;如果Z score 为负且小于-1.96,则分布为离散的;其他情况可以看作随机分布。
3、实验准备
3.1实验环境
本实验在Windows 7的操作系统环境中进行,使用ArcGis 9.3软件。
3.2实验数据
此次实习提供的数据为以湖北省为目标区域的bount.dbf 文件。.dbf 数据中包括第一产业增加值,第二产业增加值万元,小学在校学生数,医院、卫生院床位数,乡村人口万人,油料产量,城乡居民储蓄存款余额,棉花产量,地方财政一般预算收入,年末总人口(万人) ,粮食产量,普通中学在校生数,肉类总产量,规模以上工业总产值现价(万元)等属性,作为分析的对象。
4、实验步骤
本报告用Moran's I 检验湖北省各区域规模以上工业总产值现价(万元) 的空间分布的空间自相关性。
(1)Feature to Points
对于线类要素和多边形要素,程序会计算要素的几何中心点,然后对几何中心点进行分析。这就会造成有些要素的几何中心点不在几何要素内部,如果想达到此目的,需要先用Feature to Points 工具进行转换后再进行分析。
在ArcToolbox 中选择Data Management Tools----->Features----->FeatureTo Point ,在Input Features 选项中选择bount.shp
文件。
图1转换对话框
图2转换结果
(2)Moran's I 指数计算
在ArcToolbox 中选择Spatial Statistics Tools----->AnalyzingPatterns
----->SpatialAutocorrelation (Moran'sI) ,在Input Features Class 选项中选择
bount_FeatureToPoint2.shp文件,在Input Filed 中选择属性“规模以上工”,在Conceptualization of Spatial Relationships 中选择Inverse Distance Squared 。
图3Spatial Statistics
Tools
图4Spatial Autocorrelation
对话框
图5Moran's I 结果展示
(3)Anselin Local Moran's I 指数计算
在ArcToolbox 中选择Spatial Statistics Tools----->Mappingclusters ------>Cluster and Outlier Analysis(AnselinLocal Moran's I) ,在Input Features Class 选项中选择bount.shp 文件,在Input Filed 中选择属性“规模以上工”,在Conceptualization of Spatial Relationships 中选择Inverse Distance Squared
。
图6Anselin Local Moran's I
对话框
图7Anselin Local Moran's I 结果展示
图8Anselin Local Moran's I 结果一览
图9新增要素
使用该工具会输出一个新的要素类。该要素类在原要素类上添加了两个字
LMi ZScore和IMi 段,分别为LMi Index、
PValue ,前两个分别代表各个要素的索引值I 和Z score 值。如果索引值I 为正,则要素值与其相邻的要素值相近,如果索引I 值为负值,则与相邻要素值有很大的不同。如果Z score 为正且越大,则要素越与相邻要素值相近,相反,如果Z scor e 值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。
5、结果分析
(1)Moran's I 结果分析
图10Moran's I 指数结果图
Moran's I 指数的变化范围为(-1,1)。如果空间过程是不相关的,则I 的期望接近于0,当I 取负值时,一般表示负自相关,I 取正值,则表示正的自相关。用I 指数推断空间模式还必须与随机模式中的I 指数作比较。
上图显示Moran's I 的值为0.09,接近于0,可以认为整体上湖北省各区域的
规模以上总产值的空间分布是不相关的。
图11湖北省地图
从上述湖北省地形图可以知道,湖北省地形复杂,且东西地形差异大,导致
交通要素的差异(西部山区交通不便,而东部尤其是武汉城市圈交通十分便捷);地理区位差异大,资源丰富度不同(如大冶市拥有丰富的铁矿资源),经济发展起步不同及各区域的经济地位的不同,导致各区域经济发展差异且无规律分布,因而呈现出空间自相关模式中的随机模式。
(2)Anselin Local Moran's I 结果分析
图12Z Score 值图示
图13Anselin Local Moran's I 结果视图
图14原因分析
z score 为正且越大,根据聚集及分析特例工具的原理,则要素越与相邻要素
值相近,相反,如果z score 值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。图12显示,颜色越红表示要素与相邻要素值越接近,颜色越蓝,表示与相邻要素值差异越大。
而通过下图使用Graduated symbols 所展示出来的结果显然和上面所呈现出
的结果是一样的。
图15Z Score 值图示
图16Anselin Local Moran's I
结果视图
图17相关性
结合本实验分析对象,即京山、应城市、天门市、汉川市、仙桃市五个地区的规模以上工业总产值比较相近;而大冶市则与其相邻的咸宁市、江夏区、鄂州市、黄冈市、阳新等地区的规模以上工业总产值差异较大。
分析原因,京山、应城市、天门市、汉川市、仙桃市地形地势因素接近,最主要的是都位于武汉城市圈的辐射圈内,交通区位、市场潜力等因武汉市发展所带动的相关地方经济的机遇是类似的,因此其规模以上工业总产值空间分布呈现出较强的空间相关性。
对于大冶市,大冶市的大冶矿产丰富,素有“百里黄金地,江南聚宝盆”之美誉。已发现和探明的大小矿床273处,金属矿、非金属矿53种是全国6大铜矿生产基地,10大铁矿生产基地和建材重点产地。黄金、白银产量居湖北省之
冠,硅灰石储量居世界第二。其工业发展起步早,发展快,丰富的矿产资源推动了大冶市的经济发展,因而其工业总产值明显高于周围其他市县。导致其周围地区的规模以上工业总产值的空间分布的相关性较弱。