空间数据分析

空间数据分析报告

—使用Moran's I 统计法实现空间自相关的测度

1、实验目的

(1)理解空间自相关的概念和测度方法。

(2)熟悉ArcGIS 的基本操作,用Moran's I 统计法实现空间自相关的测度。

2、实验原理

2.1空间自相关

空间自相关的概念来自于时间序列的自相关,所描述的是在空间域中位置S 上的变量与其邻近位置Sj 上同一变量的相关性。对于任何空间变量(属性)Z ,空间自相关测度的是Z 的近邻值对于Z 相似或不相似的程度。如果紧邻位置上相互间的数值接近,我们说空间模式表现出的是正空间自相关;如果相互间的数值不接近,我们说空间模式表现出的是负空间自相关。

2.2空间随机性

如果任意位置上观测的属性值不依赖于近邻位置上的属性值,我们说空间过程是随机的。

Hanning 则从完全独立性的角度提出更为严格的定义,对于连续空间变量Y,

若下式成立,则是空间独立的:

式中,n 为研究区域中面积单元的数量。若变量时类型数据,则空间独立性

的定义改写成

式中,a,b 是变量的两个可能的类型,i ≠j 。

2.3Moran's I 统计

Moran's I 统计量是基于邻近面积单元上变量值的比较。如果研究区域中邻近面积单元具有相似的值,统计指示正的空间自相关;若邻近面积单元具有不相似的值,则表示可能存在强的负空间相关。

设研究区域中存在n 个面积单元,第i 个单位上的观测值记为y i ,观测变量在n 个单位中的均值记为y ,则Moran's I 定义为

I =n ∑∑W (yij

i =1j =1n n i -y )(yj -y )

ij ∑(y

i =1

n n i -y ) 2∑∑W i =1j =1

i j n n 式中,等号右边第二项∑∑W (y-y )(y-y ) ij

i =1j =1n 类似于方差,是最重要的项,事

的乘积相当于规定(yi -y )(yj -y ) 实上这是一个协方差,邻接矩阵W 和(yi -y )(yj -y )

对邻接的单元进行计算,于是I 值的大小决定于i 和j 单元中的变量值对于均值的偏离符号,若在相邻的位置上,y i 和y j 是同号的,则I 为正;y i 和y j 是异号的,

ˆ(h)=C 1ˆ}{Z(sj ) -u ˆ}{Z(si ) -u ∑N(h)相联则I 为负。在形式上Moran's I 与协变异图

系。

Moran's I 指数的变化范围为(-1,1)。如果空间过程是不相关的,则I 的期望接近于0,当I 取负值时,一般表示负自相关,I 取正值,则表示正的自相关。用I 指数推断空间模式还必须与随机模式中的I 指数作比较。

通过使用Moran's I 工具,会返回Moran's I Index 值以及Z Score 值。如果Z score 值小于-1.96获大于1.96,那么返回的统计结果就是可采信值。如果Z score 为正且大于1.96,则分布为聚集的;如果Z score 为负且小于-1.96,则分布为离散的;其他情况可以看作随机分布。

3、实验准备

3.1实验环境

本实验在Windows 7的操作系统环境中进行,使用ArcGis 9.3软件。

3.2实验数据

此次实习提供的数据为以湖北省为目标区域的bount.dbf 文件。.dbf 数据中包括第一产业增加值,第二产业增加值万元,小学在校学生数,医院、卫生院床位数,乡村人口万人,油料产量,城乡居民储蓄存款余额,棉花产量,地方财政一般预算收入,年末总人口(万人) ,粮食产量,普通中学在校生数,肉类总产量,规模以上工业总产值现价(万元)等属性,作为分析的对象。

4、实验步骤

本报告用Moran's I 检验湖北省各区域规模以上工业总产值现价(万元) 的空间分布的空间自相关性。

(1)Feature to Points

对于线类要素和多边形要素,程序会计算要素的几何中心点,然后对几何中心点进行分析。这就会造成有些要素的几何中心点不在几何要素内部,如果想达到此目的,需要先用Feature to Points 工具进行转换后再进行分析。

在ArcToolbox 中选择Data Management Tools----->Features----->FeatureTo Point ,在Input Features 选项中选择bount.shp

文件。

图1转换对话框

图2转换结果

(2)Moran's I 指数计算

在ArcToolbox 中选择Spatial Statistics Tools----->AnalyzingPatterns

----->SpatialAutocorrelation (Moran'sI) ,在Input Features Class 选项中选择

bount_FeatureToPoint2.shp文件,在Input Filed 中选择属性“规模以上工”,在Conceptualization of Spatial Relationships 中选择Inverse Distance Squared 。

图3Spatial Statistics

Tools

图4Spatial Autocorrelation

对话框

图5Moran's I 结果展示

(3)Anselin Local Moran's I 指数计算

在ArcToolbox 中选择Spatial Statistics Tools----->Mappingclusters ------>Cluster and Outlier Analysis(AnselinLocal Moran's I) ,在Input Features Class 选项中选择bount.shp 文件,在Input Filed 中选择属性“规模以上工”,在Conceptualization of Spatial Relationships 中选择Inverse Distance Squared

图6Anselin Local Moran's I

对话框

图7Anselin Local Moran's I 结果展示

图8Anselin Local Moran's I 结果一览

图9新增要素

使用该工具会输出一个新的要素类。该要素类在原要素类上添加了两个字

LMi ZScore和IMi 段,分别为LMi Index、

PValue ,前两个分别代表各个要素的索引值I 和Z score 值。如果索引值I 为正,则要素值与其相邻的要素值相近,如果索引I 值为负值,则与相邻要素值有很大的不同。如果Z score 为正且越大,则要素越与相邻要素值相近,相反,如果Z scor e 值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。

5、结果分析

(1)Moran's I 结果分析

图10Moran's I 指数结果图

Moran's I 指数的变化范围为(-1,1)。如果空间过程是不相关的,则I 的期望接近于0,当I 取负值时,一般表示负自相关,I 取正值,则表示正的自相关。用I 指数推断空间模式还必须与随机模式中的I 指数作比较。

上图显示Moran's I 的值为0.09,接近于0,可以认为整体上湖北省各区域的

规模以上总产值的空间分布是不相关的。

图11湖北省地图

从上述湖北省地形图可以知道,湖北省地形复杂,且东西地形差异大,导致

交通要素的差异(西部山区交通不便,而东部尤其是武汉城市圈交通十分便捷);地理区位差异大,资源丰富度不同(如大冶市拥有丰富的铁矿资源),经济发展起步不同及各区域的经济地位的不同,导致各区域经济发展差异且无规律分布,因而呈现出空间自相关模式中的随机模式。

(2)Anselin Local Moran's I 结果分析

图12Z Score 值图示

图13Anselin Local Moran's I 结果视图

图14原因分析

z score 为正且越大,根据聚集及分析特例工具的原理,则要素越与相邻要素

值相近,相反,如果z score 值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。图12显示,颜色越红表示要素与相邻要素值越接近,颜色越蓝,表示与相邻要素值差异越大。

而通过下图使用Graduated symbols 所展示出来的结果显然和上面所呈现出

的结果是一样的。

图15Z Score 值图示

图16Anselin Local Moran's I

结果视图

图17相关性

结合本实验分析对象,即京山、应城市、天门市、汉川市、仙桃市五个地区的规模以上工业总产值比较相近;而大冶市则与其相邻的咸宁市、江夏区、鄂州市、黄冈市、阳新等地区的规模以上工业总产值差异较大。

分析原因,京山、应城市、天门市、汉川市、仙桃市地形地势因素接近,最主要的是都位于武汉城市圈的辐射圈内,交通区位、市场潜力等因武汉市发展所带动的相关地方经济的机遇是类似的,因此其规模以上工业总产值空间分布呈现出较强的空间相关性。

对于大冶市,大冶市的大冶矿产丰富,素有“百里黄金地,江南聚宝盆”之美誉。已发现和探明的大小矿床273处,金属矿、非金属矿53种是全国6大铜矿生产基地,10大铁矿生产基地和建材重点产地。黄金、白银产量居湖北省之

冠,硅灰石储量居世界第二。其工业发展起步早,发展快,丰富的矿产资源推动了大冶市的经济发展,因而其工业总产值明显高于周围其他市县。导致其周围地区的规模以上工业总产值的空间分布的相关性较弱。

空间数据分析报告

—使用Moran's I 统计法实现空间自相关的测度

1、实验目的

(1)理解空间自相关的概念和测度方法。

(2)熟悉ArcGIS 的基本操作,用Moran's I 统计法实现空间自相关的测度。

2、实验原理

2.1空间自相关

空间自相关的概念来自于时间序列的自相关,所描述的是在空间域中位置S 上的变量与其邻近位置Sj 上同一变量的相关性。对于任何空间变量(属性)Z ,空间自相关测度的是Z 的近邻值对于Z 相似或不相似的程度。如果紧邻位置上相互间的数值接近,我们说空间模式表现出的是正空间自相关;如果相互间的数值不接近,我们说空间模式表现出的是负空间自相关。

2.2空间随机性

如果任意位置上观测的属性值不依赖于近邻位置上的属性值,我们说空间过程是随机的。

Hanning 则从完全独立性的角度提出更为严格的定义,对于连续空间变量Y,

若下式成立,则是空间独立的:

式中,n 为研究区域中面积单元的数量。若变量时类型数据,则空间独立性

的定义改写成

式中,a,b 是变量的两个可能的类型,i ≠j 。

2.3Moran's I 统计

Moran's I 统计量是基于邻近面积单元上变量值的比较。如果研究区域中邻近面积单元具有相似的值,统计指示正的空间自相关;若邻近面积单元具有不相似的值,则表示可能存在强的负空间相关。

设研究区域中存在n 个面积单元,第i 个单位上的观测值记为y i ,观测变量在n 个单位中的均值记为y ,则Moran's I 定义为

I =n ∑∑W (yij

i =1j =1n n i -y )(yj -y )

ij ∑(y

i =1

n n i -y ) 2∑∑W i =1j =1

i j n n 式中,等号右边第二项∑∑W (y-y )(y-y ) ij

i =1j =1n 类似于方差,是最重要的项,事

的乘积相当于规定(yi -y )(yj -y ) 实上这是一个协方差,邻接矩阵W 和(yi -y )(yj -y )

对邻接的单元进行计算,于是I 值的大小决定于i 和j 单元中的变量值对于均值的偏离符号,若在相邻的位置上,y i 和y j 是同号的,则I 为正;y i 和y j 是异号的,

ˆ(h)=C 1ˆ}{Z(sj ) -u ˆ}{Z(si ) -u ∑N(h)相联则I 为负。在形式上Moran's I 与协变异图

系。

Moran's I 指数的变化范围为(-1,1)。如果空间过程是不相关的,则I 的期望接近于0,当I 取负值时,一般表示负自相关,I 取正值,则表示正的自相关。用I 指数推断空间模式还必须与随机模式中的I 指数作比较。

通过使用Moran's I 工具,会返回Moran's I Index 值以及Z Score 值。如果Z score 值小于-1.96获大于1.96,那么返回的统计结果就是可采信值。如果Z score 为正且大于1.96,则分布为聚集的;如果Z score 为负且小于-1.96,则分布为离散的;其他情况可以看作随机分布。

3、实验准备

3.1实验环境

本实验在Windows 7的操作系统环境中进行,使用ArcGis 9.3软件。

3.2实验数据

此次实习提供的数据为以湖北省为目标区域的bount.dbf 文件。.dbf 数据中包括第一产业增加值,第二产业增加值万元,小学在校学生数,医院、卫生院床位数,乡村人口万人,油料产量,城乡居民储蓄存款余额,棉花产量,地方财政一般预算收入,年末总人口(万人) ,粮食产量,普通中学在校生数,肉类总产量,规模以上工业总产值现价(万元)等属性,作为分析的对象。

4、实验步骤

本报告用Moran's I 检验湖北省各区域规模以上工业总产值现价(万元) 的空间分布的空间自相关性。

(1)Feature to Points

对于线类要素和多边形要素,程序会计算要素的几何中心点,然后对几何中心点进行分析。这就会造成有些要素的几何中心点不在几何要素内部,如果想达到此目的,需要先用Feature to Points 工具进行转换后再进行分析。

在ArcToolbox 中选择Data Management Tools----->Features----->FeatureTo Point ,在Input Features 选项中选择bount.shp

文件。

图1转换对话框

图2转换结果

(2)Moran's I 指数计算

在ArcToolbox 中选择Spatial Statistics Tools----->AnalyzingPatterns

----->SpatialAutocorrelation (Moran'sI) ,在Input Features Class 选项中选择

bount_FeatureToPoint2.shp文件,在Input Filed 中选择属性“规模以上工”,在Conceptualization of Spatial Relationships 中选择Inverse Distance Squared 。

图3Spatial Statistics

Tools

图4Spatial Autocorrelation

对话框

图5Moran's I 结果展示

(3)Anselin Local Moran's I 指数计算

在ArcToolbox 中选择Spatial Statistics Tools----->Mappingclusters ------>Cluster and Outlier Analysis(AnselinLocal Moran's I) ,在Input Features Class 选项中选择bount.shp 文件,在Input Filed 中选择属性“规模以上工”,在Conceptualization of Spatial Relationships 中选择Inverse Distance Squared

图6Anselin Local Moran's I

对话框

图7Anselin Local Moran's I 结果展示

图8Anselin Local Moran's I 结果一览

图9新增要素

使用该工具会输出一个新的要素类。该要素类在原要素类上添加了两个字

LMi ZScore和IMi 段,分别为LMi Index、

PValue ,前两个分别代表各个要素的索引值I 和Z score 值。如果索引值I 为正,则要素值与其相邻的要素值相近,如果索引I 值为负值,则与相邻要素值有很大的不同。如果Z score 为正且越大,则要素越与相邻要素值相近,相反,如果Z scor e 值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。

5、结果分析

(1)Moran's I 结果分析

图10Moran's I 指数结果图

Moran's I 指数的变化范围为(-1,1)。如果空间过程是不相关的,则I 的期望接近于0,当I 取负值时,一般表示负自相关,I 取正值,则表示正的自相关。用I 指数推断空间模式还必须与随机模式中的I 指数作比较。

上图显示Moran's I 的值为0.09,接近于0,可以认为整体上湖北省各区域的

规模以上总产值的空间分布是不相关的。

图11湖北省地图

从上述湖北省地形图可以知道,湖北省地形复杂,且东西地形差异大,导致

交通要素的差异(西部山区交通不便,而东部尤其是武汉城市圈交通十分便捷);地理区位差异大,资源丰富度不同(如大冶市拥有丰富的铁矿资源),经济发展起步不同及各区域的经济地位的不同,导致各区域经济发展差异且无规律分布,因而呈现出空间自相关模式中的随机模式。

(2)Anselin Local Moran's I 结果分析

图12Z Score 值图示

图13Anselin Local Moran's I 结果视图

图14原因分析

z score 为正且越大,根据聚集及分析特例工具的原理,则要素越与相邻要素

值相近,相反,如果z score 值为负却越小,则与相邻要素值差异越大(也就是相关性不强)。图12显示,颜色越红表示要素与相邻要素值越接近,颜色越蓝,表示与相邻要素值差异越大。

而通过下图使用Graduated symbols 所展示出来的结果显然和上面所呈现出

的结果是一样的。

图15Z Score 值图示

图16Anselin Local Moran's I

结果视图

图17相关性

结合本实验分析对象,即京山、应城市、天门市、汉川市、仙桃市五个地区的规模以上工业总产值比较相近;而大冶市则与其相邻的咸宁市、江夏区、鄂州市、黄冈市、阳新等地区的规模以上工业总产值差异较大。

分析原因,京山、应城市、天门市、汉川市、仙桃市地形地势因素接近,最主要的是都位于武汉城市圈的辐射圈内,交通区位、市场潜力等因武汉市发展所带动的相关地方经济的机遇是类似的,因此其规模以上工业总产值空间分布呈现出较强的空间相关性。

对于大冶市,大冶市的大冶矿产丰富,素有“百里黄金地,江南聚宝盆”之美誉。已发现和探明的大小矿床273处,金属矿、非金属矿53种是全国6大铜矿生产基地,10大铁矿生产基地和建材重点产地。黄金、白银产量居湖北省之

冠,硅灰石储量居世界第二。其工业发展起步早,发展快,丰富的矿产资源推动了大冶市的经济发展,因而其工业总产值明显高于周围其他市县。导致其周围地区的规模以上工业总产值的空间分布的相关性较弱。


相关文章

  • 中国众创空间行业研究分析报告
  • 中国市场调研在线 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了解该行业整体发展态势及经济运行状况,旨在为企业或投资者提供方向性 ...查看


  • 探索性空间数据分析模型研究_张学良
  • 2007年4月第29卷第2期 当代经济管理 CONTEMPORARYECONOMY&MANAGEMENT Apr.2007Vol.29No.2 ■ 理论研究 TheoriesResearch 探索性空间数据分析模型研究 张学良 (上 ...查看


  • 大数据时代的空间分析
  • 第39卷第6期2014年6月武汉大学学报·信息科学版 GeomaticsandInformationScienceofWuhanUniversit y Vol.39No.6 June2014 :/.whuis20140143DOI10.13 ...查看


  • 空间数据库总结
  • 第一章: 1. 简述空间数据的结构特点及用传统商用关系数据库管理空间数据的局限性: 答:1. 结构特点:(1)从数据组织和管理角度看,空间数据与一般的事务数据相比具有非结构化特征(2)相对于一般的事务数据而言,空间数据量大(3)用以描述事物 ...查看


  • 空间统计及计量方法学习笔记
  • 空间统计及计量方法学习笔记 1. 背景及文献综述 ....................................................... 2 2. 空间效应 ............................. ...查看


  • [地理信息系统基础]思考题及答案
  • <地理信息系统基础>思考题hong 红色区域需要自己的斟酌 第一章 1.什么是地理信息?地理信息有什么特性? ⏹ 定义:地理信息是有关地理实体的性质.特征和运动状态的表征和一切有用的知识,它是对表达地理特征与地理现象之间关系的地 ...查看


  • 地理信息系统概论--知识点总结
  • 地理信息系统概论 第一章 导论 数据与信息的关系: 数据:是通过数字化或记录下来可以可以被鉴别的符号,不仅数字是数据,而且文字.符号.图象也是数据,数据本身没有意义: 信息:是对数据的解释.运用与解算,数据即使是经过处理以后的数据,只有经过 ...查看


  • ARCGIS空间分析操作步骤
  • ARCGIS 空间分析基本操作 一.实验目的 1. 了解基于矢量数据和栅格数据基本空间分析的原理和操作. 2. 掌握矢量数据与栅格数据间的相互转换. 栅格重分类(Raster Reclassify). 栅格计算-查询符合条件的栅格(Rast ...查看


  • 地质灾害多源数据一体化集成
  • 第34卷第2期 2009年4月 文章编号:1001-7445(2009) 02-0246-05广西大学学报:自然科学版Journal of Guangx i U niv ersity:Nat Sci Ed Vol. 34No. 2Apr. ...查看


  • 空间信息与数字技术本科毕业论文选题
  • 毕业论文(设计) 题 目 学 院 学 院 专 业 学生姓名 学 号 年级 级 指导教师 毕业教务处制表 毕业 毕业二〇一五年 十二月一 日 毕业 空间信息与数字技术毕业论文选题(1006个) 一.论文说明 本写作团队致力于毕业论文写作与辅导 ...查看


热门内容