得分
《数据分析》课程项目
专 业: 信息与计算科学 班 级: 软件081班 姓 名: 号 软件 07
2011年12月12日
题 目: 上海财政收入的多元回归分析
目录
目录 ..................................................................................................... I 摘要 .................................................................................................... 1 1引言 ................................................................................................. 2 2多元回想和分析步骤 ..................................................................... 2
2.1多元回归模型的基本思想 ................................................... 2 2.2多元回归模型的分析步骤 ................................................... 2
2.2.1建立型 .......................................................................... 2 2.2.2多元本假设 .................................................................. 2 2.2.3共线性检验 .................................................................. 2 2.2.4用逐步回归法处理多元回归的多重共线性 . ............. 3
3样本的选系的建立 ......................................................................... 3
3.1样本择 . ................................................................................... 3 3.2立 . ........................................................................................... 3 3.2综合评价指标的标准化 ....................................................... 3 4多例分析和结果分析 ..................................................................... 5 5总结 ................................................................................................. 8 6参考文献 ....................................................................................... 10
摘要
财政收入是线性,建立财政收入影响因素更精确的模型,分析了影响财政收入的主要因素和其影响程度。
关键词
财政收入 税收 多元回归模型 多重共线性
1引言
地方财政收入即地方财政年度收入,包括地方本级收入,中央税收返还和转移支付,是地方政府履行职能的重要保障。以下根据上海、北京、天津、重庆析四个直辖市的经济发展,并对四个直辖市的财政收入作一个比较分析,进一步了解我国不同地区的经济发展之间的差异。
2多元回归模型的基本思想和分析步骤
2.1多元回归模型的基本思想
在许多实际问题中,某个变量Y 往往相关于另外一些变量X 1, X 2, , X p -1, 但这种相关关系或者由于其。利用统计推断方法对所确定的函数的合理性以及由此关系所揭示的Y 与X 1, X 2, , X p -1, 的关系作分析,进一步预测、控制等问题。
2.2多元回归模型的分析步骤
2.2.1建立多元回归模型
当f (X 1, X 2, , X p -1,) 是X 1, X 2, , X p -1, 的线性函数时,我们有称此模型为线性回归模型。
2.2.2多元回归模型的基本假设
假设1,解释变量是非随机的或固定的,且各X 之间互不相关(无多重共线性)。 假设2,随机误差项具有零均值、同方差及不序列相关性。
假设3,解释变量与随机项不 假设4,随机项满足正态分布
2.2.3多元回归的多重共线性检验
不显著系数法 情况1、R 2很大,t 小
不显著系数法是利用多元线性回归模型的拟合结果进行检验。如果拟合优度R 2的值果来看,该解释变量的参数估计值经检验却不显著,那么可能是解释变量间存在多重共线性所导致的。 情况3、新引入变量后,方差增大
在多元线性回归模型中新引入一个变量后,发现模型中原有参数估计值的方差明显 其解释变量之间的相关系数矩阵为:
因为r ij =r ji ,,所以上面相关阵为对称阵,r jj =1,只需考察主对角线元素上
方(或下方)某个元素绝对值是否很大(一般在0.8以上),就可以判断两个解释变量间是否存在多重共线性。 结论:另外需要特别性。
2.2.4用
1、含义
逐解释变量的回归系数进行检验。 2、具体要求
引入新变量,判断拟合优度R 2 引入新变量,显著
3样本的选择和指标体系的建立
3.1样本的选择
本文以市财政收入以及其影响指标为原始样本,样本数据分别中各市2010年的统计年得到)具体数据见附录。
3.2指标体系的建立
财政收入是政府实现职能的基本保障,我国财政收入主要收税收和国民经济发展的影响。在一
3.2综合评价指标的无量纲化
市生产总值用生产总值指数,社会固定资产以固定资产指数,进出口总额转化为人民币,社会销售品总额以商品零售价格为标准。以亿元为标准得到无量纲化后的数据为:
4多元回归模型的实例分析和结果分析
现在分别对上海、北京、天津、重庆四个直辖市的财政收入进行实例 以Y 代表财政收 上海市
打开SPSS →分析→回归→线性→将Y 添加如因变量、将X 1, X 2, X 3, X 4, X 5, X 6添
,检验的p 值p 0=p H 0(F ≥F 0) =0.0001。另外在方差分析表之后,还输出R 2的
SSR 5043
==0.9986。这些结果均表明Y 与X 1, X 2, X 3, X 4, X 5, X 6之间SST 5050
的线性关系显著
值,即R 2=
⑵参数估计的有关结果
上述基本相关系数表明解释变量间高度相关,也就是存在较严重的多重共线性 为检验多重共线性的影响,做Y 与各影响因素X 1, X 2, X 3, X 4, X 5, X 6之间的简单回归,通过SPSS 得到:
根据经济理论和以上统计检验,税收X 4是最重要的解释变量(t 检验值=35.594也最大),从而得出最优简单回归方程Y =f (X 4) 。 将其余变量逐个引入Y =f (X 4) 得到下
1) 在最优简单回归方程Y =f (X 4) 引入变量X 1,R 2由0.99372提高到0.99435,
、β 的影响不大,β 的符号不满意,可能是“多余变量”R 2值略有β,暂
2
4
6
时删除
因此得到最优回归模型:
Y =f (X , X ) Y
4
2
=-173. 87+70. X 06+3
2
X 3. 4479
北京市
2=MSE =1446.896;线性回归关系显著性检验打开SPS S →σ
H 0:β1=β2=β3=β4=β5=β6=0H 1:β1, β2, β3, β4, β5, β6至少有一个非零
的统计量的观测值F 0=663.287,检验的p 值p 0=p H 0(F ≥F 0) =0.0001。另外在方差分析表之后,还输出R 2的值,即R 2=
SSR 5758238.404==0.9992。这些结SST 5762579.091
果均表明Y 与X 1, X 2, X 3, X 4, X 5, X 6之间的线性关系显著 ⑵参数估计的有关结果
Correlations
根据经济理论和以上统计检验,税收X 4是最重要的解释变量(t 检验值=35.594也最大),从而得出最优简单回归方程Y =f (X 4) 。 将其余变量逐个引入Y =f (X 4) 得到下表
1) 在最234提高到0.99755, R 2值略有提高。虽然X 4与X 6、X 5与X 6高度相
的影响不大,β 、β 的符号不满意,可能是关,但是X 的引入对参数β
6
546
“多余变量”,暂时删除
因此得到最优回归模型:
Y =f (X , X ) Y
45
=-217. 30+21. X 39+4
4
X 0. 5019
1)
因此得到最优回归模型:
Y =-187.86+2.0263X 4+0.051X 3+0.042X 5
5总结
利用进行多元回归模型分别对上海、北京、天津、重庆四个直辖市的财政收入进行了统计分析。本文通过各市的统计年鉴收集了2000年至2009年的数据,首先利用EXCEL 对数据进行了初步的整理,对单位进行了统一换算,又对一些因素运用指数进行标准化,最后利用统计分析软件SPSS 进行了多元回归分析。在分析过程中发现上海
在利用计量经济模型对各市财政收入进行多元回归分析中发现,各因素之间相关系数几乎接近于1,这也就基本否定了原假设,刚开始一直以为是数据出了问题或者是模型建立的不正确,后来通过与同学交流又从网上找来了很多相关的经济学文献,发现是由的最有回归方程
Y =-217.302+1.394X 4+0.019X 5+ε可以看出税收每增加1亿元,财政收入增
加1.394亿元,社会销售品零售总额每增加1亿元,财政收入增加0.019亿元。以天津市为例:得到人口数为影响财政收入的最主要因素,其次是税收和固定资产投资。其最有回归方程为Y
=-6869.671+7.523X 6+0.172X 2+0.332X 4,可以
看出人口每增加1万人,财政收入增加7.523亿元,税收增加1亿元,财政收入增加0.332亿元,固定资产投资每增加1亿元,财政收入增加0.172亿元。以重庆市为例:税收仍为最主要的影响因素,其次是进出口总额和社会消费品零售总额。其最有回归方程为Y
=-187.86+2.0263X 4+0.051X 3+0.042X 5
可以看出税收每增加1亿元,财政收入增加2.0263亿元,进出口总额每增加1亿元,财政收入增加0.051亿元,社会消费品零售总额每增加1亿元,财政收入增加0.042亿元。这是通过数据处理建立最优回归方程,由最优回归方程得到的比较直观的分析结果。
虽然用最优回归模型可以解释财政收入与各因素之间的关系,但是根据经济
学的理论来说,财政收入并不是仅仅靠这些变量定量的分析的,因为影响财政收入因素包括很多方面,同有显著差异。如何减少区域经济发展的不平衡,缩小城镇与农村差距是我国经济发展要面对的重要问题。在竞争激烈的社会主义市场经济体制下,如何通过改变传统的经济发展模式来适应当代的经济发展趋势也是重中之重。在科技如此发达的今天,我们要充分利用科学技术发展生产力解放生产力,来更好地发展经济。与此同时环会。正因为如此,我们应该坚持学习科学发展观,走可持续发展道路,建设人与社会和谐共处的美好社会环境。
6参考文献
[1]. 梅长林,范金城. 数据分析方法 [M].高等教育出版社,2006.2
[2]. 茆诗松,程依明,濮晓龙.概率论与数理统计 [M].高等教育出版社
[3]. 黄振 分税制改革以来湖南省财政收入的多元回归分析[J].湖南科技学院学
报,2010.4,31(4)1673—2219
[4]. 邓洁 我国财政收入影响的实证分析.金卡工程 经济与法[N].2009,09期
[5]. 赵广为 燕山大学,刘炜 石家庄铁道学院 多元回归模型在区域经济预测中
的应用[J].区域经济论坛 2009,08 1005—5800
[6]. 李浩尧 中国财政收入统计分析.中国城市经济[J].2010,06期
[7]. 北京、上海、天津、重庆各市统计年鉴,统计局网站等
[8]. 影响浙江省财政
收入的因素
得分
《数据分析》课程项目
专 业: 信息与计算科学 班 级: 软件081班 姓 名: 号 软件 07
2011年12月12日
题 目: 上海财政收入的多元回归分析
目录
目录 ..................................................................................................... I 摘要 .................................................................................................... 1 1引言 ................................................................................................. 2 2多元回想和分析步骤 ..................................................................... 2
2.1多元回归模型的基本思想 ................................................... 2 2.2多元回归模型的分析步骤 ................................................... 2
2.2.1建立型 .......................................................................... 2 2.2.2多元本假设 .................................................................. 2 2.2.3共线性检验 .................................................................. 2 2.2.4用逐步回归法处理多元回归的多重共线性 . ............. 3
3样本的选系的建立 ......................................................................... 3
3.1样本择 . ................................................................................... 3 3.2立 . ........................................................................................... 3 3.2综合评价指标的标准化 ....................................................... 3 4多例分析和结果分析 ..................................................................... 5 5总结 ................................................................................................. 8 6参考文献 ....................................................................................... 10
摘要
财政收入是线性,建立财政收入影响因素更精确的模型,分析了影响财政收入的主要因素和其影响程度。
关键词
财政收入 税收 多元回归模型 多重共线性
1引言
地方财政收入即地方财政年度收入,包括地方本级收入,中央税收返还和转移支付,是地方政府履行职能的重要保障。以下根据上海、北京、天津、重庆析四个直辖市的经济发展,并对四个直辖市的财政收入作一个比较分析,进一步了解我国不同地区的经济发展之间的差异。
2多元回归模型的基本思想和分析步骤
2.1多元回归模型的基本思想
在许多实际问题中,某个变量Y 往往相关于另外一些变量X 1, X 2, , X p -1, 但这种相关关系或者由于其。利用统计推断方法对所确定的函数的合理性以及由此关系所揭示的Y 与X 1, X 2, , X p -1, 的关系作分析,进一步预测、控制等问题。
2.2多元回归模型的分析步骤
2.2.1建立多元回归模型
当f (X 1, X 2, , X p -1,) 是X 1, X 2, , X p -1, 的线性函数时,我们有称此模型为线性回归模型。
2.2.2多元回归模型的基本假设
假设1,解释变量是非随机的或固定的,且各X 之间互不相关(无多重共线性)。 假设2,随机误差项具有零均值、同方差及不序列相关性。
假设3,解释变量与随机项不 假设4,随机项满足正态分布
2.2.3多元回归的多重共线性检验
不显著系数法 情况1、R 2很大,t 小
不显著系数法是利用多元线性回归模型的拟合结果进行检验。如果拟合优度R 2的值果来看,该解释变量的参数估计值经检验却不显著,那么可能是解释变量间存在多重共线性所导致的。 情况3、新引入变量后,方差增大
在多元线性回归模型中新引入一个变量后,发现模型中原有参数估计值的方差明显 其解释变量之间的相关系数矩阵为:
因为r ij =r ji ,,所以上面相关阵为对称阵,r jj =1,只需考察主对角线元素上
方(或下方)某个元素绝对值是否很大(一般在0.8以上),就可以判断两个解释变量间是否存在多重共线性。 结论:另外需要特别性。
2.2.4用
1、含义
逐解释变量的回归系数进行检验。 2、具体要求
引入新变量,判断拟合优度R 2 引入新变量,显著
3样本的选择和指标体系的建立
3.1样本的选择
本文以市财政收入以及其影响指标为原始样本,样本数据分别中各市2010年的统计年得到)具体数据见附录。
3.2指标体系的建立
财政收入是政府实现职能的基本保障,我国财政收入主要收税收和国民经济发展的影响。在一
3.2综合评价指标的无量纲化
市生产总值用生产总值指数,社会固定资产以固定资产指数,进出口总额转化为人民币,社会销售品总额以商品零售价格为标准。以亿元为标准得到无量纲化后的数据为:
4多元回归模型的实例分析和结果分析
现在分别对上海、北京、天津、重庆四个直辖市的财政收入进行实例 以Y 代表财政收 上海市
打开SPSS →分析→回归→线性→将Y 添加如因变量、将X 1, X 2, X 3, X 4, X 5, X 6添
,检验的p 值p 0=p H 0(F ≥F 0) =0.0001。另外在方差分析表之后,还输出R 2的
SSR 5043
==0.9986。这些结果均表明Y 与X 1, X 2, X 3, X 4, X 5, X 6之间SST 5050
的线性关系显著
值,即R 2=
⑵参数估计的有关结果
上述基本相关系数表明解释变量间高度相关,也就是存在较严重的多重共线性 为检验多重共线性的影响,做Y 与各影响因素X 1, X 2, X 3, X 4, X 5, X 6之间的简单回归,通过SPSS 得到:
根据经济理论和以上统计检验,税收X 4是最重要的解释变量(t 检验值=35.594也最大),从而得出最优简单回归方程Y =f (X 4) 。 将其余变量逐个引入Y =f (X 4) 得到下
1) 在最优简单回归方程Y =f (X 4) 引入变量X 1,R 2由0.99372提高到0.99435,
、β 的影响不大,β 的符号不满意,可能是“多余变量”R 2值略有β,暂
2
4
6
时删除
因此得到最优回归模型:
Y =f (X , X ) Y
4
2
=-173. 87+70. X 06+3
2
X 3. 4479
北京市
2=MSE =1446.896;线性回归关系显著性检验打开SPS S →σ
H 0:β1=β2=β3=β4=β5=β6=0H 1:β1, β2, β3, β4, β5, β6至少有一个非零
的统计量的观测值F 0=663.287,检验的p 值p 0=p H 0(F ≥F 0) =0.0001。另外在方差分析表之后,还输出R 2的值,即R 2=
SSR 5758238.404==0.9992。这些结SST 5762579.091
果均表明Y 与X 1, X 2, X 3, X 4, X 5, X 6之间的线性关系显著 ⑵参数估计的有关结果
Correlations
根据经济理论和以上统计检验,税收X 4是最重要的解释变量(t 检验值=35.594也最大),从而得出最优简单回归方程Y =f (X 4) 。 将其余变量逐个引入Y =f (X 4) 得到下表
1) 在最234提高到0.99755, R 2值略有提高。虽然X 4与X 6、X 5与X 6高度相
的影响不大,β 、β 的符号不满意,可能是关,但是X 的引入对参数β
6
546
“多余变量”,暂时删除
因此得到最优回归模型:
Y =f (X , X ) Y
45
=-217. 30+21. X 39+4
4
X 0. 5019
1)
因此得到最优回归模型:
Y =-187.86+2.0263X 4+0.051X 3+0.042X 5
5总结
利用进行多元回归模型分别对上海、北京、天津、重庆四个直辖市的财政收入进行了统计分析。本文通过各市的统计年鉴收集了2000年至2009年的数据,首先利用EXCEL 对数据进行了初步的整理,对单位进行了统一换算,又对一些因素运用指数进行标准化,最后利用统计分析软件SPSS 进行了多元回归分析。在分析过程中发现上海
在利用计量经济模型对各市财政收入进行多元回归分析中发现,各因素之间相关系数几乎接近于1,这也就基本否定了原假设,刚开始一直以为是数据出了问题或者是模型建立的不正确,后来通过与同学交流又从网上找来了很多相关的经济学文献,发现是由的最有回归方程
Y =-217.302+1.394X 4+0.019X 5+ε可以看出税收每增加1亿元,财政收入增
加1.394亿元,社会销售品零售总额每增加1亿元,财政收入增加0.019亿元。以天津市为例:得到人口数为影响财政收入的最主要因素,其次是税收和固定资产投资。其最有回归方程为Y
=-6869.671+7.523X 6+0.172X 2+0.332X 4,可以
看出人口每增加1万人,财政收入增加7.523亿元,税收增加1亿元,财政收入增加0.332亿元,固定资产投资每增加1亿元,财政收入增加0.172亿元。以重庆市为例:税收仍为最主要的影响因素,其次是进出口总额和社会消费品零售总额。其最有回归方程为Y
=-187.86+2.0263X 4+0.051X 3+0.042X 5
可以看出税收每增加1亿元,财政收入增加2.0263亿元,进出口总额每增加1亿元,财政收入增加0.051亿元,社会消费品零售总额每增加1亿元,财政收入增加0.042亿元。这是通过数据处理建立最优回归方程,由最优回归方程得到的比较直观的分析结果。
虽然用最优回归模型可以解释财政收入与各因素之间的关系,但是根据经济
学的理论来说,财政收入并不是仅仅靠这些变量定量的分析的,因为影响财政收入因素包括很多方面,同有显著差异。如何减少区域经济发展的不平衡,缩小城镇与农村差距是我国经济发展要面对的重要问题。在竞争激烈的社会主义市场经济体制下,如何通过改变传统的经济发展模式来适应当代的经济发展趋势也是重中之重。在科技如此发达的今天,我们要充分利用科学技术发展生产力解放生产力,来更好地发展经济。与此同时环会。正因为如此,我们应该坚持学习科学发展观,走可持续发展道路,建设人与社会和谐共处的美好社会环境。
6参考文献
[1]. 梅长林,范金城. 数据分析方法 [M].高等教育出版社,2006.2
[2]. 茆诗松,程依明,濮晓龙.概率论与数理统计 [M].高等教育出版社
[3]. 黄振 分税制改革以来湖南省财政收入的多元回归分析[J].湖南科技学院学
报,2010.4,31(4)1673—2219
[4]. 邓洁 我国财政收入影响的实证分析.金卡工程 经济与法[N].2009,09期
[5]. 赵广为 燕山大学,刘炜 石家庄铁道学院 多元回归模型在区域经济预测中
的应用[J].区域经济论坛 2009,08 1005—5800
[6]. 李浩尧 中国财政收入统计分析.中国城市经济[J].2010,06期
[7]. 北京、上海、天津、重庆各市统计年鉴,统计局网站等
[8]. 影响浙江省财政
收入的因素