大连海事大学
实 验 报 告
实验名称: 计量经济学软件应用
姓 名: 宋 杨
指导教师: 赵冰茹
交通运输管理学院
二○一四 年 十二 月
一、 实验目标
学会常用经济计量软件的基本功能,并将其应用在一元线性回归模型的分析中。具体包括:Eview6.0的安装,样本数据基本统计量计算,一元线性回归模型的建立、检验及结果输出与分析,多元回归模型的建立与分析,序列相关模型的检验与处理等。
二、实验环境
WINDOWSXP或2007操作系统下,基于EVIEWS6.0平台。
三、实验模型建立与分析
案例1:一元线性回归模型的建立与分析
已知某市货物运输量Y(万吨),国内生产总值GDP(亿元,1980年不变价)。(数据来源:《计量经济学基础》第3版 张晓峒 南开大学出版社 42页习题6) 表一:1985年~1998年的样本观测值见下表
年份 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
Y 18249 18525 18400 16693 15543 15929 18308 17522 21640 23783 24040 24133 25090 24505
GDP 161.69 171.07 184.07 194.75 197.86 208.55 221.06 246.92 276.8 316.38 363.52 415.51 465.78 509.1
1. 散点图分析
建立货物运输量Y随国内生产总值GDP的一元线性回归模型
图1-1
从图中可以看出Y与GDP之间可能存在线性相关关系。但是我们无法得出Y与GDP之间精确的计量关系,因此用普通最小二乘法进行一元线性回归模型的估计。
2.普通最小二乘法建立一元线性回归模型。
将Y作为被解释变量,GDP作为解释变量利用eviews6.0的Equation进行模型估计,输出结果报告如下:
Dependent Variable: Y Method: Least Squares Date: 12/20/14 Time: 16:49 Sample: 1985 1998 Included observations: 14
GDP C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 26.95415 12596.27
Std. Error 4.120300 1244.567
t-Statistic 6.541792 10.12101
Prob. 0.0000 0.0000 20168.57 3512.487 17.85895 17.95024 17.85050 0.859998
0.781002 Mean dependent var 0.762752 S.D. dependent var 1710.865 Akaike info criterion 35124719 Schwarz criterion -123.0126 Hannan-Quinn criter. 42.79505 Durbin-Watson stat 0.000028
图1-2
由上表可知货物运输量随国内生产总值变化的一元线性回归方程为: Y = 12596.27++ 26.9542* GDP
其中斜率26.95415表示国内生产总值每增加一元,货物运输量平均增长26.9542万辆。
3.对所建立建立的回归方程进行检验(t(12)=2.18) ⑴ 经济学意义上的检验
从回归方程来看,国内生产总值每增加一元,货物运输量平均增长26.9542万辆。系数为正,符合经济发展规律,是具有经济意义的模型。 ⑵统计学意义上的检验
可决系数R-squared=0.762752,说明被解释变量的变异中有76%以上
可由方程解释,模型总体拟合程度还不错。
F统计量=42.79505,其伴随概率0.000028
下,拒绝原假设,接受备择假设,即方程总体是显著的。
所有系数的t统计量伴随概率均小于0.05,在5%的显著性水平下,拒
绝原假设。说明系数显著,GDP对货物运输量有显著影响。
4.对模型的估计与预测
假如2000年某市以1980年为不变价的国内生产总值为620亿元,求2000年货物运输量预测值及预测区间。
国内生产总值为620亿元,货物运输量的预测值 =12596.27++ 26.9542* 620 =29307.84 万吨 经计算
vaˆr(Yˆ0)S(
2
1
n
(X0)2
xt
2
1(620280.9329)2
276.1905 )=1710.8658*141277340
故货物运输量的预测区间为: (28873.08746万辆,29742.59254万辆) 5.案例总结
从本案例中,我们知道交通运输业的发展与经济情况密切相关,影响着国内生产总值GDP的发展。在进行分析时,应注意从经济意义,统计学意义上进行分析,争取做到结果更准确。
案例2:多元线性回归模型的建立与分析
为了研究税收收入的影响因素,表二给出了我国2000~2012年国家税收收入y(亿元),国内生产总值x1(亿元),财政支出x2(亿元),商品零售价格指数x3(%),货物运输总量x4(万吨),对它们之间的关系进行回归分析。 (数据来源:国家统计局官网,统计年鉴) 表二:
年份
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
税收收入
y
12581.51 15301.38 17636.45 20017.31 24165.68 28778.54 34804.35 45621.97 54223.79 59521.59 73210.79 89738.39 100614.28
国内生产总值
x1
98000.5 108068.2 119095.7 134977.0 159453.6 183617.4 215904.4 266422.0 316030.3 340320.0 399759.5 468562.4 516282.1
财政支出x2
15886.50 18902.58 22053.15 24649.95 28486.89 33930.28 40422.73 49781.35 62592.66 76299.93 89874.16 109247.79 125952.97
商品零售价格指数
x3
100.4 100.7 99.2 101.2 103.9 101.8 101.5 104.8 105.9 99.3 103.3 105.4 102.6
货物运输总量
x4
1358682 1401786 1483447 1564492 1706412 1862066 2037060 2275822 2585937 2825222 3241807 3696961 4099400
1. 建立y与x1、x2、x3、x4的散点图如下:
图2-1
由散点图可知,解释变量与被解释变量X4之间较为显著。解释变量之间存在着线性关系。
1. 建立相关系数矩阵
建立以y,x1,x2,x3,x4为组的group对象,查看解释变量之间的相关系数矩阵,结果如图:
Y X1 X2 X3 X4
Y 1.000000 0.998575 0.997723 0.485290 0.999270
X1 0.998575 1.000000 0.994892 0.496808 0.997655
X2 0.997723 0.994892 1.000000 0.434516 0.999044
X3 0.485290 0.496808 0.434516 1.000000 0.463057
X4 0.999270 0.997655 0.999044 0.463057 1.000000
图2-2
观察发现,变量之间存在着多重共线性。X1与X2和X4之间,X2与X4之间相关系数很高,可能存在存在多重共线性,在建立模型时注意消除因此带来的影响。
2. 建立多元线性回归方程
以Y为被解释变量,X1,X2,X3,X4为解释变量,用普通最小二乘法(OLS)建立多元线性回归模型,输出结果如下:
Dependent Variable: Y Method: Least Squares Date: 12/23/14 Time: 11:17 Sample: 2000 2012 Included observations: 13
X1 X2 X3 X4 C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 0.057916 0.331199 408.6352 0.009453 -52001.51
Std. Error 0.032188 0.233223 183.1340 0.012034 16903.58
t-Statistic 1.799284 1.420093 2.231346 0.785479 -3.076361
Prob. 0.1097 0.1934 0.0562 0.4548 0.0152 44324.31 29279.90 16.57439 16.79168 16.52973 1.693475
0.999459 Mean dependent var 0.999188 S.D. dependent var 834.1345 Akaike info criterion 5566243. Schwarz criterion -102.7335 Hannan-Quinn criter. 3694.478 Durbin-Watson stat 0.000000
图2-3
由上表可知,线性回归方程为:
Y = 0.[1**********]59*X1 + 0.[1**********]5*X2 + 408.635230644*X3 + 0.[1**********]49*X4 - 52001.5104925 分析:
从表面上,方程的R平方与R-squared值很高,F统计量值明显通过检验且Prob很小,DW值也接近于2,方程的拟合程度看上去非常好,出现了“经典征兆”。
但是,通过观察,X1,X2,X3,X4前参数均未通过t检验,结果说明模型存在共线性,与相关系数矩阵得到了相互验证。说明解释变量间存在共线性。 残差图:
图2-4
3. 多重共线性的修正
为了消除多重共线性的影响,采用逐步引入法选择解释变量。
在eviews软件中采取逐步回归的办法让计算机自动选择变量。Equation对象设置时,选择最后逐步回归法(step wise ),同时,第一个框中输入因变量和必须包含的自变量,当前输入y和c;第二个框输入所有解释变量,让eviews自己去选择,再点击option选项卡,选择向前回归,逐步加入回归,结果如下:
Dependent Variable: Y Method: Stepwise Regression Date: 12/23/14 Time: 11:19 Sample: 2000 2012 Included observations: 13
Number of always included regressors: 1 Number of search regressors: 4 Selection method: Stepwise forwards
Stopping criterion: p-value forwards/backwards = 0.05/0.05
C X4 X3
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Added X4 Added X3
Coefficient -67901.03 0.031713 378.2860
Std. Error 13354.51 0.000327 133.7735
t-Statistic -5.084502 97.03854 2.827810
Prob.* 0.0005 0.0000 0.0179 44324.31 29279.90 16.67145 16.80182 16.64465 1.819396
0.999189 Mean dependent var 0.999027 S.D. dependent var 913.4238 Akaike info criterion 8343430. Schwarz criterion -105.3644 Hannan-Quinn criter. 6160.179 Durbin-Watson stat 0.000000
Selection Summary
*Note: p-values and subsequent tests do not account for stepwise selection.
图2-5
分析:R与R-squared的值很高,说明方程拟合程度很好,F统计量及其概率以及DW值明显上升,变量X4与X3的t统计量的概率均小于5%,说明逐步回归消除了多重共线性的影响。
因此,国家税收收入随着货物运输量x4,商品零售价格指数x3的二元线性回归方程为:
Y = -67901.0274323 + 0.[1**********]44*X4 + 378.28599775*X3
5.案例总结
当研究的模型存在多个解释变量时,不应该被建立出来的方程的“经典征兆”而模糊判断,而是该全面观察是否有多重共线性的可能,进而进行消除影响,此时得到的模型才是比较正确的。
案例3: 序列相关模型的检验与处理
2000年~2012年年我国城镇居民消费支出(CONSUM),人均可支配收入(INCOME)以及消费价格指数PRICE(1978年=100)
(数据来源:国家统计局,1995—2013年统计年鉴,人民生活部分)
表3
年份 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
消费价格指数
2.903 3.016 3.119 3.299 3.606 3.911 4.063 4.262 4.561 4.877 5.118 5.527 6.062 6.479 7.065 7.483 8.033 8.663
人均消费支出 3537.570 3919.470 4185.640 4331.610 4615.910 6850.000 7160.767 7486.031 8060.221 8912.257 9593.249 10618.252 12130.227 13653.426 14904.352 16546.360 19107.733 21119.683
人均可支配收入 4283.300 4838.900 5160.300 5425.100 5854.000 6280.000 6859.600 7702.800 8472.200 9421.600 10493.000 11759.500 13785.800 15780.800 17174.700 19109.400 21809.800 24564.700
1. 分析散点图
考虑到价格指数的影响,将CONSUM和INCOME各自除以价格指数,形成被解释变量CONSUM/PRICE和解释变量INCOME/PRICE,并作散点图如下,分析散点图,
CONSUM/PRICE和INCOME/PRICE呈线性相关
图3-1 2. 回归结果
建立以CONSUM/PRICE为被解释变量,以INCOME/PRICE为解释变量的回归方程。
Dependent Variable: CONSUM/PRICE Method: Least Squares Date: 12/21/14 Time: 14:55 Sample: 2000 2012 Included observations: 13
INCOME/PRICE
C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 0.588887 710.1870
Std. Error 0.038785 85.75758
t-Statistic 15.18318 8.281332
Prob. 0.0000 0.0000 1992.769 239.1207 10.93037 11.01728 10.91250 0.473658
0.954457 Mean dependent var 0.950317 S.D. dependent var 53.29950 Akaike info criterion 31249.20 Schwarz criterion -69.04740 Hannan-Quinn criter. 230.5291 Durbin-Watson stat 0.000000
图3-2
根据以上结果,得到回归方程:
CONSUM/PRICE=710.1870+0.588887* INCOME/PRICE
在0.05水平上,T=18条件下,k=1时,临界值Dl=1.16,由结果可知,DW=0.28
-
3. LM检验 LM统计量:Breusch-Godfrey Serial Correlation LM Test: F-statistic
5.904158 Prob. F(1,10) 4.826037 Prob. Chi-Square(1)
Coefficient 0.014844 -29.39168 0.659417
Std. Error 0.032829 72.33885 0.271382
t-Statistic 0.452156 -0.406306 2.429847
0.0355 0.0280 Prob. 0.6608 0.6931 0.0355 1.89E-13 51.03039 10.62022 10.75059 10.59342 1.199909
Obs*R-squared
辅助回归:
Test Equation:
Dependent Variable: RESID Method: Least Squares Date: 12/21/14 Time: 15:55 Sample: 2000 2012 Included observations: 13
Presample missing value lagged residuals set to zero.
INCOME/PRICE
C RESID(-1)
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.371234 Mean dependent var 0.245480 S.D. dependent var 44.32657 Akaike info criterion 19648.45 Schwarz criterion -66.03143 Hannan-Quinn criter. 2.952079 Durbin-Watson stat 0.098276
图3-3
由LM检验可见,卡方统计量TR2=4.83,而0.05水平下,.05(1)3.84,TR2=4.83>.05(1)3.84,因此,拒绝零假设,认为存在一阶序列相关。0.659417
说明存在正相关。
4. 用广义最小二乘法估计参数
计算一阶相关系数差分。
若令:YtCONSUM/PRICE,XtINCOME/PRICE,
1
DW
2
1
0.47
0.7652,对原变量做广义
GDYtYt0.765Yt1, GDXtXt0.765Xt1,
则以GDYt和GDXt为样本再次计算回归方程: GDY = 44.89513 + 0.784615*GDX
Dependent Variable: GDY Method: Least Squares Date: 12/21/14 Time: 15:05 Sample (adjusted): 2001 2012
Included observations: 12 after adjustments
GDX C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 0.784615 44.89513
Std. Error 0.071972 43.90644
t-Statistic 10.90161 1.022518
Prob. 0.0000 0.3306 516.7896 87.15207 9.463483 9.544300 9.433561 2.436932
0.922387 Mean dependent var 0.914626 S.D. dependent var 25.46479 Akaike info criterion 6484.557 Schwarz criterion -54.78090 Hannan-Quinn criter. 118.8451 Durbin-Watson stat 0.000001
图3-4
DW值=2.43
5. 案例总结
在用时间序列建立模型时,由于时间的滞后性可能会使结果有序列相关的影响,在建立模型的时候应该注意消除序列相关。
四、 实验总结
1、 通过实验掌握了EVIEWS6.0的安装及其应用相关(包括数据的输入、数据的分析、及其分析结果的输出)
2、 通过一次次尝试和与老师的沟通中,学会了与课本知识结合起来理解,对课本知识有了进一步的认识。
3、实验中不足的地方也是在于对课本知识的掌握程度不够。只会跟着实验讲义按部就班的走,当有同学问到相关知识时,解答的模棱两可,不敢确定。 4、通过实验报告的书写,学会了一些word的美化知识。
5、在以后的学习中,如果遇到了建立模型的问题,要善于结合数据特点进行相应的检验并建立模型。
6、希望在今后的学习中,更注重扎实基础。
大连海事大学
实 验 报 告
实验名称: 计量经济学软件应用
姓 名: 宋 杨
指导教师: 赵冰茹
交通运输管理学院
二○一四 年 十二 月
一、 实验目标
学会常用经济计量软件的基本功能,并将其应用在一元线性回归模型的分析中。具体包括:Eview6.0的安装,样本数据基本统计量计算,一元线性回归模型的建立、检验及结果输出与分析,多元回归模型的建立与分析,序列相关模型的检验与处理等。
二、实验环境
WINDOWSXP或2007操作系统下,基于EVIEWS6.0平台。
三、实验模型建立与分析
案例1:一元线性回归模型的建立与分析
已知某市货物运输量Y(万吨),国内生产总值GDP(亿元,1980年不变价)。(数据来源:《计量经济学基础》第3版 张晓峒 南开大学出版社 42页习题6) 表一:1985年~1998年的样本观测值见下表
年份 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
Y 18249 18525 18400 16693 15543 15929 18308 17522 21640 23783 24040 24133 25090 24505
GDP 161.69 171.07 184.07 194.75 197.86 208.55 221.06 246.92 276.8 316.38 363.52 415.51 465.78 509.1
1. 散点图分析
建立货物运输量Y随国内生产总值GDP的一元线性回归模型
图1-1
从图中可以看出Y与GDP之间可能存在线性相关关系。但是我们无法得出Y与GDP之间精确的计量关系,因此用普通最小二乘法进行一元线性回归模型的估计。
2.普通最小二乘法建立一元线性回归模型。
将Y作为被解释变量,GDP作为解释变量利用eviews6.0的Equation进行模型估计,输出结果报告如下:
Dependent Variable: Y Method: Least Squares Date: 12/20/14 Time: 16:49 Sample: 1985 1998 Included observations: 14
GDP C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 26.95415 12596.27
Std. Error 4.120300 1244.567
t-Statistic 6.541792 10.12101
Prob. 0.0000 0.0000 20168.57 3512.487 17.85895 17.95024 17.85050 0.859998
0.781002 Mean dependent var 0.762752 S.D. dependent var 1710.865 Akaike info criterion 35124719 Schwarz criterion -123.0126 Hannan-Quinn criter. 42.79505 Durbin-Watson stat 0.000028
图1-2
由上表可知货物运输量随国内生产总值变化的一元线性回归方程为: Y = 12596.27++ 26.9542* GDP
其中斜率26.95415表示国内生产总值每增加一元,货物运输量平均增长26.9542万辆。
3.对所建立建立的回归方程进行检验(t(12)=2.18) ⑴ 经济学意义上的检验
从回归方程来看,国内生产总值每增加一元,货物运输量平均增长26.9542万辆。系数为正,符合经济发展规律,是具有经济意义的模型。 ⑵统计学意义上的检验
可决系数R-squared=0.762752,说明被解释变量的变异中有76%以上
可由方程解释,模型总体拟合程度还不错。
F统计量=42.79505,其伴随概率0.000028
下,拒绝原假设,接受备择假设,即方程总体是显著的。
所有系数的t统计量伴随概率均小于0.05,在5%的显著性水平下,拒
绝原假设。说明系数显著,GDP对货物运输量有显著影响。
4.对模型的估计与预测
假如2000年某市以1980年为不变价的国内生产总值为620亿元,求2000年货物运输量预测值及预测区间。
国内生产总值为620亿元,货物运输量的预测值 =12596.27++ 26.9542* 620 =29307.84 万吨 经计算
vaˆr(Yˆ0)S(
2
1
n
(X0)2
xt
2
1(620280.9329)2
276.1905 )=1710.8658*141277340
故货物运输量的预测区间为: (28873.08746万辆,29742.59254万辆) 5.案例总结
从本案例中,我们知道交通运输业的发展与经济情况密切相关,影响着国内生产总值GDP的发展。在进行分析时,应注意从经济意义,统计学意义上进行分析,争取做到结果更准确。
案例2:多元线性回归模型的建立与分析
为了研究税收收入的影响因素,表二给出了我国2000~2012年国家税收收入y(亿元),国内生产总值x1(亿元),财政支出x2(亿元),商品零售价格指数x3(%),货物运输总量x4(万吨),对它们之间的关系进行回归分析。 (数据来源:国家统计局官网,统计年鉴) 表二:
年份
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
税收收入
y
12581.51 15301.38 17636.45 20017.31 24165.68 28778.54 34804.35 45621.97 54223.79 59521.59 73210.79 89738.39 100614.28
国内生产总值
x1
98000.5 108068.2 119095.7 134977.0 159453.6 183617.4 215904.4 266422.0 316030.3 340320.0 399759.5 468562.4 516282.1
财政支出x2
15886.50 18902.58 22053.15 24649.95 28486.89 33930.28 40422.73 49781.35 62592.66 76299.93 89874.16 109247.79 125952.97
商品零售价格指数
x3
100.4 100.7 99.2 101.2 103.9 101.8 101.5 104.8 105.9 99.3 103.3 105.4 102.6
货物运输总量
x4
1358682 1401786 1483447 1564492 1706412 1862066 2037060 2275822 2585937 2825222 3241807 3696961 4099400
1. 建立y与x1、x2、x3、x4的散点图如下:
图2-1
由散点图可知,解释变量与被解释变量X4之间较为显著。解释变量之间存在着线性关系。
1. 建立相关系数矩阵
建立以y,x1,x2,x3,x4为组的group对象,查看解释变量之间的相关系数矩阵,结果如图:
Y X1 X2 X3 X4
Y 1.000000 0.998575 0.997723 0.485290 0.999270
X1 0.998575 1.000000 0.994892 0.496808 0.997655
X2 0.997723 0.994892 1.000000 0.434516 0.999044
X3 0.485290 0.496808 0.434516 1.000000 0.463057
X4 0.999270 0.997655 0.999044 0.463057 1.000000
图2-2
观察发现,变量之间存在着多重共线性。X1与X2和X4之间,X2与X4之间相关系数很高,可能存在存在多重共线性,在建立模型时注意消除因此带来的影响。
2. 建立多元线性回归方程
以Y为被解释变量,X1,X2,X3,X4为解释变量,用普通最小二乘法(OLS)建立多元线性回归模型,输出结果如下:
Dependent Variable: Y Method: Least Squares Date: 12/23/14 Time: 11:17 Sample: 2000 2012 Included observations: 13
X1 X2 X3 X4 C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 0.057916 0.331199 408.6352 0.009453 -52001.51
Std. Error 0.032188 0.233223 183.1340 0.012034 16903.58
t-Statistic 1.799284 1.420093 2.231346 0.785479 -3.076361
Prob. 0.1097 0.1934 0.0562 0.4548 0.0152 44324.31 29279.90 16.57439 16.79168 16.52973 1.693475
0.999459 Mean dependent var 0.999188 S.D. dependent var 834.1345 Akaike info criterion 5566243. Schwarz criterion -102.7335 Hannan-Quinn criter. 3694.478 Durbin-Watson stat 0.000000
图2-3
由上表可知,线性回归方程为:
Y = 0.[1**********]59*X1 + 0.[1**********]5*X2 + 408.635230644*X3 + 0.[1**********]49*X4 - 52001.5104925 分析:
从表面上,方程的R平方与R-squared值很高,F统计量值明显通过检验且Prob很小,DW值也接近于2,方程的拟合程度看上去非常好,出现了“经典征兆”。
但是,通过观察,X1,X2,X3,X4前参数均未通过t检验,结果说明模型存在共线性,与相关系数矩阵得到了相互验证。说明解释变量间存在共线性。 残差图:
图2-4
3. 多重共线性的修正
为了消除多重共线性的影响,采用逐步引入法选择解释变量。
在eviews软件中采取逐步回归的办法让计算机自动选择变量。Equation对象设置时,选择最后逐步回归法(step wise ),同时,第一个框中输入因变量和必须包含的自变量,当前输入y和c;第二个框输入所有解释变量,让eviews自己去选择,再点击option选项卡,选择向前回归,逐步加入回归,结果如下:
Dependent Variable: Y Method: Stepwise Regression Date: 12/23/14 Time: 11:19 Sample: 2000 2012 Included observations: 13
Number of always included regressors: 1 Number of search regressors: 4 Selection method: Stepwise forwards
Stopping criterion: p-value forwards/backwards = 0.05/0.05
C X4 X3
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Added X4 Added X3
Coefficient -67901.03 0.031713 378.2860
Std. Error 13354.51 0.000327 133.7735
t-Statistic -5.084502 97.03854 2.827810
Prob.* 0.0005 0.0000 0.0179 44324.31 29279.90 16.67145 16.80182 16.64465 1.819396
0.999189 Mean dependent var 0.999027 S.D. dependent var 913.4238 Akaike info criterion 8343430. Schwarz criterion -105.3644 Hannan-Quinn criter. 6160.179 Durbin-Watson stat 0.000000
Selection Summary
*Note: p-values and subsequent tests do not account for stepwise selection.
图2-5
分析:R与R-squared的值很高,说明方程拟合程度很好,F统计量及其概率以及DW值明显上升,变量X4与X3的t统计量的概率均小于5%,说明逐步回归消除了多重共线性的影响。
因此,国家税收收入随着货物运输量x4,商品零售价格指数x3的二元线性回归方程为:
Y = -67901.0274323 + 0.[1**********]44*X4 + 378.28599775*X3
5.案例总结
当研究的模型存在多个解释变量时,不应该被建立出来的方程的“经典征兆”而模糊判断,而是该全面观察是否有多重共线性的可能,进而进行消除影响,此时得到的模型才是比较正确的。
案例3: 序列相关模型的检验与处理
2000年~2012年年我国城镇居民消费支出(CONSUM),人均可支配收入(INCOME)以及消费价格指数PRICE(1978年=100)
(数据来源:国家统计局,1995—2013年统计年鉴,人民生活部分)
表3
年份 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
消费价格指数
2.903 3.016 3.119 3.299 3.606 3.911 4.063 4.262 4.561 4.877 5.118 5.527 6.062 6.479 7.065 7.483 8.033 8.663
人均消费支出 3537.570 3919.470 4185.640 4331.610 4615.910 6850.000 7160.767 7486.031 8060.221 8912.257 9593.249 10618.252 12130.227 13653.426 14904.352 16546.360 19107.733 21119.683
人均可支配收入 4283.300 4838.900 5160.300 5425.100 5854.000 6280.000 6859.600 7702.800 8472.200 9421.600 10493.000 11759.500 13785.800 15780.800 17174.700 19109.400 21809.800 24564.700
1. 分析散点图
考虑到价格指数的影响,将CONSUM和INCOME各自除以价格指数,形成被解释变量CONSUM/PRICE和解释变量INCOME/PRICE,并作散点图如下,分析散点图,
CONSUM/PRICE和INCOME/PRICE呈线性相关
图3-1 2. 回归结果
建立以CONSUM/PRICE为被解释变量,以INCOME/PRICE为解释变量的回归方程。
Dependent Variable: CONSUM/PRICE Method: Least Squares Date: 12/21/14 Time: 14:55 Sample: 2000 2012 Included observations: 13
INCOME/PRICE
C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 0.588887 710.1870
Std. Error 0.038785 85.75758
t-Statistic 15.18318 8.281332
Prob. 0.0000 0.0000 1992.769 239.1207 10.93037 11.01728 10.91250 0.473658
0.954457 Mean dependent var 0.950317 S.D. dependent var 53.29950 Akaike info criterion 31249.20 Schwarz criterion -69.04740 Hannan-Quinn criter. 230.5291 Durbin-Watson stat 0.000000
图3-2
根据以上结果,得到回归方程:
CONSUM/PRICE=710.1870+0.588887* INCOME/PRICE
在0.05水平上,T=18条件下,k=1时,临界值Dl=1.16,由结果可知,DW=0.28
-
3. LM检验 LM统计量:Breusch-Godfrey Serial Correlation LM Test: F-statistic
5.904158 Prob. F(1,10) 4.826037 Prob. Chi-Square(1)
Coefficient 0.014844 -29.39168 0.659417
Std. Error 0.032829 72.33885 0.271382
t-Statistic 0.452156 -0.406306 2.429847
0.0355 0.0280 Prob. 0.6608 0.6931 0.0355 1.89E-13 51.03039 10.62022 10.75059 10.59342 1.199909
Obs*R-squared
辅助回归:
Test Equation:
Dependent Variable: RESID Method: Least Squares Date: 12/21/14 Time: 15:55 Sample: 2000 2012 Included observations: 13
Presample missing value lagged residuals set to zero.
INCOME/PRICE
C RESID(-1)
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.371234 Mean dependent var 0.245480 S.D. dependent var 44.32657 Akaike info criterion 19648.45 Schwarz criterion -66.03143 Hannan-Quinn criter. 2.952079 Durbin-Watson stat 0.098276
图3-3
由LM检验可见,卡方统计量TR2=4.83,而0.05水平下,.05(1)3.84,TR2=4.83>.05(1)3.84,因此,拒绝零假设,认为存在一阶序列相关。0.659417
说明存在正相关。
4. 用广义最小二乘法估计参数
计算一阶相关系数差分。
若令:YtCONSUM/PRICE,XtINCOME/PRICE,
1
DW
2
1
0.47
0.7652,对原变量做广义
GDYtYt0.765Yt1, GDXtXt0.765Xt1,
则以GDYt和GDXt为样本再次计算回归方程: GDY = 44.89513 + 0.784615*GDX
Dependent Variable: GDY Method: Least Squares Date: 12/21/14 Time: 15:05 Sample (adjusted): 2001 2012
Included observations: 12 after adjustments
GDX C
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
Coefficient 0.784615 44.89513
Std. Error 0.071972 43.90644
t-Statistic 10.90161 1.022518
Prob. 0.0000 0.3306 516.7896 87.15207 9.463483 9.544300 9.433561 2.436932
0.922387 Mean dependent var 0.914626 S.D. dependent var 25.46479 Akaike info criterion 6484.557 Schwarz criterion -54.78090 Hannan-Quinn criter. 118.8451 Durbin-Watson stat 0.000001
图3-4
DW值=2.43
5. 案例总结
在用时间序列建立模型时,由于时间的滞后性可能会使结果有序列相关的影响,在建立模型的时候应该注意消除序列相关。
四、 实验总结
1、 通过实验掌握了EVIEWS6.0的安装及其应用相关(包括数据的输入、数据的分析、及其分析结果的输出)
2、 通过一次次尝试和与老师的沟通中,学会了与课本知识结合起来理解,对课本知识有了进一步的认识。
3、实验中不足的地方也是在于对课本知识的掌握程度不够。只会跟着实验讲义按部就班的走,当有同学问到相关知识时,解答的模棱两可,不敢确定。 4、通过实验报告的书写,学会了一些word的美化知识。
5、在以后的学习中,如果遇到了建立模型的问题,要善于结合数据特点进行相应的检验并建立模型。
6、希望在今后的学习中,更注重扎实基础。