第一章 绪论
()
1.1 一般说来,计量经济分析按照以下步骤进行:
(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据(4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 我们在计量经济模型中列出了影响因变量的解释变量,但它(它们)仅是影响因变量的主要因素,还有很多对因变量有影响的因素,它们相对而言不那么重要,因而未被包括在模型中。为了使模型更现实,我们有必要在模型中引进扰动项u来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。 1.4 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。如就是一个估计量,
查表Z0.025
10/25
1.96 因为Z= 5 >Z0.0251.96,
故拒绝原假设, 即
此样本不是取自一个均值为120元、标准差为10元的正态总体。 2.4 原假设 :
备择假设 :
H0:2500
H1:2500
00)
100/120t
()ˆ查表0.83
得 t0.025(161)2.131 因为t = 0.83
tc2.131,
设,即从上次调查以来,平均月销售额没有发生变化。
第三章双变量线性回归模型
3.1 判断题(说明对错;如果错误,则予以更正) (1)对 (2)对 (3)错
Y
i1
n
i
n
。现有一样本,共4个数,100,104,96,130,则
只要线性回归模型满足假设条件(1)~(4),OLS估计量就是BLUE。 (4)对 (5)错
R2 =ESS/TSS。
(6)对
根据这个样本的数据运用均值估计量得出的均值估计值为
10010496130
107.5。
4
第二章 计量经济分析的统计学基础
2.1 略,参考教材。 2.2
(7)错。我们可以说的是,手头的数据不允许我们拒绝原假设。
(8)错。因为Var(
ˆ)
2
S
S
5
==1.25 N4
xt
,只有当2
xt
2
保持恒定
时,上述说法才正确。 3.2 证明:
用=0.05,N-1=15个自由度查表得t0.005=2.947,故99%置信限为
t0.005S =174±2.947×1.25=174±3.684
也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。 2.3 原假设
备择假设
ˆYX
xiyi
2i
x
ˆXY
yixi
2i
y
xyy
ii
i22
3.3 (1)
H0:120
H1:120
(xiyi)2
ˆˆYXXY22
xyiixy
r2检验统计量
ˆe)Y(Y
ˆeYY
ˆe=0,YY
t
t
t
t
t
t
t
t
t
ˆeYtYtt
ˆ,ˆ
ˆ)ˆ(
ˆ)Eˆ)]E[((ˆ))(ˆ)]ˆ,ˆ)Cov(([(
ˆ)][(ˆ)2]E[((
2ˆ)(第一项为0(0的证明见本题())1ˆ)(
两边除以n,得
YYˆ,即Y的真实值和拟合值有共同的均值。
n
n
(
2
)
2
xt2
ˆˆXtetˆˆ,注意到 ˆXt)etˆet3.5(1)Yˆtet(12
由于e0,Xtet0(教材中已证明),
xiXi,xi0,从而0,则我们有因此,Yˆtet0,即
ˆ1=ˆ2=ˆYett22Cov(Yˆ=0,Y的拟合值与残差无关。t,et) Xiˆ)ˆVar(Yett12
nxi
3.4 (1) 2xi22xi22
ˆ1)Var(22
n(x)nnxiˆ,iˆ
t
2
2
ˆ)ˆ(
2ˆ)(ˆ)22ˆ)(2
由上述结果,可以看到,无论是两个截距的估计量还是它们的方差都不相同。 (2)
(
u)
i
2
n
22
uxu
nx
i
tt
t
2
ˆ)22(
xnun)
ˆ)22X(
(ui)n2
2
(u1
un)(x1u1
nxt2
ˆ2
u
2
i
uiujn
ij
2
xu
2
2
ii
(xixj)uiuj
ij
xyx
i2i
i
ˆ2,
(x)(Y)xy
(x)x
i
i
i
2
2
i
i
22
i
nxt2
ˆ)22(
ˆ)Var(ˆ容易验证,Var()=22
这表明,两个斜率的估计量和方差都相同。
xi
两边取期望值,有:ui2uiuj
ij
ˆ)EE(2
n
等式右端三项分别推导如下:
2
xiui2(xixj)uiujijˆ)2+2E(2-2nxt
3.6(1)斜率的值 -4.318表明,在1980-1994期间,相对价格每上升一个单位,(GM/$)汇率下降约4.32个单位。也就是说,美元贬值。截距项6.682的含义是,如果相对价格为0,1美元可兑换6.682马克。当然,这一解释没有经济意义。
(2)斜率系数为负符合经济理论和常识,因为如果美国价格上
ui2uiuj
ijEn
2
12
n(E(ui)2E(uiuj))
ij
n2
2n
xiui(xixj)uiujij
2
nxt
21nxt2
2
(xiE(ui)(xixj)E(uiuj))2ij
2
2
2xinxt2
升快于德国,则美国消费者将倾向于买德国货,这就增大了对马
0
(
x=0)
i
克的需求,导致马克的升值。
(3)在这种情况下,斜率系数被预期为正数,因为,德国CPI相对于美国CPI越高,德国相对的通货膨胀就越高,这将导致美元对马克升值。 3.7(1)
ˆ)22E(因此
xt2
22222
22(xt)Xt
ˆ)]E([0
nnxt2nxt2xt2
2
2
ˆ)即Var(
(2)
Xt
2
nxt
2
2
ˆeight76.261.31*177.67156.49W
ˆeight76.261.31*164.98139.86 W
ˆeight76.261.31*187.82169.78W
ˆeight1.31*height1.31*3.814.99 (2)W
3.8 (1)
(1.73) (2.93)
0.75表明劳动工时增, 值为2.93,表明该系数显著
计
量
1.0)/0.25560.978
查t表, c2.306 ,
YYtn96/109.6
XXtn80/108 ˆxytt
tt0.025(8)2.306 ,因为│t│= 0.978
故接受原假设:
1.0。
ˆ0=10+0.90*250=235.0 y
x
2
t
21/280.75
3.9
对于x0=250 ,点预测值
ˆ*9.60.75*83.6估计方程为: ˆ
ˆ0 的95%置信区间为: y
ˆ0t0.025(122)*y
ˆ3.60.75X Ytt
(2)
2352350.29即 234.71 - 235.29。也就是说,我们有95%的把握预测位于234.71 至235.29 之间. 3.10(1)列表计算如下:
2t
y0将
ˆxy)n2)ˆ2et2n2)(yt2tt
(30.40.75*21)/81.83125
ˆ/Se(ˆ)t
ˆˆ
2.934
x
X
t
ˆ/Se(ˆ)t
ˆ
ˆ
2
2
nx
t
2
1.733
R(xtyt
2xy
t
2t
)(21/28*30.4)0.22
回归结果为(括号中数字为t值):
ˆ3.60.75X R2=0.518 Ytt
YYt15/53
对于5-2=3个自由度,查表得5%显著性水平检验的t临界值为:
tc3.182
结论:
由于t
XXt55/511
ˆxytt
4.0213.182
xt227/740.365
故拒绝原假设H0,接受备则假设H1,即新观测值与样本观测值来自不同的总体。 3.12 (1)原假设
ˆ*30.365*111.015 ˆ
H0:0 备择假设 H1:0
ˆ0)(t
ˆ)6.5Se(
ˆ1.0150.365X 我们有:Ytt
(2)
检验统计量
查t表,在5%显著水平下
t0.025(1911)2.11 ,因为
ˆxy)n2)(100.365*27)/30.048t=6.5>2.11 2et2n2)(yt2tt
R(xtyt
2xy
2t
2
t
)(27/*10)0.985
22
故拒绝原假设,即0,说明收入对消费有显著的影响。
(2)由回归结果,立即可得:
(3) 对于
ˆ)Se(
ˆ=-1.015+0.365*10=2.635 X0=10 ,点预测值 Y0
ˆ)0.0.125 Se(.5Y0 的95%置信区间为:
ˆtˆ1/n(X0)2Y00.025(52)*
.7
5.556
x
2
(3)的95%置信区间为:
ˆtSe(ˆ)0.812.11*0.1250.810.264
2
=
2.6353.182*.048*1/5(1011)2/742.6350.770
即 1.895 -3.099,也就是说,我们有95%的把握预测Y0将位于1.865 至3.405 之间.
3.11 问题可化为“预测误差是否显著地大?”
当
X0
=20
时
,
即为0.546~1.074,也就是说有95%的把握说在0.546~1.074之间,所以在这个区间中不括0包。
3.13 回归之前先对数据进行处理。把名义数据转换为实际数据,公式如下:
人均消费C=C/P*100(价格指数)
人均可支配收入Y=[Yr*rpop/100+Yu*(1-rpop/100)]/P*100 农村人均消费Cr=Cr/Pr*100 Cu/Pu*100
城镇人均消费Cu=
ˆ1.0150.365206.285 Y0
预
测
误
差
农村人均纯收入Yr=Yr/Pr*100 城镇人均可支配收入Yu=Yu/Pu*100
处理好的数据如下表所示:
ˆ7.626.2851.335 e0Y0Y0
原假设H0:
E(e0)0
0
备择假设H1:E(e0)检验:
若H0为真,则
t
e0E(e0)ˆ
1(X0)
nx2
2
1.33500.048
1(2011)
574
2
(n1)(1R2)8*(10.94)
10.92nk1921
. H0:0
H1:0 ˆt
ˆ)(
0.273/0.1352.022
t0.025(6)2.447 因为t=2.022
不显著异于0, 表明土地投入变动对年净收益变动.
H0:0
根据表中的数据用软件回归结果如下:
H1:0
ˆ
t
0.733/0.1255.864 ˆSe()
检验统计量
Ct= 90.93 + 0.692Yt R2=0.997
t: (11.45) (74.82) DW=1.15
2
农村:Crt= 106.41 + 0.60Yrt R=0.979
查表,t0.025(6)2.447 因为t=5.864>t0.025(6),故拒绝原
假设,即β显著异于0,表明资金投入变动对年净收益变动有显著的影响. (3) 原假设
备择假设
t: (8.82) (28.42) DW=0.76
城镇:Cut= 106.41 + 0.71Yut R2=0.998
t: (13.74) (91.06) DW=2.02
从回归结果来看,三个方程的R都很高,说明人均可支配收
拒绝原假设。
入较好地解释了人均消费支出。
三个消费模型中,可支配收入对人均消费的影响均是显著的,
影响.
并且都大于0小于1,符合经济理论。而斜率系数最大的是城镇
4.3 检验两个时期是否有显著结构变化,可分别检验方程中D和
的斜率系数,其次是全国平均的斜率,最小的是农村的斜率。说明城镇居民的边际消费倾向高于农村居民。
D•X的系数是否显著异于0.
(1) 原假设
结论,:土地投入和资金投入变动作为一个整体对年净收益变动有
2
H0:0
H1: 原假设不成立
检验统计量
R2/k0.94/2
F47
(1R2)/(nk1)(10.94)/(921)
查表,在5%显著水平下F(2,6)
5.14 因为F=47>5.14,故
H0:20 备择假设 H1:20
统
计
量
第四章 多元线性回归模型
4.1 应采用(1),因为由(2)和(3)的回归结果可知,除X1外,其余解释变量的系数均不显著。(检验过程略) 4.2 (1) 斜率系数含义如下:
0.273: 年净收益的土地投入弹性, 即土地投入每上升1%, 资金投入不变的情况下, 引起年净收益上升0.273%.
0.733: 年净收益的资金投入弹性, 即资金投入每上升1%, 土地投入不变的情况下, 引起年净收益上升0.733%. 拟
合
情
况
:
检验
ˆt2
ˆ)1.4839/0.47043.155 Se(2
2.145 因为
t=3.155>t0.025(14), 故拒
查表t0.025(184)
绝原假设, 即2显著异于0。
(2) 原假设 检
验
H0:40 备择假设 H1:40
统
计
量
ˆt4
ˆ)0.1034/0.03323.115 Se(4
2.145 因为|t|=3.155>t0.025(14), 故拒
查表t0.025(184)
(n1)(1R2)8*(10.94)
10.92nk1921
. H0:0
H1:0 ˆt
ˆ)(
0.273/0.1352.022
t0.025(6)2.447 因为t=2.022
不显著异于0, 表明土地投入变动对年净收益变动.
H0:0
根据表中的数据用软件回归结果如下:
H1:0
ˆ
t
0.733/0.1255.864 ˆSe()
检验统计量
Ct= 90.93 + 0.692Yt R2=0.997
t: (11.45) (74.82) DW=1.15
2
农村:Crt= 106.41 + 0.60Yrt R=0.979
查表,t0.025(6)2.447 因为t=5.864>t0.025(6),故拒绝原
假设,即β显著异于0,表明资金投入变动对年净收益变动有显著的影响. (3) 原假设
备择假设
t: (8.82) (28.42) DW=0.76
城镇:Cut= 106.41 + 0.71Yut R2=0.998
t: (13.74) (91.06) DW=2.02
从回归结果来看,三个方程的R都很高,说明人均可支配收
拒绝原假设。
入较好地解释了人均消费支出。
三个消费模型中,可支配收入对人均消费的影响均是显著的,
影响.
并且都大于0小于1,符合经济理论。而斜率系数最大的是城镇
4.3 检验两个时期是否有显著结构变化,可分别检验方程中D和
的斜率系数,其次是全国平均的斜率,最小的是农村的斜率。说明城镇居民的边际消费倾向高于农村居民。
D•X的系数是否显著异于0.
(1) 原假设
结论,:土地投入和资金投入变动作为一个整体对年净收益变动有
2
H0:0
H1: 原假设不成立
检验统计量
R2/k0.94/2
F47
(1R2)/(nk1)(10.94)/(921)
查表,在5%显著水平下F(2,6)
5.14 因为F=47>5.14,故
H0:20 备择假设 H1:20
统
计
量
第四章 多元线性回归模型
4.1 应采用(1),因为由(2)和(3)的回归结果可知,除X1外,其余解释变量的系数均不显著。(检验过程略) 4.2 (1) 斜率系数含义如下:
0.273: 年净收益的土地投入弹性, 即土地投入每上升1%, 资金投入不变的情况下, 引起年净收益上升0.273%.
0.733: 年净收益的资金投入弹性, 即资金投入每上升1%, 土地投入不变的情况下, 引起年净收益上升0.733%. 拟
合
情
况
:
5
检验
ˆt2
ˆ)1.4839/0.47043.155 Se(2
2.145 因为
t=3.155>t0.025(14), 故拒
查表t0.025(184)
绝原假设, 即2显著异于0。
(2) 原假设 检
验
H0:40 备择假设 H1:40
统
计
量
ˆt4
ˆ)0.1034/0.03323.115 Se(4
2.145 因为|t|=3.155>t0.025(14), 故拒
查表t0.025(184)
绝原假设, 即4显著异于0。 结论:两个时期有显著的结构性变化。
4.4 (1)参数线性,变量非线性 ,模型可线性化。
不能拒绝原假设,接受β2=0,说明进口商品与国内商品的比价(X2)对进口需求地解释作用不强,这个变量是否应该留在模型中,需进一步研究。
4.6(1)弹性为-1.34,它统计上异于0,因为在弹性系数真值为0
的原假设下的t值为t
11
设z1,z22,则模型转换为
xx
y01z12z2u
(2)变量、参数皆非线性,无法将模型转化为线性模型。 (3)变量、参数皆非线性,但可转化为线性模型。
1.34
4.469
0.32
得到这样一个t值的概率(P值)极低。可是,该弹性系数不显著异于-1,因为在弹性真值为-1的原假设下,t值为:
1
1e(01xu) 取倒数得:y
把1移到左边,取对数为:ln
t
1.34(1)
1.06
0.32
y
01xu,令
1y
这个t值在统计上是不显著的。
(2)收入弹性虽然为正,但并非统计上异于0,因为t值小于1(t
。 0.170.200.85)
zln
y
,则有 1y
(3)由
z01xu
4.5 (1)截距项为-58.9,在此没有什么意义。X1的系数表明在其它条件不变时,个人年消费量增加1百万美元,某国对进口的需求平均增加20万美元。X2的系数表明在其它条件不变时,进口商品与国内商品的比价增加1单位,某国对进口的需求平均减少10万美元。
(2)Y的总变差中被回归方程解释的部分为96%,未被回归方程解释的部分为4%。
(3)检验全部斜率系数均为0的原假设。
21(1R2)
nk1
n1
2
n1nk1
,可推出
R21(12)
本题中,=0.27,n=46,k=2,代入上式,得R=0.3026。
4.7 (1)薪金和每个解释变量之间应是正相关的,因而各解释变量系数都应为正,估计结果确实如此。
系数0.280的含义是,其它变量不变的情况下,CEO薪金关于销售额的弹性为0.28;
系数0.0174的含义是,其它变量不变的情况下,如果股本收益率
2
R2/kESS/k
F
(1R2)/(nk1)RSS/(nk1)
0.96/2
192
0.04/16
=
与此类似,其它变量不变的情况下,公司股票收益上升一个单位,CEO薪金上升0.024%。
(2)用回归结果中的各系数估计值分别除以相应的标准误差,得到4个系数的t值分别为:13.5、8、4.25和0.44。用经验法则容易看出,前三个系数是统计上高度显著的,而最后一个是不显著的。
(3)R2=0.283,拟合不理想,即便是横截面数据,也不理想。 4.8 (1)2.4%。
(2)因为Dt和(Dtt)的系数都是高度显著的,因而两时期人口的水平和增长率都不相同。1972-1977年间增长率为1.5%,1978-1992年间增长率为2.6%(=1.5%+1.1%)。
4.9 原假设H0: β1 =β2,β3 =1.0
备择假设H1: H0不成立 若H0成立,则正确的模型是:
6
上升一个百分点(注意,不是1%),CEO薪金的上升约为1.07%;
由于F=192 F0.05(2,16)=3.63,故拒绝原假设,回归方程
很好地解释了应变量Y。 (4)
A. 原假设H0:β1= 0 备择假设H1:β1 0
ˆ0.2
t121.74 t0.025(16)=2.12,
S(1)0.0092
故拒绝原假设,β
1
显著异于零,说明个人消费支出(X1)对
进口需求有解释作用,这个变量应该留在模型中。
B. 原假设H0:β2=0
备择假设H1:β2 0
t
ˆ0.12
1.19
0.084S(2)
Yβ0β1(X1X2)X3u
(2)对
据此进
(3)错
即使解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性。 (4)对 (5)错
在扰动项自相关的情况下OLS估计量仍为无偏估计量,但
行有约束回归,得到残差平方和
SR。
若H1为真,则正确的模型是原模型:
Yβ0β1X1β2X2β3X3u
据此进行
不再具有最小方差的性质,即不是BLUE。 (6)对
无约束回归(全回归),得到残差平方和S。检验统计量是:
(7)错 g
~F(g,n-K-1) F
S(nK1)模型中包括无关的解释变量,参数估计量仍无偏,但会增大
估计量的方差,即增大误差。 (8)错。
SRS用自由度(2,n-3-1)查F分布表,5%显著性水平下,得到FC ,
如果F FC, 则拒绝原假设H0,接受备择假设H1。
4.10 (1)2个,D1
(2)4个,
验都不显著, R2值仍可能高。 (9)错。
存在异方差的情况下,OLS法通常会高估系数估计量的标准误差,但不总是。
1大型企业0其他1中型企业
D2
0其他
大学1高中(10)错。1小学1初中1
D1D2D3D4
0其他0其他0其他异方差性是关于扰动项的方差,而不是关于解释变量的方0其他
4.11
yt01D2xt3(Dxt)ut,其中
D0
D1,
t1979t1979
差。
5.2 对模型两边取对数,有
lnYt=lnY0+t*ln(1+r)+lnut ,
令LY=lnYt,a=lnY0,b=ln(1+r),v=lnut,模型线性化
为:
LY=a+bt+v
估计出b之后,就可以求出样本期内的年均增长率r了。
5.3(1)DW=0.81,查表(n=21,k=3,α=5%)得dL=1.026。
DW=0.81<1.026
结论:存在正自相关。
(2)DW=2.25,则DW´=4 – 2.25 = 1.75 查表(n=15, k=2, α=5%)得du =1.543。 1.543<DW´= 1.75 <2 结论:无自相关。
(3)DW= 1.56,查表(n=30, k=5, α=5%)得dL =1.071, du =1.833。
1.071<DW= 1.56 <1.833
结论:无法判断是否存在自相关。
5.4 7
4.12 对数据处理如下:
lngdp=ln(gdp/p) lnk=ln(k/p) lnL=ln(L/P) 对模型两边取对数,则有 lnY=lnA+lnK+lnL+lnv 用处理后的数据回归,结果如下:
ˆdp0.260.96lnk0.18lnllng20.97
t:(-0.95) (16.46) (3.13)
由修正决定系数可知,方程的拟合程度很高;资本和劳动力的斜率系数均显著(tc=2.048), 资本投入增加1%,gdp增加0.96%,劳动投入增加1%,gdp增加0.18%,产出的资本弹性是产出的劳动弹性的5.33倍。
第五章 模型的建立与估计中的问题及对策
5.1 (1)对
(1) (2)
横截面数据.
不能采用OLS法进行估计,由于各个县经济实力差距大,可能存在异方差性。
(2)重新设定模型为
GNPt0(13)Mt(23)Mt1ut
01Mt2Mt1ut
我们可以估计出
(3) 5.5
GLS法或WLS法。
0、1和2
,但无法估计出
(1)可能存在多重共线性。因为①X3的系数符号不符合实际.②R很高,但解释变量的t值低:t2=0.9415/0.8229=1.144, t3=0.0424/0.0807=0.525.
解决方法:可考虑增加观测值或去掉解释变量X3. (2)DW=0.8252, 查表(n=16,k=1,α=5%)得dL=1.106.
DW=0.8252
-
单纯消除自相关,可考虑用科克伦-奥克特法或希尔德雷斯-卢法;进一步研究,由于此模型拟合度不高,结合实际,模型自相关有可能由模型误设定引起,即可能漏掉了相关的解释变量,可增加相关解释变量来消除自相关。5.6 存在完全多重共线性问题。因为年龄、学龄与工龄之间大致存在如下的关系:Ai=7+Si+Ei
解决办法:从模型中去掉解释变量A,就消除了完全多重共线性问题。
5.7 (1)若采用普通最小二乘法估计销售量对广告宣传费用的回归方程,则系数的估计量是无偏的,但不再是有效的,也不是一致的。
(2)应用GLS法。设原模型为
2
1、2和3。
(3)所有参数都可以估计,因为不再存在完全共线性。 (4)同(3)。
5.9(1)R2很高,logK的符号不对,其 t值也偏低,这意味着可能存在多重共线性。
(2)logK系数的预期符号为正,因为资本应该对产出有正向影响。但这里估计出的符号为负,是多重共线性所致。
(3)时间趋势变量常常被用于代表技术进步。(1)式中,0.047的含义是,在样本期内,平均而言,实际产出的年增长率大约为4.7%。
(4)此方程隐含着规模收益不变的约束,即+=1,这样变换模型,旨在减缓多重共线性问题。
(5)资本-劳动比率的系数统计上不显著,看起来多重共线性问题仍没有得到解决。
(6)两式中R2是不可比的,因为两式中因变量不同。 5.10(1)所作的假定是:扰动项的方差与GNP的平方成正比。模型的估计者应该是对数据进行研究后观察到这种关系的,也可能用格里瑟法对异方差性形式进行了实验。
(2)结果基本相同。第二个模型三个参数中的两个的标准误差比第一个模型低,可以认为是改善了第一个模型存在的异方差性问题。 5.11 我们有
yi01xiui (1)
由于已知该行业中有一半的公司比另一半公司大,且已假定大公司的误差项方差是小公司误差项方差的两倍,则有
2
ii,其中i
222
2,i大公司
i
1,i小公司
yi0xu1ii (2)
。则模型可变换为
ˆ12
RSS155
n1k125
2
ˆ32
RSS3140
n3k125
2
iii
此模型的扰动项已满足同方差性的条件,因而可以应用OLS法进行估计。
(3)可以。对变换后的模型(2)用戈德弗尔德-匡特检验法进行异方差性检验。如果模型没有异方差性,则表明对原扰动项的方差的假定是正确的;如果模型还有异方差性,则表明对原扰动项的方差的假定是错误的,应重新设定。 5.8(1)不能。因为第3个解释变量(
原假设H0:13
2
备则假设H1:13
2
检验统计量为:
ˆ3214025
F22.5454
25ˆ1
用自由度(25,25)查F表,5%显著性水平下,临界值为:Fc=1.97。
因为F=2.5454>Fc=1.97,故拒绝原假设原假设H0: 8
MtMt1)是Mt和
Mt1的线性组合,存在完全多重共线性问题。
13
22
DW=0.76,查表(n=19,k=1,α=5%)得dL=1.18。
。
DW=0.76<1.18,故存在自相关。 解决方法与(1)同,略。
(3)城镇:Cut= 106.41 + 0.71Yut R2=0.998
t: (13.74) (91.06) DW=2.02
DW=2.02,非常接近2,无自相关。
5.14 (1)用表中的数据回归,得到如下结果:
结论:存在异方差性。 5.12 将模型变换为:
Yt1Yt12Yt20(112)1(Xt1Xt12Xt2)t
(2)
若
1、2为已知,则可直接估计(2)式。一般情况下,1、
因此需要先估计它们。首先用OLS法估计原模型(1)2为未知,
式,得到残差et,然后估计:
et1et12et2t
其中
ˆ =54.19 + 0.061X1 + 1.98*X2 + 0.03X3 - 0.06X4 R2=Y
0.91
t: (1.41) (1.58) (3.81) (1.14) (-1.78) 根据tc(α=0.05,n-k-1=26)=2.056,只有X2的系数显著。 (2)理论上看,有效灌溉面积、农作物总播种面积是农业总产值的重要正向影响因素。在一定范围内,随着有效灌溉面积、播种面积的增加,农业总产值会相应增加。受灾面积与农业总产值呈反向关系,也应有一定的影响。而从模型看,这些因素都没
0和
ˆ1和ˆ2生成 t为误差项。用得到的1和2的估计值
ˆ1Yt1ˆ2Yt2 YtYt
ˆ1Xt1ˆ2Xt2 XtXt
令
0(112),用OLS法估计
Yt1Xtt
ˆˆ和即可得到ˆ
1。
1
ˆ,从而得到原模型(1)的系数估计值
显著影响。这是为什么呢?
这是因为变量有效灌溉面积、施肥量与播种面积间有较强的相关性,所以方程存在多重共线性。现在我们看看各解释变量间的相关性,相关系数矩阵如下:
X1 X2 X3 X4
1 0.896 0.880 0.715
0.896 1 0.895 0.685
0.880 0.895 1 0.883
0.715 0.685 0.883 1
5.13 (1)全国居民人均消费支出方程:
Ct= 90.93 + 0.692Yt R=0.997
2
t: (11.45) (74.82) DW=1.15 DW=1.15,查表(n=19,k=1,α=5%)得dL=1.18。 DW=1.15<1.18
结论:存在正自相关。可对原模型进行如下变换: Ct -ρCt-1 = α(1-ρ)+β(Yt-ρYt-1)+(ut -ρut -1)
X1 X2 X3 X4
ˆ由ˆ=0.425 1DW/2有
t ,结果如下:
令:Ct= Ct –0.425Ct-1 , Yt= Yt-0.425Yt-1 ,α’=0.575α 然后估计 Ct=α+βYt + ε
表中r12=0.896,r13=0.895,说明施肥量与有效灌溉面积和播种面积间高度相关。
Ct= 55.57 + 0.688Yt
R2=0.994
我们可以通过对变量X2的变换来消除多重共线性。令X22=X2/X3(公斤/亩),这样就大大降低了施肥量与面积之间的相关性,用变量X22代替X2,对模型重新回归,结果如下:
t:(11.45) (74.82) DW=1.97
DW=1.97,查表(n=19,k=1,α=5%)得du=1.401。 DW=1.97>1.18,故模型已不存在自相关。 (2)农村居民人均消费支出模型:
农村:Crt= 106.41 + 0.60Yrt R=0.979
2
ˆ =-233.62 + 0.088X1 + 13.66*X2 + 0.096X3 - 0.099X4 R2
Y
=0.91
t: (-3.10) (2.48) (3.91) (4.77) (-3.19)
从回归结果的t值可以看出,现在各个变量都已通过显著性检验,说明多重共线性问题基本得到解决。 9
t: (8.82) (28.42) DW=0.76
第六章 动态经济模型:自回归模型和分布滞后模型
6.1(1)错。使用横截面数据的模型就不是动态模型。 (2)对。
(3)错。估计量既不是无偏的,又不是一致的。 (4)对。
(5)错。将产生一致估计量,但是在小样本情况下,得到的估计量是有偏的。 (6)对。
6.2 对于科克模型和适应预期模型,应用OLS法不仅得不到无偏估计量,而且也得不到一致估计量。
但是,部分调整模型不同,用OLS法直接估计部分调整模型,将产生一致估计值,虽然估计值通常是有偏的(在小样本情况下)。
6.3 科克方法简单地假定解释变量的各滞后值的系数(有时称为权数)按几何级数递减,即:
Yt =α+βXt +βλXt-1 +βλ2Xt-2 +…+ ut 其中 0
这实际上是假设无限滞后分布,由于0
而阿尔蒙方法的基本假设是,如果Y依赖于X的现期值和若干期滞后值,则权数由一个多项式分布给出。由于这个原因,阿尔蒙滞后也称为多项式分布滞后。即在分布滞后模型 中,假定:
2p
tia1aiaiaiYt0XXXu0t112mtmpt
0000
400411620142
此,变换模型为:
因
YtiXtiut
(01i2i2)Xtiut(01i2i2)Xtiut
i0i04i04
4
2[4iXtiiXti]ut
用此式可估计出和ˆ2,即可得到ˆ14ˆ2,然后可得
到诸的估计值。
6.7 (1)设备利用对通货膨胀的短期影响是Xt的系数:0.141;从长期看,在忽略扰动项的情况下,如果Yt趋向于某一均衡水平
2
,则Xt和Xt-1也将趋向于某一均衡水平:
30.120.1410.23630.120.3770.377。
(2)对模型的回归参数的显著性检验: 原假设:H0: β1 =0
即
所以,设备利用对通货膨胀的长期影响是Xt和Xt-1的系数之和:
备择假设:H1: β1 0
从回归结果可知,检验统计量t1
2.60
根据n-k-1=15,a=5%,查临界值表得tc=2.131。 由于t=2.60> tc=2.131
故拒绝原假设,即Xt对y有显著影响。 原假设:H0: β2 =0
备择假设:H1: β2 0
其中p为多项式的阶数。也就是用一个p阶多项式来拟合分布滞后,该多项式曲线通过滞后分布的所有点。
6.4 (1)估计的Y值是非随机变量X1和X2的线性函数,与扰动项v无关。
(2)与利维顿方法相比,本方法造成多重共线性的风险要小一些。 6.5(1)
从回归结果可知,检验统计量t2
4.26
根据n-k-1=15,a=5%,查临界值表得tc=2.131。 由于t=4.26> tc=2.131
故拒绝原假设,即Xt-1对y有显著影响。
0,即设备利用和滞Mt01(11)Yt12(11)Yt12(12)Rt21(12)Rt综上所述,所有的斜率系数均显著异于1
(12)Mt1(12)Mt2[ut(12)ut1(12)ut2]
后一期的设备利用对通货膨胀都有显著的影响。
其中0是、1和2的函数。
(2) 第(1)问中得到的模型高度参数非线性,它的参数需采用非线性回归技术来估计。 6.6
(3)对此回归方程而言,检验两个斜率系数为零,等于检验回归方程的显著性,可用F检验。
原假设:H0: β1 =β2 =0
备择假设:H1:原假设
i01i2i2
10
不成立 检验统计量
R2K0.727/2
F19.973(1R)nK1)(10.727)/(1821)
根据k=2,n-k-1=15,a=5%,查临界值表得Fc=3.68。
由于F=19.973>Fc=3.68
故拒绝原假设,即Xt、Xt-1至少有一个变量对y有显著影响,表明方程总体是显著的。
6.8模型的滞后周期m=3,模型有6个参数,用二次多项式进行拟合,即p=2,得
Yt = δYt* - (1-δ)Yt-1 + u t (8)
将(1’)代入(8), 得:
(9)式两端取一期滞后,得:
Yt(1)(XtXt12Xt2)(1)Yu
t1t
(9)
Yt1(1)(Xt1Xt22Xt3)(1)Yut1
t2
(10)
(9)- λ(10),得: 整理得:
Y(1)Xt(1)Y(1)Yutut1tt1t2
(11)
Wia0a1ia2i2
我们有:
该式不能直接采用OLS法进行估计, 因为存在Yt-1、Yt-2等随机解释变量,它们与扰动项相关, 并且扰动项存在序列相关。若采用OLS法, 得到的估计量既不是无偏的, 也不是一致的。可采用工具变量法或极大似然法进行估计。
W0a0
代入
W1a0a1a2原模型,得
Wa3a9aW23a002a114a22
YtWiXtiUt
i0
3
第七章 时间序列分析
7.1 单项选择题 (1)A
3
a0Xtia1iXtia2i2XtiUt
i0
i0
i0
33
(2)D (3)B (4)B
7.2 一般来说,如果一个时间序列的均值和方差在任何时间保持恒定,并且两个时期t和t+k之间的协方差(或自协方差)仅依赖于两时期之间的距离(间隔或滞后)k,而与计算这些协方差
(a0a1ia2i2)Xti2Ut
令:Z0t=∑Xt-i , Z=∑iX, Z=∑iXt-i 1tt-i 2ti0
显然,Z0t ,Z1t和Z2t可以从现有观测数据中得出,使得我们可用OLS法估计下式:
3
Yta0Z0ta1Z1ta2Z2tut
估计出α,α0,α1, α2的值之后,我们可以转换为 βWi的
的实际时期t无关,则该时间序列是平稳的。 只要这三个条件不全满足,则该时间序列是非平稳的。事实上,大多数经济时间序列是非平稳的。
实证分析中确定经济时间序列的性质的必要性在于,如果采用非平稳时间序列进行回归,则可能产生伪回归问题,不能确定
估计值,公式为:
6.9
ˆ0aˆ1iaˆ2i2Wia
Yt* =
βXt+1
e
(1)
Yt-Yt-1 =
e
δ(Yt* - Yt-1) + u t (2)
(3)
Xt+1 - Xte = (1-λ)( Xt - Xte);t=1,2,…,n
变换(3),得
Xt+1 = (1-λ)Xt +λXt (4)
e
e
回归结果一定正确。
7.3 大致说来,单位根这一术语意味着一给定的时间序列非平稳。专业点说,单位根指的是滞后操作符多项式A(L)的根。 7.4 DF检验是一种用于决定一个时间序列是否平稳的统计检验方法。EG检验法是一种用于决定两个时间序列是否协整的统计检验方法。
因为Xt+1无法表示成仅由可观测变量组成的表达式。但如果(4)式成立,则对于t期,它也成立,即:
e
Xt = (1-λ)Xt-1 +λXt-1 (5)
(5)代入(4),得:
ee
Xt+1 =(1-λ)Xt + (1-λ)λXt-1 +λXt-1
e2e
7.5 当回归方程中涉及的时间序列是非平稳时间序列时,OLS估
(6)
我们可以用类似的方法,消掉(6)式中的X限重复下去,最后得到: 将(7)代入(1), 得:
e
t1
, 这一过程可无
计量不再是一致估计量,相应的常规推断程序会产生误导。这就是所谓的“伪回归”问题。
在回归中使用非均衡时间序列时不一定会造成伪回归,只要变量彼此同步,则这些变量间存在长期的线性关系.
7.6(1)因为||=2.35小于临界||值,表明住宅开工数时间 11
Y*(1λ)(XtλXλ2X)(1') t1t2teX(1λ)(XtλXλ2X)(7)t1t1t2变换(2)得:
序列是非平稳的。
(2)按常规检验,t的绝对值达到2.35,可判断为在5%水平上显著,但在单位根的情形下,临界|t|值是2.95而不是2.35。 (3)由于Xt1的||值远大于对应的临界值,因此,住宅开工数的一阶差分Xt是平稳时间序列。 7.7
(1)∵R2=0.9643﹥DW=0.3254
∴认为A是伪回归
(2)∵R2
(3)从C可以看出,τ=-2.2521 查表7-3变量数为2,样本容量为72.在5%的显著性水平下τ≈-3.46
∵-2.2521>-3.46 ∴M1与GDP之间不存在协整关系,不改变(1)中的结论,认为A是伪回归。
如果M1与GDP的单整阶数不同,协整关系仍然不存在,A仍然是伪回归。
(4)此方程给出的是M1和GDP的对数之间的短期关系。这是因为给出的方程考虑了误差调整机制(ECM),它试图在两变量离开其长期通道的情况下,恢复均衡。可是,方程中误差项在5%水平上不显著。
如我们在(2)和(3)中所讨论的,由于协整检验的各结果相当混乱,使人难以得出所提供的回归结果A是否伪回归的明确结论。
7.8 用表中的人口(pop)时间序列数据,进行单位根检验,得到如下估计结果:
人口时间序列dpop的单位根检验编号
t:t:
DF或ADF检验(3.287)*(3.272)*
(3.029)(2.811)(0.577)
1.dpopt0.357dpopt1495.9652.dpopt0.358dpopt1560.8272.279t
其中△dpopt=dpopt-dpopt-1。两种情况下,tδ值分别为-3.287和-3.272,从Dickey-Fullerτ统计量临界值表中可以看出,第一个检验小于从0.025到0.10的各种显著性水平下的值和T值;第二个检验小于0.10显著性水平下的τ值。因此,在0.10显著水平下,二者都拒绝原假设,即人口一阶差分时间序列没有单位根,或者说该序列是平稳序列。
综合以上结果,我们的结论是: dpopt是平稳序列,dpopt~I(0)。
而popt是非平稳序列,由于dpopt~I(0),因而popt~I(1)。
7.9
步骤一:求出三变量的单整的阶
(1)对三变量原序列的单位根检验
出口lnex的单位根检验编号
DF或ADF检验
(1.633)*
2.lnext0.1800.007t0.041lnext1
(0.95)*
1.lnext0.0150.02lnext1
人口时间序列pop的单位根检验编号1.2.
(t:)(t:)
DF或ADF检验
popt1509.900.0013popt1
(4.88)(1.48)
(0.40)*(0.85)
(0.88)*
popt3519.4460.37t0.042popt1
进口lnim的单位根检验编号1.2.
DF或ADF检验
lnimt0.0380.023lnimt1
(1.385)*
lnimt0.2630.012t0.074lnimt1
(1.519)*
价格指数lnpt的单位根检验编号1.2.
DF或ADF检验
lnptt0.0340.016lnptt1
(1.068)*
lnptt0.0350.002t0.031lnptt1
(1.056)*
两种情况下,tδ值分别为-0.40和 -0.88,从Dickey-Fuller
τ统计量临界值表中可以看出,两者分别大于从0.01到0.10的
各种显著性水平下的值和T值。因此,两种情况下都不能拒绝原假设,即私人消费时间序列是非平稳序列。
下面看一下该序列的一阶差分(dpop)的平稳性。做类似于上面的回归,得到如下结果:
从Dickey-Fullerτ统计量临界值表中可以看出,三个序列的tδ值分别大于从0.01到0.10的各种显著性水平下的值和
T值。因此,三个序列的单位根检验都不能拒绝原假设,即出
口、进口、价格指数三个时间序列都是非平稳序列。 12
下面看一下这些序列的一阶差分的平稳性。做类似于上面的回归,得到如下结果:
出口序列dlnex的单位根检验编号1.2.
DF或ADF检验
dlnext0.0810.710dlnext1
(5.112)*
dlnext0.0230.002t0.766dlnext1
(5.438)*
进口序列dlnim的单位根检验编号1.2.
DF或ADF检验
dlnimt0.0690.639dlnimt1
(4.723)*
dlnimt0.00030.003t0.688dlnimt1
(4.991)*
价格序列dlnpt的单位根检验编号1.
DF或ADF检验
dlnptt0.0100.339dlnptt1
(3.166)*
0.30.20.1
0.0-0.1-0.2
0.60.40.20.0-0.2-0.4-0.6
第八章 联立方程模型
从
8.1
(1)错。一般来说,不行。因为联立方程中变量的相互作用,
因而结构方程中往往包括随机解释变量。 (2)对。 (3)对。 (4)对。
(5)错。可以用3SLS法。 (6)对。 8.2 (1)C (2)A (3)B (4)D (5)A (6)B (7)B (8)A
8.3 恒等式与行为方程的区别有以下两点:
(1)恒等式不包含未知参数,而行为方程含有未知参数。 (2)恒等式中没有不确定性,而行为方程包含不确定性,因而在计量经济分析中需要加进随机扰动因子。
8.4 由于内生变量是联立地被决定,因此,联立方程模型中有多少个内生变量就必定有多少个方程。这个规则决定了任何联立方程模型中内生变量的个数。可是,确定哪个变量为内生变量,要根据经济分析和模型的用途。
在设定模型时,通常将以下两类变量设定为外生变量: (1)政策变量,如货币供给、税率、利率、政府支出等。 (2)短期内很大程度上是在经济系统之外决定或变化规律
13
Dickey-Fullerτ统计量临界值表中可以看出,两个差分序列dlnex、dlnim的tδ值分别小于从0.01到0.10的各种显著性水平下的值和T值;而差分序列dlnpt的tδ值分别小于从0.05到0.10的各种显著性水平下的值和T值。因此,三个差分序列的单位根检验都拒绝原假设,即出口、进口、价格指数三个差分时间序列都是平稳序列。这就是说,
dlnext~I(0),dlnimt~I(0),dlnptt~I(0);而
lnext~I(1),lnimt~I(1),lnptt~I(1),因而我们可以进入下一步。
步骤二:进行协整回归,结果如下:
LNEX =1.273+0.842*LNIM + 0.573*LNPT同时我们计算并保存残差(均衡误差估计值)et。
步骤三:检验et的平稳性。
D(et) = -0.450*et(-1) DW=1.992
(-4.405)*步骤四:得出有关两变量是否协整的结
论。
查临界值,N=3,a=0.05,T=52的临界值是-4.11,而AEG=-4.405
步骤五:建立ECM模型。
DLNEX = 0.757*DLNIM - 0.458*ET(-1) R2=0.618 t:
(12.23)
(-4.54) DW=1.788 方
程的回归系数通过了显著性检验,误差修正系数为负,符合反向修正机制。关于ECM模型dlnex的实际值、拟合值和残差的拟合图如下:
稳定的变量,如人口、劳动力供给、国外利率、世界贸易水平、国际原油价格等。
8.5 Ct = α + βDt +u t (1)
It = γ + δDt-1 + ν
t
的数目都大于G-1=3,因而都是过度识别的,宏观经济模型大都如此。
(2)考虑用2SLS方法估计三个行为方程,也可以用3SLS方法或FIML法估计之。
8.8 (1)内生变量:Yt,It,Ct,Qt;外生变量:Rt,Pt;前定变量:Yt-1,Ct-1,Q t-1,Rt,Pt。 (2)模型总变量个数k=9,方程个数G=4
方程(1): 变量个数m1=3, k-m1=6>G-1=3,因而为过度识别; 方程(2): 变量个数m2=3, k-m2=6>G-1=3,因而为过度识别; 方程(3): 变量个数m3=4, k-m3=5G-1=3,因而为过度识别。 (3)因为原模型中4个方程皆是过度识别,因此不能使用间接最
(2)
Dt = Ct + It + Zt; (3)
将(2)代入(3), 然后把(3)代入(1),得: Ct = α + β(Ct +γ + δDt-1 + νt + Zt )+u t 整理得:
Ct -βCt = α + βγ + βδDt-1 + βνt + βZt +u t (1 –β)Ct = α + βγ + βδDt-1 +βZt +βνt +u t (1 –β)Ct = α + βγ + βδDt-1 +βZt +βνt +u t
tut
CtDt1Zt
1111
模型总变量个数k=5,方程个数G=3
小二乘法。因为间接最小二乘法只适用于恰好识别方程的估计。 (4)第一步:进行简化式回归,要估计的方程是: It =П10+П11 Yt-1+П12 Ct-1+П13 Q t-1+П14 Rt+П15 Pt+ν Yt =П20+П21 Yt-1+П22 Ct-1+П23 Q t-1+П24 Rt+П25 Pt+ν Qt =П30+П31 Yt-1+П32 Ct-1+П33 Q t-1+П34 Rt+П35 Pt+ν
1t
方程(1): 变量个数m1=2, k-m1=3>G-1=2,因而为过度识别. 方程(2): 变量个数m2=2, k-m2=3>G-1=2,因而为过度识别. 方程(3): 为恒等式,无需判别识别状态。 8.6
Yt = Ct + It +Gt +Xt
Ct = β0 + β1D t + β2C t-1 + u t Dt = Yt – Tt
It = α0 + α1Yt + α2R t-1 +ν
t
2t
3t
ˆˆ 估计上述方程,得到I、Y、Q的估计值It、Yt、Qt。
t
t
t
ˆ代替方程右端的It、ˆt、Yˆ、Q 第二步:在原结构方程中用Itt
Yt、Qt ,进行OlS回归,即估计 Yt =β0 +β1Yt –1 +β
(1) 内生变量: Yt , Ct , It ,Dt; 外生变量: Gt, Xt, R t-1 Tt;
前定变量: Gt, Xt, Tt, R t-1,C t-1.
(2) 第一步:进行简化式回归,要估计的方程是: Yt = П10+П11 Tt +П12Ct-1 +П13Rt-1 +П14Gt +П15Xt+ν Dt = П20+П21 Tt +П22Ct-1 +П23Rt-1 +П24Gt +П25Xt+ν
1t
2
ˆtI
+ u 1 t
It = α0 + α
1
ˆˆ + αQYtt
2
+ u 2 t
2t
ˆ + 2Ct-1 +3Pt + u 3 t Ct = 0 + 1Yt
Qt = 0 + 1Q t-1 +2 Rt + u 4 t 得到这四个方程结构参数的估计值。
Yt ,Dt,
8.9 (1) 内生变量: Ct , It ,Mt Yt ,; 外生变量: Gt, Xt;
前定变量: Gt, Xt, C t-1, I t-1.
(2)模型总变量个数k=8,方程个数G=4
ˆ. ˆ , D 分别估计两个方程,得到Yt , Dt的估计值Ytt
ˆ代替方程右端的 第二步:在原结构方程中用Yt 、Dt
进行OlS回归, 即估计
Ct = β0 + β
1
ˆ+ βDtˆ + αYt
方程①: 变量个数m1=3, k-m1=5>G-1=3,因而为过度识别。
2
C t-1 + u t
方程②: 变量个数m2=3, k-m2=5>G-1=3,因而为过度识别。 方程③: 变量个数m3=2, k-m2=6>G-1=3,因而为过度识别。
8.7
It = α0 + α
12
R t-1 +νt
(3)第一阶段:计算各行为方程的2SLS估计值; ① 进行简化式回归,要估计的方程是: Yt = П
10+П11 Gt +П12 Xt +П13 Ct-1+П14 It-1 +ν1t
(1)本模型中K=10,G=4。不难看出,各方程中“零约束”
14
ˆ。 估计方程,得到Yt 的估计值Y 11t
② 在原结构方程中用Yt 代替方程右端的Yt ,进行OlS回归,即估计
Ct =α0 +α
1
ˆ+αYt
2Ct-1 + u1t
It =β0 +β
1
ˆ +βYt
2It –1+ u2t
ˆ + u3t Mt =0 + 1Yt
u
u1nu21Ui= u2nu31u3n
② 用GLS法估计代表该系统所有行为方程的巨型方程,得到全部参数的3sls估计值。
8.10 (1)模型总变量个数k=4,方程个数G=3
消费方程: 变量个数m1=2, k-m1=2==G-1=2,因而为恰好
识别,可用ILS或2SLS来估计。 (2)A.求简化式方程 将恒等式代入消费函数,得
第二阶段:用这些2SLS估计值计算各结构方程的残差,然后估计各结构方程扰动项的同期方差-协方差矩阵;
第三阶段:用GLS法估计代表该系统所有行为方程的巨型方程。
① 形成代表该系统所有行为方程的巨型方程; 巨型方程为:
Yi0Z1i1Z2i2Z3i0Z4i1Z5i2Z6i0Z7iC1tZ8i0ui1(CtIt)u1
i=1,2,…,n,n+1,…,2n,2n+1,…,3n
此方程各变量均有3n个观测值,如下所示:
Ct01Ct1Itu1 (a)
将投资方程代入(a)式,得
ˆYC11C00
1ˆC1C0Ynn1n0I1001Z= Z=
Yi= Z1i=2i Z3i=4i
0In001
M00010
000M0
n
Ct01Ct1(a0a1Rtu2)u1 整
理,得
Ct
该式可写为
01a01a1uu1
Rt12
111111
Ct12Rtt (b)
式中1
01a0
11
2
1a111
对(b)利用OLS法进行估计,则有
00ˆY1Z5i= Z6i=ˆYn0000I0
Z=
7i
In1000
00
Z=
8i
011000 0ˆY1Yˆn
ˆ2
(R)(C)123
4(R)
t
t2
t
ˆ1ˆ2553*364
B. 将消费和投资方程代入恒等式,得
Yt01Ytu101Rtu2
经整理得:
Yt
写为
001uu2
Rt1
111111
该式可
Yt34Rtt (c)
a00
式中3
11a1
4
11
看出,ˆ11是简化式系数的非线性函数,要估计它的标准误差着实不易。
第九章 面板数据模型
9.1表面不相关回归的含义是,所涉及的各个回归似乎不相关,但实际上相关。各个回归方程分别写出,这使得它们似乎不相关,但是它们有共同点。在本章的例子中,四个回归中的每一个关系到一个不同的制造产业,但它们都会受到宏观经济条件变动(如衰退)的影响。一般来说,影响一个回归的结果的事件也很可能影响其它回归的结果,这个事实表明,表面不相关回归中的各回归之间存在相关。这种相关在数学上表现为扰动项跨方程相关。
对(c)利用OLS法进行估计,则有
(Yt)(Rt)16ˆ44 2
4(Rt)
ˆ3ˆ4603*472
C.根据
1、2、3、4的公式,可解出0、1。
23
4
1
24
01
表面不相关回归的步骤是:
1.用OLS法分别估计每个方程,计算和保存回归中得到的残
由于已得到
1、2、3、4
的估计值
ˆ1、ˆ2、ˆ3、ˆ4,由此可解出消费函数的结构式系数的
估计值如下:
差;
2.用这些残差来估计扰动项方差和不同回归方程扰动项之间的协方差;
3.上一步估计的扰动项方差和协方差被用于执行广义最小二乘法,得到各方程系数的估计值。
9.2 有共同截距项的混合数据模型自由度最多,只有一个方程,并且没有虚拟变量。表面不相关回归模型自由度可能是少的,因为每个横截面种类都要有一个回归方程。固定效应模型只用一个
ˆ2ˆ3372ˆˆ106410
ˆ44
ˆ23ˆ10.75ˆ44
(3)模型总变量个数k=4,方程个数G=3
投资方程: 变量个数m1=2, k-m1=2==G-1=2,因而为恰好识别,可用ILS或2SLS来估计。 8.11
(1)在此模型中,K=4,M1=M2=3,G=2 应用识别的阶条件,两方程都是恰好识别的。
(2)在这种情况下,第一个方程可识别,第二个方程不可识别。 (
3
)
方程,因而自由度比表面不相关回归模型多,如果横截面种类很多的话,固定效应模型中会有很多虚拟变量,使得其自由度要显著少于有共同截距项的混合数据模型。随机效应模型用一个方程,并且它是在没有引入虚拟变量的情况下容许截距变动的,因此它的自由度比表面不相关回归模型和固定效应模型都要多。 9.3当不同的横截面种类的截距之间的差异被认为是固定的而不是随机的情况下,应采用固定效应模型。如果横截面个体是随机地被选择出来以代表一个较大的总体,则采用随机效应模型比较合适。随机效应模型与固定效应模型一样,允许不同横截面种类的截距不同,但这种不同被认为是随机的,而不是固定的。 9.4随机效应模型的扰动项不再满足普通最小二乘法各期扰动项
ˆ12ˆ12ˆˆˆˆ1010202.4;120.8
ˆ22ˆ22
相互独立的假设,扰动项的一个分量在各期都相同。 ˆ21ˆ21ˆˆˆ20ˆ106;212029.5 并不总是。尽管将数据合在一起将增加自由度,但有时采用
ˆ11ˆ11
混合数据也是不合适的。如果不同横截面种类的斜率系数不同的
话,则最好是分别回归。如果试图通过使用斜率虚拟变量来解决ˆ21ˆ21
ˆ11ˆ121.8;ˆ22ˆ22ˆ126ˆ11不同横截面种类不同斜率系数的问题,需要假定扰动项方差为常ˆ22ˆ11
数。而采用分别回归,每个回归的扰动项方差可以不同,也就是
要检验原假设11=0,我们需要ˆ11的标准误差。可是从上面可
每个产业或每个横截面种类的扰动项方差不同。
9.6 不相同。估计值不一样,t统计量也是,可是似乎没有任何
明显的差异模式。SUR估计值与OLS估计值之所以不同,是因为表面不相关回归考虑了不同回归的扰动项的相关,而普通最小二乘法分别估计每个方程,不考虑不同回归的扰动项之间的任何相关。
9.7 否。混合数据集的样本容量将为100,可是有50个县市,因此固定效应模型所需要的虚拟变量会消耗太多的自由度。如果你分别运行两个回归,每年一个,每个回归的自由度是44。而运行一个固定效应回归,自由度是45(n-k=100-55,50个虚拟变量,5个常规自变量)。将数据合在一起的主要理由是得到自由度,可是在本题中,此理由不成立。
9.8 问题可通过使用一个F检验来回答,但最容易的方法是采用两年的混合数据估计下面的回归方程:
DVDEXP = β0 +β1INCOME +β2PRICE +β3RAINFALL +β4YEAR2 +
u
其中YEAR2=1,若观测值来自第二年的数据;0,其它 回归结果如下:
Dependent Variable is DVDEXP
下三个问题:
(1)因变量拟合值代表概率,但它们常常小于0或大于1,而概
率值是不可能取这类值的;
(2)往往存在异方差性; (3)扰动项不服从正态分布。
10.2 没有问题。两种方法得到的斜率估计值不同是因为估计方法不同。Probit估计是基于累积正态概率分布,而logit估计是基于累积logistic分布。
10.3 一个事件发生的机会是该事件发生的概率除以该事件不发生的概率。如果P是因变量等于1的概率,那么因变量等于1的机会是P/(1-P).。logit模型的拟合值是因变量等于1的机会的自然对数。
10.4 (1) 不是。拟合值0.48的含义是,考虑家庭的收入、孩子的数目以及房价等因素,该家庭将买房的概率估计值为0.48;
(2)不会。因为估计的概率小于0.5,因此预测为0。 (3)若该家庭买了房,不会惊讶。因为买房的估计概率接
近0.5,0.48仅仅是估计概率。同时,即便估计值完
Variable Coefficient
Standard
Error
Constant 86.04 INCOME PRICE RAINFALL YEAR2
0.06 -3.20 7.46 -5.21
24.39 0.01 0.90 2.40 6.59
3.53 6.22 -3.57 3.11 -0.79
t-Statistic
p-Value
全正确,它也只是个概率。如果估计概率是0.9,我们预测该家庭将买房,但我们仍有10%的错误机会:该家庭继续租房;
0.00
10.5(1)PRICE和CHILDREN不变的情况下,INCOME增加一个单0.00
位(1000元),则该家庭将买房的概率增加0.005;
0.00 INCOME和CHILDREN不变的情况下,PRICE上升一个单位0.01
(1000元),则该家庭将买房的概率减少0.008;
0.44
和PRICE不变的情况下,该家庭添一个小孩,则该家庭将买房的概率增加0.3。
(2)若采用logit模型,因变量将是ln[HOME/(1-HOME)],
每个斜率系数被解释为对机会的对数的影响。
10.6 (1)86.7%;(2)78.6%;(3)93.8%
10.7 (1)估计方程(10.11),比较CAND1的拟合值和实际值,
将大于等于0.5的拟合值记入支持候选人甲(CAND1)的预测值。用全部观测值进行回归,但只用CAND1等于1的观测值来计算预测正确的观测值的百分比,答案是11/14或78.6%.
(2)估计方程(10.12),其它步骤与(1)同,答案是7/10
或70%.
Observations: 24 R2 = 0.79
Adjusted R2 = 0.74
Residual Sum of Squares = 4877.24 F-statistic = 18.18
对β4进行t检验显示,YEAR2统计上不显著,表明不需要固定效应模型。由于仅有两年的数据,因而可以用t检验来替代F检验,检验是否需要固定效应模型。
第十章 定性选择模型
10.1 一般来说,普通最小二乘法不是估计定性选择模型的好方法,这是因为OLS假定因变量和自变量之间存在线性关系,但是对于定性选择模型,二者关系通常不是线性的。具体说来,有以
(3)为回答此问题,第一步是找出甲(CAND1)和丙(CAND3)
都等于0的所有观测值。因为所有支持丙的观测值都包含在表10-6中,在表10-1中被省略,因而支持乙(CAND2)的观测值就是在表10-1中甲(CAND1)等于0的观测值。对于这些观测值,逐个检查甲和丙在上面两个回归中的拟合值,对于某观测值,如果CAND1和CAND3的拟合值都小于0.5,则模型预测该选民不支持甲和丙,而必支持乙,该观测值预测正确。如果CAND1或CAND3的拟合值大于等于0.5,则模型预测该选民支持甲或丙,而不支持乙,该观测值预测不正确。答案是12/16或75%.
(4)将上面三问中预测正确的观测值数目加在一起,11+7
+12=30,即对30个观测值预测正确,由于观测值总数是30,因此预测正确的观测值的总百分比是75%.
10.8 证
log
F(zi)1F(zi)
exp(zi)exp(zi)1exp(zi)1exp(zi)loglog
iii1
1exp(zi)1exp(zi)exp(zi)1exp(zi)loglogexp(zi)zi
11exp(zi)
第一章 绪论
()
1.1 一般说来,计量经济分析按照以下步骤进行:
(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据(4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 我们在计量经济模型中列出了影响因变量的解释变量,但它(它们)仅是影响因变量的主要因素,还有很多对因变量有影响的因素,它们相对而言不那么重要,因而未被包括在模型中。为了使模型更现实,我们有必要在模型中引进扰动项u来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。 1.4 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。如就是一个估计量,
查表Z0.025
10/25
1.96 因为Z= 5 >Z0.0251.96,
故拒绝原假设, 即
此样本不是取自一个均值为120元、标准差为10元的正态总体。 2.4 原假设 :
备择假设 :
H0:2500
H1:2500
00)
100/120t
()ˆ查表0.83
得 t0.025(161)2.131 因为t = 0.83
tc2.131,
设,即从上次调查以来,平均月销售额没有发生变化。
第三章双变量线性回归模型
3.1 判断题(说明对错;如果错误,则予以更正) (1)对 (2)对 (3)错
Y
i1
n
i
n
。现有一样本,共4个数,100,104,96,130,则
只要线性回归模型满足假设条件(1)~(4),OLS估计量就是BLUE。 (4)对 (5)错
R2 =ESS/TSS。
(6)对
根据这个样本的数据运用均值估计量得出的均值估计值为
10010496130
107.5。
4
第二章 计量经济分析的统计学基础
2.1 略,参考教材。 2.2
(7)错。我们可以说的是,手头的数据不允许我们拒绝原假设。
(8)错。因为Var(
ˆ)
2
S
S
5
==1.25 N4
xt
,只有当2
xt
2
保持恒定
时,上述说法才正确。 3.2 证明:
用=0.05,N-1=15个自由度查表得t0.005=2.947,故99%置信限为
t0.005S =174±2.947×1.25=174±3.684
也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。 2.3 原假设
备择假设
ˆYX
xiyi
2i
x
ˆXY
yixi
2i
y
xyy
ii
i22
3.3 (1)
H0:120
H1:120
(xiyi)2
ˆˆYXXY22
xyiixy
r2检验统计量
ˆe)Y(Y
ˆeYY
ˆe=0,YY
t
t
t
t
t
t
t
t
t
ˆeYtYtt
ˆ,ˆ
ˆ)ˆ(
ˆ)Eˆ)]E[((ˆ))(ˆ)]ˆ,ˆ)Cov(([(
ˆ)][(ˆ)2]E[((
2ˆ)(第一项为0(0的证明见本题())1ˆ)(
两边除以n,得
YYˆ,即Y的真实值和拟合值有共同的均值。
n
n
(
2
)
2
xt2
ˆˆXtetˆˆ,注意到 ˆXt)etˆet3.5(1)Yˆtet(12
由于e0,Xtet0(教材中已证明),
xiXi,xi0,从而0,则我们有因此,Yˆtet0,即
ˆ1=ˆ2=ˆYett22Cov(Yˆ=0,Y的拟合值与残差无关。t,et) Xiˆ)ˆVar(Yett12
nxi
3.4 (1) 2xi22xi22
ˆ1)Var(22
n(x)nnxiˆ,iˆ
t
2
2
ˆ)ˆ(
2ˆ)(ˆ)22ˆ)(2
由上述结果,可以看到,无论是两个截距的估计量还是它们的方差都不相同。 (2)
(
u)
i
2
n
22
uxu
nx
i
tt
t
2
ˆ)22(
xnun)
ˆ)22X(
(ui)n2
2
(u1
un)(x1u1
nxt2
ˆ2
u
2
i
uiujn
ij
2
xu
2
2
ii
(xixj)uiuj
ij
xyx
i2i
i
ˆ2,
(x)(Y)xy
(x)x
i
i
i
2
2
i
i
22
i
nxt2
ˆ)22(
ˆ)Var(ˆ容易验证,Var()=22
这表明,两个斜率的估计量和方差都相同。
xi
两边取期望值,有:ui2uiuj
ij
ˆ)EE(2
n
等式右端三项分别推导如下:
2
xiui2(xixj)uiujijˆ)2+2E(2-2nxt
3.6(1)斜率的值 -4.318表明,在1980-1994期间,相对价格每上升一个单位,(GM/$)汇率下降约4.32个单位。也就是说,美元贬值。截距项6.682的含义是,如果相对价格为0,1美元可兑换6.682马克。当然,这一解释没有经济意义。
(2)斜率系数为负符合经济理论和常识,因为如果美国价格上
ui2uiuj
ijEn
2
12
n(E(ui)2E(uiuj))
ij
n2
2n
xiui(xixj)uiujij
2
nxt
21nxt2
2
(xiE(ui)(xixj)E(uiuj))2ij
2
2
2xinxt2
升快于德国,则美国消费者将倾向于买德国货,这就增大了对马
0
(
x=0)
i
克的需求,导致马克的升值。
(3)在这种情况下,斜率系数被预期为正数,因为,德国CPI相对于美国CPI越高,德国相对的通货膨胀就越高,这将导致美元对马克升值。 3.7(1)
ˆ)22E(因此
xt2
22222
22(xt)Xt
ˆ)]E([0
nnxt2nxt2xt2
2
2
ˆ)即Var(
(2)
Xt
2
nxt
2
2
ˆeight76.261.31*177.67156.49W
ˆeight76.261.31*164.98139.86 W
ˆeight76.261.31*187.82169.78W
ˆeight1.31*height1.31*3.814.99 (2)W
3.8 (1)
(1.73) (2.93)
0.75表明劳动工时增, 值为2.93,表明该系数显著
计
量
1.0)/0.25560.978
查t表, c2.306 ,
YYtn96/109.6
XXtn80/108 ˆxytt
tt0.025(8)2.306 ,因为│t│= 0.978
故接受原假设:
1.0。
ˆ0=10+0.90*250=235.0 y
x
2
t
21/280.75
3.9
对于x0=250 ,点预测值
ˆ*9.60.75*83.6估计方程为: ˆ
ˆ0 的95%置信区间为: y
ˆ0t0.025(122)*y
ˆ3.60.75X Ytt
(2)
2352350.29即 234.71 - 235.29。也就是说,我们有95%的把握预测位于234.71 至235.29 之间. 3.10(1)列表计算如下:
2t
y0将
ˆxy)n2)ˆ2et2n2)(yt2tt
(30.40.75*21)/81.83125
ˆ/Se(ˆ)t
ˆˆ
2.934
x
X
t
ˆ/Se(ˆ)t
ˆ
ˆ
2
2
nx
t
2
1.733
R(xtyt
2xy
t
2t
)(21/28*30.4)0.22
回归结果为(括号中数字为t值):
ˆ3.60.75X R2=0.518 Ytt
YYt15/53
对于5-2=3个自由度,查表得5%显著性水平检验的t临界值为:
tc3.182
结论:
由于t
XXt55/511
ˆxytt
4.0213.182
xt227/740.365
故拒绝原假设H0,接受备则假设H1,即新观测值与样本观测值来自不同的总体。 3.12 (1)原假设
ˆ*30.365*111.015 ˆ
H0:0 备择假设 H1:0
ˆ0)(t
ˆ)6.5Se(
ˆ1.0150.365X 我们有:Ytt
(2)
检验统计量
查t表,在5%显著水平下
t0.025(1911)2.11 ,因为
ˆxy)n2)(100.365*27)/30.048t=6.5>2.11 2et2n2)(yt2tt
R(xtyt
2xy
2t
2
t
)(27/*10)0.985
22
故拒绝原假设,即0,说明收入对消费有显著的影响。
(2)由回归结果,立即可得:
(3) 对于
ˆ)Se(
ˆ=-1.015+0.365*10=2.635 X0=10 ,点预测值 Y0
ˆ)0.0.125 Se(.5Y0 的95%置信区间为:
ˆtˆ1/n(X0)2Y00.025(52)*
.7
5.556
x
2
(3)的95%置信区间为:
ˆtSe(ˆ)0.812.11*0.1250.810.264
2
=
2.6353.182*.048*1/5(1011)2/742.6350.770
即 1.895 -3.099,也就是说,我们有95%的把握预测Y0将位于1.865 至3.405 之间.
3.11 问题可化为“预测误差是否显著地大?”
当
X0
=20
时
,
即为0.546~1.074,也就是说有95%的把握说在0.546~1.074之间,所以在这个区间中不括0包。
3.13 回归之前先对数据进行处理。把名义数据转换为实际数据,公式如下:
人均消费C=C/P*100(价格指数)
人均可支配收入Y=[Yr*rpop/100+Yu*(1-rpop/100)]/P*100 农村人均消费Cr=Cr/Pr*100 Cu/Pu*100
城镇人均消费Cu=
ˆ1.0150.365206.285 Y0
预
测
误
差
农村人均纯收入Yr=Yr/Pr*100 城镇人均可支配收入Yu=Yu/Pu*100
处理好的数据如下表所示:
ˆ7.626.2851.335 e0Y0Y0
原假设H0:
E(e0)0
0
备择假设H1:E(e0)检验:
若H0为真,则
t
e0E(e0)ˆ
1(X0)
nx2
2
1.33500.048
1(2011)
574
2
(n1)(1R2)8*(10.94)
10.92nk1921
. H0:0
H1:0 ˆt
ˆ)(
0.273/0.1352.022
t0.025(6)2.447 因为t=2.022
不显著异于0, 表明土地投入变动对年净收益变动.
H0:0
根据表中的数据用软件回归结果如下:
H1:0
ˆ
t
0.733/0.1255.864 ˆSe()
检验统计量
Ct= 90.93 + 0.692Yt R2=0.997
t: (11.45) (74.82) DW=1.15
2
农村:Crt= 106.41 + 0.60Yrt R=0.979
查表,t0.025(6)2.447 因为t=5.864>t0.025(6),故拒绝原
假设,即β显著异于0,表明资金投入变动对年净收益变动有显著的影响. (3) 原假设
备择假设
t: (8.82) (28.42) DW=0.76
城镇:Cut= 106.41 + 0.71Yut R2=0.998
t: (13.74) (91.06) DW=2.02
从回归结果来看,三个方程的R都很高,说明人均可支配收
拒绝原假设。
入较好地解释了人均消费支出。
三个消费模型中,可支配收入对人均消费的影响均是显著的,
影响.
并且都大于0小于1,符合经济理论。而斜率系数最大的是城镇
4.3 检验两个时期是否有显著结构变化,可分别检验方程中D和
的斜率系数,其次是全国平均的斜率,最小的是农村的斜率。说明城镇居民的边际消费倾向高于农村居民。
D•X的系数是否显著异于0.
(1) 原假设
结论,:土地投入和资金投入变动作为一个整体对年净收益变动有
2
H0:0
H1: 原假设不成立
检验统计量
R2/k0.94/2
F47
(1R2)/(nk1)(10.94)/(921)
查表,在5%显著水平下F(2,6)
5.14 因为F=47>5.14,故
H0:20 备择假设 H1:20
统
计
量
第四章 多元线性回归模型
4.1 应采用(1),因为由(2)和(3)的回归结果可知,除X1外,其余解释变量的系数均不显著。(检验过程略) 4.2 (1) 斜率系数含义如下:
0.273: 年净收益的土地投入弹性, 即土地投入每上升1%, 资金投入不变的情况下, 引起年净收益上升0.273%.
0.733: 年净收益的资金投入弹性, 即资金投入每上升1%, 土地投入不变的情况下, 引起年净收益上升0.733%. 拟
合
情
况
:
检验
ˆt2
ˆ)1.4839/0.47043.155 Se(2
2.145 因为
t=3.155>t0.025(14), 故拒
查表t0.025(184)
绝原假设, 即2显著异于0。
(2) 原假设 检
验
H0:40 备择假设 H1:40
统
计
量
ˆt4
ˆ)0.1034/0.03323.115 Se(4
2.145 因为|t|=3.155>t0.025(14), 故拒
查表t0.025(184)
(n1)(1R2)8*(10.94)
10.92nk1921
. H0:0
H1:0 ˆt
ˆ)(
0.273/0.1352.022
t0.025(6)2.447 因为t=2.022
不显著异于0, 表明土地投入变动对年净收益变动.
H0:0
根据表中的数据用软件回归结果如下:
H1:0
ˆ
t
0.733/0.1255.864 ˆSe()
检验统计量
Ct= 90.93 + 0.692Yt R2=0.997
t: (11.45) (74.82) DW=1.15
2
农村:Crt= 106.41 + 0.60Yrt R=0.979
查表,t0.025(6)2.447 因为t=5.864>t0.025(6),故拒绝原
假设,即β显著异于0,表明资金投入变动对年净收益变动有显著的影响. (3) 原假设
备择假设
t: (8.82) (28.42) DW=0.76
城镇:Cut= 106.41 + 0.71Yut R2=0.998
t: (13.74) (91.06) DW=2.02
从回归结果来看,三个方程的R都很高,说明人均可支配收
拒绝原假设。
入较好地解释了人均消费支出。
三个消费模型中,可支配收入对人均消费的影响均是显著的,
影响.
并且都大于0小于1,符合经济理论。而斜率系数最大的是城镇
4.3 检验两个时期是否有显著结构变化,可分别检验方程中D和
的斜率系数,其次是全国平均的斜率,最小的是农村的斜率。说明城镇居民的边际消费倾向高于农村居民。
D•X的系数是否显著异于0.
(1) 原假设
结论,:土地投入和资金投入变动作为一个整体对年净收益变动有
2
H0:0
H1: 原假设不成立
检验统计量
R2/k0.94/2
F47
(1R2)/(nk1)(10.94)/(921)
查表,在5%显著水平下F(2,6)
5.14 因为F=47>5.14,故
H0:20 备择假设 H1:20
统
计
量
第四章 多元线性回归模型
4.1 应采用(1),因为由(2)和(3)的回归结果可知,除X1外,其余解释变量的系数均不显著。(检验过程略) 4.2 (1) 斜率系数含义如下:
0.273: 年净收益的土地投入弹性, 即土地投入每上升1%, 资金投入不变的情况下, 引起年净收益上升0.273%.
0.733: 年净收益的资金投入弹性, 即资金投入每上升1%, 土地投入不变的情况下, 引起年净收益上升0.733%. 拟
合
情
况
:
5
检验
ˆt2
ˆ)1.4839/0.47043.155 Se(2
2.145 因为
t=3.155>t0.025(14), 故拒
查表t0.025(184)
绝原假设, 即2显著异于0。
(2) 原假设 检
验
H0:40 备择假设 H1:40
统
计
量
ˆt4
ˆ)0.1034/0.03323.115 Se(4
2.145 因为|t|=3.155>t0.025(14), 故拒
查表t0.025(184)
绝原假设, 即4显著异于0。 结论:两个时期有显著的结构性变化。
4.4 (1)参数线性,变量非线性 ,模型可线性化。
不能拒绝原假设,接受β2=0,说明进口商品与国内商品的比价(X2)对进口需求地解释作用不强,这个变量是否应该留在模型中,需进一步研究。
4.6(1)弹性为-1.34,它统计上异于0,因为在弹性系数真值为0
的原假设下的t值为t
11
设z1,z22,则模型转换为
xx
y01z12z2u
(2)变量、参数皆非线性,无法将模型转化为线性模型。 (3)变量、参数皆非线性,但可转化为线性模型。
1.34
4.469
0.32
得到这样一个t值的概率(P值)极低。可是,该弹性系数不显著异于-1,因为在弹性真值为-1的原假设下,t值为:
1
1e(01xu) 取倒数得:y
把1移到左边,取对数为:ln
t
1.34(1)
1.06
0.32
y
01xu,令
1y
这个t值在统计上是不显著的。
(2)收入弹性虽然为正,但并非统计上异于0,因为t值小于1(t
。 0.170.200.85)
zln
y
,则有 1y
(3)由
z01xu
4.5 (1)截距项为-58.9,在此没有什么意义。X1的系数表明在其它条件不变时,个人年消费量增加1百万美元,某国对进口的需求平均增加20万美元。X2的系数表明在其它条件不变时,进口商品与国内商品的比价增加1单位,某国对进口的需求平均减少10万美元。
(2)Y的总变差中被回归方程解释的部分为96%,未被回归方程解释的部分为4%。
(3)检验全部斜率系数均为0的原假设。
21(1R2)
nk1
n1
2
n1nk1
,可推出
R21(12)
本题中,=0.27,n=46,k=2,代入上式,得R=0.3026。
4.7 (1)薪金和每个解释变量之间应是正相关的,因而各解释变量系数都应为正,估计结果确实如此。
系数0.280的含义是,其它变量不变的情况下,CEO薪金关于销售额的弹性为0.28;
系数0.0174的含义是,其它变量不变的情况下,如果股本收益率
2
R2/kESS/k
F
(1R2)/(nk1)RSS/(nk1)
0.96/2
192
0.04/16
=
与此类似,其它变量不变的情况下,公司股票收益上升一个单位,CEO薪金上升0.024%。
(2)用回归结果中的各系数估计值分别除以相应的标准误差,得到4个系数的t值分别为:13.5、8、4.25和0.44。用经验法则容易看出,前三个系数是统计上高度显著的,而最后一个是不显著的。
(3)R2=0.283,拟合不理想,即便是横截面数据,也不理想。 4.8 (1)2.4%。
(2)因为Dt和(Dtt)的系数都是高度显著的,因而两时期人口的水平和增长率都不相同。1972-1977年间增长率为1.5%,1978-1992年间增长率为2.6%(=1.5%+1.1%)。
4.9 原假设H0: β1 =β2,β3 =1.0
备择假设H1: H0不成立 若H0成立,则正确的模型是:
6
上升一个百分点(注意,不是1%),CEO薪金的上升约为1.07%;
由于F=192 F0.05(2,16)=3.63,故拒绝原假设,回归方程
很好地解释了应变量Y。 (4)
A. 原假设H0:β1= 0 备择假设H1:β1 0
ˆ0.2
t121.74 t0.025(16)=2.12,
S(1)0.0092
故拒绝原假设,β
1
显著异于零,说明个人消费支出(X1)对
进口需求有解释作用,这个变量应该留在模型中。
B. 原假设H0:β2=0
备择假设H1:β2 0
t
ˆ0.12
1.19
0.084S(2)
Yβ0β1(X1X2)X3u
(2)对
据此进
(3)错
即使解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性。 (4)对 (5)错
在扰动项自相关的情况下OLS估计量仍为无偏估计量,但
行有约束回归,得到残差平方和
SR。
若H1为真,则正确的模型是原模型:
Yβ0β1X1β2X2β3X3u
据此进行
不再具有最小方差的性质,即不是BLUE。 (6)对
无约束回归(全回归),得到残差平方和S。检验统计量是:
(7)错 g
~F(g,n-K-1) F
S(nK1)模型中包括无关的解释变量,参数估计量仍无偏,但会增大
估计量的方差,即增大误差。 (8)错。
SRS用自由度(2,n-3-1)查F分布表,5%显著性水平下,得到FC ,
如果F FC, 则拒绝原假设H0,接受备择假设H1。
4.10 (1)2个,D1
(2)4个,
验都不显著, R2值仍可能高。 (9)错。
存在异方差的情况下,OLS法通常会高估系数估计量的标准误差,但不总是。
1大型企业0其他1中型企业
D2
0其他
大学1高中(10)错。1小学1初中1
D1D2D3D4
0其他0其他0其他异方差性是关于扰动项的方差,而不是关于解释变量的方0其他
4.11
yt01D2xt3(Dxt)ut,其中
D0
D1,
t1979t1979
差。
5.2 对模型两边取对数,有
lnYt=lnY0+t*ln(1+r)+lnut ,
令LY=lnYt,a=lnY0,b=ln(1+r),v=lnut,模型线性化
为:
LY=a+bt+v
估计出b之后,就可以求出样本期内的年均增长率r了。
5.3(1)DW=0.81,查表(n=21,k=3,α=5%)得dL=1.026。
DW=0.81<1.026
结论:存在正自相关。
(2)DW=2.25,则DW´=4 – 2.25 = 1.75 查表(n=15, k=2, α=5%)得du =1.543。 1.543<DW´= 1.75 <2 结论:无自相关。
(3)DW= 1.56,查表(n=30, k=5, α=5%)得dL =1.071, du =1.833。
1.071<DW= 1.56 <1.833
结论:无法判断是否存在自相关。
5.4 7
4.12 对数据处理如下:
lngdp=ln(gdp/p) lnk=ln(k/p) lnL=ln(L/P) 对模型两边取对数,则有 lnY=lnA+lnK+lnL+lnv 用处理后的数据回归,结果如下:
ˆdp0.260.96lnk0.18lnllng20.97
t:(-0.95) (16.46) (3.13)
由修正决定系数可知,方程的拟合程度很高;资本和劳动力的斜率系数均显著(tc=2.048), 资本投入增加1%,gdp增加0.96%,劳动投入增加1%,gdp增加0.18%,产出的资本弹性是产出的劳动弹性的5.33倍。
第五章 模型的建立与估计中的问题及对策
5.1 (1)对
(1) (2)
横截面数据.
不能采用OLS法进行估计,由于各个县经济实力差距大,可能存在异方差性。
(2)重新设定模型为
GNPt0(13)Mt(23)Mt1ut
01Mt2Mt1ut
我们可以估计出
(3) 5.5
GLS法或WLS法。
0、1和2
,但无法估计出
(1)可能存在多重共线性。因为①X3的系数符号不符合实际.②R很高,但解释变量的t值低:t2=0.9415/0.8229=1.144, t3=0.0424/0.0807=0.525.
解决方法:可考虑增加观测值或去掉解释变量X3. (2)DW=0.8252, 查表(n=16,k=1,α=5%)得dL=1.106.
DW=0.8252
-
单纯消除自相关,可考虑用科克伦-奥克特法或希尔德雷斯-卢法;进一步研究,由于此模型拟合度不高,结合实际,模型自相关有可能由模型误设定引起,即可能漏掉了相关的解释变量,可增加相关解释变量来消除自相关。5.6 存在完全多重共线性问题。因为年龄、学龄与工龄之间大致存在如下的关系:Ai=7+Si+Ei
解决办法:从模型中去掉解释变量A,就消除了完全多重共线性问题。
5.7 (1)若采用普通最小二乘法估计销售量对广告宣传费用的回归方程,则系数的估计量是无偏的,但不再是有效的,也不是一致的。
(2)应用GLS法。设原模型为
2
1、2和3。
(3)所有参数都可以估计,因为不再存在完全共线性。 (4)同(3)。
5.9(1)R2很高,logK的符号不对,其 t值也偏低,这意味着可能存在多重共线性。
(2)logK系数的预期符号为正,因为资本应该对产出有正向影响。但这里估计出的符号为负,是多重共线性所致。
(3)时间趋势变量常常被用于代表技术进步。(1)式中,0.047的含义是,在样本期内,平均而言,实际产出的年增长率大约为4.7%。
(4)此方程隐含着规模收益不变的约束,即+=1,这样变换模型,旨在减缓多重共线性问题。
(5)资本-劳动比率的系数统计上不显著,看起来多重共线性问题仍没有得到解决。
(6)两式中R2是不可比的,因为两式中因变量不同。 5.10(1)所作的假定是:扰动项的方差与GNP的平方成正比。模型的估计者应该是对数据进行研究后观察到这种关系的,也可能用格里瑟法对异方差性形式进行了实验。
(2)结果基本相同。第二个模型三个参数中的两个的标准误差比第一个模型低,可以认为是改善了第一个模型存在的异方差性问题。 5.11 我们有
yi01xiui (1)
由于已知该行业中有一半的公司比另一半公司大,且已假定大公司的误差项方差是小公司误差项方差的两倍,则有
2
ii,其中i
222
2,i大公司
i
1,i小公司
yi0xu1ii (2)
。则模型可变换为
ˆ12
RSS155
n1k125
2
ˆ32
RSS3140
n3k125
2
iii
此模型的扰动项已满足同方差性的条件,因而可以应用OLS法进行估计。
(3)可以。对变换后的模型(2)用戈德弗尔德-匡特检验法进行异方差性检验。如果模型没有异方差性,则表明对原扰动项的方差的假定是正确的;如果模型还有异方差性,则表明对原扰动项的方差的假定是错误的,应重新设定。 5.8(1)不能。因为第3个解释变量(
原假设H0:13
2
备则假设H1:13
2
检验统计量为:
ˆ3214025
F22.5454
25ˆ1
用自由度(25,25)查F表,5%显著性水平下,临界值为:Fc=1.97。
因为F=2.5454>Fc=1.97,故拒绝原假设原假设H0: 8
MtMt1)是Mt和
Mt1的线性组合,存在完全多重共线性问题。
13
22
DW=0.76,查表(n=19,k=1,α=5%)得dL=1.18。
。
DW=0.76<1.18,故存在自相关。 解决方法与(1)同,略。
(3)城镇:Cut= 106.41 + 0.71Yut R2=0.998
t: (13.74) (91.06) DW=2.02
DW=2.02,非常接近2,无自相关。
5.14 (1)用表中的数据回归,得到如下结果:
结论:存在异方差性。 5.12 将模型变换为:
Yt1Yt12Yt20(112)1(Xt1Xt12Xt2)t
(2)
若
1、2为已知,则可直接估计(2)式。一般情况下,1、
因此需要先估计它们。首先用OLS法估计原模型(1)2为未知,
式,得到残差et,然后估计:
et1et12et2t
其中
ˆ =54.19 + 0.061X1 + 1.98*X2 + 0.03X3 - 0.06X4 R2=Y
0.91
t: (1.41) (1.58) (3.81) (1.14) (-1.78) 根据tc(α=0.05,n-k-1=26)=2.056,只有X2的系数显著。 (2)理论上看,有效灌溉面积、农作物总播种面积是农业总产值的重要正向影响因素。在一定范围内,随着有效灌溉面积、播种面积的增加,农业总产值会相应增加。受灾面积与农业总产值呈反向关系,也应有一定的影响。而从模型看,这些因素都没
0和
ˆ1和ˆ2生成 t为误差项。用得到的1和2的估计值
ˆ1Yt1ˆ2Yt2 YtYt
ˆ1Xt1ˆ2Xt2 XtXt
令
0(112),用OLS法估计
Yt1Xtt
ˆˆ和即可得到ˆ
1。
1
ˆ,从而得到原模型(1)的系数估计值
显著影响。这是为什么呢?
这是因为变量有效灌溉面积、施肥量与播种面积间有较强的相关性,所以方程存在多重共线性。现在我们看看各解释变量间的相关性,相关系数矩阵如下:
X1 X2 X3 X4
1 0.896 0.880 0.715
0.896 1 0.895 0.685
0.880 0.895 1 0.883
0.715 0.685 0.883 1
5.13 (1)全国居民人均消费支出方程:
Ct= 90.93 + 0.692Yt R=0.997
2
t: (11.45) (74.82) DW=1.15 DW=1.15,查表(n=19,k=1,α=5%)得dL=1.18。 DW=1.15<1.18
结论:存在正自相关。可对原模型进行如下变换: Ct -ρCt-1 = α(1-ρ)+β(Yt-ρYt-1)+(ut -ρut -1)
X1 X2 X3 X4
ˆ由ˆ=0.425 1DW/2有
t ,结果如下:
令:Ct= Ct –0.425Ct-1 , Yt= Yt-0.425Yt-1 ,α’=0.575α 然后估计 Ct=α+βYt + ε
表中r12=0.896,r13=0.895,说明施肥量与有效灌溉面积和播种面积间高度相关。
Ct= 55.57 + 0.688Yt
R2=0.994
我们可以通过对变量X2的变换来消除多重共线性。令X22=X2/X3(公斤/亩),这样就大大降低了施肥量与面积之间的相关性,用变量X22代替X2,对模型重新回归,结果如下:
t:(11.45) (74.82) DW=1.97
DW=1.97,查表(n=19,k=1,α=5%)得du=1.401。 DW=1.97>1.18,故模型已不存在自相关。 (2)农村居民人均消费支出模型:
农村:Crt= 106.41 + 0.60Yrt R=0.979
2
ˆ =-233.62 + 0.088X1 + 13.66*X2 + 0.096X3 - 0.099X4 R2
Y
=0.91
t: (-3.10) (2.48) (3.91) (4.77) (-3.19)
从回归结果的t值可以看出,现在各个变量都已通过显著性检验,说明多重共线性问题基本得到解决。 9
t: (8.82) (28.42) DW=0.76
第六章 动态经济模型:自回归模型和分布滞后模型
6.1(1)错。使用横截面数据的模型就不是动态模型。 (2)对。
(3)错。估计量既不是无偏的,又不是一致的。 (4)对。
(5)错。将产生一致估计量,但是在小样本情况下,得到的估计量是有偏的。 (6)对。
6.2 对于科克模型和适应预期模型,应用OLS法不仅得不到无偏估计量,而且也得不到一致估计量。
但是,部分调整模型不同,用OLS法直接估计部分调整模型,将产生一致估计值,虽然估计值通常是有偏的(在小样本情况下)。
6.3 科克方法简单地假定解释变量的各滞后值的系数(有时称为权数)按几何级数递减,即:
Yt =α+βXt +βλXt-1 +βλ2Xt-2 +…+ ut 其中 0
这实际上是假设无限滞后分布,由于0
而阿尔蒙方法的基本假设是,如果Y依赖于X的现期值和若干期滞后值,则权数由一个多项式分布给出。由于这个原因,阿尔蒙滞后也称为多项式分布滞后。即在分布滞后模型 中,假定:
2p
tia1aiaiaiYt0XXXu0t112mtmpt
0000
400411620142
此,变换模型为:
因
YtiXtiut
(01i2i2)Xtiut(01i2i2)Xtiut
i0i04i04
4
2[4iXtiiXti]ut
用此式可估计出和ˆ2,即可得到ˆ14ˆ2,然后可得
到诸的估计值。
6.7 (1)设备利用对通货膨胀的短期影响是Xt的系数:0.141;从长期看,在忽略扰动项的情况下,如果Yt趋向于某一均衡水平
2
,则Xt和Xt-1也将趋向于某一均衡水平:
30.120.1410.23630.120.3770.377。
(2)对模型的回归参数的显著性检验: 原假设:H0: β1 =0
即
所以,设备利用对通货膨胀的长期影响是Xt和Xt-1的系数之和:
备择假设:H1: β1 0
从回归结果可知,检验统计量t1
2.60
根据n-k-1=15,a=5%,查临界值表得tc=2.131。 由于t=2.60> tc=2.131
故拒绝原假设,即Xt对y有显著影响。 原假设:H0: β2 =0
备择假设:H1: β2 0
其中p为多项式的阶数。也就是用一个p阶多项式来拟合分布滞后,该多项式曲线通过滞后分布的所有点。
6.4 (1)估计的Y值是非随机变量X1和X2的线性函数,与扰动项v无关。
(2)与利维顿方法相比,本方法造成多重共线性的风险要小一些。 6.5(1)
从回归结果可知,检验统计量t2
4.26
根据n-k-1=15,a=5%,查临界值表得tc=2.131。 由于t=4.26> tc=2.131
故拒绝原假设,即Xt-1对y有显著影响。
0,即设备利用和滞Mt01(11)Yt12(11)Yt12(12)Rt21(12)Rt综上所述,所有的斜率系数均显著异于1
(12)Mt1(12)Mt2[ut(12)ut1(12)ut2]
后一期的设备利用对通货膨胀都有显著的影响。
其中0是、1和2的函数。
(2) 第(1)问中得到的模型高度参数非线性,它的参数需采用非线性回归技术来估计。 6.6
(3)对此回归方程而言,检验两个斜率系数为零,等于检验回归方程的显著性,可用F检验。
原假设:H0: β1 =β2 =0
备择假设:H1:原假设
i01i2i2
10
不成立 检验统计量
R2K0.727/2
F19.973(1R)nK1)(10.727)/(1821)
根据k=2,n-k-1=15,a=5%,查临界值表得Fc=3.68。
由于F=19.973>Fc=3.68
故拒绝原假设,即Xt、Xt-1至少有一个变量对y有显著影响,表明方程总体是显著的。
6.8模型的滞后周期m=3,模型有6个参数,用二次多项式进行拟合,即p=2,得
Yt = δYt* - (1-δ)Yt-1 + u t (8)
将(1’)代入(8), 得:
(9)式两端取一期滞后,得:
Yt(1)(XtXt12Xt2)(1)Yu
t1t
(9)
Yt1(1)(Xt1Xt22Xt3)(1)Yut1
t2
(10)
(9)- λ(10),得: 整理得:
Y(1)Xt(1)Y(1)Yutut1tt1t2
(11)
Wia0a1ia2i2
我们有:
该式不能直接采用OLS法进行估计, 因为存在Yt-1、Yt-2等随机解释变量,它们与扰动项相关, 并且扰动项存在序列相关。若采用OLS法, 得到的估计量既不是无偏的, 也不是一致的。可采用工具变量法或极大似然法进行估计。
W0a0
代入
W1a0a1a2原模型,得
Wa3a9aW23a002a114a22
YtWiXtiUt
i0
3
第七章 时间序列分析
7.1 单项选择题 (1)A
3
a0Xtia1iXtia2i2XtiUt
i0
i0
i0
33
(2)D (3)B (4)B
7.2 一般来说,如果一个时间序列的均值和方差在任何时间保持恒定,并且两个时期t和t+k之间的协方差(或自协方差)仅依赖于两时期之间的距离(间隔或滞后)k,而与计算这些协方差
(a0a1ia2i2)Xti2Ut
令:Z0t=∑Xt-i , Z=∑iX, Z=∑iXt-i 1tt-i 2ti0
显然,Z0t ,Z1t和Z2t可以从现有观测数据中得出,使得我们可用OLS法估计下式:
3
Yta0Z0ta1Z1ta2Z2tut
估计出α,α0,α1, α2的值之后,我们可以转换为 βWi的
的实际时期t无关,则该时间序列是平稳的。 只要这三个条件不全满足,则该时间序列是非平稳的。事实上,大多数经济时间序列是非平稳的。
实证分析中确定经济时间序列的性质的必要性在于,如果采用非平稳时间序列进行回归,则可能产生伪回归问题,不能确定
估计值,公式为:
6.9
ˆ0aˆ1iaˆ2i2Wia
Yt* =
βXt+1
e
(1)
Yt-Yt-1 =
e
δ(Yt* - Yt-1) + u t (2)
(3)
Xt+1 - Xte = (1-λ)( Xt - Xte);t=1,2,…,n
变换(3),得
Xt+1 = (1-λ)Xt +λXt (4)
e
e
回归结果一定正确。
7.3 大致说来,单位根这一术语意味着一给定的时间序列非平稳。专业点说,单位根指的是滞后操作符多项式A(L)的根。 7.4 DF检验是一种用于决定一个时间序列是否平稳的统计检验方法。EG检验法是一种用于决定两个时间序列是否协整的统计检验方法。
因为Xt+1无法表示成仅由可观测变量组成的表达式。但如果(4)式成立,则对于t期,它也成立,即:
e
Xt = (1-λ)Xt-1 +λXt-1 (5)
(5)代入(4),得:
ee
Xt+1 =(1-λ)Xt + (1-λ)λXt-1 +λXt-1
e2e
7.5 当回归方程中涉及的时间序列是非平稳时间序列时,OLS估
(6)
我们可以用类似的方法,消掉(6)式中的X限重复下去,最后得到: 将(7)代入(1), 得:
e
t1
, 这一过程可无
计量不再是一致估计量,相应的常规推断程序会产生误导。这就是所谓的“伪回归”问题。
在回归中使用非均衡时间序列时不一定会造成伪回归,只要变量彼此同步,则这些变量间存在长期的线性关系.
7.6(1)因为||=2.35小于临界||值,表明住宅开工数时间 11
Y*(1λ)(XtλXλ2X)(1') t1t2teX(1λ)(XtλXλ2X)(7)t1t1t2变换(2)得:
序列是非平稳的。
(2)按常规检验,t的绝对值达到2.35,可判断为在5%水平上显著,但在单位根的情形下,临界|t|值是2.95而不是2.35。 (3)由于Xt1的||值远大于对应的临界值,因此,住宅开工数的一阶差分Xt是平稳时间序列。 7.7
(1)∵R2=0.9643﹥DW=0.3254
∴认为A是伪回归
(2)∵R2
(3)从C可以看出,τ=-2.2521 查表7-3变量数为2,样本容量为72.在5%的显著性水平下τ≈-3.46
∵-2.2521>-3.46 ∴M1与GDP之间不存在协整关系,不改变(1)中的结论,认为A是伪回归。
如果M1与GDP的单整阶数不同,协整关系仍然不存在,A仍然是伪回归。
(4)此方程给出的是M1和GDP的对数之间的短期关系。这是因为给出的方程考虑了误差调整机制(ECM),它试图在两变量离开其长期通道的情况下,恢复均衡。可是,方程中误差项在5%水平上不显著。
如我们在(2)和(3)中所讨论的,由于协整检验的各结果相当混乱,使人难以得出所提供的回归结果A是否伪回归的明确结论。
7.8 用表中的人口(pop)时间序列数据,进行单位根检验,得到如下估计结果:
人口时间序列dpop的单位根检验编号
t:t:
DF或ADF检验(3.287)*(3.272)*
(3.029)(2.811)(0.577)
1.dpopt0.357dpopt1495.9652.dpopt0.358dpopt1560.8272.279t
其中△dpopt=dpopt-dpopt-1。两种情况下,tδ值分别为-3.287和-3.272,从Dickey-Fullerτ统计量临界值表中可以看出,第一个检验小于从0.025到0.10的各种显著性水平下的值和T值;第二个检验小于0.10显著性水平下的τ值。因此,在0.10显著水平下,二者都拒绝原假设,即人口一阶差分时间序列没有单位根,或者说该序列是平稳序列。
综合以上结果,我们的结论是: dpopt是平稳序列,dpopt~I(0)。
而popt是非平稳序列,由于dpopt~I(0),因而popt~I(1)。
7.9
步骤一:求出三变量的单整的阶
(1)对三变量原序列的单位根检验
出口lnex的单位根检验编号
DF或ADF检验
(1.633)*
2.lnext0.1800.007t0.041lnext1
(0.95)*
1.lnext0.0150.02lnext1
人口时间序列pop的单位根检验编号1.2.
(t:)(t:)
DF或ADF检验
popt1509.900.0013popt1
(4.88)(1.48)
(0.40)*(0.85)
(0.88)*
popt3519.4460.37t0.042popt1
进口lnim的单位根检验编号1.2.
DF或ADF检验
lnimt0.0380.023lnimt1
(1.385)*
lnimt0.2630.012t0.074lnimt1
(1.519)*
价格指数lnpt的单位根检验编号1.2.
DF或ADF检验
lnptt0.0340.016lnptt1
(1.068)*
lnptt0.0350.002t0.031lnptt1
(1.056)*
两种情况下,tδ值分别为-0.40和 -0.88,从Dickey-Fuller
τ统计量临界值表中可以看出,两者分别大于从0.01到0.10的
各种显著性水平下的值和T值。因此,两种情况下都不能拒绝原假设,即私人消费时间序列是非平稳序列。
下面看一下该序列的一阶差分(dpop)的平稳性。做类似于上面的回归,得到如下结果:
从Dickey-Fullerτ统计量临界值表中可以看出,三个序列的tδ值分别大于从0.01到0.10的各种显著性水平下的值和
T值。因此,三个序列的单位根检验都不能拒绝原假设,即出
口、进口、价格指数三个时间序列都是非平稳序列。 12
下面看一下这些序列的一阶差分的平稳性。做类似于上面的回归,得到如下结果:
出口序列dlnex的单位根检验编号1.2.
DF或ADF检验
dlnext0.0810.710dlnext1
(5.112)*
dlnext0.0230.002t0.766dlnext1
(5.438)*
进口序列dlnim的单位根检验编号1.2.
DF或ADF检验
dlnimt0.0690.639dlnimt1
(4.723)*
dlnimt0.00030.003t0.688dlnimt1
(4.991)*
价格序列dlnpt的单位根检验编号1.
DF或ADF检验
dlnptt0.0100.339dlnptt1
(3.166)*
0.30.20.1
0.0-0.1-0.2
0.60.40.20.0-0.2-0.4-0.6
第八章 联立方程模型
从
8.1
(1)错。一般来说,不行。因为联立方程中变量的相互作用,
因而结构方程中往往包括随机解释变量。 (2)对。 (3)对。 (4)对。
(5)错。可以用3SLS法。 (6)对。 8.2 (1)C (2)A (3)B (4)D (5)A (6)B (7)B (8)A
8.3 恒等式与行为方程的区别有以下两点:
(1)恒等式不包含未知参数,而行为方程含有未知参数。 (2)恒等式中没有不确定性,而行为方程包含不确定性,因而在计量经济分析中需要加进随机扰动因子。
8.4 由于内生变量是联立地被决定,因此,联立方程模型中有多少个内生变量就必定有多少个方程。这个规则决定了任何联立方程模型中内生变量的个数。可是,确定哪个变量为内生变量,要根据经济分析和模型的用途。
在设定模型时,通常将以下两类变量设定为外生变量: (1)政策变量,如货币供给、税率、利率、政府支出等。 (2)短期内很大程度上是在经济系统之外决定或变化规律
13
Dickey-Fullerτ统计量临界值表中可以看出,两个差分序列dlnex、dlnim的tδ值分别小于从0.01到0.10的各种显著性水平下的值和T值;而差分序列dlnpt的tδ值分别小于从0.05到0.10的各种显著性水平下的值和T值。因此,三个差分序列的单位根检验都拒绝原假设,即出口、进口、价格指数三个差分时间序列都是平稳序列。这就是说,
dlnext~I(0),dlnimt~I(0),dlnptt~I(0);而
lnext~I(1),lnimt~I(1),lnptt~I(1),因而我们可以进入下一步。
步骤二:进行协整回归,结果如下:
LNEX =1.273+0.842*LNIM + 0.573*LNPT同时我们计算并保存残差(均衡误差估计值)et。
步骤三:检验et的平稳性。
D(et) = -0.450*et(-1) DW=1.992
(-4.405)*步骤四:得出有关两变量是否协整的结
论。
查临界值,N=3,a=0.05,T=52的临界值是-4.11,而AEG=-4.405
步骤五:建立ECM模型。
DLNEX = 0.757*DLNIM - 0.458*ET(-1) R2=0.618 t:
(12.23)
(-4.54) DW=1.788 方
程的回归系数通过了显著性检验,误差修正系数为负,符合反向修正机制。关于ECM模型dlnex的实际值、拟合值和残差的拟合图如下:
稳定的变量,如人口、劳动力供给、国外利率、世界贸易水平、国际原油价格等。
8.5 Ct = α + βDt +u t (1)
It = γ + δDt-1 + ν
t
的数目都大于G-1=3,因而都是过度识别的,宏观经济模型大都如此。
(2)考虑用2SLS方法估计三个行为方程,也可以用3SLS方法或FIML法估计之。
8.8 (1)内生变量:Yt,It,Ct,Qt;外生变量:Rt,Pt;前定变量:Yt-1,Ct-1,Q t-1,Rt,Pt。 (2)模型总变量个数k=9,方程个数G=4
方程(1): 变量个数m1=3, k-m1=6>G-1=3,因而为过度识别; 方程(2): 变量个数m2=3, k-m2=6>G-1=3,因而为过度识别; 方程(3): 变量个数m3=4, k-m3=5G-1=3,因而为过度识别。 (3)因为原模型中4个方程皆是过度识别,因此不能使用间接最
(2)
Dt = Ct + It + Zt; (3)
将(2)代入(3), 然后把(3)代入(1),得: Ct = α + β(Ct +γ + δDt-1 + νt + Zt )+u t 整理得:
Ct -βCt = α + βγ + βδDt-1 + βνt + βZt +u t (1 –β)Ct = α + βγ + βδDt-1 +βZt +βνt +u t (1 –β)Ct = α + βγ + βδDt-1 +βZt +βνt +u t
tut
CtDt1Zt
1111
模型总变量个数k=5,方程个数G=3
小二乘法。因为间接最小二乘法只适用于恰好识别方程的估计。 (4)第一步:进行简化式回归,要估计的方程是: It =П10+П11 Yt-1+П12 Ct-1+П13 Q t-1+П14 Rt+П15 Pt+ν Yt =П20+П21 Yt-1+П22 Ct-1+П23 Q t-1+П24 Rt+П25 Pt+ν Qt =П30+П31 Yt-1+П32 Ct-1+П33 Q t-1+П34 Rt+П35 Pt+ν
1t
方程(1): 变量个数m1=2, k-m1=3>G-1=2,因而为过度识别. 方程(2): 变量个数m2=2, k-m2=3>G-1=2,因而为过度识别. 方程(3): 为恒等式,无需判别识别状态。 8.6
Yt = Ct + It +Gt +Xt
Ct = β0 + β1D t + β2C t-1 + u t Dt = Yt – Tt
It = α0 + α1Yt + α2R t-1 +ν
t
2t
3t
ˆˆ 估计上述方程,得到I、Y、Q的估计值It、Yt、Qt。
t
t
t
ˆ代替方程右端的It、ˆt、Yˆ、Q 第二步:在原结构方程中用Itt
Yt、Qt ,进行OlS回归,即估计 Yt =β0 +β1Yt –1 +β
(1) 内生变量: Yt , Ct , It ,Dt; 外生变量: Gt, Xt, R t-1 Tt;
前定变量: Gt, Xt, Tt, R t-1,C t-1.
(2) 第一步:进行简化式回归,要估计的方程是: Yt = П10+П11 Tt +П12Ct-1 +П13Rt-1 +П14Gt +П15Xt+ν Dt = П20+П21 Tt +П22Ct-1 +П23Rt-1 +П24Gt +П25Xt+ν
1t
2
ˆtI
+ u 1 t
It = α0 + α
1
ˆˆ + αQYtt
2
+ u 2 t
2t
ˆ + 2Ct-1 +3Pt + u 3 t Ct = 0 + 1Yt
Qt = 0 + 1Q t-1 +2 Rt + u 4 t 得到这四个方程结构参数的估计值。
Yt ,Dt,
8.9 (1) 内生变量: Ct , It ,Mt Yt ,; 外生变量: Gt, Xt;
前定变量: Gt, Xt, C t-1, I t-1.
(2)模型总变量个数k=8,方程个数G=4
ˆ. ˆ , D 分别估计两个方程,得到Yt , Dt的估计值Ytt
ˆ代替方程右端的 第二步:在原结构方程中用Yt 、Dt
进行OlS回归, 即估计
Ct = β0 + β
1
ˆ+ βDtˆ + αYt
方程①: 变量个数m1=3, k-m1=5>G-1=3,因而为过度识别。
2
C t-1 + u t
方程②: 变量个数m2=3, k-m2=5>G-1=3,因而为过度识别。 方程③: 变量个数m3=2, k-m2=6>G-1=3,因而为过度识别。
8.7
It = α0 + α
12
R t-1 +νt
(3)第一阶段:计算各行为方程的2SLS估计值; ① 进行简化式回归,要估计的方程是: Yt = П
10+П11 Gt +П12 Xt +П13 Ct-1+П14 It-1 +ν1t
(1)本模型中K=10,G=4。不难看出,各方程中“零约束”
14
ˆ。 估计方程,得到Yt 的估计值Y 11t
② 在原结构方程中用Yt 代替方程右端的Yt ,进行OlS回归,即估计
Ct =α0 +α
1
ˆ+αYt
2Ct-1 + u1t
It =β0 +β
1
ˆ +βYt
2It –1+ u2t
ˆ + u3t Mt =0 + 1Yt
u
u1nu21Ui= u2nu31u3n
② 用GLS法估计代表该系统所有行为方程的巨型方程,得到全部参数的3sls估计值。
8.10 (1)模型总变量个数k=4,方程个数G=3
消费方程: 变量个数m1=2, k-m1=2==G-1=2,因而为恰好
识别,可用ILS或2SLS来估计。 (2)A.求简化式方程 将恒等式代入消费函数,得
第二阶段:用这些2SLS估计值计算各结构方程的残差,然后估计各结构方程扰动项的同期方差-协方差矩阵;
第三阶段:用GLS法估计代表该系统所有行为方程的巨型方程。
① 形成代表该系统所有行为方程的巨型方程; 巨型方程为:
Yi0Z1i1Z2i2Z3i0Z4i1Z5i2Z6i0Z7iC1tZ8i0ui1(CtIt)u1
i=1,2,…,n,n+1,…,2n,2n+1,…,3n
此方程各变量均有3n个观测值,如下所示:
Ct01Ct1Itu1 (a)
将投资方程代入(a)式,得
ˆYC11C00
1ˆC1C0Ynn1n0I1001Z= Z=
Yi= Z1i=2i Z3i=4i
0In001
M00010
000M0
n
Ct01Ct1(a0a1Rtu2)u1 整
理,得
Ct
该式可写为
01a01a1uu1
Rt12
111111
Ct12Rtt (b)
式中1
01a0
11
2
1a111
对(b)利用OLS法进行估计,则有
00ˆY1Z5i= Z6i=ˆYn0000I0
Z=
7i
In1000
00
Z=
8i
011000 0ˆY1Yˆn
ˆ2
(R)(C)123
4(R)
t
t2
t
ˆ1ˆ2553*364
B. 将消费和投资方程代入恒等式,得
Yt01Ytu101Rtu2
经整理得:
Yt
写为
001uu2
Rt1
111111
该式可
Yt34Rtt (c)
a00
式中3
11a1
4
11
看出,ˆ11是简化式系数的非线性函数,要估计它的标准误差着实不易。
第九章 面板数据模型
9.1表面不相关回归的含义是,所涉及的各个回归似乎不相关,但实际上相关。各个回归方程分别写出,这使得它们似乎不相关,但是它们有共同点。在本章的例子中,四个回归中的每一个关系到一个不同的制造产业,但它们都会受到宏观经济条件变动(如衰退)的影响。一般来说,影响一个回归的结果的事件也很可能影响其它回归的结果,这个事实表明,表面不相关回归中的各回归之间存在相关。这种相关在数学上表现为扰动项跨方程相关。
对(c)利用OLS法进行估计,则有
(Yt)(Rt)16ˆ44 2
4(Rt)
ˆ3ˆ4603*472
C.根据
1、2、3、4的公式,可解出0、1。
23
4
1
24
01
表面不相关回归的步骤是:
1.用OLS法分别估计每个方程,计算和保存回归中得到的残
由于已得到
1、2、3、4
的估计值
ˆ1、ˆ2、ˆ3、ˆ4,由此可解出消费函数的结构式系数的
估计值如下:
差;
2.用这些残差来估计扰动项方差和不同回归方程扰动项之间的协方差;
3.上一步估计的扰动项方差和协方差被用于执行广义最小二乘法,得到各方程系数的估计值。
9.2 有共同截距项的混合数据模型自由度最多,只有一个方程,并且没有虚拟变量。表面不相关回归模型自由度可能是少的,因为每个横截面种类都要有一个回归方程。固定效应模型只用一个
ˆ2ˆ3372ˆˆ106410
ˆ44
ˆ23ˆ10.75ˆ44
(3)模型总变量个数k=4,方程个数G=3
投资方程: 变量个数m1=2, k-m1=2==G-1=2,因而为恰好识别,可用ILS或2SLS来估计。 8.11
(1)在此模型中,K=4,M1=M2=3,G=2 应用识别的阶条件,两方程都是恰好识别的。
(2)在这种情况下,第一个方程可识别,第二个方程不可识别。 (
3
)
方程,因而自由度比表面不相关回归模型多,如果横截面种类很多的话,固定效应模型中会有很多虚拟变量,使得其自由度要显著少于有共同截距项的混合数据模型。随机效应模型用一个方程,并且它是在没有引入虚拟变量的情况下容许截距变动的,因此它的自由度比表面不相关回归模型和固定效应模型都要多。 9.3当不同的横截面种类的截距之间的差异被认为是固定的而不是随机的情况下,应采用固定效应模型。如果横截面个体是随机地被选择出来以代表一个较大的总体,则采用随机效应模型比较合适。随机效应模型与固定效应模型一样,允许不同横截面种类的截距不同,但这种不同被认为是随机的,而不是固定的。 9.4随机效应模型的扰动项不再满足普通最小二乘法各期扰动项
ˆ12ˆ12ˆˆˆˆ1010202.4;120.8
ˆ22ˆ22
相互独立的假设,扰动项的一个分量在各期都相同。 ˆ21ˆ21ˆˆˆ20ˆ106;212029.5 并不总是。尽管将数据合在一起将增加自由度,但有时采用
ˆ11ˆ11
混合数据也是不合适的。如果不同横截面种类的斜率系数不同的
话,则最好是分别回归。如果试图通过使用斜率虚拟变量来解决ˆ21ˆ21
ˆ11ˆ121.8;ˆ22ˆ22ˆ126ˆ11不同横截面种类不同斜率系数的问题,需要假定扰动项方差为常ˆ22ˆ11
数。而采用分别回归,每个回归的扰动项方差可以不同,也就是
要检验原假设11=0,我们需要ˆ11的标准误差。可是从上面可
每个产业或每个横截面种类的扰动项方差不同。
9.6 不相同。估计值不一样,t统计量也是,可是似乎没有任何
明显的差异模式。SUR估计值与OLS估计值之所以不同,是因为表面不相关回归考虑了不同回归的扰动项的相关,而普通最小二乘法分别估计每个方程,不考虑不同回归的扰动项之间的任何相关。
9.7 否。混合数据集的样本容量将为100,可是有50个县市,因此固定效应模型所需要的虚拟变量会消耗太多的自由度。如果你分别运行两个回归,每年一个,每个回归的自由度是44。而运行一个固定效应回归,自由度是45(n-k=100-55,50个虚拟变量,5个常规自变量)。将数据合在一起的主要理由是得到自由度,可是在本题中,此理由不成立。
9.8 问题可通过使用一个F检验来回答,但最容易的方法是采用两年的混合数据估计下面的回归方程:
DVDEXP = β0 +β1INCOME +β2PRICE +β3RAINFALL +β4YEAR2 +
u
其中YEAR2=1,若观测值来自第二年的数据;0,其它 回归结果如下:
Dependent Variable is DVDEXP
下三个问题:
(1)因变量拟合值代表概率,但它们常常小于0或大于1,而概
率值是不可能取这类值的;
(2)往往存在异方差性; (3)扰动项不服从正态分布。
10.2 没有问题。两种方法得到的斜率估计值不同是因为估计方法不同。Probit估计是基于累积正态概率分布,而logit估计是基于累积logistic分布。
10.3 一个事件发生的机会是该事件发生的概率除以该事件不发生的概率。如果P是因变量等于1的概率,那么因变量等于1的机会是P/(1-P).。logit模型的拟合值是因变量等于1的机会的自然对数。
10.4 (1) 不是。拟合值0.48的含义是,考虑家庭的收入、孩子的数目以及房价等因素,该家庭将买房的概率估计值为0.48;
(2)不会。因为估计的概率小于0.5,因此预测为0。 (3)若该家庭买了房,不会惊讶。因为买房的估计概率接
近0.5,0.48仅仅是估计概率。同时,即便估计值完
Variable Coefficient
Standard
Error
Constant 86.04 INCOME PRICE RAINFALL YEAR2
0.06 -3.20 7.46 -5.21
24.39 0.01 0.90 2.40 6.59
3.53 6.22 -3.57 3.11 -0.79
t-Statistic
p-Value
全正确,它也只是个概率。如果估计概率是0.9,我们预测该家庭将买房,但我们仍有10%的错误机会:该家庭继续租房;
0.00
10.5(1)PRICE和CHILDREN不变的情况下,INCOME增加一个单0.00
位(1000元),则该家庭将买房的概率增加0.005;
0.00 INCOME和CHILDREN不变的情况下,PRICE上升一个单位0.01
(1000元),则该家庭将买房的概率减少0.008;
0.44
和PRICE不变的情况下,该家庭添一个小孩,则该家庭将买房的概率增加0.3。
(2)若采用logit模型,因变量将是ln[HOME/(1-HOME)],
每个斜率系数被解释为对机会的对数的影响。
10.6 (1)86.7%;(2)78.6%;(3)93.8%
10.7 (1)估计方程(10.11),比较CAND1的拟合值和实际值,
将大于等于0.5的拟合值记入支持候选人甲(CAND1)的预测值。用全部观测值进行回归,但只用CAND1等于1的观测值来计算预测正确的观测值的百分比,答案是11/14或78.6%.
(2)估计方程(10.12),其它步骤与(1)同,答案是7/10
或70%.
Observations: 24 R2 = 0.79
Adjusted R2 = 0.74
Residual Sum of Squares = 4877.24 F-statistic = 18.18
对β4进行t检验显示,YEAR2统计上不显著,表明不需要固定效应模型。由于仅有两年的数据,因而可以用t检验来替代F检验,检验是否需要固定效应模型。
第十章 定性选择模型
10.1 一般来说,普通最小二乘法不是估计定性选择模型的好方法,这是因为OLS假定因变量和自变量之间存在线性关系,但是对于定性选择模型,二者关系通常不是线性的。具体说来,有以
(3)为回答此问题,第一步是找出甲(CAND1)和丙(CAND3)
都等于0的所有观测值。因为所有支持丙的观测值都包含在表10-6中,在表10-1中被省略,因而支持乙(CAND2)的观测值就是在表10-1中甲(CAND1)等于0的观测值。对于这些观测值,逐个检查甲和丙在上面两个回归中的拟合值,对于某观测值,如果CAND1和CAND3的拟合值都小于0.5,则模型预测该选民不支持甲和丙,而必支持乙,该观测值预测正确。如果CAND1或CAND3的拟合值大于等于0.5,则模型预测该选民支持甲或丙,而不支持乙,该观测值预测不正确。答案是12/16或75%.
(4)将上面三问中预测正确的观测值数目加在一起,11+7
+12=30,即对30个观测值预测正确,由于观测值总数是30,因此预测正确的观测值的总百分比是75%.
10.8 证
log
F(zi)1F(zi)
exp(zi)exp(zi)1exp(zi)1exp(zi)loglog
iii1
1exp(zi)1exp(zi)exp(zi)1exp(zi)loglogexp(zi)zi
11exp(zi)