§4.2 序列相关性
一、序列相关性概念
对于模型
Y i =b0+b1X 1i +b2X 2i +…+bk X ki +mi i =1,2, …,n随机项互不相关的基本假设表现为
Cov(mi , mj )=0i ¹j , i , j =1,2, …,n
如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。
在其他假设仍成立的条件下,序列相关即意味着或E (mi mj ) ¹0æs2
(µ) =E (µµ¢) =çççM
èE (mn m1)
æs2L s1n ö
=çç÷
çM O M ÷
ès2÷
n 1L sø
=s2Ω¹s2I E (m1mn ) öM ÷÷s2÷øL Cov O L
如果仅存在
E(mi mi+1) ¹0i =1,2, …,n
称为一阶列相关,或自相关(autocorrelation )自相关往往可写成如下形式:
mi =rmi -1+ei -1
其中:r被称为自协方差系数(coefficient of autocovariance )或一阶自相关系数(first-order coefficient of autocorrelation )
ei 是满足以下标准的OLS 假定的随机干扰项: E (ei ) =0, var(ei ) =s, cov(ei , ei -s ) =0 s ¹0 2
由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t 代表i 。
二、实际经济问题中的序列相关性
1、经济变量固有的惯性
大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。
例如,绝对收入假设下居民总消费函数模型:
C t =b0+b1Y t +mt t=1,2,…,n
由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。
2、模型设定的偏误
所谓模型设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例如,本来应该估计的模型为
Y t =b0+b1X 1t + b2X 2t + b3X 3t + mt
但在模型设定中做了下述回归:
Y t =b0+b1X 1t + b1X 2t + vt
因此,v t =b3X 3t + mt ,如果X 3确实影响Y ,则出现序列相关。
又如:如果真实的边际成本回归模型应为:
Y t =b0+b1X t +b2X t 2+mt
其中:Y=边际成本,X=产出,
但建模时设立了如下模型:
Y t = b0+b1X t +vt
因此,由于v t = b2X t 2+mt, ,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。
3、数据的“编造”
在实际经济问题中,有些数据是通过已知数据生成的。
因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。
还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。
二、序列相关性的后果
计量经济学模型一旦出现序列相关性,如果仍采用OLS 法估计模型参数,会产生下列不良后果:
1、参数估计量非有效
因为,在有效性证明中利用了
E(NN ’)=s 2I
即同方差性和互相独立性条件。
而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。
2、变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差
项具有同方差性和互相独立性时才能成立。
其他检验也是如此。
3、模型的预测失效
区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。
所以,当模型出现序列相关性时,它的预测功能失效。
三、序列相关性的检验
基本思路:
序列相关性检验方法有多种,但基本思路相同:首先,采用OLS 法估计模型,以求得随机误差项的
~表示:“近似估计量”,用e i
~ˆe =Y -(Y i i i ) 0ls
然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。
1、图示法
2、回归检验法
~~以e t 为被解释变量,以各种可能的相关量,诸如以e t -1、
2~~e t -2、e t 等为解释变量,建立各种方程:
~=re ~+ee t t -1t
~~+r~e t =r1e t -12e t -2+et
……
如果存在某一种函数形式,使得方程显著成
立,则说明原模型存在序列相关性。
回归检验法的优点是:(1)能够确定序列相
关的形式,(2)适用于任何类型序列相关性问题的检验。
3、杜宾-瓦森(Durbin-Watson )检验法D-W 检验是杜宾(J.Durbin )和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是:
(1)解释变量X 非随机;
(2)随机误差项mi 为一阶自回归形式:
mi =rmi-1+ei
(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:
Y i =b0+b1X 1i +¼bk X ki +gY i-1+mi
(4)回归含有截距项
D.W 检验步骤:
(1)计算DW 值
(2)给定a ,由n 和k 的大小查DW 分布表,得临界值d L 和d U (3)比较、判断
若0
d L
d U
4-d U
4-d L
能无自相关能负
相确确关定定关
0 dL d U 2 4-dU 4-d L
4、拉格朗日乘数(Lagrange multiplier)检验拉格朗日乘数检验克服了DW 检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。
它是由布劳殊(Breusch )与戈弗雷(Godfrey )于1978年提出的,也被称为GB 检验。
对于模型
Y i =b0+b1X 1i +b2X 2i +L +bk X ki +mi
如果怀疑随机扰动项存在p 阶序列相关:
mt =r1mt -1+r2mt -2L +rp mt -p +et
GB 检验可用来检验如下受约束回归方程
Y t =b0+b1X 1t +L +bk X kt +r1mt -1+L +rp mt -p +et
约束条件为:
H 0: r1=r2=…=rp =0
约束条件H 0为真时,大样本下
22LM =(n -p ) R ~c(p )
其中,n 为样本容量,R 2为如下辅助回归的可决系数:
~=b+bX +L +bX +e ~m+L +r~e t 011t k kt 1t -1p e t -p +et
给定a,查临界值ca2(p ) ,与LM 值比较,做出判断,实际检验中,可从1阶、2阶、…逐次向更高阶检验。
四、序列相关的补救
如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。
最常用的方法是广义最小二乘法(GLS: Generalized least squares)和广义差分法(GeneralizedDifference) 。
1、广义最小二乘法
对于模型
Y =X b+ m
如果存在序列相关,同时存在异方差,即有
és12ês21ê¢) =E (µ,¢) =Cov(µ,µµ
êL êêësn 1
s12
2s2L sn 2
L s1n ù
ú
L s2n ú2
=sΩ
L L ú
2úL sn úû
W是一对称正定矩阵,存在一可逆矩阵D ,使得
W=DD’
变换原模型:
D -1Y =D -1X b+D -1m
即Y *=X *b+m*(*)
该模型具有同方差性和随机误差项互相独立性:
¢D ) =D E (µ¢) D E (µµµ*µ*) =E (D µ-12-1¢=D sΩD =D -1s2D D ¢D ¢-1
¢
-1
-1
¢
-1-1
¢
=sI
2
(*)式的OLS 估计:
-1ˆ¢¢β*=(X *X *) X *Y *
-1
=(X ¢D D X ) X ¢D D -1Y
-1-1-1¢¢=(X ΩX ) X ΩY
¢
-1-1-1
¢
这就是原模型的广义最小二乘估计量(GLS estimators),
是无偏的、有效的估计量。
2、广义差分法
广义差分法是将原模型变换为满足OLS 法的差分模型,再进行OLS 估计。如果原模型
Y i =b0+b1X 1i +b2X 2i +L +bk X ki +mi
存在
mt =r1mt -1+r2mt -2+L +rl mt -l +et
可以将原模型变换为:
Y t -r1Y t -1-L -rl Y t -l =b0(1-r1-L -rl ) +b1(X 1t -r1X 1t -1-L -rl X 1t -l )
+L +bk (X kt -r1X kt -1-L -rl X kt -l ) +et
该模型为广义差分模型,不存在序列相关问题。可进行OLS 估计。
3、随机误差项相关系数的估计
应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数r1, r2, …, rL 。
实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。常用的估计方法有:
•科克伦-奥科特(Cochrane-Orcutt )迭代法。•杜宾(durbin )两步法
(1)科克伦-奥科特迭代法。
以一元线性模型为例:首先,采用OLS 法估计原模型
Y i =b0+b1X i +mi
得到的m的“近似估计值”,并以之作为观测值使用OLS 法估计下式
mi =r1mi-1+r2mi-2+¼rL mi-L +ei
$1, r$2, L , r$l ,作为随机误差项的相关系得到r
数r1, r2, L , rl 的第一次估计值。
ˆ1-L
-rˆl ) +b1(X i -rˆ1X i -1-L -rˆl X i -l ) +ei Y i -r1Y i -1-L -rl Y i -l =b0(1-r
i =1+l , 2+l , L , n
求出mi 新的“近拟估计值”,并以之作为样本
观测值,再次估计
mi =r1mi-1+r2mi-2+¼rL mi-L +e
i
类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次r1, r2, ¼, rL 的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。
(2)杜宾(durbin )两步法
该方法仍是先估计r1, r2, ¼, rl ,再对差分模型进行估计
第一步,变换差分模型为下列形式
ˆ1-L -rˆl ) +b1(X i -rˆ1X i -1-L -rˆl X i -l ) +ei Y i =r1Y i -1+L +rl Y i -l +b0(1-r
i =1+l , 2+l , L , n
进行OLS 估计,得各Y j (j =i -1, i -2, …,i -l ) 前的系数r1, r2, ¼, rl
的估计值
•应用软件中的广义差分法
在Eview /TSP 软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt )迭代法估计r 。在解释变量中引入AR (1)、AR (2)、…,即可得到参数和ρ1、ρ2、…的估计值。
其中AR (m ) 表示随机误差项的m 阶自回归。在估计过程中自动完成了ρ1、ρ2、…的迭代。
注意:
•如果能够找到一种方法,求得Ω或各序列相关系数r j 的估计量,使得GLS 能够实现,则称为可行的广义最小二乘法(FGLS, Feasible Generalized Least Squares)。
•FGLS 估计量,也称为可行的广义最小二乘估计量(feasible general least squares estimators)•可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦-奥科特迭代法下,估计量也具有渐近有效性。•前面提出的方法,就是FGLS
4、虚假序列相关问题
由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(false autocorrelation),应在模型设定中排除。
避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。
五、案例:中国商品进口模型
经济理论指出,商品进口主要由进口国的经济发展水平,以及商品进口价格指数与国内价格指数对比因素决定的。
由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。
表4.2.1 1978~2001年中国商品进口与国内生产总值
国内生产总值 商品进口
GDP M (亿元) 3624.1
4038.2 4517.8 4862.4 5294.7 5934.5 7171.0 8964.4 10202.2 11962.5 14928.3 16909.2
国内生产总值
GDP (亿元)
18547.9 21617.8 26638.1 34634.4 46759.4 58478.1 67884.6 74462.6 78345.2 82067.46 89442.2 95933.3
商品进口
M
(亿美元)
533.5 637.9 805.9 1039.6 1156.1 1320.8 1388.3 1423.7 1402.4 1657 2250.9 2436.1
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989
资料来源:《中国统计年鉴》(1995、2000、2002)。
1. 通过OLS 法建立如下中国商品进口方程:
ˆ=152. 91+0. 02GDP M t
t
(2.32)(20.12)
2. 进行序列相关性检验。
•DW 检验
取a=5%,由于n =24,k =2(包含常数项) ,查表得:
d l =1.27,
由于
2阶滞后:
d u =1.45
DW=0.628
~=6. 593-0. 0003GDP +1. 094e ~-0. 786e ~e t t t -1t -2(0.23)(-0.50)(6.23)(-3.69)
R 2=0.6614
•拉格朗日乘数检验
于是,LM=22´0.6614=14.55
取a=5%,c2分布的临界值c20.05(2)=5.991
LM > c20.05(2) 故: 存在正自相关
3阶滞后:
~~~~e t =6. 692-0. 0003GDP +1. 108e t -1-0. 819e t -2+0. 032e t -3
(0.22)(-0.497)
(4.541)(-1.842)(0.087)
R 2=0.6615
于是,LM=21´0.6614=13.89
取a=5%,c2分布的临界值c
20.05(3)=7.815
LM > c20.05(3)
表明: 存在正自相关;但ět-3的参数不显著,说明不存在3阶序列相关性。
3、运用广义差分法进行自相关的处理
(1)采用杜宾两步法估计r
第一步,估计模型
**M t =b0+r1M t -1+r2M t -2+b1*GDP t +b2GDP t -1+b3*GDP t -2+et ˆ=78. 09+0. 938M -0. 469M +0. 055GDP -0. 096GDP +0. 054GDP M t t -1t -2t t -1t -2(1.76)
(6.64) (-1.76) (5.88) (-5.19) (5.30)第二步,作差分变换:
M t *=M t -(0. 938M t -1-0. 469M t -2)
GDP t *=GDP t -(0. 938GDP t -1-0. 469GDP t -2)
则M *关于GDP *的OLS 估计结果为:
ˆ*=86. 18+0. 020GDP *M t t
(2.76)
(16.46)
取a=5%,DW>d u =1.43 (样本容量24-2=22) 表明:
已不存在自相关
ˆ=bˆ*/(1-rˆ1-rˆ2) =86.18 /(1-0.938+0.469) =162.30b00
于是原模型为:
ˆ=162. 30+0. 020GDP M t t
ˆ=152. 91+0. 02GDP M 与OLS 估计结果的差别只在截距项:t t
(2)采用科克伦-奥科特迭代法估计r在Eviews 软包下,2阶广义差分的结果为:ˆ=169. 32+0. 020GDP +1. 108AR [1]-0. 801AR [2]M t t
(3.81)
(18.45)(6.11)(-3.61)取a=5%,DW>d u =1.66(样本容量:22) 表明:广义差分模型已不存在序列相关性。
可以验证:仅采用1阶广义差分,变换后的模型仍存在1阶自相关性;
采用3阶广义差分,变换后的模型不再有自相关性,但AR[3]的系数的t 值不显著。
§4.2 序列相关性
一、序列相关性概念
对于模型
Y i =b0+b1X 1i +b2X 2i +…+bk X ki +mi i =1,2, …,n随机项互不相关的基本假设表现为
Cov(mi , mj )=0i ¹j , i , j =1,2, …,n
如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。
在其他假设仍成立的条件下,序列相关即意味着或E (mi mj ) ¹0æs2
(µ) =E (µµ¢) =çççM
èE (mn m1)
æs2L s1n ö
=çç÷
çM O M ÷
ès2÷
n 1L sø
=s2Ω¹s2I E (m1mn ) öM ÷÷s2÷øL Cov O L
如果仅存在
E(mi mi+1) ¹0i =1,2, …,n
称为一阶列相关,或自相关(autocorrelation )自相关往往可写成如下形式:
mi =rmi -1+ei -1
其中:r被称为自协方差系数(coefficient of autocovariance )或一阶自相关系数(first-order coefficient of autocorrelation )
ei 是满足以下标准的OLS 假定的随机干扰项: E (ei ) =0, var(ei ) =s, cov(ei , ei -s ) =0 s ¹0 2
由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t 代表i 。
二、实际经济问题中的序列相关性
1、经济变量固有的惯性
大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。
例如,绝对收入假设下居民总消费函数模型:
C t =b0+b1Y t +mt t=1,2,…,n
由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。
2、模型设定的偏误
所谓模型设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例如,本来应该估计的模型为
Y t =b0+b1X 1t + b2X 2t + b3X 3t + mt
但在模型设定中做了下述回归:
Y t =b0+b1X 1t + b1X 2t + vt
因此,v t =b3X 3t + mt ,如果X 3确实影响Y ,则出现序列相关。
又如:如果真实的边际成本回归模型应为:
Y t =b0+b1X t +b2X t 2+mt
其中:Y=边际成本,X=产出,
但建模时设立了如下模型:
Y t = b0+b1X t +vt
因此,由于v t = b2X t 2+mt, ,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。
3、数据的“编造”
在实际经济问题中,有些数据是通过已知数据生成的。
因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。
还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。
二、序列相关性的后果
计量经济学模型一旦出现序列相关性,如果仍采用OLS 法估计模型参数,会产生下列不良后果:
1、参数估计量非有效
因为,在有效性证明中利用了
E(NN ’)=s 2I
即同方差性和互相独立性条件。
而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。
2、变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差
项具有同方差性和互相独立性时才能成立。
其他检验也是如此。
3、模型的预测失效
区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。
所以,当模型出现序列相关性时,它的预测功能失效。
三、序列相关性的检验
基本思路:
序列相关性检验方法有多种,但基本思路相同:首先,采用OLS 法估计模型,以求得随机误差项的
~表示:“近似估计量”,用e i
~ˆe =Y -(Y i i i ) 0ls
然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。
1、图示法
2、回归检验法
~~以e t 为被解释变量,以各种可能的相关量,诸如以e t -1、
2~~e t -2、e t 等为解释变量,建立各种方程:
~=re ~+ee t t -1t
~~+r~e t =r1e t -12e t -2+et
……
如果存在某一种函数形式,使得方程显著成
立,则说明原模型存在序列相关性。
回归检验法的优点是:(1)能够确定序列相
关的形式,(2)适用于任何类型序列相关性问题的检验。
3、杜宾-瓦森(Durbin-Watson )检验法D-W 检验是杜宾(J.Durbin )和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是:
(1)解释变量X 非随机;
(2)随机误差项mi 为一阶自回归形式:
mi =rmi-1+ei
(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:
Y i =b0+b1X 1i +¼bk X ki +gY i-1+mi
(4)回归含有截距项
D.W 检验步骤:
(1)计算DW 值
(2)给定a ,由n 和k 的大小查DW 分布表,得临界值d L 和d U (3)比较、判断
若0
d L
d U
4-d U
4-d L
能无自相关能负
相确确关定定关
0 dL d U 2 4-dU 4-d L
4、拉格朗日乘数(Lagrange multiplier)检验拉格朗日乘数检验克服了DW 检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。
它是由布劳殊(Breusch )与戈弗雷(Godfrey )于1978年提出的,也被称为GB 检验。
对于模型
Y i =b0+b1X 1i +b2X 2i +L +bk X ki +mi
如果怀疑随机扰动项存在p 阶序列相关:
mt =r1mt -1+r2mt -2L +rp mt -p +et
GB 检验可用来检验如下受约束回归方程
Y t =b0+b1X 1t +L +bk X kt +r1mt -1+L +rp mt -p +et
约束条件为:
H 0: r1=r2=…=rp =0
约束条件H 0为真时,大样本下
22LM =(n -p ) R ~c(p )
其中,n 为样本容量,R 2为如下辅助回归的可决系数:
~=b+bX +L +bX +e ~m+L +r~e t 011t k kt 1t -1p e t -p +et
给定a,查临界值ca2(p ) ,与LM 值比较,做出判断,实际检验中,可从1阶、2阶、…逐次向更高阶检验。
四、序列相关的补救
如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。
最常用的方法是广义最小二乘法(GLS: Generalized least squares)和广义差分法(GeneralizedDifference) 。
1、广义最小二乘法
对于模型
Y =X b+ m
如果存在序列相关,同时存在异方差,即有
és12ês21ê¢) =E (µ,¢) =Cov(µ,µµ
êL êêësn 1
s12
2s2L sn 2
L s1n ù
ú
L s2n ú2
=sΩ
L L ú
2úL sn úû
W是一对称正定矩阵,存在一可逆矩阵D ,使得
W=DD’
变换原模型:
D -1Y =D -1X b+D -1m
即Y *=X *b+m*(*)
该模型具有同方差性和随机误差项互相独立性:
¢D ) =D E (µ¢) D E (µµµ*µ*) =E (D µ-12-1¢=D sΩD =D -1s2D D ¢D ¢-1
¢
-1
-1
¢
-1-1
¢
=sI
2
(*)式的OLS 估计:
-1ˆ¢¢β*=(X *X *) X *Y *
-1
=(X ¢D D X ) X ¢D D -1Y
-1-1-1¢¢=(X ΩX ) X ΩY
¢
-1-1-1
¢
这就是原模型的广义最小二乘估计量(GLS estimators),
是无偏的、有效的估计量。
2、广义差分法
广义差分法是将原模型变换为满足OLS 法的差分模型,再进行OLS 估计。如果原模型
Y i =b0+b1X 1i +b2X 2i +L +bk X ki +mi
存在
mt =r1mt -1+r2mt -2+L +rl mt -l +et
可以将原模型变换为:
Y t -r1Y t -1-L -rl Y t -l =b0(1-r1-L -rl ) +b1(X 1t -r1X 1t -1-L -rl X 1t -l )
+L +bk (X kt -r1X kt -1-L -rl X kt -l ) +et
该模型为广义差分模型,不存在序列相关问题。可进行OLS 估计。
3、随机误差项相关系数的估计
应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数r1, r2, …, rL 。
实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。常用的估计方法有:
•科克伦-奥科特(Cochrane-Orcutt )迭代法。•杜宾(durbin )两步法
(1)科克伦-奥科特迭代法。
以一元线性模型为例:首先,采用OLS 法估计原模型
Y i =b0+b1X i +mi
得到的m的“近似估计值”,并以之作为观测值使用OLS 法估计下式
mi =r1mi-1+r2mi-2+¼rL mi-L +ei
$1, r$2, L , r$l ,作为随机误差项的相关系得到r
数r1, r2, L , rl 的第一次估计值。
ˆ1-L
-rˆl ) +b1(X i -rˆ1X i -1-L -rˆl X i -l ) +ei Y i -r1Y i -1-L -rl Y i -l =b0(1-r
i =1+l , 2+l , L , n
求出mi 新的“近拟估计值”,并以之作为样本
观测值,再次估计
mi =r1mi-1+r2mi-2+¼rL mi-L +e
i
类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次r1, r2, ¼, rL 的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。
(2)杜宾(durbin )两步法
该方法仍是先估计r1, r2, ¼, rl ,再对差分模型进行估计
第一步,变换差分模型为下列形式
ˆ1-L -rˆl ) +b1(X i -rˆ1X i -1-L -rˆl X i -l ) +ei Y i =r1Y i -1+L +rl Y i -l +b0(1-r
i =1+l , 2+l , L , n
进行OLS 估计,得各Y j (j =i -1, i -2, …,i -l ) 前的系数r1, r2, ¼, rl
的估计值
•应用软件中的广义差分法
在Eview /TSP 软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt )迭代法估计r 。在解释变量中引入AR (1)、AR (2)、…,即可得到参数和ρ1、ρ2、…的估计值。
其中AR (m ) 表示随机误差项的m 阶自回归。在估计过程中自动完成了ρ1、ρ2、…的迭代。
注意:
•如果能够找到一种方法,求得Ω或各序列相关系数r j 的估计量,使得GLS 能够实现,则称为可行的广义最小二乘法(FGLS, Feasible Generalized Least Squares)。
•FGLS 估计量,也称为可行的广义最小二乘估计量(feasible general least squares estimators)•可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦-奥科特迭代法下,估计量也具有渐近有效性。•前面提出的方法,就是FGLS
4、虚假序列相关问题
由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(false autocorrelation),应在模型设定中排除。
避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。
五、案例:中国商品进口模型
经济理论指出,商品进口主要由进口国的经济发展水平,以及商品进口价格指数与国内价格指数对比因素决定的。
由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。
表4.2.1 1978~2001年中国商品进口与国内生产总值
国内生产总值 商品进口
GDP M (亿元) 3624.1
4038.2 4517.8 4862.4 5294.7 5934.5 7171.0 8964.4 10202.2 11962.5 14928.3 16909.2
国内生产总值
GDP (亿元)
18547.9 21617.8 26638.1 34634.4 46759.4 58478.1 67884.6 74462.6 78345.2 82067.46 89442.2 95933.3
商品进口
M
(亿美元)
533.5 637.9 805.9 1039.6 1156.1 1320.8 1388.3 1423.7 1402.4 1657 2250.9 2436.1
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989
资料来源:《中国统计年鉴》(1995、2000、2002)。
1. 通过OLS 法建立如下中国商品进口方程:
ˆ=152. 91+0. 02GDP M t
t
(2.32)(20.12)
2. 进行序列相关性检验。
•DW 检验
取a=5%,由于n =24,k =2(包含常数项) ,查表得:
d l =1.27,
由于
2阶滞后:
d u =1.45
DW=0.628
~=6. 593-0. 0003GDP +1. 094e ~-0. 786e ~e t t t -1t -2(0.23)(-0.50)(6.23)(-3.69)
R 2=0.6614
•拉格朗日乘数检验
于是,LM=22´0.6614=14.55
取a=5%,c2分布的临界值c20.05(2)=5.991
LM > c20.05(2) 故: 存在正自相关
3阶滞后:
~~~~e t =6. 692-0. 0003GDP +1. 108e t -1-0. 819e t -2+0. 032e t -3
(0.22)(-0.497)
(4.541)(-1.842)(0.087)
R 2=0.6615
于是,LM=21´0.6614=13.89
取a=5%,c2分布的临界值c
20.05(3)=7.815
LM > c20.05(3)
表明: 存在正自相关;但ět-3的参数不显著,说明不存在3阶序列相关性。
3、运用广义差分法进行自相关的处理
(1)采用杜宾两步法估计r
第一步,估计模型
**M t =b0+r1M t -1+r2M t -2+b1*GDP t +b2GDP t -1+b3*GDP t -2+et ˆ=78. 09+0. 938M -0. 469M +0. 055GDP -0. 096GDP +0. 054GDP M t t -1t -2t t -1t -2(1.76)
(6.64) (-1.76) (5.88) (-5.19) (5.30)第二步,作差分变换:
M t *=M t -(0. 938M t -1-0. 469M t -2)
GDP t *=GDP t -(0. 938GDP t -1-0. 469GDP t -2)
则M *关于GDP *的OLS 估计结果为:
ˆ*=86. 18+0. 020GDP *M t t
(2.76)
(16.46)
取a=5%,DW>d u =1.43 (样本容量24-2=22) 表明:
已不存在自相关
ˆ=bˆ*/(1-rˆ1-rˆ2) =86.18 /(1-0.938+0.469) =162.30b00
于是原模型为:
ˆ=162. 30+0. 020GDP M t t
ˆ=152. 91+0. 02GDP M 与OLS 估计结果的差别只在截距项:t t
(2)采用科克伦-奥科特迭代法估计r在Eviews 软包下,2阶广义差分的结果为:ˆ=169. 32+0. 020GDP +1. 108AR [1]-0. 801AR [2]M t t
(3.81)
(18.45)(6.11)(-3.61)取a=5%,DW>d u =1.66(样本容量:22) 表明:广义差分模型已不存在序列相关性。
可以验证:仅采用1阶广义差分,变换后的模型仍存在1阶自相关性;
采用3阶广义差分,变换后的模型不再有自相关性,但AR[3]的系数的t 值不显著。