时间序列回归
§13.1序列相关理论 本章讨论含有ARMA 项的单方程回归方法,这种方法对于分析时间序列数据(检验序列相关性,估计ARMA 模型,使用分布多重滞后,非平稳时间序列的单位根检验)是很重要的。
时间序列回归中的一个普遍现象是:残差和它自己的滞后值有关。这种相关性违背了回归理论的标准假设:干扰项互不相关。与序列相关相联系的主要问题有:
一、一阶自回归模型
最简单且最常用的序列相关模型是一阶自回归AR(1)模型
定义如下:y t =x t 'β+u t
u t =ρu t -1+εt
参数ρ是一阶序列相关系数,实际上,AR(1)模型是将以前观测值的残差包含到现观测值的回归模型中。
二、高阶自回归模型:
更为一般,带有p 阶自回归的回归,AR(p)误差由下式给出:
y t =x t 'β+u t
u t =ρ1u t -1+ρ2u t -2+ +ρp u t -p +εt
AR(p)的自回归将渐渐衰减至零,同时高于p 阶的偏自相关也是零。
§13.2 检验序列相关
在使用估计方程进行统计推断(如假设检验和预测)之前,一般应检验残差(序列相关的证据),Eviews 提供了几种方法来检验当前序列相关。
1.Dubin-Waston 统计量 D-W 统计量用于检验一阶序列相关。
2.相关图和Q-统计量 计算相关图和Q-统计量的细节见第七章
3.序列相关LM 检验 检验的原假设是:至给定阶数,残差不具有序列相关。
§13.3 估计含AR 项的模型
随机误差项存在序列相关说明模型定义存在严重问题。特别的,应注意使用OLS 得出的过分限制的定义。有时,在回归方程中添加不应被排除的变量会消除序列相关。
1.一阶序列相关
在EViews 中估计一AR(1)模型,选择Quick/Estimate Equation打开一个方程,用列表法输入方程后,最后将AR(1)项加到列表中。例如:估计一个带有AR(1)误差的简单消费函数
CS t =c 1+c 2GDP t +u t
u t =ρu t -1+εt
应定义方程为: cs c gdp ar(1)
2.高阶序列相关
估计高阶AR 模型稍稍复杂些,为估计AR(k ) ,应输入模型的定义和所包括的各阶AR 值。如果想估计一个有1-5阶自回归的模型
CS t =c 1+c 2GDP t +u t
u t =ρ1u t -1+ +ρ5u t -5+εt
应输入: cs c gdp ar(1) ar(2) ar(3) ar(4) ar(5)
3.存在序列相关的非线性模型
EViews 可以估计带有AR 误差项的非线性回归模型。例如:
估计如下的带有附加AR(2)误差的非线性方程
c 2CS t =c 1+GDP +u t t
u t =c 3u t -1+c 4u t -2+εt
使用EViews 表达式定义模型,在后面的方括号内描述AR 修正项,对每一阶AR 滞后项都应包括一个系数,每项之间用逗号隔开。
cs=c(1)+gdpc(2)+[ar(1)=c(3),ar(2)=c(4)]
EViews 通过ρ差分来转换这种非线性模型且使用Gauss-Newton 迭代法来估计转换后的非线性模型。
4.存在序列相关的两阶段回归模型
通过把二阶段最小二乘法或二阶段非线性最小二乘法和AR 项结合起来,对于在回归因子和扰动项存在相关性的情况和残差存在序列相关一样估计模型。
5.AR 估计输出 ∧
ˆt =y t -x t 'b , 含有AR 项的模型有两种残差:第一种是无条件残差 u
通过原始变量以及估计参数β算出。在用同期信息对y t 值进行预测时,这些残差是可以观测出的误差,但要忽略滞后残差中包含的信息。
通常,除非有特别的原因来检验这些残差,Eviews 不能自动计算下面的估计。
ˆ。如名所示,这种残差代表预测误差。 第二种残差是估计的一期向前预测误差ε
一般AR(p ) 平稳条件是:滞后算子多项式的根的倒数在单位圆内。EViews 在回归输出的底部给出这些根:Inverted AR Roots。如果存在虚根,根的模应该小于1。
6.EViews 如何估计AR 模型
EViews 估计AR 模型采用非线性回归方法。这种方法的优点在于:易被理解,应用广泛,易被扩展为非线性定义的模型。注意:非线性最小二乘估计渐进等于极大似然估计且渐进有效。
§13.4 ARIMA 理论
ARIMA (自回归单整动平均)模型是AR 模型的一般化,EViews 使用三种工具来为干扰项的序列相关建模:自回归AR 、单整I 、动平均MA 。
§13.5 估计ARIMA 模型
为建立ARIMA 模型,需要:① 差分因变量,确定差分阶数;② 描述结构回归模型(因变量和回归因子),加入AR 或MA 项。
一、ARMA 项 模型中AR 和MA 部分应使用关键词ar 和ma 定义。
二、季节ARMA 项 对于带有季节移动的季度数据,Box and Jenkins(1976)建议使用季节自回归SAR 和季节动平均SMA 。
三、ARIMA 估计输出 存在AR 或MA 定义的估计输出和OLS 是一样的,只是增加了一个AR ,MA 多项式的倒根的下部程序块。
四、ARMA 估计选择 带有AR 或MA 的模型用非线性最小二乘法估计。非线性估计方法对所有系数估计都要求初值。作为缺省Eviews 决定初值。用户可设置初值,EViews 使用C 系数向量。也可使用命令安排C 向量值定义,例如下面方程的系数
Y c X ma(2) ma(1) sma(4) ar(1)
可定义为 param c(1) 50 c(2 ) 0.8 c(3) 0.2 c(4) 0.6 c(5) 0.1 c(6) 0.5
初值:常数是50, X 系数的初值是0.8, ar(1)、ma(2)、ma(1)、sma(4) 系数的初值分别是0.2 , 0.6,0.1,0.5。
§13.6 诊断检验
如果ARMA 模型定义正确,模型残差将为白噪声。这意味着残差中应不存在序列相关。D-W 统计量是当方程右边没有滞后变量时对一阶序列相关的检验。如上所述,对残差中序列相关更多的检验可以如:
View/Residual Tests/Correlogram-Q-Statistic和View/Residual Tests/Serial correlation LM Test。
§13.7 多项分布滞后(PDLs )
一个分布滞后算子如下
y t =ωt δ+β0x t +β1x t -1+ +βk x t -k +εt (13.37)
系数β描述x 对y 作用的滞后。在模型中解释变量与随机误差项不相关的情况下,可以直接使用OLS 估计参数。在其它情形下,x 的当前和滞后值具有高共线性时,直接估计失败。
可以使用多项式分布滞后(PDLS )来减少要估计的参数个数,以此来平滑滞后系数。平滑就是要求系数服从一个相对低阶的多项式。P 阶PDLS 模型限制β系数服从如下形式的p 阶多项式
βj =γ1+γ2(j -) +γ3(j -) 2+ +γp +1(j -) p j = 0 , 1 , 2 , … , k (13.38)
是事先定义常数:
(⎧(k -1) /2=⎨⎩(k ) /2p 是奇数p 是偶数
PDLS 有时被称为Almon 分布滞后模型。常数仅用来避免共线性引起的数值问题,不影响β的估计。这种定义允许仅使用参数p 来估计一个x 的k 阶滞后的模型(如果p > k,将显示“近似奇异“错误信息)。
如果定义一个PDL 模型,EViews 用(13.38)式代入到(13.37)式,将产生如下形式方程
y t =α+γ1z t +γ2z 2+ +γp +1z p +1+εt (13.40)
其中
z 1=x t +x t -1+ +x t -k
z 2=-x t +(1-) x t -1+ +(k -) x t -k
z p +1=(-) p x t +(1-) p x t -1+ +(k -) p x t -k
一旦从(13.40)式估计γ,利用(13.38)式就可得到β的各系数。这一过程很明了,因为β是γ的线性变换。定义一个PDLs 有三个元素:滞后长度k ,多项式阶数(多项式最高次幂数)p 和附加的约束。 (13.41)
§13.8 非平稳时间序列
上述ARMA 估计理论都是基于平稳时间序列。如果一个序列的均值和自协方差不依赖于时间,就说它是平稳的。非平稳序列的典型例子是随机游动 y t =y t -1+εt ,εt 是平稳随机扰动项。序列y 有一个常数预测值,方差随时间增长。随机游动是差分平稳序列,因为y 一阶差分后平稳。y t -y t -1=(1-L ) y t =εt ,差分平稳序列称为单整,记为I(d),d 为单整阶数。单整阶数是序列中单位根数,或者是使序列平稳而差分的阶数。对于上面的随机游动,有一个单位根,所以是I(1),同样,平稳序列是I(0)。
§13.9 单位根检验
EViews 提供两种单位根检验:Dickey-Fuller(DF)、增广DF(ADF)检验和Phillips-Perron (PP )检验。
一、ADF 检验
为说明ADF 检验的使用,先考虑一个AR(1)过程
y t =μ+ρy t -1+εt (13.46)
μ, ρ是参数,εt 假设为白噪声。如果-1
从方程两边同时减去y t -1
∆y t =μ+γy t -1+εt
其中 γ=ρ-1 (13.47)
所以原假设和备选假设可改为⎨⎧H 0:γ=0 (13.48) H :γ
单位根检验可以看作对γ进行t 检验。EViews 将DF ,ADF 检验都看成为ADF 检验。ADF 检验考虑如下三种回归形式:
∆y t =γy t -1+∑βi ∆y t -i +εt
i =1p
∆y t =μ+γy t -1+∑βi ∆y t -i +εt
i =1p
∆y t =a 0+γy t -1+a 2t +
趋势,或二者都不包含。 ∑β∆y i i =1p t -i +εt 即通过在模型中增加∆y t 的滞后项,以消除残差的序列相关性。在检验回归中包括常数,常数和线性
二、Phillips-Perron(PP)检验
Phillips 和Perron (1988)提出一种非参数方法来控制序列中高阶序列相关。对AR(1)的PP 检验为:
∆y t =α+βy t -1+εt (13.51)
ADF 检验通过在方程右边添加滞后差分项来修正高阶序列相关。PP 检验γ参数的t 统计量来修正AR(1)的ε序列相关。这种修正方法是非参数的,因为我们使用ε在零频率的谱估计。零频率对未知形式的异方差性和自相关性较稳健。EViews 使用Newey-West 异方差自相关一致估计
ˆ=γ0+2∑(1-ω2
j =1q ) γj (13.52) q +1υ
1T ˆt εˆt -j (13.53) γj =∑εT t =j +1
q 是截断滞后值。PP 统计量由下式计算:
t pp ˆ2-γ0) Ts b γ0t b (ω (13.54) =-ˆˆs ω2ω
t b 是t 统计量;s b 是β的标准差;s 是检验回归标准差。PP 统计量渐进分布同ADF 的t 统计量一样。EViews 显示Mackinnon 临界值。对PP 检验,必须为Newey-West 纠正定义截断滞后因子q ,即要包括的序列相关期数。对话框开始包括N-W 自动截断滞后选择(floor 函数返回的是不超过括号中数的最大整数)
q =floor (4(T /100) )
这仅基于检验回归中使用的观测值数,也可定义为任何整数。
§13.10 命 令
命令equation eq_gdp.ls gdp c ar(1) ar (2) ma(1) ma(2)用来用一个arma(2,2)模型拟和序列GDP 并把结果储存在方程 EQ_GDP中。
命令 eq1.auto(4) 用来检验方程EQ! 残差序列直到四阶的相关系数。
命令eq1.correlogram(12)用来显示方程直到12阶的残差相关图。
命令equation eq2.ls gdp c pdl(m1,12,3) 使用一个三次多项式拟和m1直到十二阶的值。
命令gdp.ruoot(4, c)用来运行一个带常数和四阶滞后的ADF 检验。
时间序列回归
§13.1序列相关理论 本章讨论含有ARMA 项的单方程回归方法,这种方法对于分析时间序列数据(检验序列相关性,估计ARMA 模型,使用分布多重滞后,非平稳时间序列的单位根检验)是很重要的。
时间序列回归中的一个普遍现象是:残差和它自己的滞后值有关。这种相关性违背了回归理论的标准假设:干扰项互不相关。与序列相关相联系的主要问题有:
一、一阶自回归模型
最简单且最常用的序列相关模型是一阶自回归AR(1)模型
定义如下:y t =x t 'β+u t
u t =ρu t -1+εt
参数ρ是一阶序列相关系数,实际上,AR(1)模型是将以前观测值的残差包含到现观测值的回归模型中。
二、高阶自回归模型:
更为一般,带有p 阶自回归的回归,AR(p)误差由下式给出:
y t =x t 'β+u t
u t =ρ1u t -1+ρ2u t -2+ +ρp u t -p +εt
AR(p)的自回归将渐渐衰减至零,同时高于p 阶的偏自相关也是零。
§13.2 检验序列相关
在使用估计方程进行统计推断(如假设检验和预测)之前,一般应检验残差(序列相关的证据),Eviews 提供了几种方法来检验当前序列相关。
1.Dubin-Waston 统计量 D-W 统计量用于检验一阶序列相关。
2.相关图和Q-统计量 计算相关图和Q-统计量的细节见第七章
3.序列相关LM 检验 检验的原假设是:至给定阶数,残差不具有序列相关。
§13.3 估计含AR 项的模型
随机误差项存在序列相关说明模型定义存在严重问题。特别的,应注意使用OLS 得出的过分限制的定义。有时,在回归方程中添加不应被排除的变量会消除序列相关。
1.一阶序列相关
在EViews 中估计一AR(1)模型,选择Quick/Estimate Equation打开一个方程,用列表法输入方程后,最后将AR(1)项加到列表中。例如:估计一个带有AR(1)误差的简单消费函数
CS t =c 1+c 2GDP t +u t
u t =ρu t -1+εt
应定义方程为: cs c gdp ar(1)
2.高阶序列相关
估计高阶AR 模型稍稍复杂些,为估计AR(k ) ,应输入模型的定义和所包括的各阶AR 值。如果想估计一个有1-5阶自回归的模型
CS t =c 1+c 2GDP t +u t
u t =ρ1u t -1+ +ρ5u t -5+εt
应输入: cs c gdp ar(1) ar(2) ar(3) ar(4) ar(5)
3.存在序列相关的非线性模型
EViews 可以估计带有AR 误差项的非线性回归模型。例如:
估计如下的带有附加AR(2)误差的非线性方程
c 2CS t =c 1+GDP +u t t
u t =c 3u t -1+c 4u t -2+εt
使用EViews 表达式定义模型,在后面的方括号内描述AR 修正项,对每一阶AR 滞后项都应包括一个系数,每项之间用逗号隔开。
cs=c(1)+gdpc(2)+[ar(1)=c(3),ar(2)=c(4)]
EViews 通过ρ差分来转换这种非线性模型且使用Gauss-Newton 迭代法来估计转换后的非线性模型。
4.存在序列相关的两阶段回归模型
通过把二阶段最小二乘法或二阶段非线性最小二乘法和AR 项结合起来,对于在回归因子和扰动项存在相关性的情况和残差存在序列相关一样估计模型。
5.AR 估计输出 ∧
ˆt =y t -x t 'b , 含有AR 项的模型有两种残差:第一种是无条件残差 u
通过原始变量以及估计参数β算出。在用同期信息对y t 值进行预测时,这些残差是可以观测出的误差,但要忽略滞后残差中包含的信息。
通常,除非有特别的原因来检验这些残差,Eviews 不能自动计算下面的估计。
ˆ。如名所示,这种残差代表预测误差。 第二种残差是估计的一期向前预测误差ε
一般AR(p ) 平稳条件是:滞后算子多项式的根的倒数在单位圆内。EViews 在回归输出的底部给出这些根:Inverted AR Roots。如果存在虚根,根的模应该小于1。
6.EViews 如何估计AR 模型
EViews 估计AR 模型采用非线性回归方法。这种方法的优点在于:易被理解,应用广泛,易被扩展为非线性定义的模型。注意:非线性最小二乘估计渐进等于极大似然估计且渐进有效。
§13.4 ARIMA 理论
ARIMA (自回归单整动平均)模型是AR 模型的一般化,EViews 使用三种工具来为干扰项的序列相关建模:自回归AR 、单整I 、动平均MA 。
§13.5 估计ARIMA 模型
为建立ARIMA 模型,需要:① 差分因变量,确定差分阶数;② 描述结构回归模型(因变量和回归因子),加入AR 或MA 项。
一、ARMA 项 模型中AR 和MA 部分应使用关键词ar 和ma 定义。
二、季节ARMA 项 对于带有季节移动的季度数据,Box and Jenkins(1976)建议使用季节自回归SAR 和季节动平均SMA 。
三、ARIMA 估计输出 存在AR 或MA 定义的估计输出和OLS 是一样的,只是增加了一个AR ,MA 多项式的倒根的下部程序块。
四、ARMA 估计选择 带有AR 或MA 的模型用非线性最小二乘法估计。非线性估计方法对所有系数估计都要求初值。作为缺省Eviews 决定初值。用户可设置初值,EViews 使用C 系数向量。也可使用命令安排C 向量值定义,例如下面方程的系数
Y c X ma(2) ma(1) sma(4) ar(1)
可定义为 param c(1) 50 c(2 ) 0.8 c(3) 0.2 c(4) 0.6 c(5) 0.1 c(6) 0.5
初值:常数是50, X 系数的初值是0.8, ar(1)、ma(2)、ma(1)、sma(4) 系数的初值分别是0.2 , 0.6,0.1,0.5。
§13.6 诊断检验
如果ARMA 模型定义正确,模型残差将为白噪声。这意味着残差中应不存在序列相关。D-W 统计量是当方程右边没有滞后变量时对一阶序列相关的检验。如上所述,对残差中序列相关更多的检验可以如:
View/Residual Tests/Correlogram-Q-Statistic和View/Residual Tests/Serial correlation LM Test。
§13.7 多项分布滞后(PDLs )
一个分布滞后算子如下
y t =ωt δ+β0x t +β1x t -1+ +βk x t -k +εt (13.37)
系数β描述x 对y 作用的滞后。在模型中解释变量与随机误差项不相关的情况下,可以直接使用OLS 估计参数。在其它情形下,x 的当前和滞后值具有高共线性时,直接估计失败。
可以使用多项式分布滞后(PDLS )来减少要估计的参数个数,以此来平滑滞后系数。平滑就是要求系数服从一个相对低阶的多项式。P 阶PDLS 模型限制β系数服从如下形式的p 阶多项式
βj =γ1+γ2(j -) +γ3(j -) 2+ +γp +1(j -) p j = 0 , 1 , 2 , … , k (13.38)
是事先定义常数:
(⎧(k -1) /2=⎨⎩(k ) /2p 是奇数p 是偶数
PDLS 有时被称为Almon 分布滞后模型。常数仅用来避免共线性引起的数值问题,不影响β的估计。这种定义允许仅使用参数p 来估计一个x 的k 阶滞后的模型(如果p > k,将显示“近似奇异“错误信息)。
如果定义一个PDL 模型,EViews 用(13.38)式代入到(13.37)式,将产生如下形式方程
y t =α+γ1z t +γ2z 2+ +γp +1z p +1+εt (13.40)
其中
z 1=x t +x t -1+ +x t -k
z 2=-x t +(1-) x t -1+ +(k -) x t -k
z p +1=(-) p x t +(1-) p x t -1+ +(k -) p x t -k
一旦从(13.40)式估计γ,利用(13.38)式就可得到β的各系数。这一过程很明了,因为β是γ的线性变换。定义一个PDLs 有三个元素:滞后长度k ,多项式阶数(多项式最高次幂数)p 和附加的约束。 (13.41)
§13.8 非平稳时间序列
上述ARMA 估计理论都是基于平稳时间序列。如果一个序列的均值和自协方差不依赖于时间,就说它是平稳的。非平稳序列的典型例子是随机游动 y t =y t -1+εt ,εt 是平稳随机扰动项。序列y 有一个常数预测值,方差随时间增长。随机游动是差分平稳序列,因为y 一阶差分后平稳。y t -y t -1=(1-L ) y t =εt ,差分平稳序列称为单整,记为I(d),d 为单整阶数。单整阶数是序列中单位根数,或者是使序列平稳而差分的阶数。对于上面的随机游动,有一个单位根,所以是I(1),同样,平稳序列是I(0)。
§13.9 单位根检验
EViews 提供两种单位根检验:Dickey-Fuller(DF)、增广DF(ADF)检验和Phillips-Perron (PP )检验。
一、ADF 检验
为说明ADF 检验的使用,先考虑一个AR(1)过程
y t =μ+ρy t -1+εt (13.46)
μ, ρ是参数,εt 假设为白噪声。如果-1
从方程两边同时减去y t -1
∆y t =μ+γy t -1+εt
其中 γ=ρ-1 (13.47)
所以原假设和备选假设可改为⎨⎧H 0:γ=0 (13.48) H :γ
单位根检验可以看作对γ进行t 检验。EViews 将DF ,ADF 检验都看成为ADF 检验。ADF 检验考虑如下三种回归形式:
∆y t =γy t -1+∑βi ∆y t -i +εt
i =1p
∆y t =μ+γy t -1+∑βi ∆y t -i +εt
i =1p
∆y t =a 0+γy t -1+a 2t +
趋势,或二者都不包含。 ∑β∆y i i =1p t -i +εt 即通过在模型中增加∆y t 的滞后项,以消除残差的序列相关性。在检验回归中包括常数,常数和线性
二、Phillips-Perron(PP)检验
Phillips 和Perron (1988)提出一种非参数方法来控制序列中高阶序列相关。对AR(1)的PP 检验为:
∆y t =α+βy t -1+εt (13.51)
ADF 检验通过在方程右边添加滞后差分项来修正高阶序列相关。PP 检验γ参数的t 统计量来修正AR(1)的ε序列相关。这种修正方法是非参数的,因为我们使用ε在零频率的谱估计。零频率对未知形式的异方差性和自相关性较稳健。EViews 使用Newey-West 异方差自相关一致估计
ˆ=γ0+2∑(1-ω2
j =1q ) γj (13.52) q +1υ
1T ˆt εˆt -j (13.53) γj =∑εT t =j +1
q 是截断滞后值。PP 统计量由下式计算:
t pp ˆ2-γ0) Ts b γ0t b (ω (13.54) =-ˆˆs ω2ω
t b 是t 统计量;s b 是β的标准差;s 是检验回归标准差。PP 统计量渐进分布同ADF 的t 统计量一样。EViews 显示Mackinnon 临界值。对PP 检验,必须为Newey-West 纠正定义截断滞后因子q ,即要包括的序列相关期数。对话框开始包括N-W 自动截断滞后选择(floor 函数返回的是不超过括号中数的最大整数)
q =floor (4(T /100) )
这仅基于检验回归中使用的观测值数,也可定义为任何整数。
§13.10 命 令
命令equation eq_gdp.ls gdp c ar(1) ar (2) ma(1) ma(2)用来用一个arma(2,2)模型拟和序列GDP 并把结果储存在方程 EQ_GDP中。
命令 eq1.auto(4) 用来检验方程EQ! 残差序列直到四阶的相关系数。
命令eq1.correlogram(12)用来显示方程直到12阶的残差相关图。
命令equation eq2.ls gdp c pdl(m1,12,3) 使用一个三次多项式拟和m1直到十二阶的值。
命令gdp.ruoot(4, c)用来运行一个带常数和四阶滞后的ADF 检验。