面板数据模型与应用 张晓彤

面板数据模型与应用

张晓峒

中国数量经济学会常务理事,学术委员会委员

南开大学数量经济学专业博士生导师 [email protected][email protected]

最近新书:

1.Badi H. Baltagi, Econometric Analysis of Panel Data, John Wiley & Sons, 2005. 2.Jeffrey M. Wooldridge, Econometric Analysis of Cross Section and Panel Data, 3.Cheng Hsiao, Analysis of Panel Data, Cambridge University Press, 2003.

4.Manuel Arellano, Panel Data Econometrics (Advanced Texts in Econometrics), 2003. 5. Edward W. Frees, Longitudinal and Panel Data: Analysis and Applications in the Social Sciences, 2004.

6.谢识予 朱宏鑫 编著,高级计量经济学,2005-5 7.童光荣,计量经济学,武汉大学出版社2006-3 学术会议:

1. 13th International Conference on Panel Data , Faculty of Economics, & Robinson College, University of Cambridge, Cambridge, UK, 7-9 July 2006

1.面板数据定义

panel data的中译:面板数据、桌面数据、平行数据、纵列数据、时间序列截面数据、混合数据(pool data)、固定调查对象数据。

面板数据定义

(1)面板数据定义为相同截面上的个体在不同时点的重复观测数据。 (2)称为纵向变量序列(个体)的多次测量。

面板数据从横截面(cross section )看,是由若干个体(entity, unit, individual )在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。

图1

面板数据用双下标变量表示。例如

y i t, i = 1, 2, …, N ; t = 1, 2, …, T

i 对应面板数据中不同个体。N 表示面板数据中含有N 个个体。t 对应面板数据中不同时点。T 表示时间序列的最大长度。若固定t 不变,y i ., ( i = 1, 2, …, N ) 是横截面上的N 个随机变量;若固定i 不变,y . t, (t = 1, 2, …, T ) 是纵剖面上的

一个时间序列(个体)。

这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。

案例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP )和人均收入(IP )数据见file:panel02。数据是7年的,每一年都有15个数据,共105组观测值。

人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。

图2 15个省级地区的人均消费序列(纵剖面) 图3 15个省级地区的人均收入序列(file:5panel02)

[***********][1**********]00

2

46

8

10

12

14

[***********][1**********]00

2

46

8

10

12

14

图4 7个时点人均消费横截面数据(含15个地区) 图5 7个时点人均收入横截面数据(含15个地区) (每条连线数据表示同一年度15个地区的消费值) (每条连线数据表示同一年度15个地区的收入值)

用CP 表示消费,IP 表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、

图6 人均消费对收入的面板数据散点图(15个时间序列叠加)

12000

C P1996C P1997C P1998C P1999C P2000C P2001C P2002

10000

8000

6000

4000

IP(1996-2002)

图7 人均消费对收入的面板数据散点图(7个截面叠加)

2000

2000

[***********]200014000

图8 北京和内蒙古1996-2002年消费对收入散点图 图9 1996和2002年15个地区的消费对收入散点图

2.面板数据模型分类

用面板数据建立的模型通常有3种,即混合回归模型、固定效应回归模型和随机效应回归模型。

2.1 混合回归模型(Pooled model)。 如果一个面板数据模型定义为,

y it = α + X it ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (1) 其中y it 为被回归变量(标量),α表示截距项,X it 为k ⨯1阶回归变量列向量(包括k 个回归量),β为k ⨯1阶回归系数列向量,εit 为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数α和β都相同。

如果模型是正确设定的,解释变量与误差项不相关,即Cov(X it , εit ) = 0。那么无论是N →∞,还是T →∞,模型参数的混合最小二乘估计量(Pooled OLS)都是一致估计量。

2.2 固定效应回归模型(fixed effects regression model)。

固定效应模型分为3种类型,即个体固定效应回归模型、时点固定效应回归模型和个体时点双固定效应回归模型。下面分别介绍。

2.2.1个体固定效应回归模型(entity fixed effects regression model) 如果一个面板数据模型定义为,

y it = αi + X it ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (3) 其中αi 是随机变量,表示对于i 个个体有i 个不同的截距项,且其变化与X it 有关系;y it 为被回归变量(标量),εit 为误差项(标量),X it 为k ⨯1阶回归变量列向量(包括k 个回归量),β为k ⨯1阶回归系数列向量,对于不同个体回归系数相同,则称此模型为个体固定效应回归模型。

αi 作为随机变量描述不同个体建立的模型间的差异。因为αi 是不可观测

的,且与可观测的解释变量X it 的变化相联系,所以称(3)式为个体固定效应回归模型。

个体固定效应回归模型也可以表示为

y it = α1 + α2 D 2 + … +αN D N + Xit ' β +εit , t = 1, 2, …, T (4) 其中

⎧1, D i =⎨0,

如果属于第i 个个体,i =2, ..., N , 其他,

设定个体固定效应回归模型的原因如下。假定有面板数据模型

y it = β0 + β1 xit +β2 zi +εit , i = 1, 2, …, N ; t = 1, 2, …, T (5) 其中β0为常数,不随时间、截面变化;z i 表示随个体变化,但不随时间变化的难以观测的变量。上述模型可以被解释为含有N 个截距,即每个个体都对应一个不同截距的模型。令

αi = β0 +β2 zi ,于是(5)式变为

y it = αi + β1 xit +εit , i = 1, 2, …, N ; t = 1, 2, …, T (6) 这正是个体固定效应回归模型形式。对于每个个体回归函数的斜率相同(都是β1),截距

αi 却因个体不同而变化。可见个体固定效应回归模型中的截距项αi 中包括了那些随个体变化,但不随时间变化的难以观测的变量的影响。αi 是一个随机变量。

以案例1为例,省家庭平均人口数就是这样的一个变量。对于短期面板来说,这是一个基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。

以案例1为例(file:panel02)得到的个体固定效应模型估计结果如下:

注意:个体固定效应模型的EViwes 输出结果中没有公共截距项。

图10 个体固定效应回归模型的估计结果

2.2.2 时点固定效应回归模型(time fixed effects regression model) 如果一个面板数据模型定义为,

y it = γt + X it ' β +εit , i = 1, 2, …, N (7) 其中γt 是模型截距项,随机变量,表示对于T 个截面有T 个不同的截距项,且其变化与X it 有关系;y it 为被回归变量(标量),εit 为误差项(标量),满足通常假定条件。X it 为k ⨯1阶回归变量列向量(包括k 个回归变量),β为k ⨯1阶回归系数列向量,则称此模型为时点固定效应回归模型。

时点固定效应回归模型也可以加入虚拟变量表示为

y it = γ1 + γ2 W 2 + … +γ T W T + Xit ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (8) 其中

⎧1, 如果属于第t 个截面,t =2,..., T ; W t =⎨

0, 其他(不属于第t 个截面) 。 ⎩

设定时点固定效应回归模型的原因。假定有面板数据模型

y it = β0 + β1 xit +β2 zt +εit , i = 1, 2, …, N ; t = 1, 2, …, T (9) 其中β0为常数,不随时间、截面变化;z t 表示随不同截面(时点)变化,但不随个体变化的难以观测的变量。上述模型可以被解释为含有T 个截距,即每个截面都对应一个不同截距的模型。令γt = β0 +β2 zt ,于是(9)式变为 y it = γt + β1 xit +εit , i = 1, 2, …, N ; t = 1, 2, …, T (10) 这正是时点固定效应回归模型形式。对于每个截面,回归函数的斜率相同(都是β1),γt 却因截面(时点)不同而异。可见时点固定效应回归模型中的截距项γt 包括了那些随不同截面(时点)变化,但不随个体变化的难以观测的变量的影响。γt 是一个随机变量。

以案例1为例,“全国零售物价指数”就是这样的一个变量。对于不同时点,这是一个变化的量,但是对于不同省份(个体),这是一个不变化的量。

图11

2.2.3 个体时点双固定效应回归模型(time and entity fixed effects regression model) 如果一个面板数据模型定义为,

y it = αi +γt + X it ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (11) 其中y it 为被回归变量(标量);αi 是随机变量,表示对于N 个个体有N 个不同的截距项,且其变化与X it 有关系;γt 是随机变量,表示对于T 个截面(时点)有T 个不同的截距项,且其变化与X it 有关系;X it 为k ⨯1阶回归变量列向量(包括k 个回归量);β为k ⨯1阶回归系数列向量;εit 为误差项(标量)满足通常假定(εit ⎢X it , αi , γt ) = 0;则称此模型为个体时点固定效应回归模型。

个体时点固定效应回归模型还可以表示为,

y it = α1+α2 D 2 +…+αN D N +γ2 W 2 +…+γ T W T + Xit ' β +εit , t = 1, 2, …, (12) 其中

D i =⎨

⎧1, ⎩0,

如果属于第i 个个体,i =2, ..., N , 其他,

(13)

W t =⎨

⎧1, 如果属于第t 个截面,t =2,..., T ; ⎩0, 其他(不属于第t 个截面) 。

(14)

如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(12)进行混合OLS 估计,全部参数估计量都是不一致的。正如个体固定效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方法也可以使个体时点双固定效应回归模型得到更有效的参数估计量。

以例1为例得到的截面、时点固定效应模型估计结果如下:

图12

回归系数为0.67,这与个体固定效应回归模型给出的估计结果0.70基本一致。

在上述三种固定效应回归模型中,个体固定效应回归模型最为常用。

2.3 随机效应模型 对于面板数据模型

y it = αi + X it ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (15) 如果αi 为随机变量,其分布与X it 无关;y it 为被回归变量(标量),εit 为误差项(标量),X it 为k ⨯1阶回归变量列向量(包括k 个回归量),β为k ⨯1阶回归系数列向量,对于不同个体回归系数相同,这种模型称为个体随机效应回归模型(随机截距模型、随机分量模型)。其假定条件是

αi ~ iid(α, σα2) , εit ~ iid(0, σε2)

都被假定为独立同分布,但并未限定何种分布。

同理也可定义时点随机效应回归模型和个体时点随机效应回归模型,但个体随机效应回归模型最为常用。

个体随机效应模型又称为等相关模型(Equicorrelated model )。原因如下。随机效应模型可以看作是混合模型的特例。对于个体随机效应回归模型y it = αi + X it ' β +εit , 可以把αi 并入误差项εit 。模型改写为

y it = X it ' β + (αi +εit ) = X it ' β + u it (16)

其中u it = (αi +εit ) 。如果有αi ~(α, σα2) ,εit ~(0, σε2) 成立,那么,

Cov(u it , u is ) = Cov[(αi +εit )( αi +εis )] =

因为对于t ≠ s ,有

r(u it , u is

) =

2

⎧⎪σα, t ≠s ⎨22⎪σ+σε, t =s ⎩α

(17)

σα

2

2

2

(18)

σα+σε

相关系数r(u it , u is ) 与 (t – s ) 即相隔期数长短无关。所以个体随机效应模型也称作等相关模型,或者可交换误差模型(exchangeable model)。

对于个体随机效应模型,E(αi ⎢X it ) = α,则有,E(y it ⎢x it ) = α + X it ' β,对y it 可以识别。所以随机效应模型参数的混合OLS 估计量具有一致性,但不具有有效性。

注意:“固定效应模型”这个术语用得并不十分恰当,容易产生误解。其实固定效应模型应该称之为“相关效应模型”,而随机效应模型应该称之为“非相关效应模型”。因为固定效应模型和随机效应模型中的αi 都是随机变量。

3.面板数据模型估计方法

面板数据模型中β的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随设定固定效应模型是否正确而变化。

3.1 混合最小二乘(Pooled OLS)估计

混合OLS 估计方法是在时间上和截面上把NT 个观测值混合在一起,然后用OLS 法估计模型参数。给定混合模型

y it = α + X it ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (19) 如果模型是正确设定的,且解释变量与误差项不相关,即Cov(X it , εit ) = 0。那么无论是N →∞,还是T →∞,模型参数的混合最小二乘估计量都具有一致性。

对混合模型通常采用的是混合最小二乘(Pooled OLS)估计法。

然而,在误差项服从独立同分布条件下由OLS 法得到的方差协方差矩阵,在这里通常不会成立。因为对于每个个体i 及其误差项来说通常是序列相关的。NT 个相关观测值要比NT 个相互独立的观测值包含的信息少。从而导致误差项的标准差常常被低估,估计量的精度被虚假夸大。

如果模型存在个体固定效应,即αi 与X it 相关,那么对模型应用混合OLS 估计方法,估计量不再具有一致性。解释如下:

假定模型实为个体固定效应模型y it = αi + Xit ' β +εit ,但却当作混合模型来估计参数,则模型可写为

y it = α + X it ' β + (αi -α +εit ) = α + Xit ' β + u it (20)

其中u it = (αi -α +εit ) 。因为αi 与X it 相关,也即u it 与X it 相关,所以个体固定效应模型的参数若采用混合OLS 估计,估计量不具有一致性。

3.2平均(between )OLS 估计

平均OLS 估计法的步骤是首先对面板数据中的每个个体求平均数,共得到N 个平均数(估计值)。然后利用y it 和X it 的N 组观测值估计参数。以个体固定效应回归模型

y it = αi + X it ' β +εit (21)

为例,首先对面板中的每个个体求平均数,从而建立模型

i = αi +X i ' β +i

, i = 1, 2, …, N (22)

-1

T

T

其中i =T

T -1

t =1

y it

,X i =T ∑

t =1

X it

,i =T

-1

∑ε,i = 1, 2, …, N 。变换上式得

it

t =1

i = α +X i ' β +(α i - α +i

), i = 1, 2, …, N (23)

上式称作平均模型。对上式应用OLS 估计,则参数估计量称作平均OLS 估计量。此条件下的样本容量为N ,(T =1)。

如果X i 与(α i - α +i ) 相互独立,α和β的平均OLS 估计量是一致估计量。平均OLS 估计法适用于短期面板的混合模型和个体随机效应模型。对于个体固定效应模型来说,由于αi 和X it 相关,也即αi 和X i 相关,所以,回归参数的平均OLS 估计量是非一致估计量。

3.3 离差(within )OLS 估计

对于短期面板数据,离差OLS 估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离差观测值,然后利用离差数据估计模型参数。具体步骤是,对于个体固定效应回归模型

y it = αi + X it ' β +εit (24)

中的每个个体计算平均数,可得到如下模型,

i = αi +X i ' β +i

其中i 、X i 、i 的定义见(22)式。上两式相减,消去了αi ,得

y it -i = (X it -X i )' β + (εit -i )

此模型称作离差数据模型。对上式应用OLS 估计,所得β的估计量称作离差OLS 估计量。对于个体固定效应回归模型,β的离差OLS 估计量是一致估计量。如果εit 还满足独立同分布条件,β的离差OLS 估计量不但具有一致性而且还具有有效性。

如果对固定效应αi 感兴趣,也可按下式估计。

ˆi =i -X ' βˆ (27) αi

个体固定效应回归模型的估计通常采用的就是离差(within )OLS 估计法。 在短期面板条件下,即便αi 的分布、以及αi 和X it 的关系都已知到,αi 的估计量仍不具有一致性。当个体数N 不大时,可采用OLS 虚拟变量估计法估计αi 和β。

离差OLS 估计法的主要缺点是不能估计非时变回归变量构成的面板数据模型。比如X it = Xi (非时变变量),那么有X i = X i ,计算离差时有X i -X i = 0。

3.4 一阶差分(first difference)OLS 估计

在短期面板条件下,一阶差分OLS 估计就是对个体固定效应模型中的回归量与被回归量的差分变量构成的模型的参数进行OLS 估计。具体步骤是,对个体固定效应回归模型

y it = αi + X it 'β +εit

取其滞后一期关系式

y it -1 = αi + X it -1' β +εit -1

上两式相减,得一阶差分模型(αi 被消去)

y it -y it -1 = (X it - Xit -1) ' β + (εit -εit -1) , i = 1, 2, …, N ; t = 1, 2, …, T

对上式应用OLS 估计得到的β的估计量称作一阶差分OLS 估计量。尽管αi 不能被估计,β的估计量是一致估计量。

在T >2,εit 独立同分布条件下得到的β的一阶差分OLS 估计量不如离差OLS 估计量有效。

3.5 随机效应(random effects)估计法(可行GLS (feasible GLS)估计法) 有个体固定效应模型

y it = αi + X it 'β +εi

αi ,εit 服从独立同分布。对其作如下变换

ˆ) μ + (X it -λˆX )' β + v it (29) ˆ= (1-λy it -λi i

ˆ) αi + (εit -λˆ) 渐近服从独立同分布,λ = 1-其中v it = (1-λi

σε

σε

2

,应用OLS 估计,

2

+T σα

ˆ= 0时,则所得估计量称为随机效应估计量或可行GLS 估计量。当λ(29)式等同于混合ˆ=1时,OLS 估计;当λ(29)式等同于离差OLS 估计。

对于随机效应模型,可行GLS 估计量不但是一致估计量,而且是有效估计量,但对于个体固定效应模型,可行GLS 估计量不是一致估计量。

面板数据模型估计量的稳健统计推断。在实际的经济面板数据中,N 个个体之间相互独立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。为了得到正确的统计推断,需要克服这两个因素。

对于第i 个个体,当N →∞,X i ⋅的方差协方差矩阵仍然是T ⨯T 有限阶的,所以可以用以前的方法克服异方差。采用GMM 方法还可以得到更有效的估计量。

EViwes 中对随机效应回归模型的估计采用的就是可行(feasible )GLS 估计法。

4.面板数据模型设定检验方法 4.1 F 检验

先介绍原理。F 统计量定义为 F =

(SSE

r

-SSE

u

u

) /m

SSE /(T -k )

~ F ( m , T – k ) (30)

其中SSE r 表示施加约束条件后估计模型的残差平方和,SSE u 表示未施加约束条件的估计模型的残差平方和,m 表示约束条件个数,T 表示样本容量,k 表示未加约束的模型中被估参数的个数。在原假设“约束条件真实”条件下,F 统计量渐近服从自由度为( m , T – k )的F 分布。

以检验个体固定效应回归模型为例,介绍F 检验的应用。建立假设

H 0:αi =α。模型中不同个体的截距相同(真实模型为混合回归模型)。 H 1:模型中不同个体的截距项αi 不同(真实模型为个体固定效应回归模型)。 F 统计量定义为:

F =(SSE r

-SSE

u

) /[(NT -k -1) -(NT -N -k )]

u

=

(SSE SSE

r u

-SSE u ) /(N -1) /(NT -N -k )

(31)

SSE /(NT -N -k )

其中SSE r 表示约束模型,即混合估计模型的残差平方和,SSE u 表示非约束模型,即个体固定效应回归模型的残差平方和。非约束模型比约束模型多了N -1个被估参数。

以案例1为例,已知SSE r = 4824588,SSE u = 4028843,

F = =

(SSE

r u

-SSE u ) /(N -1) /(NT -N -1)

SSE

[1**********]

=

(4824588-2270386) /(15-1)

2270386/(105-15-1)

= 8.1 (32)

F 0.05(6, 87) = 1.8

因为F = 8.1 > F0.05(14, 89) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。

4.2 Hausman 检验

对同一参数的两个估计量差异的显著性检验称作Hausman 检验,简称H 检验。H 检验由Hausman1978年提出,是在Durbin (1914)和Wu (1973)基础上发展起来的。所以H 检验也称作Wu-Hausman 检验,和Durbin-Wu-Hausman 检验。

先介绍Hausman 检验原理

例如在检验单一方程中某个回归变量(解释变量)的内生性问题时得到相应回归参数的两个估计量,一个是OLS 估计量、一个是2SLS 估计量。其中2SLS 估计量用来克服回归变量可能存在的内生性。如果模型的解释变量中不存在内生性变量,那么OLS 估计量和2SLS 估计量都具有一致性,都有相同的概率极限分布。如果模型的解释变量中存在内

生性变量,那么回归参数的OLS 估计量是不一致的而2SLS 估计量仍具有一致性,两个估计量将有不同的概率极限分布。

更一般地,假定得到q 个回归系数的两组估计量θˆ和θ,则H 检验的零假设和被择假设是:

H 0: plim(θˆ-θ) = 0 H 1: plim(θˆ-θ) ≠ 0

假定两个估计量的差作为统计量也具有一致性,在H 0成立条件下,

N

d

~ˆ(θ-θ) →N (0, VH )

~

~~

其中V H 是(θˆ-θ) 的极限分布方差矩阵。则H 检验统计量定义为

H = (θˆ-θ)' (N -1V ˆH ) -1 (θˆ-θ) → χ2(q ) (33)

其中(N -1V ˆH ) 是(θˆ-θ) 的估计的方差协方差矩阵。在H 0成立条件下,H 统计量渐近服从χ2(q ) 分布。其中q 表示零假设中约束条件个数。

H 检验原理很简单,但实际中V H 的一致估计量V ˆH 并不容易。一般来说,

N -1V ˆH = Var(θˆ-θ) = Var(θˆ)+Var(θ)-2Cov(θˆ, θ) (34)

Var(θˆ) ,Var(θ) 在一般软件计算中都能给出。但Cov(θˆ, θ) 不能给出。致使H 统计量(33)在实际中无法使用。

实际中也常进行如下检验。

H 0:模型中所有解释变量都是外生的。 H 1:其中某些解释变量都是内生的。 在原假设成立条件下,

∧∧~~~ˆH = (θ-θ)' (Var (θ) -Var (θˆ) ) -1 (θˆ-θ) ~χ2(k ) (36)

~

~~

~

~~~

~~

其中Var (θ) 和Var (θˆ) 分别是对Var(θ) 和Var(θˆ) 的估计。与(34)式比较,这个结果只要求计算Var(θˆ) 和Var(θ) ,H 统计量(36)具有实用性。

当θ表示一个标量时,H 统计量(36)退化为, H =

~

~2

(θˆ-θ) 2

ˆ2

S -S

~

~

~

~χ2(1)

~

ˆ2分别表示θ和θˆ的样本方差值。 其中S 2和S

H 检验用途很广。可用来做模型丢失变量的检验、变量内生性检验、模型形式设定检验、模型嵌套检验、建模顺序检验等。

下面详细介绍面板数据中利用H 统计量进行模型形式设定的检验。

假定面板模型的误差项满足通常的假定条件,如果真实的模型是随机效应回归模型,那么β的离差OLS 估计量βˆW 和随机GLS 法估计量βRE 都具有一致性。如果真实的模型是个体固定效应回归模型,则参数β的离差OLS 法估计量βˆW 是一致估计量,但随机GLS 估计量βRE 是非一致估计量。可以通过H 统计量检验(βRE -βˆW ) 的非零显著性,检验面板数据模型中是否存在个体固定效应。原假设与备择假设是

H 0: 个体效应与回归变量无关(个体随机效应回归模型) H 1: 个体效应与回归变量相关(个体固定效应回归模型) 例:

ˆ=0.7747,s(βˆ) = 0.00868(计算结果对应图15); βW W

βRE =0.7246,s(βRE ) = 0.0106(计算结果取自EViwes 个体固定效应估计结果)

~

~

~

~~

H =

~2ˆ-β(βW RE )

2ˆ) 2s (βRE ) -s (βW

=

(0. 7747-0. 7246) 0. 0106

2

22

= 68.4

-0. 0087

因为H =68.4 > χ20.05 (1) = 3.8,所以模型存在个体固定效应。应该建立个体固定效应回归模型。

5.面板数据建模案例分析

图13 混合估计散点图 图14 平均估计散点图

以案例1为例,图13是混合估计对应数据的散点图。回归结果如下

CP = 129.63 + 0.76 IP

(2.0) (79.7)

图14是平均值数据散点图。先对数据按个体求平均数CP 和IP 。然后用15组平均值数据回归,

CP = -40.88+0.79IP

(-0.3) (41.1)

图15 离差估计散点图 图16 差分估计散点图

图15是离差数据散点图。先计算CP 、IP 分别对CP 、IP 的离差数据,然后用离差数据计算OLS 回归。

CPM = 0.77 IPM

(90)

图16是一阶差分数据散点图。先对CP 、IP 各个体作一阶差分,然后用一阶差分数据

回归。

DCP = 0.71 DIP

(24)

案例2(file:5panel01a)美国公路交通事故死亡人数与啤酒税的关系研究

见Stock J H and M W Watson, Introduction to Econometrics, Addison Wesley, 2003第8章。美国每年有4万高速公路交通事故,约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。早晨1~3点25%的司机饮酒。饮酒司机出交通事故数是不饮酒司机的13倍。现有1982~1988年48个州共336组美国公路交通事故死亡人数(number )与啤酒税(beertax )的数据。

VFR82 vs. BEER82

4.54.03.5V F R 82

3.02.52.01.51.0

0.0

0.40.81.21.62.02.42.8BEER82

图17 1982年数据散点图(File: 5panel01a-graph01) 图18 1988年数据散点图(File:5panel01a- graph07)

1982年数据的估计结果(散点图见图17)

number 1982 = 2.01 + 0.15 beertax 1982

(0.15) (0.13)

1988年数据的估计结果(散点图见图18)

number 1988 = 1.86 + 0.44 beertax 1988

(0.11) (0.13)

图19 混合估计共336个观测值。估计结果仍不可靠。(file: 5panel01b )

1982~1988年混合数据估计结果(散点图见图19)

number 1982~1988 = 1.85 + 0.36 beertax 1982~1988

(42.5) (5.9) SSE=98.75

显然以上三种估计结果都不可靠(回归参数符号不对)。原因是啤酒税之外还有许多因素影响交通事故死亡人数。

个体固定效应估计结果(散点图见图1)

number it = 2.375 +… - 0.66 beertax it

(24.5) (-3.5) SSE=10.35 双固定效应估计结果(散点图见图1)

number it = 2.37 +… - 0.65 beertax it

(23.3) (-3.25) SSE=9.92

以上两种回归系数的估计结果非常近似。下面的F 检验证实参数-0.66和0.65比较合理。

用F 检验判断应该建立混合模型还是个体固定效应模型。

H 0:αi =α。混合回归模型(约束截距项为同一参数)。

H 1:αi 各不相同。个体固定效应回归模型(截距项任意取值)

F =

(SSE SSE

u r

-SSE u ) /(N ) /(NT -N -2)

(以EViwes5.0计算自由度)

1. 840. 0362

=

(98. 75-10. 35) /4810. 35/(336-50)

== 50.8

F 0.05(48, 286) = 1.2

因为F = 50.8 > F0.05(14, 89) = 1.2,推翻原假设,比较上述两种模型,建立个体固定效应回归

模型更合理。

下面讨论面板差分数据的估计结果。利用1988年和1982年数据的差分数据得估计结果(散点图见图3)

number 1988 -number 1982 = -0.072 - 1.04 (beertax 1988 - beertax1982)

(0.065) (0.36)

图20 差分数据散点图(File:5panel01a- graph08)

6.面板数据的单位根检验 下面介绍11种检验方法。

6.1 LLC (Levin-Lin-Chu ,2002)检验(适用于相同根(common root)情形) LLC 检验原理是仍采用ADF 检验式形式。但使用的却是∆y it 和y it 的剔出自相关和确定项影响的、标准的代理变量。具体做法是(1)先从∆ y it 和y it 中剔出自相关和确定项的影响,并使其标准化,成为代理变量。(2)用代理变量做ADF 回归,εˆij =ρε ij + v it 。LLC 修正的t (ρˆ) 渐近服从N(0,1)分布。

详细步骤如下:

H 0: ρ = 0(有单位根); H 1: ρ

∆ yit = ρ yi t-1 +∑γi j ∆ y i t-j + Z it ' φ + εit , i = 1, 2, …, N ; t = 1, 2, …, T (38)

j =1k i

*

*

其中Z it 表示外生变量(确定性变量)列向量,φ 表示回归系数列向量。

(1)估计代理变量。首先确定附加项个数k i ,然后作如下两个回归式,

∆ yit =

∑γˆ∆ y i t-j + Z it ' φˆ+εˆ

i j

i t

k i

j =1

y i t-1 = 移项得

~

∑γ~∆ y i t-j + Z it ' φ +ε

i j

k i

it -1

j =1

ˆi j ∆ y i t-j - Z it ' φˆ εˆi t = ∆ yit -∑γ

j =1k i

k i

it -1

~∆ y - Z ' φ = yit -∑γi t-j it i j

j =1

~标准化, 把εˆi t 和εit -1

*

εˆij = εˆi t /si *~/s ε ij = εi it -1

其中s i , i = 1, 2, …, N 是用(38)式对每个个体回归时得到的残差的标准差,从而得到∆ yit

**

和y it -1的代理变量εˆij 和ε ij 。

**

(2)用代理变量εˆij 和ε ij 作如下回归,

**

εˆij =ρε ij + v it

ˆ的如下修正的t ρLLC 证明,上式中估计量ρˆ统计量渐近地服从标准正态分布。

~

t ρˆ

~

=

~

ˆ) μm T ˆ2s (ρ~*t ρˆ-(N T ) S N σ

~*σm T

→ N (0, 1)

~

⎛⎝

⎫⎭

其中t ρˆ表示标准的t 统计量;N 是截面容量;T =T - ∑k i /N ⎪-1,(T 为个体容量);S N 是

i

ˆ) 是ρˆ标准ˆ2是误差项v it 的方差;s (ρ每个个体长期标准差与新息标准差之比的平均数;σ

误差;μm T ~和σm T ~分别是均值和标准差的调整项。

见图21输出结果,LLC = 9.7 > -1.65,所以存在单位根。

图21 LLC 检验的EV iews 5.0输出结果(部分)

EViews 5.0操作步骤:在面板数据窗口点击View 选Unit Root Test功能。在T est Type中选Common root –Levin, Lin, Chu。

6.5 Breitung 检验(2002)(适用于相同根(common root)情形)

Breitung 检验法与LLC 检验法类似。先从∆y it 和y it 中剔出动态项∆y it -j ,然后标准化,

~* + v 。检验单位根。 再退势,最后用ADF 回归εˆi t *=ρεit it -1

用每个个体建立的单位根检验式的误差项之间若存在同期相关,上述面板数据的单位根检验方法都不再适用。主要是统计量的分布发生变化,检验功效降低。为此提出一些个体同期相关面板数据的单位根检验方法。

6.2 Hadri 检验(适用于相同根(common root)情形)

Hadri 检验与KPSS 检验相类似。原假设是面板中的所有序列都不含有单位根。计算步骤是用原面板数据的退势序列(残差)建立LM 统计量。

退势回归是

y it = α1 +α2 t + uit

ˆit 计算如下LM 统计量, 利用上式中的残差u

LM =

1⎡N ⎡22⎤

S (t ) T ∑∑i ⎢⎢⎥

N ⎣i =1⎣t ⎦⎤

f 0⎥⎦

(39)

其中S i (t ) =

ˆ是残差累积函数,f 是频率为零时的残差谱密度。 ∑u

it

t

s =1

Hadri 给出,在一般假定条件下

Z =

N (LM -a )

b

→N (0, 1) (40)

其中a=1/6,b=1/45,LM 由(39)式计算。

Hadri 检验的原假设是没有单位根。以案例1为例,图22给出检验结果。EViews 给出假定同方差和克服异方差两种情形下的Z 统计量。因为Z 渐近服从正态分布,Z = 7.5和7.6落在拒绝域,结论是存在共同单位根。

图22 Hadri 检验的EV iews 5.0输出结果(部分)

EViews 5.0操作步骤:在面板数据窗口点击View 选Unit Root Test功能。在T est Type中选Common root – Hadri。

下面介绍适用于不同根(individual unit root)情形的面板数据单位根检验方法 6.8 IPS (Im-Pesaran-Shin )检验(1997,2002)

IPS 检验克服了LL 检验的缺陷,允许面板中不同个体(序列)的ρi 不同。IPS 检验式是

k i

∆ y it = ρi y i t-1 +∑γi j ∆ y i t-j + X it ' α + εit , i = 1, 2, …, N ; t = 1, 2, …, T , εit ~IID(0,σ2)

j =1

(43)

H 0: ρi = 0, i = 1, 2, …, N ; (存在单位根)

⎧ρi =0, H 1: ⎨

⎩ρi

i =1,..., n 1 i =n 1+1, n 1+2,..., N

1N

N

利用(41)式对N 个个体估计N 个ρi 及相应的t ρˆ。计算平均值(ρˆ) =造面板IPS 检验用统计量Z =

Z ∑t ρ。再用ρ构

(ˆ)

(ˆ)

i =1

[(ρˆ) -E ((ρˆ) )]((ρˆ) ) /N

渐近服从N(0,1)分布。临界值与N 、T 以及检验式中是否含有确定项有关系。IPS

检验为左单端检验。

图23 IPS 检验的EV iews 5.0输出结果

EViews 5.0操作步骤:在面板数据窗口点击V iew 选Unit Root Test功能。在Test Type中选Individual root – Im, Pesaran。

6.10 崔仁(In Choi)检验(2001),又称Fisher -ADF 检验。

崔仁(2001)提出了两种组合p i 值检验统计量。这两种检验方法都是从Fisher 原理出发,首先对每个个体进行ADF 检验,用ADF 统计量所对应的概率p i 的和构造ADF-Fisher

χ2和ADF-Choi Z 统计量。原假设H 0是存在单位根。在原假设成立条件下,

ADF-Fisher χ = -2∑log(p i ) →χ2(2N )

i =1

2

N

ADF-Choi Z =

1N

N

∑Φ

i =1

-1

(p i )

→N (0, 1)

其中Φ-1(·) 表示标准正态分布累计函数的倒数。

如果概率p i 是通过PP 检验计算出来的,还可以得到PP-Fisher χ2,PP-Choi Z 两个统计量。EViews 5.0对这4个统计量都有报告。因为这4个统计量计算的都是每个个体单位

根检验尾部概率的和,所以如果这个值很小,应该落在Fisher χ2和Choi Z 统计量的拒绝域,如果这个值很大,则落在Fisher χ2和Choi Z 统计量的接受域。

图24 ADF-Fisher ,ADF-Choi 检验的EV iews 5.0输出结果(部分)

图25 PP-Fisher ,PP-Choi 检验的EViews 5.0输出结果(部分)

7.我们的研究成果

详细内容请见张晓峒、白仲林的论文“退势单位根检验小样本性质的比较”《数量经

济技术经济研究》2005第5期,40-49页和白仲林的博士学位论文。

张晓峒、白仲林(2005)给出四种退势方法(OLS 退势、GLS 退势、KGLS 退势、ROLS 退势)与五种单位根检验(DF 检验、ADF 检验、RMA 检验、WS 检验、MAX 检验)相结合的20种单位根检验功效比较。结论是:(1)用退势方法检验单位根比不用退势方法检验单位根的功效都有一定程度的提高;(2)递归退势RMA (递归均值调整)单位根检验(RMA-ROLS )的功效最高;广义最小二乘退势DF (GLS-DF )单位根检验的功效次之;其他检验方法再次之。(3)各种退势方法均不能有效地提高T ( ˆ-1) 统计量的检验功效。

2006年底将有一部面板数据专著出版。

我们承担的国家自然科学基金项目将从三个方面进行深入研究。(1)面板数据的协积研究;(2)季节面板数据的特征研究;(3)含有结构突变的面板数据单位根检验。

8.面板数据最新研究领域 8.1 动态面板数据模型 8.2 非平衡面板数据模型 8.3 离散因变量面板数据模型

8.4 非平稳面板数据模型(动态面板数据模型、非均衡面板数据模型、离散面板数据模型、面板数据非平稳性、面板数据的协积)

面板数据模型与应用

张晓峒

中国数量经济学会常务理事,学术委员会委员

南开大学数量经济学专业博士生导师 [email protected][email protected]

最近新书:

1.Badi H. Baltagi, Econometric Analysis of Panel Data, John Wiley & Sons, 2005. 2.Jeffrey M. Wooldridge, Econometric Analysis of Cross Section and Panel Data, 3.Cheng Hsiao, Analysis of Panel Data, Cambridge University Press, 2003.

4.Manuel Arellano, Panel Data Econometrics (Advanced Texts in Econometrics), 2003. 5. Edward W. Frees, Longitudinal and Panel Data: Analysis and Applications in the Social Sciences, 2004.

6.谢识予 朱宏鑫 编著,高级计量经济学,2005-5 7.童光荣,计量经济学,武汉大学出版社2006-3 学术会议:

1. 13th International Conference on Panel Data , Faculty of Economics, & Robinson College, University of Cambridge, Cambridge, UK, 7-9 July 2006

1.面板数据定义

panel data的中译:面板数据、桌面数据、平行数据、纵列数据、时间序列截面数据、混合数据(pool data)、固定调查对象数据。

面板数据定义

(1)面板数据定义为相同截面上的个体在不同时点的重复观测数据。 (2)称为纵向变量序列(个体)的多次测量。

面板数据从横截面(cross section )看,是由若干个体(entity, unit, individual )在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。

图1

面板数据用双下标变量表示。例如

y i t, i = 1, 2, …, N ; t = 1, 2, …, T

i 对应面板数据中不同个体。N 表示面板数据中含有N 个个体。t 对应面板数据中不同时点。T 表示时间序列的最大长度。若固定t 不变,y i ., ( i = 1, 2, …, N ) 是横截面上的N 个随机变量;若固定i 不变,y . t, (t = 1, 2, …, T ) 是纵剖面上的

一个时间序列(个体)。

这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。

案例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP )和人均收入(IP )数据见file:panel02。数据是7年的,每一年都有15个数据,共105组观测值。

人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。

图2 15个省级地区的人均消费序列(纵剖面) 图3 15个省级地区的人均收入序列(file:5panel02)

[***********][1**********]00

2

46

8

10

12

14

[***********][1**********]00

2

46

8

10

12

14

图4 7个时点人均消费横截面数据(含15个地区) 图5 7个时点人均收入横截面数据(含15个地区) (每条连线数据表示同一年度15个地区的消费值) (每条连线数据表示同一年度15个地区的收入值)

用CP 表示消费,IP 表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、

图6 人均消费对收入的面板数据散点图(15个时间序列叠加)

12000

C P1996C P1997C P1998C P1999C P2000C P2001C P2002

10000

8000

6000

4000

IP(1996-2002)

图7 人均消费对收入的面板数据散点图(7个截面叠加)

2000

2000

[***********]200014000

图8 北京和内蒙古1996-2002年消费对收入散点图 图9 1996和2002年15个地区的消费对收入散点图

2.面板数据模型分类

用面板数据建立的模型通常有3种,即混合回归模型、固定效应回归模型和随机效应回归模型。

2.1 混合回归模型(Pooled model)。 如果一个面板数据模型定义为,

y it = α + X it ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (1) 其中y it 为被回归变量(标量),α表示截距项,X it 为k ⨯1阶回归变量列向量(包括k 个回归量),β为k ⨯1阶回归系数列向量,εit 为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数α和β都相同。

如果模型是正确设定的,解释变量与误差项不相关,即Cov(X it , εit ) = 0。那么无论是N →∞,还是T →∞,模型参数的混合最小二乘估计量(Pooled OLS)都是一致估计量。

2.2 固定效应回归模型(fixed effects regression model)。

固定效应模型分为3种类型,即个体固定效应回归模型、时点固定效应回归模型和个体时点双固定效应回归模型。下面分别介绍。

2.2.1个体固定效应回归模型(entity fixed effects regression model) 如果一个面板数据模型定义为,

y it = αi + X it ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (3) 其中αi 是随机变量,表示对于i 个个体有i 个不同的截距项,且其变化与X it 有关系;y it 为被回归变量(标量),εit 为误差项(标量),X it 为k ⨯1阶回归变量列向量(包括k 个回归量),β为k ⨯1阶回归系数列向量,对于不同个体回归系数相同,则称此模型为个体固定效应回归模型。

αi 作为随机变量描述不同个体建立的模型间的差异。因为αi 是不可观测

的,且与可观测的解释变量X it 的变化相联系,所以称(3)式为个体固定效应回归模型。

个体固定效应回归模型也可以表示为

y it = α1 + α2 D 2 + … +αN D N + Xit ' β +εit , t = 1, 2, …, T (4) 其中

⎧1, D i =⎨0,

如果属于第i 个个体,i =2, ..., N , 其他,

设定个体固定效应回归模型的原因如下。假定有面板数据模型

y it = β0 + β1 xit +β2 zi +εit , i = 1, 2, …, N ; t = 1, 2, …, T (5) 其中β0为常数,不随时间、截面变化;z i 表示随个体变化,但不随时间变化的难以观测的变量。上述模型可以被解释为含有N 个截距,即每个个体都对应一个不同截距的模型。令

αi = β0 +β2 zi ,于是(5)式变为

y it = αi + β1 xit +εit , i = 1, 2, …, N ; t = 1, 2, …, T (6) 这正是个体固定效应回归模型形式。对于每个个体回归函数的斜率相同(都是β1),截距

αi 却因个体不同而变化。可见个体固定效应回归模型中的截距项αi 中包括了那些随个体变化,但不随时间变化的难以观测的变量的影响。αi 是一个随机变量。

以案例1为例,省家庭平均人口数就是这样的一个变量。对于短期面板来说,这是一个基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。

以案例1为例(file:panel02)得到的个体固定效应模型估计结果如下:

注意:个体固定效应模型的EViwes 输出结果中没有公共截距项。

图10 个体固定效应回归模型的估计结果

2.2.2 时点固定效应回归模型(time fixed effects regression model) 如果一个面板数据模型定义为,

y it = γt + X it ' β +εit , i = 1, 2, …, N (7) 其中γt 是模型截距项,随机变量,表示对于T 个截面有T 个不同的截距项,且其变化与X it 有关系;y it 为被回归变量(标量),εit 为误差项(标量),满足通常假定条件。X it 为k ⨯1阶回归变量列向量(包括k 个回归变量),β为k ⨯1阶回归系数列向量,则称此模型为时点固定效应回归模型。

时点固定效应回归模型也可以加入虚拟变量表示为

y it = γ1 + γ2 W 2 + … +γ T W T + Xit ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (8) 其中

⎧1, 如果属于第t 个截面,t =2,..., T ; W t =⎨

0, 其他(不属于第t 个截面) 。 ⎩

设定时点固定效应回归模型的原因。假定有面板数据模型

y it = β0 + β1 xit +β2 zt +εit , i = 1, 2, …, N ; t = 1, 2, …, T (9) 其中β0为常数,不随时间、截面变化;z t 表示随不同截面(时点)变化,但不随个体变化的难以观测的变量。上述模型可以被解释为含有T 个截距,即每个截面都对应一个不同截距的模型。令γt = β0 +β2 zt ,于是(9)式变为 y it = γt + β1 xit +εit , i = 1, 2, …, N ; t = 1, 2, …, T (10) 这正是时点固定效应回归模型形式。对于每个截面,回归函数的斜率相同(都是β1),γt 却因截面(时点)不同而异。可见时点固定效应回归模型中的截距项γt 包括了那些随不同截面(时点)变化,但不随个体变化的难以观测的变量的影响。γt 是一个随机变量。

以案例1为例,“全国零售物价指数”就是这样的一个变量。对于不同时点,这是一个变化的量,但是对于不同省份(个体),这是一个不变化的量。

图11

2.2.3 个体时点双固定效应回归模型(time and entity fixed effects regression model) 如果一个面板数据模型定义为,

y it = αi +γt + X it ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (11) 其中y it 为被回归变量(标量);αi 是随机变量,表示对于N 个个体有N 个不同的截距项,且其变化与X it 有关系;γt 是随机变量,表示对于T 个截面(时点)有T 个不同的截距项,且其变化与X it 有关系;X it 为k ⨯1阶回归变量列向量(包括k 个回归量);β为k ⨯1阶回归系数列向量;εit 为误差项(标量)满足通常假定(εit ⎢X it , αi , γt ) = 0;则称此模型为个体时点固定效应回归模型。

个体时点固定效应回归模型还可以表示为,

y it = α1+α2 D 2 +…+αN D N +γ2 W 2 +…+γ T W T + Xit ' β +εit , t = 1, 2, …, (12) 其中

D i =⎨

⎧1, ⎩0,

如果属于第i 个个体,i =2, ..., N , 其他,

(13)

W t =⎨

⎧1, 如果属于第t 个截面,t =2,..., T ; ⎩0, 其他(不属于第t 个截面) 。

(14)

如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(12)进行混合OLS 估计,全部参数估计量都是不一致的。正如个体固定效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方法也可以使个体时点双固定效应回归模型得到更有效的参数估计量。

以例1为例得到的截面、时点固定效应模型估计结果如下:

图12

回归系数为0.67,这与个体固定效应回归模型给出的估计结果0.70基本一致。

在上述三种固定效应回归模型中,个体固定效应回归模型最为常用。

2.3 随机效应模型 对于面板数据模型

y it = αi + X it ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (15) 如果αi 为随机变量,其分布与X it 无关;y it 为被回归变量(标量),εit 为误差项(标量),X it 为k ⨯1阶回归变量列向量(包括k 个回归量),β为k ⨯1阶回归系数列向量,对于不同个体回归系数相同,这种模型称为个体随机效应回归模型(随机截距模型、随机分量模型)。其假定条件是

αi ~ iid(α, σα2) , εit ~ iid(0, σε2)

都被假定为独立同分布,但并未限定何种分布。

同理也可定义时点随机效应回归模型和个体时点随机效应回归模型,但个体随机效应回归模型最为常用。

个体随机效应模型又称为等相关模型(Equicorrelated model )。原因如下。随机效应模型可以看作是混合模型的特例。对于个体随机效应回归模型y it = αi + X it ' β +εit , 可以把αi 并入误差项εit 。模型改写为

y it = X it ' β + (αi +εit ) = X it ' β + u it (16)

其中u it = (αi +εit ) 。如果有αi ~(α, σα2) ,εit ~(0, σε2) 成立,那么,

Cov(u it , u is ) = Cov[(αi +εit )( αi +εis )] =

因为对于t ≠ s ,有

r(u it , u is

) =

2

⎧⎪σα, t ≠s ⎨22⎪σ+σε, t =s ⎩α

(17)

σα

2

2

2

(18)

σα+σε

相关系数r(u it , u is ) 与 (t – s ) 即相隔期数长短无关。所以个体随机效应模型也称作等相关模型,或者可交换误差模型(exchangeable model)。

对于个体随机效应模型,E(αi ⎢X it ) = α,则有,E(y it ⎢x it ) = α + X it ' β,对y it 可以识别。所以随机效应模型参数的混合OLS 估计量具有一致性,但不具有有效性。

注意:“固定效应模型”这个术语用得并不十分恰当,容易产生误解。其实固定效应模型应该称之为“相关效应模型”,而随机效应模型应该称之为“非相关效应模型”。因为固定效应模型和随机效应模型中的αi 都是随机变量。

3.面板数据模型估计方法

面板数据模型中β的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随设定固定效应模型是否正确而变化。

3.1 混合最小二乘(Pooled OLS)估计

混合OLS 估计方法是在时间上和截面上把NT 个观测值混合在一起,然后用OLS 法估计模型参数。给定混合模型

y it = α + X it ' β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (19) 如果模型是正确设定的,且解释变量与误差项不相关,即Cov(X it , εit ) = 0。那么无论是N →∞,还是T →∞,模型参数的混合最小二乘估计量都具有一致性。

对混合模型通常采用的是混合最小二乘(Pooled OLS)估计法。

然而,在误差项服从独立同分布条件下由OLS 法得到的方差协方差矩阵,在这里通常不会成立。因为对于每个个体i 及其误差项来说通常是序列相关的。NT 个相关观测值要比NT 个相互独立的观测值包含的信息少。从而导致误差项的标准差常常被低估,估计量的精度被虚假夸大。

如果模型存在个体固定效应,即αi 与X it 相关,那么对模型应用混合OLS 估计方法,估计量不再具有一致性。解释如下:

假定模型实为个体固定效应模型y it = αi + Xit ' β +εit ,但却当作混合模型来估计参数,则模型可写为

y it = α + X it ' β + (αi -α +εit ) = α + Xit ' β + u it (20)

其中u it = (αi -α +εit ) 。因为αi 与X it 相关,也即u it 与X it 相关,所以个体固定效应模型的参数若采用混合OLS 估计,估计量不具有一致性。

3.2平均(between )OLS 估计

平均OLS 估计法的步骤是首先对面板数据中的每个个体求平均数,共得到N 个平均数(估计值)。然后利用y it 和X it 的N 组观测值估计参数。以个体固定效应回归模型

y it = αi + X it ' β +εit (21)

为例,首先对面板中的每个个体求平均数,从而建立模型

i = αi +X i ' β +i

, i = 1, 2, …, N (22)

-1

T

T

其中i =T

T -1

t =1

y it

,X i =T ∑

t =1

X it

,i =T

-1

∑ε,i = 1, 2, …, N 。变换上式得

it

t =1

i = α +X i ' β +(α i - α +i

), i = 1, 2, …, N (23)

上式称作平均模型。对上式应用OLS 估计,则参数估计量称作平均OLS 估计量。此条件下的样本容量为N ,(T =1)。

如果X i 与(α i - α +i ) 相互独立,α和β的平均OLS 估计量是一致估计量。平均OLS 估计法适用于短期面板的混合模型和个体随机效应模型。对于个体固定效应模型来说,由于αi 和X it 相关,也即αi 和X i 相关,所以,回归参数的平均OLS 估计量是非一致估计量。

3.3 离差(within )OLS 估计

对于短期面板数据,离差OLS 估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离差观测值,然后利用离差数据估计模型参数。具体步骤是,对于个体固定效应回归模型

y it = αi + X it ' β +εit (24)

中的每个个体计算平均数,可得到如下模型,

i = αi +X i ' β +i

其中i 、X i 、i 的定义见(22)式。上两式相减,消去了αi ,得

y it -i = (X it -X i )' β + (εit -i )

此模型称作离差数据模型。对上式应用OLS 估计,所得β的估计量称作离差OLS 估计量。对于个体固定效应回归模型,β的离差OLS 估计量是一致估计量。如果εit 还满足独立同分布条件,β的离差OLS 估计量不但具有一致性而且还具有有效性。

如果对固定效应αi 感兴趣,也可按下式估计。

ˆi =i -X ' βˆ (27) αi

个体固定效应回归模型的估计通常采用的就是离差(within )OLS 估计法。 在短期面板条件下,即便αi 的分布、以及αi 和X it 的关系都已知到,αi 的估计量仍不具有一致性。当个体数N 不大时,可采用OLS 虚拟变量估计法估计αi 和β。

离差OLS 估计法的主要缺点是不能估计非时变回归变量构成的面板数据模型。比如X it = Xi (非时变变量),那么有X i = X i ,计算离差时有X i -X i = 0。

3.4 一阶差分(first difference)OLS 估计

在短期面板条件下,一阶差分OLS 估计就是对个体固定效应模型中的回归量与被回归量的差分变量构成的模型的参数进行OLS 估计。具体步骤是,对个体固定效应回归模型

y it = αi + X it 'β +εit

取其滞后一期关系式

y it -1 = αi + X it -1' β +εit -1

上两式相减,得一阶差分模型(αi 被消去)

y it -y it -1 = (X it - Xit -1) ' β + (εit -εit -1) , i = 1, 2, …, N ; t = 1, 2, …, T

对上式应用OLS 估计得到的β的估计量称作一阶差分OLS 估计量。尽管αi 不能被估计,β的估计量是一致估计量。

在T >2,εit 独立同分布条件下得到的β的一阶差分OLS 估计量不如离差OLS 估计量有效。

3.5 随机效应(random effects)估计法(可行GLS (feasible GLS)估计法) 有个体固定效应模型

y it = αi + X it 'β +εi

αi ,εit 服从独立同分布。对其作如下变换

ˆ) μ + (X it -λˆX )' β + v it (29) ˆ= (1-λy it -λi i

ˆ) αi + (εit -λˆ) 渐近服从独立同分布,λ = 1-其中v it = (1-λi

σε

σε

2

,应用OLS 估计,

2

+T σα

ˆ= 0时,则所得估计量称为随机效应估计量或可行GLS 估计量。当λ(29)式等同于混合ˆ=1时,OLS 估计;当λ(29)式等同于离差OLS 估计。

对于随机效应模型,可行GLS 估计量不但是一致估计量,而且是有效估计量,但对于个体固定效应模型,可行GLS 估计量不是一致估计量。

面板数据模型估计量的稳健统计推断。在实际的经济面板数据中,N 个个体之间相互独立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。为了得到正确的统计推断,需要克服这两个因素。

对于第i 个个体,当N →∞,X i ⋅的方差协方差矩阵仍然是T ⨯T 有限阶的,所以可以用以前的方法克服异方差。采用GMM 方法还可以得到更有效的估计量。

EViwes 中对随机效应回归模型的估计采用的就是可行(feasible )GLS 估计法。

4.面板数据模型设定检验方法 4.1 F 检验

先介绍原理。F 统计量定义为 F =

(SSE

r

-SSE

u

u

) /m

SSE /(T -k )

~ F ( m , T – k ) (30)

其中SSE r 表示施加约束条件后估计模型的残差平方和,SSE u 表示未施加约束条件的估计模型的残差平方和,m 表示约束条件个数,T 表示样本容量,k 表示未加约束的模型中被估参数的个数。在原假设“约束条件真实”条件下,F 统计量渐近服从自由度为( m , T – k )的F 分布。

以检验个体固定效应回归模型为例,介绍F 检验的应用。建立假设

H 0:αi =α。模型中不同个体的截距相同(真实模型为混合回归模型)。 H 1:模型中不同个体的截距项αi 不同(真实模型为个体固定效应回归模型)。 F 统计量定义为:

F =(SSE r

-SSE

u

) /[(NT -k -1) -(NT -N -k )]

u

=

(SSE SSE

r u

-SSE u ) /(N -1) /(NT -N -k )

(31)

SSE /(NT -N -k )

其中SSE r 表示约束模型,即混合估计模型的残差平方和,SSE u 表示非约束模型,即个体固定效应回归模型的残差平方和。非约束模型比约束模型多了N -1个被估参数。

以案例1为例,已知SSE r = 4824588,SSE u = 4028843,

F = =

(SSE

r u

-SSE u ) /(N -1) /(NT -N -1)

SSE

[1**********]

=

(4824588-2270386) /(15-1)

2270386/(105-15-1)

= 8.1 (32)

F 0.05(6, 87) = 1.8

因为F = 8.1 > F0.05(14, 89) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。

4.2 Hausman 检验

对同一参数的两个估计量差异的显著性检验称作Hausman 检验,简称H 检验。H 检验由Hausman1978年提出,是在Durbin (1914)和Wu (1973)基础上发展起来的。所以H 检验也称作Wu-Hausman 检验,和Durbin-Wu-Hausman 检验。

先介绍Hausman 检验原理

例如在检验单一方程中某个回归变量(解释变量)的内生性问题时得到相应回归参数的两个估计量,一个是OLS 估计量、一个是2SLS 估计量。其中2SLS 估计量用来克服回归变量可能存在的内生性。如果模型的解释变量中不存在内生性变量,那么OLS 估计量和2SLS 估计量都具有一致性,都有相同的概率极限分布。如果模型的解释变量中存在内

生性变量,那么回归参数的OLS 估计量是不一致的而2SLS 估计量仍具有一致性,两个估计量将有不同的概率极限分布。

更一般地,假定得到q 个回归系数的两组估计量θˆ和θ,则H 检验的零假设和被择假设是:

H 0: plim(θˆ-θ) = 0 H 1: plim(θˆ-θ) ≠ 0

假定两个估计量的差作为统计量也具有一致性,在H 0成立条件下,

N

d

~ˆ(θ-θ) →N (0, VH )

~

~~

其中V H 是(θˆ-θ) 的极限分布方差矩阵。则H 检验统计量定义为

H = (θˆ-θ)' (N -1V ˆH ) -1 (θˆ-θ) → χ2(q ) (33)

其中(N -1V ˆH ) 是(θˆ-θ) 的估计的方差协方差矩阵。在H 0成立条件下,H 统计量渐近服从χ2(q ) 分布。其中q 表示零假设中约束条件个数。

H 检验原理很简单,但实际中V H 的一致估计量V ˆH 并不容易。一般来说,

N -1V ˆH = Var(θˆ-θ) = Var(θˆ)+Var(θ)-2Cov(θˆ, θ) (34)

Var(θˆ) ,Var(θ) 在一般软件计算中都能给出。但Cov(θˆ, θ) 不能给出。致使H 统计量(33)在实际中无法使用。

实际中也常进行如下检验。

H 0:模型中所有解释变量都是外生的。 H 1:其中某些解释变量都是内生的。 在原假设成立条件下,

∧∧~~~ˆH = (θ-θ)' (Var (θ) -Var (θˆ) ) -1 (θˆ-θ) ~χ2(k ) (36)

~

~~

~

~~~

~~

其中Var (θ) 和Var (θˆ) 分别是对Var(θ) 和Var(θˆ) 的估计。与(34)式比较,这个结果只要求计算Var(θˆ) 和Var(θ) ,H 统计量(36)具有实用性。

当θ表示一个标量时,H 统计量(36)退化为, H =

~

~2

(θˆ-θ) 2

ˆ2

S -S

~

~

~

~χ2(1)

~

ˆ2分别表示θ和θˆ的样本方差值。 其中S 2和S

H 检验用途很广。可用来做模型丢失变量的检验、变量内生性检验、模型形式设定检验、模型嵌套检验、建模顺序检验等。

下面详细介绍面板数据中利用H 统计量进行模型形式设定的检验。

假定面板模型的误差项满足通常的假定条件,如果真实的模型是随机效应回归模型,那么β的离差OLS 估计量βˆW 和随机GLS 法估计量βRE 都具有一致性。如果真实的模型是个体固定效应回归模型,则参数β的离差OLS 法估计量βˆW 是一致估计量,但随机GLS 估计量βRE 是非一致估计量。可以通过H 统计量检验(βRE -βˆW ) 的非零显著性,检验面板数据模型中是否存在个体固定效应。原假设与备择假设是

H 0: 个体效应与回归变量无关(个体随机效应回归模型) H 1: 个体效应与回归变量相关(个体固定效应回归模型) 例:

ˆ=0.7747,s(βˆ) = 0.00868(计算结果对应图15); βW W

βRE =0.7246,s(βRE ) = 0.0106(计算结果取自EViwes 个体固定效应估计结果)

~

~

~

~~

H =

~2ˆ-β(βW RE )

2ˆ) 2s (βRE ) -s (βW

=

(0. 7747-0. 7246) 0. 0106

2

22

= 68.4

-0. 0087

因为H =68.4 > χ20.05 (1) = 3.8,所以模型存在个体固定效应。应该建立个体固定效应回归模型。

5.面板数据建模案例分析

图13 混合估计散点图 图14 平均估计散点图

以案例1为例,图13是混合估计对应数据的散点图。回归结果如下

CP = 129.63 + 0.76 IP

(2.0) (79.7)

图14是平均值数据散点图。先对数据按个体求平均数CP 和IP 。然后用15组平均值数据回归,

CP = -40.88+0.79IP

(-0.3) (41.1)

图15 离差估计散点图 图16 差分估计散点图

图15是离差数据散点图。先计算CP 、IP 分别对CP 、IP 的离差数据,然后用离差数据计算OLS 回归。

CPM = 0.77 IPM

(90)

图16是一阶差分数据散点图。先对CP 、IP 各个体作一阶差分,然后用一阶差分数据

回归。

DCP = 0.71 DIP

(24)

案例2(file:5panel01a)美国公路交通事故死亡人数与啤酒税的关系研究

见Stock J H and M W Watson, Introduction to Econometrics, Addison Wesley, 2003第8章。美国每年有4万高速公路交通事故,约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。早晨1~3点25%的司机饮酒。饮酒司机出交通事故数是不饮酒司机的13倍。现有1982~1988年48个州共336组美国公路交通事故死亡人数(number )与啤酒税(beertax )的数据。

VFR82 vs. BEER82

4.54.03.5V F R 82

3.02.52.01.51.0

0.0

0.40.81.21.62.02.42.8BEER82

图17 1982年数据散点图(File: 5panel01a-graph01) 图18 1988年数据散点图(File:5panel01a- graph07)

1982年数据的估计结果(散点图见图17)

number 1982 = 2.01 + 0.15 beertax 1982

(0.15) (0.13)

1988年数据的估计结果(散点图见图18)

number 1988 = 1.86 + 0.44 beertax 1988

(0.11) (0.13)

图19 混合估计共336个观测值。估计结果仍不可靠。(file: 5panel01b )

1982~1988年混合数据估计结果(散点图见图19)

number 1982~1988 = 1.85 + 0.36 beertax 1982~1988

(42.5) (5.9) SSE=98.75

显然以上三种估计结果都不可靠(回归参数符号不对)。原因是啤酒税之外还有许多因素影响交通事故死亡人数。

个体固定效应估计结果(散点图见图1)

number it = 2.375 +… - 0.66 beertax it

(24.5) (-3.5) SSE=10.35 双固定效应估计结果(散点图见图1)

number it = 2.37 +… - 0.65 beertax it

(23.3) (-3.25) SSE=9.92

以上两种回归系数的估计结果非常近似。下面的F 检验证实参数-0.66和0.65比较合理。

用F 检验判断应该建立混合模型还是个体固定效应模型。

H 0:αi =α。混合回归模型(约束截距项为同一参数)。

H 1:αi 各不相同。个体固定效应回归模型(截距项任意取值)

F =

(SSE SSE

u r

-SSE u ) /(N ) /(NT -N -2)

(以EViwes5.0计算自由度)

1. 840. 0362

=

(98. 75-10. 35) /4810. 35/(336-50)

== 50.8

F 0.05(48, 286) = 1.2

因为F = 50.8 > F0.05(14, 89) = 1.2,推翻原假设,比较上述两种模型,建立个体固定效应回归

模型更合理。

下面讨论面板差分数据的估计结果。利用1988年和1982年数据的差分数据得估计结果(散点图见图3)

number 1988 -number 1982 = -0.072 - 1.04 (beertax 1988 - beertax1982)

(0.065) (0.36)

图20 差分数据散点图(File:5panel01a- graph08)

6.面板数据的单位根检验 下面介绍11种检验方法。

6.1 LLC (Levin-Lin-Chu ,2002)检验(适用于相同根(common root)情形) LLC 检验原理是仍采用ADF 检验式形式。但使用的却是∆y it 和y it 的剔出自相关和确定项影响的、标准的代理变量。具体做法是(1)先从∆ y it 和y it 中剔出自相关和确定项的影响,并使其标准化,成为代理变量。(2)用代理变量做ADF 回归,εˆij =ρε ij + v it 。LLC 修正的t (ρˆ) 渐近服从N(0,1)分布。

详细步骤如下:

H 0: ρ = 0(有单位根); H 1: ρ

∆ yit = ρ yi t-1 +∑γi j ∆ y i t-j + Z it ' φ + εit , i = 1, 2, …, N ; t = 1, 2, …, T (38)

j =1k i

*

*

其中Z it 表示外生变量(确定性变量)列向量,φ 表示回归系数列向量。

(1)估计代理变量。首先确定附加项个数k i ,然后作如下两个回归式,

∆ yit =

∑γˆ∆ y i t-j + Z it ' φˆ+εˆ

i j

i t

k i

j =1

y i t-1 = 移项得

~

∑γ~∆ y i t-j + Z it ' φ +ε

i j

k i

it -1

j =1

ˆi j ∆ y i t-j - Z it ' φˆ εˆi t = ∆ yit -∑γ

j =1k i

k i

it -1

~∆ y - Z ' φ = yit -∑γi t-j it i j

j =1

~标准化, 把εˆi t 和εit -1

*

εˆij = εˆi t /si *~/s ε ij = εi it -1

其中s i , i = 1, 2, …, N 是用(38)式对每个个体回归时得到的残差的标准差,从而得到∆ yit

**

和y it -1的代理变量εˆij 和ε ij 。

**

(2)用代理变量εˆij 和ε ij 作如下回归,

**

εˆij =ρε ij + v it

ˆ的如下修正的t ρLLC 证明,上式中估计量ρˆ统计量渐近地服从标准正态分布。

~

t ρˆ

~

=

~

ˆ) μm T ˆ2s (ρ~*t ρˆ-(N T ) S N σ

~*σm T

→ N (0, 1)

~

⎛⎝

⎫⎭

其中t ρˆ表示标准的t 统计量;N 是截面容量;T =T - ∑k i /N ⎪-1,(T 为个体容量);S N 是

i

ˆ) 是ρˆ标准ˆ2是误差项v it 的方差;s (ρ每个个体长期标准差与新息标准差之比的平均数;σ

误差;μm T ~和σm T ~分别是均值和标准差的调整项。

见图21输出结果,LLC = 9.7 > -1.65,所以存在单位根。

图21 LLC 检验的EV iews 5.0输出结果(部分)

EViews 5.0操作步骤:在面板数据窗口点击View 选Unit Root Test功能。在T est Type中选Common root –Levin, Lin, Chu。

6.5 Breitung 检验(2002)(适用于相同根(common root)情形)

Breitung 检验法与LLC 检验法类似。先从∆y it 和y it 中剔出动态项∆y it -j ,然后标准化,

~* + v 。检验单位根。 再退势,最后用ADF 回归εˆi t *=ρεit it -1

用每个个体建立的单位根检验式的误差项之间若存在同期相关,上述面板数据的单位根检验方法都不再适用。主要是统计量的分布发生变化,检验功效降低。为此提出一些个体同期相关面板数据的单位根检验方法。

6.2 Hadri 检验(适用于相同根(common root)情形)

Hadri 检验与KPSS 检验相类似。原假设是面板中的所有序列都不含有单位根。计算步骤是用原面板数据的退势序列(残差)建立LM 统计量。

退势回归是

y it = α1 +α2 t + uit

ˆit 计算如下LM 统计量, 利用上式中的残差u

LM =

1⎡N ⎡22⎤

S (t ) T ∑∑i ⎢⎢⎥

N ⎣i =1⎣t ⎦⎤

f 0⎥⎦

(39)

其中S i (t ) =

ˆ是残差累积函数,f 是频率为零时的残差谱密度。 ∑u

it

t

s =1

Hadri 给出,在一般假定条件下

Z =

N (LM -a )

b

→N (0, 1) (40)

其中a=1/6,b=1/45,LM 由(39)式计算。

Hadri 检验的原假设是没有单位根。以案例1为例,图22给出检验结果。EViews 给出假定同方差和克服异方差两种情形下的Z 统计量。因为Z 渐近服从正态分布,Z = 7.5和7.6落在拒绝域,结论是存在共同单位根。

图22 Hadri 检验的EV iews 5.0输出结果(部分)

EViews 5.0操作步骤:在面板数据窗口点击View 选Unit Root Test功能。在T est Type中选Common root – Hadri。

下面介绍适用于不同根(individual unit root)情形的面板数据单位根检验方法 6.8 IPS (Im-Pesaran-Shin )检验(1997,2002)

IPS 检验克服了LL 检验的缺陷,允许面板中不同个体(序列)的ρi 不同。IPS 检验式是

k i

∆ y it = ρi y i t-1 +∑γi j ∆ y i t-j + X it ' α + εit , i = 1, 2, …, N ; t = 1, 2, …, T , εit ~IID(0,σ2)

j =1

(43)

H 0: ρi = 0, i = 1, 2, …, N ; (存在单位根)

⎧ρi =0, H 1: ⎨

⎩ρi

i =1,..., n 1 i =n 1+1, n 1+2,..., N

1N

N

利用(41)式对N 个个体估计N 个ρi 及相应的t ρˆ。计算平均值(ρˆ) =造面板IPS 检验用统计量Z =

Z ∑t ρ。再用ρ构

(ˆ)

(ˆ)

i =1

[(ρˆ) -E ((ρˆ) )]((ρˆ) ) /N

渐近服从N(0,1)分布。临界值与N 、T 以及检验式中是否含有确定项有关系。IPS

检验为左单端检验。

图23 IPS 检验的EV iews 5.0输出结果

EViews 5.0操作步骤:在面板数据窗口点击V iew 选Unit Root Test功能。在Test Type中选Individual root – Im, Pesaran。

6.10 崔仁(In Choi)检验(2001),又称Fisher -ADF 检验。

崔仁(2001)提出了两种组合p i 值检验统计量。这两种检验方法都是从Fisher 原理出发,首先对每个个体进行ADF 检验,用ADF 统计量所对应的概率p i 的和构造ADF-Fisher

χ2和ADF-Choi Z 统计量。原假设H 0是存在单位根。在原假设成立条件下,

ADF-Fisher χ = -2∑log(p i ) →χ2(2N )

i =1

2

N

ADF-Choi Z =

1N

N

∑Φ

i =1

-1

(p i )

→N (0, 1)

其中Φ-1(·) 表示标准正态分布累计函数的倒数。

如果概率p i 是通过PP 检验计算出来的,还可以得到PP-Fisher χ2,PP-Choi Z 两个统计量。EViews 5.0对这4个统计量都有报告。因为这4个统计量计算的都是每个个体单位

根检验尾部概率的和,所以如果这个值很小,应该落在Fisher χ2和Choi Z 统计量的拒绝域,如果这个值很大,则落在Fisher χ2和Choi Z 统计量的接受域。

图24 ADF-Fisher ,ADF-Choi 检验的EV iews 5.0输出结果(部分)

图25 PP-Fisher ,PP-Choi 检验的EViews 5.0输出结果(部分)

7.我们的研究成果

详细内容请见张晓峒、白仲林的论文“退势单位根检验小样本性质的比较”《数量经

济技术经济研究》2005第5期,40-49页和白仲林的博士学位论文。

张晓峒、白仲林(2005)给出四种退势方法(OLS 退势、GLS 退势、KGLS 退势、ROLS 退势)与五种单位根检验(DF 检验、ADF 检验、RMA 检验、WS 检验、MAX 检验)相结合的20种单位根检验功效比较。结论是:(1)用退势方法检验单位根比不用退势方法检验单位根的功效都有一定程度的提高;(2)递归退势RMA (递归均值调整)单位根检验(RMA-ROLS )的功效最高;广义最小二乘退势DF (GLS-DF )单位根检验的功效次之;其他检验方法再次之。(3)各种退势方法均不能有效地提高T ( ˆ-1) 统计量的检验功效。

2006年底将有一部面板数据专著出版。

我们承担的国家自然科学基金项目将从三个方面进行深入研究。(1)面板数据的协积研究;(2)季节面板数据的特征研究;(3)含有结构突变的面板数据单位根检验。

8.面板数据最新研究领域 8.1 动态面板数据模型 8.2 非平衡面板数据模型 8.3 离散因变量面板数据模型

8.4 非平稳面板数据模型(动态面板数据模型、非均衡面板数据模型、离散面板数据模型、面板数据非平稳性、面板数据的协积)


相关文章

  • 格兰杰因果关系检验在面板数据上的应用研究
  • 第38卷第2期20104福州大学学报(自然科学版) JournalofFuzhouUniversity(NaturalScience) Vol.38No.2Apr.2010 文章编号:1000-2243(2010)02-0183-05 格兰 ...查看


  • 面板数据比较好
  • 随机效应与固定效应 方差分析主要有三种模型:即固定效应模型(fixed effects model),随机效应模型(random effects model),混合效应模型(mixed effects model). 所谓的固定.随机.混合 ...查看


  • 第9章 面板数据模型理论
  • 5.2 面板数据模型理论 5.2.1 面板数据模型及类型. 面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data).面板数据是同时在时间和 ...查看


  • 高级计量经济学教学计划
  • 教学计划 高级计量经济学II 2009 春季 本课程的目的是培养学生进行独立研究的能力.除了宏观经济学与微观经济学的知识,我们假定学生有比较坚实的微积分.线性代数.概率论.数理统计的基础.学生阅读英文教材以及英文文献的能力是必不可少的.编程 ...查看


  • 动态面板数据分析步骤详解
  • 动态面板数据分析算法 1. 面板数据简介 面板数据(Panel Data, Longitudinal Data ),也称为时间序列截面数据.混合数据,是指同一截面单元数据集上以不同时间段的重复观测值,是同时具有时间和截面空间两个维度的数据集 ...查看


  • 空间统计及计量方法学习笔记
  • 空间统计及计量方法学习笔记 1. 背景及文献综述 ....................................................... 2 2. 空间效应 ............................. ...查看


  • 第二讲 面板数据回归模型
  • 第二讲 面板数据回归模型 2.1面板数据回归模型的一般形式 面板数据模型的一般形式如下: yit=∑βkixkit+uit (2.1) k=1 K 其中,i=1,2,3,",N,表示N个个体:t=1,2,3,",T,表示 ...查看


  • 面板数据分析方法总结
  • 面板数据分析方法总结 这是我在查阅各种资料后得出的关于面板数据的总结,最近在做面板的实证论文,所以需要这个,欢迎大家继续扩充,只要是关于面板的都行,关于具体如何在Eviews6中实现的更好,不甚感激. ---------- *横截面的异方差 ...查看


  • 用Eviews6处理面板数据
  • Eviews6.0面板数据操作 1. 数据输入 1.1创建工作文档 如下图操作,在" workfile create "文本框的"workfile structure type "选择"ba ...查看


热门内容