高级计量经济学复习精要

高级计量经济学复习精要

一、简答题(10分×2):

(一)多重共线性问题:(主要看修正方法)

1、多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。

2、产生原因主要有3各方面:(1)经济变量相关的共同趋势;(2)滞后变量的引入;(3)样本资料的限制。

3、造成的后果:(1)完全共线性下参数估计量不存在;(2)近似共线性下OLS 估计量非有效;(3)参数估计量经济含义不合理;(4)变量的显著性检验失去意义;(5)模型的预测功能失效。

2

4、识别方法:(1)经验识别:对模型估计后,R 极高,多个变量不显著,出现与理论预期相悖的情况,有理由怀疑存在多重共线性。(2)相关系数法:计算变量间两两相关系数。只要其中一个大等于0.6或0.7,则表明可能存在严重的共线性。(3)膨胀因子法:计算每个解释变量的VIF ,若某一个VIF ≥10, 则表明存在严重的共线性。

5、修正方法:(※※※)根据潘老师讲课内容进行整理

共线性的修正方法有很多,按照优劣程度排序,主要有五种方法:

方法1:扩充样本以减弱共线性。主要通过增加自由度来提高精度,如将时序数据或截面数据变为面板数据,从而将一维数据变为二维。

评价:这种方法最理想,但存在的缺点是:①效果不定;②不可行。 方法2:工具变量法(IV )。主要通过工具变量,运用两阶段最小二乘完成。

评价:这种方法目前最受欢迎,高质量的期刊论文通常都采用该方法。缺点是:①由于相关关系具有传导性,工具变量S 很难找;②用S 替代X ,有时经济正当性不足。

方法3:变量变换法。可以通过对数变换、绝对转相对和方程变换进行变量变换。 评价:这种方法最简单易行,但存在的缺点是:①简单相关系数描述的是线性关系,而对数是非线性化过程;②功效不足;③不是所有变量都能用来做变换,必须有明确的经济学指代。

方法4:逐步回归法。主要是通过降维减少变量来减弱共线性。

评价:这种方法要慎用,最大的缺点是:虽然能很好地解决共线性问题,但是却引发了更严重的内生性问题。

方法5:主成份分析法或因子分析法。具有降维的作用,主要用于多指标评价。

评价:该方法很好地消除了共线性。但这种方法要慎用,最大的缺点是:经济含义伤害过大。

(二)内生性问题

1、内生性是指:模型中的解释变量与扰动项相关。通常我们做古典假设①E(ε)=0,var (

εi 为白噪声,

εi )=σ2,cov(εi εj )=0;②X 是非随机变量(微观可以通过固定抽样得到

解决,宏观则不可),则cov (X, ε)=0成立。但是当cov (X, ε)≠0时上述假设便不再成立,我们称之为内生性,进而导致OLS 失效,是非一致性的。

2、内生性产生的原因:①X 与Y 存在双向因果,即X 影响Y 的同时,Y 也影响X ;如金融发展与经济增长;外商直接投资FDI 与经济增长;犯罪率与警备投入。②模型遗漏重要解释变量。无论是缺失重要解释变量导致,还是无法获取数据导致,被遗漏的重要变量进

入了残差项,如果与其他解释变量相关,就会出现cov(Ut ,X t )≠0,也就是内生性问题。③度量误差:由于关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。(潘老师上课没讲③)

3、解决方法:

针对双向因果产生的内生性问题,比较容易解决,通过联立方程组即可。 难处理的是遗漏重要解释变量的情况,通常采用的方法有: ①工具变量法(IV ):就是找到一个变量和内生化变量相关,但是和残差项不相关。通常采用2SLS 方法进行回归。这种方法是找到影响内生变量的外生变量,连同其他已有的外生变量一起回归,得到内生变量的估计值,以此作为IV ,放到原来的回归方程中进行回归。

(假如我们考察一个工资决定模型salary =β0+β1educ +β2abli +u i

ˆi 首先,用Probit 模型估计p (work ) =f (educ , abli ) ,得到p ˆi +v i 进行估计) 其次,构建模型salary =β0+β1educ +β2abli +δp

②得分匹配与DID 模型(双差分模型):思想是按照一定的标准,找到与样本match 的控制组。在假设外在冲击同时影响两个组别的情况下,做差来剔除掉外界冲击的影响。

第一步,该方法关键在于得分匹配的确定,配对样本的选择原则是保证两个样本随时间自然变化的部分是相同的,一般根据距离最近作为配对的样本点的方法进行匹配得分。

第二步是估计方法,采用双重差分法(DID )。在假设外在冲击同时影响两个组别的情况下,做差来剔除掉外界冲击的影响。

(在样本选择上,控制不可观测变量,然后利用双差分模型进行估计 Eg :salary =β0+β1educ +β2abli +u i

(1)样本抽取时,将ablity 相等或相近的观测值进行配对(匹配标准IQ/双胞胎) (2)用双差分模型(DID )进行参数估计

ln(salary 得分组-salary 对照组)=α0+α1ln(educ 得分组-educ 对照组)+v i

ˆ 不足:样本要求非常大,尤其是用多重标准进行匹ˆ1,等价于原模型中的β估计出α1

配时,样本要求更大。) 潘老师举得例子

二、虚拟变量:(20分)(给出实际经济问题,根据目标设计虚拟变量,写出模

型。考察一种群体异质。完整考察如何设计,如何运用到模型中。)

注意事项:1、模型设计时一定要有截距项,虚拟变量引入原则一定要满足m-1原则。m 为互斥类型的定性因素。2、要掌握虚拟变量引入模型的三种方法,即加法模型、乘法模型和既加又乘模型。

1、举例说明如何引进加法模式和乘法模式建立虚拟变量模型。

答案:设Y 为个人消费支出;X 表示可支配收入,定义

如果设定模型为

此时模型仅影响截距项,差异表现为截距项的和,因此也称为加法模型。 如果设定模型为

此时模型不仅影响截距项,而且还影响斜率项。差异表现为截距和斜率的双重变化,因此也称为乘法模型。

2、考虑下面的模型:

其中,Y 表示大

学教师的年薪收入,X 表示工龄。为了研究大学教师的年薪是否受到性别(男、女)、学历(本科、硕士、博士)的影响。按照下面的方式引入虚拟变量:

3、考虑下面的模型:

其中,Y 表示大学教

师的年薪收入,X 表示工龄。为了研究大学教师的年薪是否受到性别、学历的影响。按照下面的方式引入虚拟变量:(10分)

1. 基准类是什么?

2. 解释各系数所代表的含义,并预期各系数的符号。 3. 若B4>B3,你得出什么结论? 答案:1. 基准类是本科学历的女教师。

2. B0表示刚参加工作的本科学历女教师的收入,所以B0的符号为正。

B1表示在其他条件不变时,工龄变化一个单位所引起的收入的变化,所以

B1的符号为正。

B2表示男教师与女教师的工资差异,所以B2的符号为正。

B3表示硕士学历与本科学历对工资收入的影响,所以B3的符号为正。 B4表示博士学历与本科学历对工资收入的影响,所以B4的符号为正。 3. 若B4>B3,说明博士学历的大学教师比硕士学历的大学教师收入要高。

4、性别因素可能对年薪和工龄之间的关系产生影响。试问这种影响可能有几种形式,并设定出相应的计量经济模型。

性别因素可能对年薪和工龄之间的关系的影响有三种方式。 第一种,性别只影响职工的初始年薪,设定模型为:

5、考虑下面的模型:

其中,Y ——MBA 毕业生收入,X ——工龄。所有毕业生均来自清华大学,东北财经大学,

沈阳工业大学。

(1) 基准类是什么?

基准类是东北财经大学MBA 毕业生。

你预期各系数的符号如何?

预期B1的符号为正;B2的符号为正;B3的符号为负。

(2) 如何解释截距B2 B3? 截距B2反应了清华大学MBA 毕业生相对于东北财

经大学MBA 毕业生收入的差别;截距B3反应了沈阳工业大学MBA 毕业生相对于东北财经大学MBA 毕业生收入的差别。)

(3) 若B2>B3,你得出什么结论?

(4) 如果B2>B3,我们可以判断清华大学MBA 毕业生的收入平均高于沈阳工业

大学MBA 毕业生的收入。

三、异方差问题(25分)

,如果出

,对于不同的样本点,随机扰动项的方差不再是常数,而且

互不相同,则认为出现了异方差。

1、异方差的三大后果:一是最小二乘估计不再是有效估计量;二是相关参数的t 检验、模型F 检验失效;三是估计量的方差是有偏的,参数或因变量预测的置信区间的估计精度下降(甚至这种区间估计是失效的)。

2、异方差的检验识别:

White 检验的具体步骤如下。以二元回归模型为例,

y t = β0 +β1 x t 1 +β2 x t 2 + u t (1)

ˆt 。 ①首先对上式进行OLS 回归,求残差u

②做如下辅助回归式,(包括截距项、一次项、平方项、交叉项)

ˆt 2= α0 +α1 x t 1 +α2 x t 2 + α3 x t 12 +α4 x t 22 + α5 x t 1 x t 2 + v t (2) u

ˆt 2对原回归式(1)中的各解释变量、解释变量的平方项、交叉积项进行OLS 回归。即用u

求辅助回归式(2)的可决系数R 2。

③White 检验的零假设和备择假设是 H 0: (1)式中的u t 不存在异方差, H 1: (1) 式中的u t 存在异方差

④在不存在异方差假设条件下构造LM 统计量或F 统计量 LM=n R 2 ~ χ 2(5)

R 2/5

或 F=

___ ~F(5,n-6)

(1-R 2) /(n -6)

其中n 表示样本容量,R 2是辅助回归式(2)的OLS 估计式的可决系数。自由度5表示辅助回归式(2)中解释变量项数(注意,不计算常数项),n-6是样本量减参数个数(因此可以扩展到K 个解释变量的情形)。nR 2属于LM 统计量。

⑤判别规则是

若 n R 2 ≤ χ2α (5), 接受H 0 (u t 具有同方差) 若 nR 2 > χ2α (5), 拒绝H 0 (u t 具有异方差)

或F ≤ Fα(5,n-6),接受H 0 (u t 具有同方差)反之拒绝 3、 异方差的消除(WLS :加权最小二乘估计)

ˆt |为权关键在于权重的选择,我们考的是采用残差作为权重,即采用(1)式中估计的1/|u

重,将残差的绝对值除(1)式的左右两边,然后对转换后的(1)式进行OLS 。

1、什么是异方差性? 举例说明经济现象中的异方差性。 1) 模型

,如果出现

,对于不同的样本点,随机扰动项的方差不再是常数,而且

互不相同,则认为出现了异方差。 2)在现实经济中,异方差性经常出现,尤其是采用截面数据作样本的计量经济学问题。例如:工业企业的研究与发展费用支出同企业的销售和利润之间关系的函数模型;服装需求量与季节、收入之间关系的函数模型;个人储蓄与个人可支配收入之间关系的函数模型等。检验异方差的主要思路就是检验随机扰动项的方差与解释变量观察值的某种函数形式之间是否存在相关性。

2、下面是一个回归模型的检验结果。

White Heteroskedasticity Test:

F-statistic Obs*R-squared

Test Equation:

Dependent Variable: RESID^2 Method: Least Squares Date: 05/31/06 Time: 10:54 Sample: 1 18

Included observations: 18

Variable

C X1 X1^2 X1*X2 X2 X2^2

R-squared

0.000022 0.006788

t-Statistic 0.261494 1.253239 -3.427009 2.415467 -1.514698 -0.793752

Prob. 0.7981 0.2340 0.0050 0.0326 0.1557 0.4428 6167356.

19.41659 Probability 16.01986 Probability

Coefficient

693735.7 135.0044 -0.002708 0.050110 -1965.712 -0.116387

Std. Error 2652973. 107.7244 0.000790 0.020745 1297.758 0.146629

0.889992 Mean dependent var

Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

1)写出原回归模型?

0.844155 S.D. dependent var 5148181. Akaike info criterion 3.18E+14 Schwarz criterion -300.0665 F-statistic 2.127414 Prob(F-statistic)

13040908 34.00739 34.30418 19.41659 0.000022

2)检验结果说明什么问题?

异方差问题。 3)如何修正?

加权最小二乘法,做变量变换。 3、试述异方差的后果及其补救措施。

答案:后果:OLS 估计量是线性无偏的,不是有效的,估计量方差的估计有偏。建立 在t 分布和F 分布之上的置信区间和假设检验是不可靠的。 补救措施:加权最小二乘法(WLS )

1.假设已知,则对模型进行如下变换:

2

.如果

未知

成比例:平方根变换。

(1)误差与

可见,此时模型同方差,从而可以利用OLS 估计和假设检验。 (2) 误差方差和

成比例。即

3. 重新设定模型:

若在模型:计参数

中存在下列形式的异方差:,你如何估

由于,所以式(2)所表示的模型不再存在异方差问

的估计值。

题,故可利用普通最小二乘法对其进行估计,求得参数

四、面板数据问题(20分)

1. 模型形式的选择(混合模型、变截距模型及变系数模型的选择问题):F 检验 混合模型形式:针对不同截面个体和时点,截距项相等和斜率项也相等

(1)

变截距模型:不同截面个体的截距项不同,但斜率项相同

(2)

变系数模型:所有参数在不同截面个体间不一样

(3)

所以F 检验的目的在于对截距参数和斜率参数进行检验 假设:

H1: b1=b2=…=bN

H2: a1=a2=…=aN; b1=b2=…=bN

如果接受H2,则应该选择混合模型,如果拒绝H2, 然后检验H1,若接受H1, 则选择变截距模型,否则选择变系数模型。 F 检验的基本思想:

记变系数模型(6)的残差平方和S1,变截距模型的残差平方和为S2,混合模型的残差平

方和为S3。

在H2下检验统计量F 2服从相应自由度下的F 分布,即

如果F 2的值小于给定显著性水平下的临界值F ∂((N-1((k+1),N(T-K-1)),(K 为解释变量的个数)。则接受H2,即选择混合模型;若大于临界值,则继续检验H1. 在H1下检验统计量F 1也服从相应自由度下F 分布,即

若F 1的值小于给定显著性水平下的临界值F ∂((N-1)k,N(T-K-1)),则接受H1,应建立变截距模型,否则建立变系数模型。

[以下不需要记,仅供大家理解,公式看着复杂,其实理解F 检验的思想就好记了(方便大家记忆,给出个人对F 检验的理解):F 检验是在给定约束条件下(即原假设),比较两个模型的好坏,判断好坏的一个标准就是看哪个模型的残差平方和较小(很显然模型拟合的结果显示残差平方和最小,表明解释变量量越能解释因变量的变异程度)就选该模型(要小到如何程度或大到如何程度呢,所以需要在给定一个显著性水平下的临界值比较),但不同模型的自由度不一样,所以应该比较平均残差平方和(术语叫做均方误),用含约束的模型的残差平方和原模型(即不含约束或假设的模型)的残差平方差和之差再除以自由度之差即分子,分母就是原模型的均方误(记不住自由度,可以投机取巧:如分子的自由度表示为q r -q ur , 分别注明为约束方程残差平方和的自由度与不存在约束的方程的残差平方和的自由度(注意指出哪个是约束方程哪个不是约束方程),分母自由度为q ur )]。

1、 变截距模型中固定效应(FE :fixed effect )和随机效应(RE: random effect )的检

验:Hausman 检验(豪斯曼检验) 首先将变截距模型变形为:

[如下不需要记:方便大家理解,个人总结理解(理解这些,hausman 检验的假设就不需要记):变形的目的在于将截距项分成不随截面个体变化的共同截距成分和随不同截面个体变化的部分,这就是变截距模型的实质,如果分离出的随截面个体变化的截距成分与样本有关,

即与X 有关,则这些因素是由样本或自变量决定的,是可由样本控制或可观测或可确定(为什么称为“固定效应”呢?原因就在于此,该效应在给定样本下是确定的)的成分,如果是不能由样本决定则其是不受控制或不可观测的成分,即由其他样本之外的随机因素决定,则该成分与样本是无关的],这就构成了如下Hausman 检验的假设条件: H 0:cov(xit ,v i )=0 (RE) H 1: cov(xit ,v i ) ≠0(FE) Hausman 检验统计量为:

b GLS 为随机效应模型的参数估计。其中b cv 为固定效应模型的离差变换OLS 参数估计,

在原假设成立下,W 服从自由度为K (解释变量的个数)的卡方分布,所以在给定显著性水平下与临界值X (进行比较,若大于卡方临界值则拒绝H1,应该建立固定效应模型,∂K )反之则建立随机效应模型。

[不需要记忆,仅供大家理解,理解Hausman 检验的思想:如果截距项与解释变量是不相关的,实际上这种随机成分可以归入误差项,则采用两种估计参数的方法得到的估计量均还是一致估计量,因为残差项与解释变量不相关,所以两种估计方法的参数估计之差应该是很小的,若H0不成立,即截距项与解释变量相关,则GLS 将不是一致估计,则参数之差应比较

2

^^

大。]

2、 FE 和RE 的参数估计方法(离差变换OLS 估计和FGLS 估计) (1) FE 的参数估计:离差变换OLS

即分别对因变量和各解释变量取平均值,并对原模型进行离差转换,此时无截距项,如下: 变换的方程为y it -y =(X it -X i )

-

-

/

β+(u it -u i )

-

然后采用OLS 对该方程进行估计。

(2) RE 效应模型的FGLS 估计大家看伍德里奇书上第468-469页

11

12

13

14

五、给定经济现象,请选择解释变量,设定模型。(15分)

主要考点:①被解释变量 ②解释变量有哪些 ③ 为什么引入这些变量 ④解释变量如何度量?(虚拟 or 数值)⑤写出具体的模型形式。⑥判断经济显著性,即预期符号。

举例子:博学楼6:00-9:00自习室上座率。 1、变量选取和数据获得 被解释变量:

y ——博学楼6:00-9:00自习室上座率

y=上自习人数/座位数*100% 调查取得;

X1——在校研究生人数(博士+硕士)

X1=在校博士生人数+在校硕士生人数

选取理由:因为博学楼主要是研究生的学习场所 根据入学注册人数-毕业人数-辍学人数; X2——居住地离博学楼距离

选取理由:在校研究生分为住校和不住校,原则上居住地离学校过远,则一般情况

不会选择来博学楼上自习

X2=具体里程数 调查取得; D1——是否假期

选取理由:与学期相比,假期在校的学生人数明显减少; 正常学期 寒暑假 根据学校校历

D2——是否临近考试

选取理由:临近考试,自习室上座率会增加

15

每学期16周-19周 其他 根据学校校历 2、 模型构建 构建模型如下:

Y=β0+β1X 1+β2X 2+β3D 1+β4D 2+(β5D 1+β6D 2) X 1+(β5D 1+β6D 2) X 2+μi

3、 判断经济显著性,即预期符号:

X1: 预期符号为正,理论上在校研究生人数越多,上座率越高; X2: 预期符号为负,理论上居住地离博学楼距离越远,上座率越低; D1: 预期符号为正,理论上正常学期与假期相比,上座率高; D2: 预期符号为正,理论上越是临近考试,上座率越高。

(差不多应该这种形式)

根据下面例子练习一下:

试指出在目前建立中国宏观计量经济模型时,下列内生变量应由哪些变量来解释,简单说明理由,并拟定关于每个解释变量的待估参数的正负号。

⑴ 轻工业增加值 ⑵ 衣着类商品价格指数 ⑶农业生产资料进口额 答: ⑴ 轻工业增加值应该由反映需求的变量解释。包括居民收入(反映居民对轻工业的消费需求,参数符号为正)、国际市场轻工业品交易总额(反映国际市场对轻工业的需求,参数符号为正)等。

⑵ 衣着类商品价格指数应该由反映需求和反映成本的两类变量解释。主要包括居民收入(反映居民对衣着类商品的消费需求,参数符号为正)、国际市场衣着类商品交易总额(反映国际市场对衣着类商品的需求,参数符号为正)、棉花的收购价格指数(反映成本对价格

的影响,参数符号为正)等。

⑶ 农业生产资料进口额应该由国内第一产业增加值(反映国内需求,参数符号为正)、国内农业生产资料生产部门增加值(反映国内供给,参数符号为负)、国际市场价格(参数

符号为负)、出口额(反映外汇支付能力,参数符号为正)等变量解释。

16

高级计量经济学复习精要

一、简答题(10分×2):

(一)多重共线性问题:(主要看修正方法)

1、多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。

2、产生原因主要有3各方面:(1)经济变量相关的共同趋势;(2)滞后变量的引入;(3)样本资料的限制。

3、造成的后果:(1)完全共线性下参数估计量不存在;(2)近似共线性下OLS 估计量非有效;(3)参数估计量经济含义不合理;(4)变量的显著性检验失去意义;(5)模型的预测功能失效。

2

4、识别方法:(1)经验识别:对模型估计后,R 极高,多个变量不显著,出现与理论预期相悖的情况,有理由怀疑存在多重共线性。(2)相关系数法:计算变量间两两相关系数。只要其中一个大等于0.6或0.7,则表明可能存在严重的共线性。(3)膨胀因子法:计算每个解释变量的VIF ,若某一个VIF ≥10, 则表明存在严重的共线性。

5、修正方法:(※※※)根据潘老师讲课内容进行整理

共线性的修正方法有很多,按照优劣程度排序,主要有五种方法:

方法1:扩充样本以减弱共线性。主要通过增加自由度来提高精度,如将时序数据或截面数据变为面板数据,从而将一维数据变为二维。

评价:这种方法最理想,但存在的缺点是:①效果不定;②不可行。 方法2:工具变量法(IV )。主要通过工具变量,运用两阶段最小二乘完成。

评价:这种方法目前最受欢迎,高质量的期刊论文通常都采用该方法。缺点是:①由于相关关系具有传导性,工具变量S 很难找;②用S 替代X ,有时经济正当性不足。

方法3:变量变换法。可以通过对数变换、绝对转相对和方程变换进行变量变换。 评价:这种方法最简单易行,但存在的缺点是:①简单相关系数描述的是线性关系,而对数是非线性化过程;②功效不足;③不是所有变量都能用来做变换,必须有明确的经济学指代。

方法4:逐步回归法。主要是通过降维减少变量来减弱共线性。

评价:这种方法要慎用,最大的缺点是:虽然能很好地解决共线性问题,但是却引发了更严重的内生性问题。

方法5:主成份分析法或因子分析法。具有降维的作用,主要用于多指标评价。

评价:该方法很好地消除了共线性。但这种方法要慎用,最大的缺点是:经济含义伤害过大。

(二)内生性问题

1、内生性是指:模型中的解释变量与扰动项相关。通常我们做古典假设①E(ε)=0,var (

εi 为白噪声,

εi )=σ2,cov(εi εj )=0;②X 是非随机变量(微观可以通过固定抽样得到

解决,宏观则不可),则cov (X, ε)=0成立。但是当cov (X, ε)≠0时上述假设便不再成立,我们称之为内生性,进而导致OLS 失效,是非一致性的。

2、内生性产生的原因:①X 与Y 存在双向因果,即X 影响Y 的同时,Y 也影响X ;如金融发展与经济增长;外商直接投资FDI 与经济增长;犯罪率与警备投入。②模型遗漏重要解释变量。无论是缺失重要解释变量导致,还是无法获取数据导致,被遗漏的重要变量进

入了残差项,如果与其他解释变量相关,就会出现cov(Ut ,X t )≠0,也就是内生性问题。③度量误差:由于关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。(潘老师上课没讲③)

3、解决方法:

针对双向因果产生的内生性问题,比较容易解决,通过联立方程组即可。 难处理的是遗漏重要解释变量的情况,通常采用的方法有: ①工具变量法(IV ):就是找到一个变量和内生化变量相关,但是和残差项不相关。通常采用2SLS 方法进行回归。这种方法是找到影响内生变量的外生变量,连同其他已有的外生变量一起回归,得到内生变量的估计值,以此作为IV ,放到原来的回归方程中进行回归。

(假如我们考察一个工资决定模型salary =β0+β1educ +β2abli +u i

ˆi 首先,用Probit 模型估计p (work ) =f (educ , abli ) ,得到p ˆi +v i 进行估计) 其次,构建模型salary =β0+β1educ +β2abli +δp

②得分匹配与DID 模型(双差分模型):思想是按照一定的标准,找到与样本match 的控制组。在假设外在冲击同时影响两个组别的情况下,做差来剔除掉外界冲击的影响。

第一步,该方法关键在于得分匹配的确定,配对样本的选择原则是保证两个样本随时间自然变化的部分是相同的,一般根据距离最近作为配对的样本点的方法进行匹配得分。

第二步是估计方法,采用双重差分法(DID )。在假设外在冲击同时影响两个组别的情况下,做差来剔除掉外界冲击的影响。

(在样本选择上,控制不可观测变量,然后利用双差分模型进行估计 Eg :salary =β0+β1educ +β2abli +u i

(1)样本抽取时,将ablity 相等或相近的观测值进行配对(匹配标准IQ/双胞胎) (2)用双差分模型(DID )进行参数估计

ln(salary 得分组-salary 对照组)=α0+α1ln(educ 得分组-educ 对照组)+v i

ˆ 不足:样本要求非常大,尤其是用多重标准进行匹ˆ1,等价于原模型中的β估计出α1

配时,样本要求更大。) 潘老师举得例子

二、虚拟变量:(20分)(给出实际经济问题,根据目标设计虚拟变量,写出模

型。考察一种群体异质。完整考察如何设计,如何运用到模型中。)

注意事项:1、模型设计时一定要有截距项,虚拟变量引入原则一定要满足m-1原则。m 为互斥类型的定性因素。2、要掌握虚拟变量引入模型的三种方法,即加法模型、乘法模型和既加又乘模型。

1、举例说明如何引进加法模式和乘法模式建立虚拟变量模型。

答案:设Y 为个人消费支出;X 表示可支配收入,定义

如果设定模型为

此时模型仅影响截距项,差异表现为截距项的和,因此也称为加法模型。 如果设定模型为

此时模型不仅影响截距项,而且还影响斜率项。差异表现为截距和斜率的双重变化,因此也称为乘法模型。

2、考虑下面的模型:

其中,Y 表示大

学教师的年薪收入,X 表示工龄。为了研究大学教师的年薪是否受到性别(男、女)、学历(本科、硕士、博士)的影响。按照下面的方式引入虚拟变量:

3、考虑下面的模型:

其中,Y 表示大学教

师的年薪收入,X 表示工龄。为了研究大学教师的年薪是否受到性别、学历的影响。按照下面的方式引入虚拟变量:(10分)

1. 基准类是什么?

2. 解释各系数所代表的含义,并预期各系数的符号。 3. 若B4>B3,你得出什么结论? 答案:1. 基准类是本科学历的女教师。

2. B0表示刚参加工作的本科学历女教师的收入,所以B0的符号为正。

B1表示在其他条件不变时,工龄变化一个单位所引起的收入的变化,所以

B1的符号为正。

B2表示男教师与女教师的工资差异,所以B2的符号为正。

B3表示硕士学历与本科学历对工资收入的影响,所以B3的符号为正。 B4表示博士学历与本科学历对工资收入的影响,所以B4的符号为正。 3. 若B4>B3,说明博士学历的大学教师比硕士学历的大学教师收入要高。

4、性别因素可能对年薪和工龄之间的关系产生影响。试问这种影响可能有几种形式,并设定出相应的计量经济模型。

性别因素可能对年薪和工龄之间的关系的影响有三种方式。 第一种,性别只影响职工的初始年薪,设定模型为:

5、考虑下面的模型:

其中,Y ——MBA 毕业生收入,X ——工龄。所有毕业生均来自清华大学,东北财经大学,

沈阳工业大学。

(1) 基准类是什么?

基准类是东北财经大学MBA 毕业生。

你预期各系数的符号如何?

预期B1的符号为正;B2的符号为正;B3的符号为负。

(2) 如何解释截距B2 B3? 截距B2反应了清华大学MBA 毕业生相对于东北财

经大学MBA 毕业生收入的差别;截距B3反应了沈阳工业大学MBA 毕业生相对于东北财经大学MBA 毕业生收入的差别。)

(3) 若B2>B3,你得出什么结论?

(4) 如果B2>B3,我们可以判断清华大学MBA 毕业生的收入平均高于沈阳工业

大学MBA 毕业生的收入。

三、异方差问题(25分)

,如果出

,对于不同的样本点,随机扰动项的方差不再是常数,而且

互不相同,则认为出现了异方差。

1、异方差的三大后果:一是最小二乘估计不再是有效估计量;二是相关参数的t 检验、模型F 检验失效;三是估计量的方差是有偏的,参数或因变量预测的置信区间的估计精度下降(甚至这种区间估计是失效的)。

2、异方差的检验识别:

White 检验的具体步骤如下。以二元回归模型为例,

y t = β0 +β1 x t 1 +β2 x t 2 + u t (1)

ˆt 。 ①首先对上式进行OLS 回归,求残差u

②做如下辅助回归式,(包括截距项、一次项、平方项、交叉项)

ˆt 2= α0 +α1 x t 1 +α2 x t 2 + α3 x t 12 +α4 x t 22 + α5 x t 1 x t 2 + v t (2) u

ˆt 2对原回归式(1)中的各解释变量、解释变量的平方项、交叉积项进行OLS 回归。即用u

求辅助回归式(2)的可决系数R 2。

③White 检验的零假设和备择假设是 H 0: (1)式中的u t 不存在异方差, H 1: (1) 式中的u t 存在异方差

④在不存在异方差假设条件下构造LM 统计量或F 统计量 LM=n R 2 ~ χ 2(5)

R 2/5

或 F=

___ ~F(5,n-6)

(1-R 2) /(n -6)

其中n 表示样本容量,R 2是辅助回归式(2)的OLS 估计式的可决系数。自由度5表示辅助回归式(2)中解释变量项数(注意,不计算常数项),n-6是样本量减参数个数(因此可以扩展到K 个解释变量的情形)。nR 2属于LM 统计量。

⑤判别规则是

若 n R 2 ≤ χ2α (5), 接受H 0 (u t 具有同方差) 若 nR 2 > χ2α (5), 拒绝H 0 (u t 具有异方差)

或F ≤ Fα(5,n-6),接受H 0 (u t 具有同方差)反之拒绝 3、 异方差的消除(WLS :加权最小二乘估计)

ˆt |为权关键在于权重的选择,我们考的是采用残差作为权重,即采用(1)式中估计的1/|u

重,将残差的绝对值除(1)式的左右两边,然后对转换后的(1)式进行OLS 。

1、什么是异方差性? 举例说明经济现象中的异方差性。 1) 模型

,如果出现

,对于不同的样本点,随机扰动项的方差不再是常数,而且

互不相同,则认为出现了异方差。 2)在现实经济中,异方差性经常出现,尤其是采用截面数据作样本的计量经济学问题。例如:工业企业的研究与发展费用支出同企业的销售和利润之间关系的函数模型;服装需求量与季节、收入之间关系的函数模型;个人储蓄与个人可支配收入之间关系的函数模型等。检验异方差的主要思路就是检验随机扰动项的方差与解释变量观察值的某种函数形式之间是否存在相关性。

2、下面是一个回归模型的检验结果。

White Heteroskedasticity Test:

F-statistic Obs*R-squared

Test Equation:

Dependent Variable: RESID^2 Method: Least Squares Date: 05/31/06 Time: 10:54 Sample: 1 18

Included observations: 18

Variable

C X1 X1^2 X1*X2 X2 X2^2

R-squared

0.000022 0.006788

t-Statistic 0.261494 1.253239 -3.427009 2.415467 -1.514698 -0.793752

Prob. 0.7981 0.2340 0.0050 0.0326 0.1557 0.4428 6167356.

19.41659 Probability 16.01986 Probability

Coefficient

693735.7 135.0044 -0.002708 0.050110 -1965.712 -0.116387

Std. Error 2652973. 107.7244 0.000790 0.020745 1297.758 0.146629

0.889992 Mean dependent var

Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

1)写出原回归模型?

0.844155 S.D. dependent var 5148181. Akaike info criterion 3.18E+14 Schwarz criterion -300.0665 F-statistic 2.127414 Prob(F-statistic)

13040908 34.00739 34.30418 19.41659 0.000022

2)检验结果说明什么问题?

异方差问题。 3)如何修正?

加权最小二乘法,做变量变换。 3、试述异方差的后果及其补救措施。

答案:后果:OLS 估计量是线性无偏的,不是有效的,估计量方差的估计有偏。建立 在t 分布和F 分布之上的置信区间和假设检验是不可靠的。 补救措施:加权最小二乘法(WLS )

1.假设已知,则对模型进行如下变换:

2

.如果

未知

成比例:平方根变换。

(1)误差与

可见,此时模型同方差,从而可以利用OLS 估计和假设检验。 (2) 误差方差和

成比例。即

3. 重新设定模型:

若在模型:计参数

中存在下列形式的异方差:,你如何估

由于,所以式(2)所表示的模型不再存在异方差问

的估计值。

题,故可利用普通最小二乘法对其进行估计,求得参数

四、面板数据问题(20分)

1. 模型形式的选择(混合模型、变截距模型及变系数模型的选择问题):F 检验 混合模型形式:针对不同截面个体和时点,截距项相等和斜率项也相等

(1)

变截距模型:不同截面个体的截距项不同,但斜率项相同

(2)

变系数模型:所有参数在不同截面个体间不一样

(3)

所以F 检验的目的在于对截距参数和斜率参数进行检验 假设:

H1: b1=b2=…=bN

H2: a1=a2=…=aN; b1=b2=…=bN

如果接受H2,则应该选择混合模型,如果拒绝H2, 然后检验H1,若接受H1, 则选择变截距模型,否则选择变系数模型。 F 检验的基本思想:

记变系数模型(6)的残差平方和S1,变截距模型的残差平方和为S2,混合模型的残差平

方和为S3。

在H2下检验统计量F 2服从相应自由度下的F 分布,即

如果F 2的值小于给定显著性水平下的临界值F ∂((N-1((k+1),N(T-K-1)),(K 为解释变量的个数)。则接受H2,即选择混合模型;若大于临界值,则继续检验H1. 在H1下检验统计量F 1也服从相应自由度下F 分布,即

若F 1的值小于给定显著性水平下的临界值F ∂((N-1)k,N(T-K-1)),则接受H1,应建立变截距模型,否则建立变系数模型。

[以下不需要记,仅供大家理解,公式看着复杂,其实理解F 检验的思想就好记了(方便大家记忆,给出个人对F 检验的理解):F 检验是在给定约束条件下(即原假设),比较两个模型的好坏,判断好坏的一个标准就是看哪个模型的残差平方和较小(很显然模型拟合的结果显示残差平方和最小,表明解释变量量越能解释因变量的变异程度)就选该模型(要小到如何程度或大到如何程度呢,所以需要在给定一个显著性水平下的临界值比较),但不同模型的自由度不一样,所以应该比较平均残差平方和(术语叫做均方误),用含约束的模型的残差平方和原模型(即不含约束或假设的模型)的残差平方差和之差再除以自由度之差即分子,分母就是原模型的均方误(记不住自由度,可以投机取巧:如分子的自由度表示为q r -q ur , 分别注明为约束方程残差平方和的自由度与不存在约束的方程的残差平方和的自由度(注意指出哪个是约束方程哪个不是约束方程),分母自由度为q ur )]。

1、 变截距模型中固定效应(FE :fixed effect )和随机效应(RE: random effect )的检

验:Hausman 检验(豪斯曼检验) 首先将变截距模型变形为:

[如下不需要记:方便大家理解,个人总结理解(理解这些,hausman 检验的假设就不需要记):变形的目的在于将截距项分成不随截面个体变化的共同截距成分和随不同截面个体变化的部分,这就是变截距模型的实质,如果分离出的随截面个体变化的截距成分与样本有关,

即与X 有关,则这些因素是由样本或自变量决定的,是可由样本控制或可观测或可确定(为什么称为“固定效应”呢?原因就在于此,该效应在给定样本下是确定的)的成分,如果是不能由样本决定则其是不受控制或不可观测的成分,即由其他样本之外的随机因素决定,则该成分与样本是无关的],这就构成了如下Hausman 检验的假设条件: H 0:cov(xit ,v i )=0 (RE) H 1: cov(xit ,v i ) ≠0(FE) Hausman 检验统计量为:

b GLS 为随机效应模型的参数估计。其中b cv 为固定效应模型的离差变换OLS 参数估计,

在原假设成立下,W 服从自由度为K (解释变量的个数)的卡方分布,所以在给定显著性水平下与临界值X (进行比较,若大于卡方临界值则拒绝H1,应该建立固定效应模型,∂K )反之则建立随机效应模型。

[不需要记忆,仅供大家理解,理解Hausman 检验的思想:如果截距项与解释变量是不相关的,实际上这种随机成分可以归入误差项,则采用两种估计参数的方法得到的估计量均还是一致估计量,因为残差项与解释变量不相关,所以两种估计方法的参数估计之差应该是很小的,若H0不成立,即截距项与解释变量相关,则GLS 将不是一致估计,则参数之差应比较

2

^^

大。]

2、 FE 和RE 的参数估计方法(离差变换OLS 估计和FGLS 估计) (1) FE 的参数估计:离差变换OLS

即分别对因变量和各解释变量取平均值,并对原模型进行离差转换,此时无截距项,如下: 变换的方程为y it -y =(X it -X i )

-

-

/

β+(u it -u i )

-

然后采用OLS 对该方程进行估计。

(2) RE 效应模型的FGLS 估计大家看伍德里奇书上第468-469页

11

12

13

14

五、给定经济现象,请选择解释变量,设定模型。(15分)

主要考点:①被解释变量 ②解释变量有哪些 ③ 为什么引入这些变量 ④解释变量如何度量?(虚拟 or 数值)⑤写出具体的模型形式。⑥判断经济显著性,即预期符号。

举例子:博学楼6:00-9:00自习室上座率。 1、变量选取和数据获得 被解释变量:

y ——博学楼6:00-9:00自习室上座率

y=上自习人数/座位数*100% 调查取得;

X1——在校研究生人数(博士+硕士)

X1=在校博士生人数+在校硕士生人数

选取理由:因为博学楼主要是研究生的学习场所 根据入学注册人数-毕业人数-辍学人数; X2——居住地离博学楼距离

选取理由:在校研究生分为住校和不住校,原则上居住地离学校过远,则一般情况

不会选择来博学楼上自习

X2=具体里程数 调查取得; D1——是否假期

选取理由:与学期相比,假期在校的学生人数明显减少; 正常学期 寒暑假 根据学校校历

D2——是否临近考试

选取理由:临近考试,自习室上座率会增加

15

每学期16周-19周 其他 根据学校校历 2、 模型构建 构建模型如下:

Y=β0+β1X 1+β2X 2+β3D 1+β4D 2+(β5D 1+β6D 2) X 1+(β5D 1+β6D 2) X 2+μi

3、 判断经济显著性,即预期符号:

X1: 预期符号为正,理论上在校研究生人数越多,上座率越高; X2: 预期符号为负,理论上居住地离博学楼距离越远,上座率越低; D1: 预期符号为正,理论上正常学期与假期相比,上座率高; D2: 预期符号为正,理论上越是临近考试,上座率越高。

(差不多应该这种形式)

根据下面例子练习一下:

试指出在目前建立中国宏观计量经济模型时,下列内生变量应由哪些变量来解释,简单说明理由,并拟定关于每个解释变量的待估参数的正负号。

⑴ 轻工业增加值 ⑵ 衣着类商品价格指数 ⑶农业生产资料进口额 答: ⑴ 轻工业增加值应该由反映需求的变量解释。包括居民收入(反映居民对轻工业的消费需求,参数符号为正)、国际市场轻工业品交易总额(反映国际市场对轻工业的需求,参数符号为正)等。

⑵ 衣着类商品价格指数应该由反映需求和反映成本的两类变量解释。主要包括居民收入(反映居民对衣着类商品的消费需求,参数符号为正)、国际市场衣着类商品交易总额(反映国际市场对衣着类商品的需求,参数符号为正)、棉花的收购价格指数(反映成本对价格

的影响,参数符号为正)等。

⑶ 农业生产资料进口额应该由国内第一产业增加值(反映国内需求,参数符号为正)、国内农业生产资料生产部门增加值(反映国内供给,参数符号为负)、国际市场价格(参数

符号为负)、出口额(反映外汇支付能力,参数符号为正)等变量解释。

16


相关文章

  • 2014循证医学
  • 循证医学证据资源及检索 中南大学,刘双阳 2014 年10 月 2014年 10月 1 阿司匹林真的能预防大肠癌吗? 阿司匹林真的能预防大肠癌吗? 阿司匹林真的能预防大肠癌吗? 2 3 4 5 问题 • 这些证据的质量如何?证据的结论是否科 ...查看


  • 国内外经济学经典教材简评
  • 国内外经济学经典教材简评 国内外经济学的经典教材可以分为入门教材.中级微观.中级宏观和高级微观.高级宏观等.初级的入门教材一般是针对初学者,所以大多举案例和现象.加以文字解释,偶尔添加二维图案.高级教材注重数理逻辑,而二维图案及文字已难以表 ...查看


  • 法律硕士考研备考刑法学精要:故意杀人罪
  • 法律硕士考研备考刑法学精要:故意杀 人罪 刑法学是法硕考研的重要科目,为帮助大家更好地展开复习,凯程考研辅导老师为大家整理了2015考研法律硕士刑法学重点解析,希望能对大家考研有帮助! 一.故意杀人罪 1.合法剥夺生命.故意杀人罪: 自杀/ ...查看


  • 建设工程技术与计量 安装工程部分
  • 基本资料 建设工程技术与计量 安装工程部分 作者: 陈伟琳 出版社: 出版年: 2008.4 页数: 定价: 21.00 装帧: ISAN: 内容简介 天津理工大学造价工程师培训中心是全国最早的建设部造价工程师执业资格考试指定培训单位,也是 ...查看


  • 口腔执业医师口腔内科学复习精要:颅面骨骼和牙列的生长发育
  • 颅面骨骼和牙列的生长发育 颅面骨骼的生长:膜内化骨--头盖骨,包括额骨顶骨. 软骨内化骨--颅底的枕骨,蝶骨,筛骨和颞骨的岩部.如图不·乳突部. 面骨的生长: 上颌骨--上颌骨体积的增长主要是骨的表面增生和骨缝间质增生的结果. 上颌窦的发育 ...查看


  • 初三化学复习提纲:第四章生命之源--水(精要)
  • 第四章生命之源--水 4.1我们的水资源 一.地球表面有70.8%被水覆盖,但是其中可以利用的淡水只占0.7%.中国的总水量占世界第六位,但人均水量只占第88位. 二.人体中含量最多的是?水,约占?65%,人体中含量最多的元素是?氧元素. ...查看


  • 经济学书推荐[1]
  • 经济学书推荐 一.入门教材:人大版<经济科学译丛系列> 1.曼昆<经济学原理>上下册,88元.梁小民教授翻译.曼昆为哈佛高才生,天才横溢 ,属新古典凯恩斯主义学派,研究范围偏重宏观经济分析. 该书为大学一年级学生而写 ...查看


  • 宏观经济学经典教材解读
  • 宏观经济学经典教材解读 宏观经济学(Macroeconomics),是使用国民收入.经济整体的投资和消费等总体性的统计概念来分析经济运行规律的一个经济学领域.宏观经济学是相对于古典的微观经济学而言的.宏观经济学是约翰·梅纳德·凯恩斯的< ...查看


  • 中传传媒经济学硕士国际文化贸易方向就业前景怎么样
  • 中传传媒经济学硕士国际文化贸易方向就业前景怎么样 本文系统介绍中传传媒经济学考研难度,中传传媒经济学专业就业,中传传媒经济学考研辅导,中传传媒经济学考研参考书,中传传媒经济学考研专业课五大方面的问题,凯程中传传媒经济学考研老师给大家详细讲解 ...查看


热门内容