案例一、建筑行业工资差异制度因素的分析
一、引言
我国目前正处在由计划经济向市场经济过渡的体制转型时期。在这一时期,各行业之间的职工工资差异在日趋扩大的同时,呈现出与计划经济时期完全不同的特征。本文试图通过考察体制转型时期行业(以建筑业为例)工资,以及行业垄断程度,提出基于体制转型这一特定时期的行业工资决定假说:行业相对工资差异的扩大是由于行业垄断程度的扩大引致的,并用回归方法分析对这一假说进行验证。
二、数据定义与经济理论假说 (一)数据定义 1.建筑业工资水平
建筑业相对工资水平定义为建筑业平均工资与全社会平均工资之比。本文之所以采用的是相对工资水平的概念,而没有采用绝对水平,因为我们更关注改革开放20多年来,建筑行业的工资相对于整个行业的变化,而不关心建筑业自身工资的发展趋势。部分年份建筑业相对工资水平的时序数据见表1。
表1 部分年份建筑业相对工资水平时序数据
2.垄断程度
在西方国家,人们通常用一个行业中最大的几家厂商的销售收入的份额表示一个行业的垄断程度。然而这种方法在我国目前的情况下并不完全适用,因为目前影响(甚至决定)我国行业职工工资水平的并不是一般意义上的垄断,,而是体制转型时期一种特有的垄断,它并不是针对企业的规模而言的,而是针对所有制结构或国有经济成分对行业的控制程度而言的,,即所谓“所有制垄断”或“行政垄断”。
在传统的计划经济体制下,我国经济属于典型的二元经济模式。如果撇开农村经济这一“元”而不论,城市经济这一“元”的大多数行业基本上都是由国有经济控制的,各行业间在这一点上没有显著性的差别。然而,随着计划经济体制向市场经济体制的过渡,这种国有经济一统天下的格局逐步被打破,呈现出所有制日趋多元化的的趋势。但是,不同行业所有制多元化的进程并不一致,由此产生了不同行业间所有制结构的差异。建筑业相对于电力、金融、房地产等行业,其非国有经济成分进入的门槛相对较低,竞争较为激烈,因此所有制多元化进展较快。因此,在体制转型时期,我国建筑行业的垄断程度的绝对水平可以在建筑行业的国有化程度上得到大致的体现。为了获取资料的方便,本文将建筑业国有化程度用建筑业国有单位职工人数占建筑业全部就业人数的比重来表示。
由于不管什么行业,所有制结构多元化、国有经济比重下降是一个总的趋势,而且决定相对工资高低的不是个行业垄断程度的绝对数,而是行业垄断程度与其他行业垄断程度或社会平均水平相比较的相对水平,所以引入相对垄断程度的概念:
相对垄断程度=行业所有制垄断度的绝对数/全社会所有制垄断度的平均数 改革开放以来部分年份建筑业相对垄断度的时序数据见表2。 表2 部分年份建筑业相对垄断度的时序数据
(二)体制转型期行业工资决定假说
从表1的数据看出,经过20多年,作为具有高劳动强度、艰苦、危险等特征的传统高工资行业之一—建筑业逐渐被挤出高工资行业的行列,在市场经济下建筑业具有进入门槛低、竞争激烈的特征,其工资相对水平逐年下降,2003年建筑业工资只相当于全国平均工资的82%。而一些原来工资并不太高,但垄断程度至今仍保持较高水平的行业,如金融保险业、房地产业等则陆续进入最高工资行列。基于上述事实,我们提出如下关于体制转型这一特定时期行业决定的假说:从总体上看,我国行业相对工资差异的扩大是由于行业垄断程度差异的扩大引致的;建筑业相对工资水平已经逐渐地不再取决于该行业的拉动强度及艰苦危险程度,而是主要取决于行业的垄断程度。即建筑业相对工资水平的变化,可以由该行业垄断程度的相对变化所解释。
三、模型设定、估计与检验
将我国建筑业1978年至2002年的主要17个年份的工资相对水平与其垄断相对程度,建立一元计量模型,理论模型如下:
其中表示建筑业工资相对水平,表示建筑业相对国有化程度。根据体制转型期行业工
资决定假说,总体参数对水平就越高。
应该大于0,相对国有化程度越高,行业垄断程度越高,工资相
利用计量经济分析软件Eviews进行估计,结果如下:
Dependent Variable: 建筑业工资相对水平 Method: Least Squares Sample: 1 17
Variable CCoefficient 2.9399841.311088
Std. Error 11.782180.150872
t-Statistic 0.2495288.690069
Prob. 0.80630.0000 104.9118 10.40786 5.900179 5.998204 75.51731 0.000000建筑业相对国有化程度
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat0.834286 Mean dependent var 0.823238 S.D. dependent var 4.375783 Akaike info criterion 287.2121 Schwarz criterion -48.15152 F-statistic 0.930656 Prob(F-statistic)合优度较高。建筑业相对国有化程度对建筑业工资相对水平的回归系数为1.311088,t值达到8.690069,通过了变量的统计检验;并且该回归系数大于0,与理论模型总体参数的预期符号相一致,因此通过了经济意义检验。但截距项系数2.939984,t值只有0.249528,未通过统计检验,说明建筑业相对国有化程度对建筑业工资相对水平的总体回归直线是通过原点的。因此理论线性模型应设定为通过原点的回归直线模型,具体形式如下:
再利用计量经济分析软件Eviews进行估计,结果如下:
Dependent Variable: 建筑业工资相对水平 Method: Least Squares Sample: 1 17
Included observations: 17
1.3485820.013186102.2770 0.0000104.9118 10.40786 5.786674 5.835687 0.951702
建筑业相对国有化程度
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
0.833598 Mean dependent var 0.833598 S.D. dependent var 4.245618 Akaike info criterion 288.4043 Schwarz criterion -48.18673 Durbin-Watson stat
说明去掉截距项的模型拟合优度有了进一步改善。建筑业相对国有化程度对建筑业工资相对
水平的回归系数为1.348582,t值高达102.2770,通过了变量的统计检验。但该模型的DW值很低,只有0.951702,说明模型的随机误差项之间存在正自相关,因此还需要处理模型的自相关问题。
我们在模型中引入AR(1)来处理自相关。估计结果如下:
Dependent Variable: 建筑业工资相对水平 Method: Least Squares Sample(adjusted): 2 17
Included observations: 16 after adjusting endpoints 1.3601340.02084665.24616 0.0000104.2125 10.32853 5.493937 5.590511 建筑业相对国有化程度
R-squared Adjusted R-squared S.E. of regression Sum squared resid 0.889110 Mean dependent var 0.881190 S.D. dependent var 3.560126 Akaike info criterion 177.4429 Schwarz criterion 满的解决。同时模型修正的可决系数0.881190,又得以进一步提高。
四、结果分析
1.本文验证了我们提出的关于体制转型时期行业决定的假说,我国建筑业相对工资差异的扩大主要是由于该行业垄断程度差异的扩大引致的。
2.建筑业相对国有化程度每下降1个百分点,建筑业工资相对水平将会平均下降1.360134个百分点。
案例二、咖啡需求函数——双对数线性模型与弹性系数
由微观经济学中需求理论可知,一种商品的需求量与该商品的价格是息息相关的,一般情况下,商品的价格上涨,会引致该商品需求量下降。通过观察1970年至1980年11年间美国咖啡消费量与咖啡实际零售价格,建立美国咖啡消费函数模型,考察美国咖啡消费行为规律。1970年至1980年咖啡消费与平均实际零售价格的时序数据详见下表。
表 咖啡消费(Y)与平均实际零售价格(X)的时序数据
利用Eviews软件可以绘制咖啡消费Y与平均实际零售价格X的水平尺度散点图,见图1:
从上图可发现咖啡消费y与平均实际零售价格X之间并不是呈线性关系,而是双曲线的非线性关系。因此理论模型若设定为线性模型形式是不适当的。处理方法可以有多种,可以采用双曲线模型形式,还可以采用双对数形式,都能够提高模型的拟合度。而又由于双对数线性形式模型的参数具有很直观的经济含义——即是弹性的概念,于是这里我们试图采用双对数形式。
利用Eviews软件绘制咖啡消费Y与平均实际零售价格X的双对数尺度散点图,见图2:
与图1相比,图2的线性关系更明显,双对数需求函数模型会给出比线性需求函数模型更好的拟合,因此有理由建立一个双对数线性需求函数理论模型 。
估计后的结果如下:
Dependent Variable: LY Method: Least Squares Sample: 1970 1980 Included observations: 11
Variable C LX
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient Std. Error 0.777418 0.015242 -0.253046 0.049374
t-Statistic 51.00455 -5.125086
Prob. 0.0000 0.0006 0.787284 0.094174 -2.984727 -2.912383 26.26651 0.000624
0.744800 Mean dependent var 0.716445 S.D. dependent var 0.050148 Akaike info criterion 0.022633 Schwarz criterion 18.41600 F-statistic 0.680136 Prob(F-statistic)
从估计结果可以看到价格弹性系数为-0.25,意味着咖啡每磅实际价格每增加1%,咖啡需求量平均减少0.25%。由于-0.25的价格弹性值在绝对值上小于1,可以说对咖啡的需求是缺乏价格弹性的。
为了与线性需求函数模型进行对比,我们对线性需求函数模型也进行了估计,结果如下:
Dependent Variable: Y Method: Least Squares Sample: 1970 1980 Included observations: 11
Variable C X
Coefficient Std. Error 2.691124 0.121622 -0.479529 0.114022
t-Statistic 22.12686 -4.205592
Prob. 0.0000 0.0023
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.662757 Mean dependent var 0.625286 S.D. dependent var 0.128703 Akaike info criterion 0.149080 Schwarz criterion 8.048108 F-statistic 0.726590 Prob(F-statistic)
2.206364 0.210251 -1.099656 -1.027311 17.68700 0.002288
从估计结果看拟合优度明显不如双对数形式模型好,可决系数只有0.662757,着进一步证实了采用双对数形式的咖啡需求函数的正确性。斜率系数表明咖啡价格每增加1美元/磅,咖啡消费每日每人平均减少0.4795杯。咖啡需求的平均价格弹性为
这个弹性系数的结果
可与得自双对数模型的弹性系数的结果
相对照。前一个弹性随着具体样本均值而变化,而后一个弹性不
管价格取在哪里都是一样的。
案例三、美国制造业的利润与销售额行为
——虚拟变量在季节分析中的应用
回归模型中,虚拟变量作为定性解释变量的引入,使线性回归模型成为一种极其灵活的工具,可以处理经验研究中遇到的许多有趣的问题。
考察考虑了季节效应影响的美国制造业的利润和销售额的规律,数据如下表:
表 1965-1970年美国制造业利润和销售额情况 (单位:百万美元)
理论模型:其中
假定“季节”变量有四个类别:一年的春、夏、秋、冬,因而要用三个虚拟变量。这样如果在各个季度中显示有季节模式的话,则所估的极差截距项
将在其统计显著性上反映出来。有可能仅有某些极差截距项统计上
显著的,那么,就只有某些相应的季度反映有季节变化。但该模型是一个一般的模型,可以处理好所有的情形。
Eviews软件估计结果如下:
结果表明只有销售额系数和第二季度的极差截距在5%水平上是统计上显著的。因此可下结论说,每年二季度由某种季节性因素在运作。销售额系数0.0383告诉我们,在考虑季节效应之后,如果销售额增加1美元,则平均利润可望增加约4美分。第一季度的平均利润水平虽是6688美元,而在第二季度中提高了约1323美元,即达到了约8011美元。
由于第二季度似与其余季度有所不同,就不妨仅用一个虚拟变量,以区别二季度和其余季度,重新估计如下:
讨论1:第二个模型实际上是第一个模型的一种约束形式,其约束是第一、三、四季度的截距项等。从第一个模型的结果看,我们预期着这些约束是真实的,这需要证实这些约束确是真实的。因此在做第二个模型之前,需要进行多个回归系数是否相等的显著性检验,从而才能确认仅在第二季度出现某种季度变化。
讨论2:在两个模型中,我们假定季度之间的差异仅在于截距项,而销售额变量的斜率系数则各季度均相同。但这个假定需要通过虚拟变量乘法引入的技术加以检验,以确认利润函数在各季度之间没有发生结构性变化,即斜率未发生较大改变。
案例四、消费支出与收入和财富的关系
——多重共线性问题
假定消费与收入和财富有线性关系,并建立如下形式的理论模型:
表 消费支出、收入和财富的截面数据 单位:美元
回归结果表明收入和财富一起解释了消费支出总变差中的约96%。然而没有一个斜率系数在统计上显著。不但如此,财富变量不但统计上不显著,而且带有错误的符号。我们自然会先验地预料到消费与财富之间有正的关系。虽然
个别地看都是统计上不显著的,但如果我们同时检验假设F值是高度显著的。
和,发现
这个案例生动地表明多重共线性问题。在二元线性回归模型中,F检验是显著的,而解释变量的t值个别地看又是不显著的,这一事实说明两个解释变量的相关程度如此之高,以至无法辨别收入或财富对消费的个别的影响。
事实上,如果我们做
对
的回归便得到:
这表明对之间有着几乎完全的共线性。
的回归,看会出现什么情况:
现在我们做Y仅对
在二元线性模型(1)中,收入变量是统计上不显著的,而在现在的一元线性模型(2)中,则是高度显著的。
同样,我们做Y仅对
我们看到财富现在对消费支出也有显著的影响,而在二元线性模型(1)中却不显著。
(2)和(3)非常明显地表示,在极端多重共线性的情况下,去掉一个高度共线的变量常常会使另一个解释变量变得统计上显著。
如何减少或消除多重共线性呢?其中一种补救措施是利用先验信息,将信息重叠的一些变量合为一个变量。假如认为消费对财富的变化率是对收入的相应变化率的1/10,即
,于是有:
于是可以对上式进行估计,得到 再根据假想的关系式,推算出。
案例五、研究与开发支出对销售额回归中的异方差性问题
2003年我国15种高技术行业大中型工业企业产品销售收入和研究与开发(R&D)支出截面数据如下:
表1 2003年高技术行业大中型工业企业产品销售收入和R&D支出 单位:万元
利用Eviews软件估计结果如下:
Dependent Variable: R&D Method: Least Squares Sample: 1 15
C
7555.035
52744.76
0.143238
0.8883
产品销售收入 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat0.012651 0.003585 3.528735 0.0037 140340.8 193004.9 26.70465 26.79906 12.45197 0.0037040.489234 Mean dependent var 0.449944 S.D. dependent var 143143.5 Akaike info criterion 2.66E+11 Schwarz criterion -198.2849 F-statistic 1.222721
Prob(F-statistic)
R&D支出与销售量是正相关的。计算的值“似乎”在0.004水平上是统计上显著的(双尾检验)。
二、异方差性检验
由于我们所研究的对象是横截面数据,我们自然会预料到在R&D对销售的回归中异方差性很可能出现。如果有异方差性,我们还不能相信上面所估计的标准误或所估计的值。下面对模型的异方差性进行检验。
1.图示法
利用估计方程的残差的绝对值与产品销售收入,绘散点图可看出,残差绝对值与产品销售收入成正比。表明模型可能存在异方差性。
2.斯皮尔曼的等级相关检验
首先,分别按产品销售收入X和残差绝对值自的排序次序(见表2);
的数据升序排列,并标定各
最后,对等级相关系数做显著性检验 H0:
H1:
其自由度df=15-2=13,在0.001的显著水平下,拒绝同方差性。因此我们还不能相信所估计的标准误及相应的值。
3.戈里瑟(Glejser)检验
根据戈里瑟(Glejser)检验,我们得到如下结果:
Dependent Variable: Method: Least Squares Sample: 1 15
Variable产品销售收入 R-squaredAdjusted R-squared S.E. of regression Sum squared resid Coefficient0.007801
Std. Error0.001230
t-Statistic6.339790
Prob. 0.0000 75228.82113854.6 25.21782 25.26503
0.620822 Mean dependent var0.620822 S.D. dependent var 70108.71 Akaike info criterion 6.88E+10 Schwarz criterion
由于残差与产品销售收入的回归中,产品销售收入对应的参数估计量的t值统计上显著,表明可以拒绝同方差性。因此我们还不能相信所估计的标准误及相应的值。
三、加权最小二乘法
既然对同方差性假定存有疑问,我们试图将数据变换以减少异方差的严重性,即使不能将它全部排除。从估计方程的残差平方与销售量的散点图可看出,残差平方与销售量成正比,因而利用WLS得到以下结果:
Dependent Variable: Y Method: Least Squares Sample: 1 15
Included observations: 15 Weighting series: 1/E
CX
R-squaredAdjusted R-squared S.E. of regression Sum squared resid Log likelihood Unweighted Statistics4946.2600.013169
1361.7230.000369
3.63235435.64895
0.00300.0000
49541.9964785.77 20.56055 20.65496 1270.847 0.990271 Mean dependent var0.989523 S.D. dependent var 6631.286 Akaike info criterion 5.72E+08 Schwarz criterion -152.2041 F-statistic
R-squared Adjusted R-squared S.E. of regression
0.488182 Mean dependent var 0.448812 S.D. dependent var 143290.8 Sum squared resid 140340.8 193004.9 2.67E+11
如果用乘以(2)的两边,得到可与原回归模型(1)相比较的结果。两
个斜率系数相差甚微,但与(1)相比,(2)的斜率系数的标准误较小,表明OLS回归确实高估了标准误。我们知道,在有异方差性的情形下,标准误的OLS估计量是有偏的,并且我们无法事先预知偏误的方向。在本案例中,偏误是向上的。就是说,它过高估计了标准误。
案例一、建筑行业工资差异制度因素的分析
一、引言
我国目前正处在由计划经济向市场经济过渡的体制转型时期。在这一时期,各行业之间的职工工资差异在日趋扩大的同时,呈现出与计划经济时期完全不同的特征。本文试图通过考察体制转型时期行业(以建筑业为例)工资,以及行业垄断程度,提出基于体制转型这一特定时期的行业工资决定假说:行业相对工资差异的扩大是由于行业垄断程度的扩大引致的,并用回归方法分析对这一假说进行验证。
二、数据定义与经济理论假说 (一)数据定义 1.建筑业工资水平
建筑业相对工资水平定义为建筑业平均工资与全社会平均工资之比。本文之所以采用的是相对工资水平的概念,而没有采用绝对水平,因为我们更关注改革开放20多年来,建筑行业的工资相对于整个行业的变化,而不关心建筑业自身工资的发展趋势。部分年份建筑业相对工资水平的时序数据见表1。
表1 部分年份建筑业相对工资水平时序数据
2.垄断程度
在西方国家,人们通常用一个行业中最大的几家厂商的销售收入的份额表示一个行业的垄断程度。然而这种方法在我国目前的情况下并不完全适用,因为目前影响(甚至决定)我国行业职工工资水平的并不是一般意义上的垄断,,而是体制转型时期一种特有的垄断,它并不是针对企业的规模而言的,而是针对所有制结构或国有经济成分对行业的控制程度而言的,,即所谓“所有制垄断”或“行政垄断”。
在传统的计划经济体制下,我国经济属于典型的二元经济模式。如果撇开农村经济这一“元”而不论,城市经济这一“元”的大多数行业基本上都是由国有经济控制的,各行业间在这一点上没有显著性的差别。然而,随着计划经济体制向市场经济体制的过渡,这种国有经济一统天下的格局逐步被打破,呈现出所有制日趋多元化的的趋势。但是,不同行业所有制多元化的进程并不一致,由此产生了不同行业间所有制结构的差异。建筑业相对于电力、金融、房地产等行业,其非国有经济成分进入的门槛相对较低,竞争较为激烈,因此所有制多元化进展较快。因此,在体制转型时期,我国建筑行业的垄断程度的绝对水平可以在建筑行业的国有化程度上得到大致的体现。为了获取资料的方便,本文将建筑业国有化程度用建筑业国有单位职工人数占建筑业全部就业人数的比重来表示。
由于不管什么行业,所有制结构多元化、国有经济比重下降是一个总的趋势,而且决定相对工资高低的不是个行业垄断程度的绝对数,而是行业垄断程度与其他行业垄断程度或社会平均水平相比较的相对水平,所以引入相对垄断程度的概念:
相对垄断程度=行业所有制垄断度的绝对数/全社会所有制垄断度的平均数 改革开放以来部分年份建筑业相对垄断度的时序数据见表2。 表2 部分年份建筑业相对垄断度的时序数据
(二)体制转型期行业工资决定假说
从表1的数据看出,经过20多年,作为具有高劳动强度、艰苦、危险等特征的传统高工资行业之一—建筑业逐渐被挤出高工资行业的行列,在市场经济下建筑业具有进入门槛低、竞争激烈的特征,其工资相对水平逐年下降,2003年建筑业工资只相当于全国平均工资的82%。而一些原来工资并不太高,但垄断程度至今仍保持较高水平的行业,如金融保险业、房地产业等则陆续进入最高工资行列。基于上述事实,我们提出如下关于体制转型这一特定时期行业决定的假说:从总体上看,我国行业相对工资差异的扩大是由于行业垄断程度差异的扩大引致的;建筑业相对工资水平已经逐渐地不再取决于该行业的拉动强度及艰苦危险程度,而是主要取决于行业的垄断程度。即建筑业相对工资水平的变化,可以由该行业垄断程度的相对变化所解释。
三、模型设定、估计与检验
将我国建筑业1978年至2002年的主要17个年份的工资相对水平与其垄断相对程度,建立一元计量模型,理论模型如下:
其中表示建筑业工资相对水平,表示建筑业相对国有化程度。根据体制转型期行业工
资决定假说,总体参数对水平就越高。
应该大于0,相对国有化程度越高,行业垄断程度越高,工资相
利用计量经济分析软件Eviews进行估计,结果如下:
Dependent Variable: 建筑业工资相对水平 Method: Least Squares Sample: 1 17
Variable CCoefficient 2.9399841.311088
Std. Error 11.782180.150872
t-Statistic 0.2495288.690069
Prob. 0.80630.0000 104.9118 10.40786 5.900179 5.998204 75.51731 0.000000建筑业相对国有化程度
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat0.834286 Mean dependent var 0.823238 S.D. dependent var 4.375783 Akaike info criterion 287.2121 Schwarz criterion -48.15152 F-statistic 0.930656 Prob(F-statistic)合优度较高。建筑业相对国有化程度对建筑业工资相对水平的回归系数为1.311088,t值达到8.690069,通过了变量的统计检验;并且该回归系数大于0,与理论模型总体参数的预期符号相一致,因此通过了经济意义检验。但截距项系数2.939984,t值只有0.249528,未通过统计检验,说明建筑业相对国有化程度对建筑业工资相对水平的总体回归直线是通过原点的。因此理论线性模型应设定为通过原点的回归直线模型,具体形式如下:
再利用计量经济分析软件Eviews进行估计,结果如下:
Dependent Variable: 建筑业工资相对水平 Method: Least Squares Sample: 1 17
Included observations: 17
1.3485820.013186102.2770 0.0000104.9118 10.40786 5.786674 5.835687 0.951702
建筑业相对国有化程度
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
0.833598 Mean dependent var 0.833598 S.D. dependent var 4.245618 Akaike info criterion 288.4043 Schwarz criterion -48.18673 Durbin-Watson stat
说明去掉截距项的模型拟合优度有了进一步改善。建筑业相对国有化程度对建筑业工资相对
水平的回归系数为1.348582,t值高达102.2770,通过了变量的统计检验。但该模型的DW值很低,只有0.951702,说明模型的随机误差项之间存在正自相关,因此还需要处理模型的自相关问题。
我们在模型中引入AR(1)来处理自相关。估计结果如下:
Dependent Variable: 建筑业工资相对水平 Method: Least Squares Sample(adjusted): 2 17
Included observations: 16 after adjusting endpoints 1.3601340.02084665.24616 0.0000104.2125 10.32853 5.493937 5.590511 建筑业相对国有化程度
R-squared Adjusted R-squared S.E. of regression Sum squared resid 0.889110 Mean dependent var 0.881190 S.D. dependent var 3.560126 Akaike info criterion 177.4429 Schwarz criterion 满的解决。同时模型修正的可决系数0.881190,又得以进一步提高。
四、结果分析
1.本文验证了我们提出的关于体制转型时期行业决定的假说,我国建筑业相对工资差异的扩大主要是由于该行业垄断程度差异的扩大引致的。
2.建筑业相对国有化程度每下降1个百分点,建筑业工资相对水平将会平均下降1.360134个百分点。
案例二、咖啡需求函数——双对数线性模型与弹性系数
由微观经济学中需求理论可知,一种商品的需求量与该商品的价格是息息相关的,一般情况下,商品的价格上涨,会引致该商品需求量下降。通过观察1970年至1980年11年间美国咖啡消费量与咖啡实际零售价格,建立美国咖啡消费函数模型,考察美国咖啡消费行为规律。1970年至1980年咖啡消费与平均实际零售价格的时序数据详见下表。
表 咖啡消费(Y)与平均实际零售价格(X)的时序数据
利用Eviews软件可以绘制咖啡消费Y与平均实际零售价格X的水平尺度散点图,见图1:
从上图可发现咖啡消费y与平均实际零售价格X之间并不是呈线性关系,而是双曲线的非线性关系。因此理论模型若设定为线性模型形式是不适当的。处理方法可以有多种,可以采用双曲线模型形式,还可以采用双对数形式,都能够提高模型的拟合度。而又由于双对数线性形式模型的参数具有很直观的经济含义——即是弹性的概念,于是这里我们试图采用双对数形式。
利用Eviews软件绘制咖啡消费Y与平均实际零售价格X的双对数尺度散点图,见图2:
与图1相比,图2的线性关系更明显,双对数需求函数模型会给出比线性需求函数模型更好的拟合,因此有理由建立一个双对数线性需求函数理论模型 。
估计后的结果如下:
Dependent Variable: LY Method: Least Squares Sample: 1970 1980 Included observations: 11
Variable C LX
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient Std. Error 0.777418 0.015242 -0.253046 0.049374
t-Statistic 51.00455 -5.125086
Prob. 0.0000 0.0006 0.787284 0.094174 -2.984727 -2.912383 26.26651 0.000624
0.744800 Mean dependent var 0.716445 S.D. dependent var 0.050148 Akaike info criterion 0.022633 Schwarz criterion 18.41600 F-statistic 0.680136 Prob(F-statistic)
从估计结果可以看到价格弹性系数为-0.25,意味着咖啡每磅实际价格每增加1%,咖啡需求量平均减少0.25%。由于-0.25的价格弹性值在绝对值上小于1,可以说对咖啡的需求是缺乏价格弹性的。
为了与线性需求函数模型进行对比,我们对线性需求函数模型也进行了估计,结果如下:
Dependent Variable: Y Method: Least Squares Sample: 1970 1980 Included observations: 11
Variable C X
Coefficient Std. Error 2.691124 0.121622 -0.479529 0.114022
t-Statistic 22.12686 -4.205592
Prob. 0.0000 0.0023
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.662757 Mean dependent var 0.625286 S.D. dependent var 0.128703 Akaike info criterion 0.149080 Schwarz criterion 8.048108 F-statistic 0.726590 Prob(F-statistic)
2.206364 0.210251 -1.099656 -1.027311 17.68700 0.002288
从估计结果看拟合优度明显不如双对数形式模型好,可决系数只有0.662757,着进一步证实了采用双对数形式的咖啡需求函数的正确性。斜率系数表明咖啡价格每增加1美元/磅,咖啡消费每日每人平均减少0.4795杯。咖啡需求的平均价格弹性为
这个弹性系数的结果
可与得自双对数模型的弹性系数的结果
相对照。前一个弹性随着具体样本均值而变化,而后一个弹性不
管价格取在哪里都是一样的。
案例三、美国制造业的利润与销售额行为
——虚拟变量在季节分析中的应用
回归模型中,虚拟变量作为定性解释变量的引入,使线性回归模型成为一种极其灵活的工具,可以处理经验研究中遇到的许多有趣的问题。
考察考虑了季节效应影响的美国制造业的利润和销售额的规律,数据如下表:
表 1965-1970年美国制造业利润和销售额情况 (单位:百万美元)
理论模型:其中
假定“季节”变量有四个类别:一年的春、夏、秋、冬,因而要用三个虚拟变量。这样如果在各个季度中显示有季节模式的话,则所估的极差截距项
将在其统计显著性上反映出来。有可能仅有某些极差截距项统计上
显著的,那么,就只有某些相应的季度反映有季节变化。但该模型是一个一般的模型,可以处理好所有的情形。
Eviews软件估计结果如下:
结果表明只有销售额系数和第二季度的极差截距在5%水平上是统计上显著的。因此可下结论说,每年二季度由某种季节性因素在运作。销售额系数0.0383告诉我们,在考虑季节效应之后,如果销售额增加1美元,则平均利润可望增加约4美分。第一季度的平均利润水平虽是6688美元,而在第二季度中提高了约1323美元,即达到了约8011美元。
由于第二季度似与其余季度有所不同,就不妨仅用一个虚拟变量,以区别二季度和其余季度,重新估计如下:
讨论1:第二个模型实际上是第一个模型的一种约束形式,其约束是第一、三、四季度的截距项等。从第一个模型的结果看,我们预期着这些约束是真实的,这需要证实这些约束确是真实的。因此在做第二个模型之前,需要进行多个回归系数是否相等的显著性检验,从而才能确认仅在第二季度出现某种季度变化。
讨论2:在两个模型中,我们假定季度之间的差异仅在于截距项,而销售额变量的斜率系数则各季度均相同。但这个假定需要通过虚拟变量乘法引入的技术加以检验,以确认利润函数在各季度之间没有发生结构性变化,即斜率未发生较大改变。
案例四、消费支出与收入和财富的关系
——多重共线性问题
假定消费与收入和财富有线性关系,并建立如下形式的理论模型:
表 消费支出、收入和财富的截面数据 单位:美元
回归结果表明收入和财富一起解释了消费支出总变差中的约96%。然而没有一个斜率系数在统计上显著。不但如此,财富变量不但统计上不显著,而且带有错误的符号。我们自然会先验地预料到消费与财富之间有正的关系。虽然
个别地看都是统计上不显著的,但如果我们同时检验假设F值是高度显著的。
和,发现
这个案例生动地表明多重共线性问题。在二元线性回归模型中,F检验是显著的,而解释变量的t值个别地看又是不显著的,这一事实说明两个解释变量的相关程度如此之高,以至无法辨别收入或财富对消费的个别的影响。
事实上,如果我们做
对
的回归便得到:
这表明对之间有着几乎完全的共线性。
的回归,看会出现什么情况:
现在我们做Y仅对
在二元线性模型(1)中,收入变量是统计上不显著的,而在现在的一元线性模型(2)中,则是高度显著的。
同样,我们做Y仅对
我们看到财富现在对消费支出也有显著的影响,而在二元线性模型(1)中却不显著。
(2)和(3)非常明显地表示,在极端多重共线性的情况下,去掉一个高度共线的变量常常会使另一个解释变量变得统计上显著。
如何减少或消除多重共线性呢?其中一种补救措施是利用先验信息,将信息重叠的一些变量合为一个变量。假如认为消费对财富的变化率是对收入的相应变化率的1/10,即
,于是有:
于是可以对上式进行估计,得到 再根据假想的关系式,推算出。
案例五、研究与开发支出对销售额回归中的异方差性问题
2003年我国15种高技术行业大中型工业企业产品销售收入和研究与开发(R&D)支出截面数据如下:
表1 2003年高技术行业大中型工业企业产品销售收入和R&D支出 单位:万元
利用Eviews软件估计结果如下:
Dependent Variable: R&D Method: Least Squares Sample: 1 15
C
7555.035
52744.76
0.143238
0.8883
产品销售收入 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat0.012651 0.003585 3.528735 0.0037 140340.8 193004.9 26.70465 26.79906 12.45197 0.0037040.489234 Mean dependent var 0.449944 S.D. dependent var 143143.5 Akaike info criterion 2.66E+11 Schwarz criterion -198.2849 F-statistic 1.222721
Prob(F-statistic)
R&D支出与销售量是正相关的。计算的值“似乎”在0.004水平上是统计上显著的(双尾检验)。
二、异方差性检验
由于我们所研究的对象是横截面数据,我们自然会预料到在R&D对销售的回归中异方差性很可能出现。如果有异方差性,我们还不能相信上面所估计的标准误或所估计的值。下面对模型的异方差性进行检验。
1.图示法
利用估计方程的残差的绝对值与产品销售收入,绘散点图可看出,残差绝对值与产品销售收入成正比。表明模型可能存在异方差性。
2.斯皮尔曼的等级相关检验
首先,分别按产品销售收入X和残差绝对值自的排序次序(见表2);
的数据升序排列,并标定各
最后,对等级相关系数做显著性检验 H0:
H1:
其自由度df=15-2=13,在0.001的显著水平下,拒绝同方差性。因此我们还不能相信所估计的标准误及相应的值。
3.戈里瑟(Glejser)检验
根据戈里瑟(Glejser)检验,我们得到如下结果:
Dependent Variable: Method: Least Squares Sample: 1 15
Variable产品销售收入 R-squaredAdjusted R-squared S.E. of regression Sum squared resid Coefficient0.007801
Std. Error0.001230
t-Statistic6.339790
Prob. 0.0000 75228.82113854.6 25.21782 25.26503
0.620822 Mean dependent var0.620822 S.D. dependent var 70108.71 Akaike info criterion 6.88E+10 Schwarz criterion
由于残差与产品销售收入的回归中,产品销售收入对应的参数估计量的t值统计上显著,表明可以拒绝同方差性。因此我们还不能相信所估计的标准误及相应的值。
三、加权最小二乘法
既然对同方差性假定存有疑问,我们试图将数据变换以减少异方差的严重性,即使不能将它全部排除。从估计方程的残差平方与销售量的散点图可看出,残差平方与销售量成正比,因而利用WLS得到以下结果:
Dependent Variable: Y Method: Least Squares Sample: 1 15
Included observations: 15 Weighting series: 1/E
CX
R-squaredAdjusted R-squared S.E. of regression Sum squared resid Log likelihood Unweighted Statistics4946.2600.013169
1361.7230.000369
3.63235435.64895
0.00300.0000
49541.9964785.77 20.56055 20.65496 1270.847 0.990271 Mean dependent var0.989523 S.D. dependent var 6631.286 Akaike info criterion 5.72E+08 Schwarz criterion -152.2041 F-statistic
R-squared Adjusted R-squared S.E. of regression
0.488182 Mean dependent var 0.448812 S.D. dependent var 143290.8 Sum squared resid 140340.8 193004.9 2.67E+11
如果用乘以(2)的两边,得到可与原回归模型(1)相比较的结果。两
个斜率系数相差甚微,但与(1)相比,(2)的斜率系数的标准误较小,表明OLS回归确实高估了标准误。我们知道,在有异方差性的情形下,标准误的OLS估计量是有偏的,并且我们无法事先预知偏误的方向。在本案例中,偏误是向上的。就是说,它过高估计了标准误。