判别和主成份/因子分析上机作业
1、(1
其次,由协方差矩阵计算特征值,以及各个主成分的贡献率和累计贡献
率:
主成分数的确定:
第1、 第2的主成分的累积贡献率已高达83.4%; 第1主成分的特征根大于1,第2主成分的特征根接近于1,故只需求出第1与第2主成分Z1,Z2即可。最终保留2个主成分经济增长率和非国有化水平。
(2)其次求得特征向量:
变量 PC1 PC2 C1 0.529 -0.070 C2 0.558 -0.410 C3 0.369 0.901 C4 0.523 -0.127
由此得出主成分:
Y1=0.529*x11-0.558*x22-0.369x33+0.523x44 Y2=-0.07*x11-0.41*x22+0.901x33-0.127x44 主成分系数为:
X11=(x1-13.46)/3.91642 X22=(x2-52.013)/19.6285 X33=(x3-14.9117)/15.4085 X44=(x4-64.597)/10.9591
所以得出主成分表达式为:
Y1=0.1314x1-0.0278x2-0.0232x3-0.0472x4-6.6040 Y2=-0.0174x1-0.0204x2-0.0566x3-0.0114x4+1.1901 (3
第1主成分与C1,C2,C3,C4均呈较强正相关,因此可认为第1主成分Z1是地区经济增长差异代表。
第2主成分与C3呈较强正相关,与C1,C2,C4呈较强负相关,因此可认为第2主成分Z2代表了开放度。
由两个主成分Z1与Z2代替原4个变量描述地区经济增长差异,可以使问题进一步简化、明了。
(4)对上述两个主成分进行判别分析,得到费歇尔判别方程为: 主成分1:Y=1.812*x1-0.337*x2-0.058*x3+1.38*x4-54.567
,其中主成分1的错判率为50%,主成分2的错
2、解答:
(1)首先将原始数据标准化,进行协方差分析: C5 C6 C7 C8 C5 1.00000
C6 -0.06039 1.00000
C7 0.99161 -0.06807 1.00000
C8 0.2467 0.95075 0.23686 1.00000 其次,计算各主成分特征值、贡献率和累积贡献率
X1 X2 X3 X4 特征值 2.1758 1.8141 0.0086 0.0016
比率 0.544 0.454 0.002 0.000 累积 0.544 0.997 1.000 1.000 然后,主成分数的确定:
X1与X2的累积贡献率已达99.7%,二者的特征值均大于1 ,故只需做出第1与第2的主成分即可。最终保留两个主成分。 最后,计算主成分表达式: 主成分系数:
X11=(x1+0.0235)/1.0299 X22=(x2-0.028)/2.0829 X33=(x3+0.0645)/2.0667 X44=(x4+0.0016)/1.7125 求得特征向量:
变量 PC1 PC2 C5 0.553 -0.426
C6 0.356 0.632
C7 0.55 -0.432 C8 0.515 0.483 因此主成分表达式为:
Y1=0.5396x1-0.1709x2-0.2661x3+0.3007x4+0.0246 Y2=-0.4136x1+0.3034x2-0.2090x3+0.2820x4-0.0321
(2)以主成分为自变量,Y为因变量采用Enter法得到回归方程:
Y=0.605*z1+0.146*z2-0.016 R2=0.892
决定系数为0.892
对方程的显著性进行检验:
查表得F0.05(1,98)=3.92
对回归系数的显著性进行检验,查表,t0.05(98)=1.658,对照上表可知,该回归系数亦显著。
判别和主成份/因子分析上机作业
1、(1
其次,由协方差矩阵计算特征值,以及各个主成分的贡献率和累计贡献
率:
主成分数的确定:
第1、 第2的主成分的累积贡献率已高达83.4%; 第1主成分的特征根大于1,第2主成分的特征根接近于1,故只需求出第1与第2主成分Z1,Z2即可。最终保留2个主成分经济增长率和非国有化水平。
(2)其次求得特征向量:
变量 PC1 PC2 C1 0.529 -0.070 C2 0.558 -0.410 C3 0.369 0.901 C4 0.523 -0.127
由此得出主成分:
Y1=0.529*x11-0.558*x22-0.369x33+0.523x44 Y2=-0.07*x11-0.41*x22+0.901x33-0.127x44 主成分系数为:
X11=(x1-13.46)/3.91642 X22=(x2-52.013)/19.6285 X33=(x3-14.9117)/15.4085 X44=(x4-64.597)/10.9591
所以得出主成分表达式为:
Y1=0.1314x1-0.0278x2-0.0232x3-0.0472x4-6.6040 Y2=-0.0174x1-0.0204x2-0.0566x3-0.0114x4+1.1901 (3
第1主成分与C1,C2,C3,C4均呈较强正相关,因此可认为第1主成分Z1是地区经济增长差异代表。
第2主成分与C3呈较强正相关,与C1,C2,C4呈较强负相关,因此可认为第2主成分Z2代表了开放度。
由两个主成分Z1与Z2代替原4个变量描述地区经济增长差异,可以使问题进一步简化、明了。
(4)对上述两个主成分进行判别分析,得到费歇尔判别方程为: 主成分1:Y=1.812*x1-0.337*x2-0.058*x3+1.38*x4-54.567
,其中主成分1的错判率为50%,主成分2的错
2、解答:
(1)首先将原始数据标准化,进行协方差分析: C5 C6 C7 C8 C5 1.00000
C6 -0.06039 1.00000
C7 0.99161 -0.06807 1.00000
C8 0.2467 0.95075 0.23686 1.00000 其次,计算各主成分特征值、贡献率和累积贡献率
X1 X2 X3 X4 特征值 2.1758 1.8141 0.0086 0.0016
比率 0.544 0.454 0.002 0.000 累积 0.544 0.997 1.000 1.000 然后,主成分数的确定:
X1与X2的累积贡献率已达99.7%,二者的特征值均大于1 ,故只需做出第1与第2的主成分即可。最终保留两个主成分。 最后,计算主成分表达式: 主成分系数:
X11=(x1+0.0235)/1.0299 X22=(x2-0.028)/2.0829 X33=(x3+0.0645)/2.0667 X44=(x4+0.0016)/1.7125 求得特征向量:
变量 PC1 PC2 C5 0.553 -0.426
C6 0.356 0.632
C7 0.55 -0.432 C8 0.515 0.483 因此主成分表达式为:
Y1=0.5396x1-0.1709x2-0.2661x3+0.3007x4+0.0246 Y2=-0.4136x1+0.3034x2-0.2090x3+0.2820x4-0.0321
(2)以主成分为自变量,Y为因变量采用Enter法得到回归方程:
Y=0.605*z1+0.146*z2-0.016 R2=0.892
决定系数为0.892
对方程的显著性进行检验:
查表得F0.05(1,98)=3.92
对回归系数的显著性进行检验,查表,t0.05(98)=1.658,对照上表可知,该回归系数亦显著。