9.1.2一元线性回归方程的建立 数据:9.1 工龄与年薪.sav
问题:MBA 研究生毕业后工作的第一年年薪为应变量Y ,读MBA 之前工龄为自变量X ,在X 与Y 之间建立线性回归方程。 解答:
第一步:明确X 与Y ,绘制散点图,目测线性关系的存在性。
总体回归模型,理论回归方程:Y =β0+β1X +ε
简单回归方程,一元线性回归方程:=β0+β1X 样本回归模型
ˆ+βˆX +e Y =β
1
ˆ+βˆ=β01
估计的回归方程(直线), 经验回归方程ˆ+βˆX ˆ=βY
1
第二步:拟合最有代表性的方程(直线)
ˆ=40.507+1.470X Y
工龄增加1单位,年薪平均增加1.47个单位。
ˆ=.703X Y
第三步:回归方程的检验
(1)理论检验:参数估计值的符号和取值范围是否与其相对应的理论或经验一致。
(2)统计学检验:运用统计学的抽样理论对样本回归方程的可靠性进行检验。包括:经验回归方程的显著性检验、回归系数的显著性检验、拟合优度检验、对方程的适宜性做出评价。
Model Summary
(3)经济计量学检验:对回归模型中的随机误差项的假设条件是否能得到满足进行检验P590。
(a)残差均值为0的判断:
(b)残差正态性检验
(c)残差方差齐性检验
方法1:残差图分析法
方法2:求Spearman 等级相关系数
P=0.238>0.05,不能拒绝原假设(H0:两者之间不相关) ,即残差与自变量之间没有显著的相关性,残差不随自变量的变化而变化,
残差的变化是随机的,具有方差齐性。 (d)残差序列独立性判断
注意,不同的排序,结果完全不同。因此,做游程检验时,须遵循数据的原始的随机排序。
Cases >= Test Value Total Cases Number of Runs Z
Asymp. Sig. (2-tailed) a. Median
26 51 19 -2.120 .034
26 51 19 -2.120 .034
Runs Test
Test Valuea Cases = Test Value Total Cases Number of Runs Z
Standardized Residual
.08977
25 26 51 5 -6.082
Studentized Residual
.09600
25 26 51 5 -6.082
Runs Test 2
Test Value Cases = Test Value Total Cases Number of Runs Z
Asymp. Sig. (2-tailed) a. Mean
a
Standardized Residual
.0000000
25 26 51 5 -6.082 .000
Studentized
Residual
-.0025569
25 26 51 5 -6.082 .000
9.3.2.1
数据:9.3 服装销售.sav
问题:利用多元回归,考察销售额与广告费、营业厅面积以及销售人员人数的关系,并预测广告费400万元、营业面积45平方米、营销人员6人的销售额。
第一步:散点图观察,初步确认线性关系的存在性。
第二步:回归方程建立
Correlations
销售额 广告费 经营面积 销售人员
销售额 1.000 .548 广告费 .548 1.000
Pearson Correlation
经营面积 .731 .279 销售人员 .625 .242 销售额 . .014 广告费 .014 .
Sig. (1-tailed)
经营面积 .001 .148 销售人员 .005 .183 销售额 16 16 广告费 16 16
N
经营面积 16 16 销售人员 16 16
.731 .279 1.000
.275 .001 .148
. .151 16 16 16 16
.625 .242 .275 1.000 .005 .183 .151
. 16 16 16 16
第三步:理论检验:回归系数的符号方向与取值大小。
第四步:统计学检验:运用统计学的抽样理论对样本回归方程的可靠性进行检验。包括:经验回归方程的显著性检验、回归系数的显著性检验、拟合优度检验、对方程的适宜性做出评价。
第五步:经济计量学检验:对回归模型中的随机误差项的假设条件是否能得到满足进行检验P602:残差的正态性、残差的零均值、残差的方差齐性、残差项之间的独立性、各自变量之间的多重共线性。
残差均值为0:绝大部分残差点在[-2,+2]之间波动,此外者为异常值。
残差正态性:
方差齐性:
残差项之间的独立性:
H0:残差项之间具有随机性
9.1.2一元线性回归方程的建立 数据:9.1 工龄与年薪.sav
问题:MBA 研究生毕业后工作的第一年年薪为应变量Y ,读MBA 之前工龄为自变量X ,在X 与Y 之间建立线性回归方程。 解答:
第一步:明确X 与Y ,绘制散点图,目测线性关系的存在性。
总体回归模型,理论回归方程:Y =β0+β1X +ε
简单回归方程,一元线性回归方程:=β0+β1X 样本回归模型
ˆ+βˆX +e Y =β
1
ˆ+βˆ=β01
估计的回归方程(直线), 经验回归方程ˆ+βˆX ˆ=βY
1
第二步:拟合最有代表性的方程(直线)
ˆ=40.507+1.470X Y
工龄增加1单位,年薪平均增加1.47个单位。
ˆ=.703X Y
第三步:回归方程的检验
(1)理论检验:参数估计值的符号和取值范围是否与其相对应的理论或经验一致。
(2)统计学检验:运用统计学的抽样理论对样本回归方程的可靠性进行检验。包括:经验回归方程的显著性检验、回归系数的显著性检验、拟合优度检验、对方程的适宜性做出评价。
Model Summary
(3)经济计量学检验:对回归模型中的随机误差项的假设条件是否能得到满足进行检验P590。
(a)残差均值为0的判断:
(b)残差正态性检验
(c)残差方差齐性检验
方法1:残差图分析法
方法2:求Spearman 等级相关系数
P=0.238>0.05,不能拒绝原假设(H0:两者之间不相关) ,即残差与自变量之间没有显著的相关性,残差不随自变量的变化而变化,
残差的变化是随机的,具有方差齐性。 (d)残差序列独立性判断
注意,不同的排序,结果完全不同。因此,做游程检验时,须遵循数据的原始的随机排序。
Cases >= Test Value Total Cases Number of Runs Z
Asymp. Sig. (2-tailed) a. Median
26 51 19 -2.120 .034
26 51 19 -2.120 .034
Runs Test
Test Valuea Cases = Test Value Total Cases Number of Runs Z
Standardized Residual
.08977
25 26 51 5 -6.082
Studentized Residual
.09600
25 26 51 5 -6.082
Runs Test 2
Test Value Cases = Test Value Total Cases Number of Runs Z
Asymp. Sig. (2-tailed) a. Mean
a
Standardized Residual
.0000000
25 26 51 5 -6.082 .000
Studentized
Residual
-.0025569
25 26 51 5 -6.082 .000
9.3.2.1
数据:9.3 服装销售.sav
问题:利用多元回归,考察销售额与广告费、营业厅面积以及销售人员人数的关系,并预测广告费400万元、营业面积45平方米、营销人员6人的销售额。
第一步:散点图观察,初步确认线性关系的存在性。
第二步:回归方程建立
Correlations
销售额 广告费 经营面积 销售人员
销售额 1.000 .548 广告费 .548 1.000
Pearson Correlation
经营面积 .731 .279 销售人员 .625 .242 销售额 . .014 广告费 .014 .
Sig. (1-tailed)
经营面积 .001 .148 销售人员 .005 .183 销售额 16 16 广告费 16 16
N
经营面积 16 16 销售人员 16 16
.731 .279 1.000
.275 .001 .148
. .151 16 16 16 16
.625 .242 .275 1.000 .005 .183 .151
. 16 16 16 16
第三步:理论检验:回归系数的符号方向与取值大小。
第四步:统计学检验:运用统计学的抽样理论对样本回归方程的可靠性进行检验。包括:经验回归方程的显著性检验、回归系数的显著性检验、拟合优度检验、对方程的适宜性做出评价。
第五步:经济计量学检验:对回归模型中的随机误差项的假设条件是否能得到满足进行检验P602:残差的正态性、残差的零均值、残差的方差齐性、残差项之间的独立性、各自变量之间的多重共线性。
残差均值为0:绝大部分残差点在[-2,+2]之间波动,此外者为异常值。
残差正态性:
方差齐性:
残差项之间的独立性:
H0:残差项之间具有随机性