第六章 方差分析
第一节 Simple Factorial过程 6.1.2
第二节 General Factorial过程 6.2.1 主要功能
第三节 Multivarite过程 6.3.1 方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。 方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异的作用,3、分析因素间的交互作用,4、方差齐性检验。 第一节 Simple Factorial过程 6.1.1 主要功能 调用此过程可对资料进行方差分析或协方差分析。在方差分析中可按用户需要作单因素方差分析(其结果将与第五章第四节相同)或多因素方差分析(包括医学中常用的配伍组方差分析);当观察因素中存在有很难或无法人为控制的因素时,则可对之加以指定以便进行协方差分析。 6.1.2 实例操作 [例6-1]下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼
6.1.2.1 数据准备
激活数据管理窗口,定义变量名:组变量为group(运动员=1,大学生=2),身高为x,肺活量为y,按顺序输入相应数值,建立数据库,结果见图6.1。
图6.1 原始数据的输入
6.1.2.2 统计分析
激活 Statistics 菜单选ANOVA Models中的Simple Factorial...项,弹出Simple Factorial ANOVA对话框(图6.2)。在变量列表中选变量y,点击钮使之进入Dependent框;选分组变量group,点击钮使之进入Factor(s)框中, 并点击Define Range...钮在弹出的Simple Factorial ANOVA:Define Range框中确定分组变量group的起止值(1,2);选协变量x,点击钮使之进入Covariate(s)框中。
图6.2 协方差分析对话框
点击Options...框,弹出Simple Factorial ANOVA:Options对话框。系统在协方差分析的方法(Method)上有三种选项: 1、Unique:同时评价所有的效应; 2、Hierarchical:除主效应外,逐一评价各因素的效应; 3、Experimental:评价因素干预之前的主效应。 本例选Unique方法,之后点击Continue钮返回Simple Factorial ANOVA对话框,再点击OK钮即可。
6.1.2.3 结果解释 在结果输出窗口中可见如下统计数据: 先输出肺活量总均数和两组的肺活量均数,总均数为4033.25,运用员组均数为4399.00,大学生组为3667.50。 接着协方差分析表明,混杂因素X(身高)两组间是有差异的(F=10.679,P=0.002),控制其影响后,两组间肺活量的差别依然存在(F=9.220,P=0.004),故可以认为两组间肺活量的均数在消除了身高因素的影响之后仍有差别,运动员的肺活量大于大学生,即体育锻炼会提高肺活量。 最后系统输出公共回归系数,bc= 36.002,该值可用于求修正均数:
Yi' = Yi
- bc( Xi
-
X
)
'Y本例为运动员= 4399.00 - 36.002×(178.175 - 174.3325)= 4260.6623 '
Y大学生
= 3667.50 - 36.002×(170.49 - 174.3325)= 3805.8377
返回目录
第二节 General Factorial过程
返回全书目录
6.2.1 主要功能 调用此过程可对完全随机设计资料、配伍设计资料、析因设计资料、正交设计资料等等进行多因素方差分析或协方差分析。
返回目录
返回全书目录
6.2.2 实例操作 [例6-2]下表为三因素析因实验的资料,请用方差分析说明不同基础液与不同血清种类对钩端螺旋体的培养计数的影响。
6.2.2.1 数据准备
激活数据管理窗口,定义变量名:基础液为base,血清种类为sero,血清浓度为pct,钩端螺旋体的培养计数为X,按顺序输入相应数值,建立数据库。
6.2.2.2 统计分析
激活Statistics菜单选ANOVA Models中的General Factorial...项,弹出General Factorial ANOVA对话框(图6.3)。在对话框左侧的变量列表中选变量x,点击钮使之进入Dependent Variable框;选要控制的分组变量base、sero和pct,点钮使之进入Factor(s)框中,并分别点击Define Range钮,在弹出的General Factorial ANOVA:Define Range对话框中确定各变量的起止值,本例变量base的起止值为1、3,变量sero的起止值为1、2,变量pct的起止值为1、2。之后点击OK钮即可。
图6.3 析因方差分析对话框
6.2.2.3 结果解释 在结果输出窗口中,系统显示48个观察值进入统计,三个因素按其各自水平共产生12种组合。 分析表明,模型总效应的F值为10.55,P值
A×B:基础液(BASE)×血清种类(SERO) F = 5.16,P = 0.011,交互作用明显; B×C:血清种类(SERO)×血清浓度(PCT) F = 15.96,P
A×B×C:基础液(BASE)×血清种类(SERO)×血清浓度(PCT) F = 6.75,P = 0.003,交互作用明显。
返回目录
第三节 Multivarite过程
返回全书目录
6.3.1 主要功能
调用此过程可进行多元方差分析。此外,对于一元设计,如涉及混合模型的设计、分割设计(又称列区设计)、重复测量设计、嵌套设计、因子与协变量交互效应设计等,此过程均能适用。
返回目录
6.3.2 实例操作
返回全书目录
[例6-3]甲地区为大城市,乙地区为县城,丙地区为农村。某地分别调查了上述三类地区8岁男生三项身体生长发育指标:身高、体重和胸围,数据见下表,问:三类地区之间男生三项身体生长发育指标的差异有无显著性?
6.3.2.1 数据准备
激活数据管理窗口,定义变量名:地区为G,身高为X1,体重为X2,胸围为X3,按顺序输入相应数值,变量G的数值是:甲地区为1,乙地区为2,丙地区为3。
6.3.2.2 统计分析
激活Statistics菜单选ANOVA Models中的Multivarite...项,弹出Multivarite ANOVA 对话框(图6.8)。首先指定供分析用的变量x1、x2、x3,故在对话框左侧的变量列表中选变量x1、x2、x3,点击钮使之进入Dependent Variable框;然后选变量g(分组变量)点击钮使之进入Factor(s)框中,并点击Define Range钮,确定g的起始值和终止值。
图6.4 多元方差分析对话框
点击Options...钮,弹出Multivarite ANOVA:Options对话框,选择需要计算的指标。在Factor(s)栏内选变量g,点击钮使之进入Display Means for框,要求计算平均值指标;在Matriced Within Cell栏内选Correlation、Covariance、SSCP项,要求计算单元内的相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在Error Matrices栏内也选上述三项,要求计算误差的相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在Diagnostics栏内选Homogeneity test项,要求作变量的方差齐性检验。之后点击Continue钮返回Multivarite ANOVA对话框,最后点击OK钮即可。
6.3.2.3 结果解释
在结果输出窗口中将看到如下分析结果: 系统首先显示共90个观察值进入统计分析,因分组变量g为三个地区,故分析的单元数为3。然后输出3个应变量(x1、x2、x3)的方差齐性检验结果,分别输出了Cochran C检验值及其显著性水平P值、Bartlett-Box F检验值及其显著性水平P值。其中 身高:C = 0.39825,P = 0.540;F = 1.01272,P = 0.363; 体重:C = 0.43787,P = 0.227;F = 4.48624, P = 0.011; 胸围:C = 0.47239, P = 0.089;F = 2.06585, P = 0.127; 可见3项指标的方差基本整齐(P值均大于0.05)。
Cochran C检验和Bartlett-Box F检验对考查协方差矩阵的相等性比较方便,但还不够。于是系统接着分别输出了三类地区(即各个单元)各生长发育指标的离均差平方和交叉乘积矩阵和方差协方差矩阵。之后作Box M检验,Box M检验提供矩阵一致性的多元测试,本例Boxs M = 36.93910,在基于方差分析的显著性检验中F = 2.92393;在基于χ2的显著性检验中χ2 = 35.09922, 两者P
下面系统输出将三类地区看成一个大样本时的离均差平方和交叉乘积矩阵。如X1、X2和X3的离均差平方和分别为662.884、121.562和114.902。在此基础上,进行多元差异的检验。通常有四种方法:
1、Pillai轨迹:V = 1Σ1λi1
1Π1λi1
sssi 2、Wilks λ值:W = i
3、Hotelling轨迹:T = 1Σ1λi1
si
4、Roy最大根:R = λmaxΣ1λmaxi1
式中λmax为最大特征值, λi为第i个特征值,s为非零特征值个数。根据这些值变换的F检验均有显著性(P
X2: SS = 121.56200, F = 10.04439
X3: SS = 114.90200, F = 7.49893
差别均有显著性,说明三项生长发育指标各地区间的差别均有显著性。
之后按单元输出各项指标的观察值均数(Obs.Mean)、调整均数(Adj.Mean)、估计均数(Est.Mean)、粗误差(Raw Resid)、标准化误差(Std.Resid)以及不分地区的总均数(Comined Adjusted Means for G)。
最后,系统输出各变量的离差参数。用户可据此计算预测值,
预测值 Y = 总均数 + 该变量离差参数 + 变量间交互效应的离差参数 如本例因无变量间交互效应的离差参数,故甲地区8岁男生的身高预测值为 Y = 126.46667 + (-1.71555551)= 124.7511145。
上式中126.46667可从系统输出的Combined Adjusted Means for G一栏中得到,离差参数-1.71555551 = 0 - 3.83111111 - (-2.1155556),这是因为离差参数的合计总为0的缘故。余同,在此不作赘述。
学知网推荐:企业培训 管理培训 研修班 总裁研修班 营销管理研修班 房地产研修班 清华大学总裁班 企业管理研修班 北京大学总裁班 工商管理研修班 在职博士 在职硕士
返回主页
第六章 方差分析
第一节 Simple Factorial过程 6.1.2
第二节 General Factorial过程 6.2.1 主要功能
第三节 Multivarite过程 6.3.1 方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。 方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异的作用,3、分析因素间的交互作用,4、方差齐性检验。 第一节 Simple Factorial过程 6.1.1 主要功能 调用此过程可对资料进行方差分析或协方差分析。在方差分析中可按用户需要作单因素方差分析(其结果将与第五章第四节相同)或多因素方差分析(包括医学中常用的配伍组方差分析);当观察因素中存在有很难或无法人为控制的因素时,则可对之加以指定以便进行协方差分析。 6.1.2 实例操作 [例6-1]下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼
6.1.2.1 数据准备
激活数据管理窗口,定义变量名:组变量为group(运动员=1,大学生=2),身高为x,肺活量为y,按顺序输入相应数值,建立数据库,结果见图6.1。
图6.1 原始数据的输入
6.1.2.2 统计分析
激活 Statistics 菜单选ANOVA Models中的Simple Factorial...项,弹出Simple Factorial ANOVA对话框(图6.2)。在变量列表中选变量y,点击钮使之进入Dependent框;选分组变量group,点击钮使之进入Factor(s)框中, 并点击Define Range...钮在弹出的Simple Factorial ANOVA:Define Range框中确定分组变量group的起止值(1,2);选协变量x,点击钮使之进入Covariate(s)框中。
图6.2 协方差分析对话框
点击Options...框,弹出Simple Factorial ANOVA:Options对话框。系统在协方差分析的方法(Method)上有三种选项: 1、Unique:同时评价所有的效应; 2、Hierarchical:除主效应外,逐一评价各因素的效应; 3、Experimental:评价因素干预之前的主效应。 本例选Unique方法,之后点击Continue钮返回Simple Factorial ANOVA对话框,再点击OK钮即可。
6.1.2.3 结果解释 在结果输出窗口中可见如下统计数据: 先输出肺活量总均数和两组的肺活量均数,总均数为4033.25,运用员组均数为4399.00,大学生组为3667.50。 接着协方差分析表明,混杂因素X(身高)两组间是有差异的(F=10.679,P=0.002),控制其影响后,两组间肺活量的差别依然存在(F=9.220,P=0.004),故可以认为两组间肺活量的均数在消除了身高因素的影响之后仍有差别,运动员的肺活量大于大学生,即体育锻炼会提高肺活量。 最后系统输出公共回归系数,bc= 36.002,该值可用于求修正均数:
Yi' = Yi
- bc( Xi
-
X
)
'Y本例为运动员= 4399.00 - 36.002×(178.175 - 174.3325)= 4260.6623 '
Y大学生
= 3667.50 - 36.002×(170.49 - 174.3325)= 3805.8377
返回目录
第二节 General Factorial过程
返回全书目录
6.2.1 主要功能 调用此过程可对完全随机设计资料、配伍设计资料、析因设计资料、正交设计资料等等进行多因素方差分析或协方差分析。
返回目录
返回全书目录
6.2.2 实例操作 [例6-2]下表为三因素析因实验的资料,请用方差分析说明不同基础液与不同血清种类对钩端螺旋体的培养计数的影响。
6.2.2.1 数据准备
激活数据管理窗口,定义变量名:基础液为base,血清种类为sero,血清浓度为pct,钩端螺旋体的培养计数为X,按顺序输入相应数值,建立数据库。
6.2.2.2 统计分析
激活Statistics菜单选ANOVA Models中的General Factorial...项,弹出General Factorial ANOVA对话框(图6.3)。在对话框左侧的变量列表中选变量x,点击钮使之进入Dependent Variable框;选要控制的分组变量base、sero和pct,点钮使之进入Factor(s)框中,并分别点击Define Range钮,在弹出的General Factorial ANOVA:Define Range对话框中确定各变量的起止值,本例变量base的起止值为1、3,变量sero的起止值为1、2,变量pct的起止值为1、2。之后点击OK钮即可。
图6.3 析因方差分析对话框
6.2.2.3 结果解释 在结果输出窗口中,系统显示48个观察值进入统计,三个因素按其各自水平共产生12种组合。 分析表明,模型总效应的F值为10.55,P值
A×B:基础液(BASE)×血清种类(SERO) F = 5.16,P = 0.011,交互作用明显; B×C:血清种类(SERO)×血清浓度(PCT) F = 15.96,P
A×B×C:基础液(BASE)×血清种类(SERO)×血清浓度(PCT) F = 6.75,P = 0.003,交互作用明显。
返回目录
第三节 Multivarite过程
返回全书目录
6.3.1 主要功能
调用此过程可进行多元方差分析。此外,对于一元设计,如涉及混合模型的设计、分割设计(又称列区设计)、重复测量设计、嵌套设计、因子与协变量交互效应设计等,此过程均能适用。
返回目录
6.3.2 实例操作
返回全书目录
[例6-3]甲地区为大城市,乙地区为县城,丙地区为农村。某地分别调查了上述三类地区8岁男生三项身体生长发育指标:身高、体重和胸围,数据见下表,问:三类地区之间男生三项身体生长发育指标的差异有无显著性?
6.3.2.1 数据准备
激活数据管理窗口,定义变量名:地区为G,身高为X1,体重为X2,胸围为X3,按顺序输入相应数值,变量G的数值是:甲地区为1,乙地区为2,丙地区为3。
6.3.2.2 统计分析
激活Statistics菜单选ANOVA Models中的Multivarite...项,弹出Multivarite ANOVA 对话框(图6.8)。首先指定供分析用的变量x1、x2、x3,故在对话框左侧的变量列表中选变量x1、x2、x3,点击钮使之进入Dependent Variable框;然后选变量g(分组变量)点击钮使之进入Factor(s)框中,并点击Define Range钮,确定g的起始值和终止值。
图6.4 多元方差分析对话框
点击Options...钮,弹出Multivarite ANOVA:Options对话框,选择需要计算的指标。在Factor(s)栏内选变量g,点击钮使之进入Display Means for框,要求计算平均值指标;在Matriced Within Cell栏内选Correlation、Covariance、SSCP项,要求计算单元内的相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在Error Matrices栏内也选上述三项,要求计算误差的相关矩阵、方差协方差矩阵和离均差平方和交叉乘积矩阵;在Diagnostics栏内选Homogeneity test项,要求作变量的方差齐性检验。之后点击Continue钮返回Multivarite ANOVA对话框,最后点击OK钮即可。
6.3.2.3 结果解释
在结果输出窗口中将看到如下分析结果: 系统首先显示共90个观察值进入统计分析,因分组变量g为三个地区,故分析的单元数为3。然后输出3个应变量(x1、x2、x3)的方差齐性检验结果,分别输出了Cochran C检验值及其显著性水平P值、Bartlett-Box F检验值及其显著性水平P值。其中 身高:C = 0.39825,P = 0.540;F = 1.01272,P = 0.363; 体重:C = 0.43787,P = 0.227;F = 4.48624, P = 0.011; 胸围:C = 0.47239, P = 0.089;F = 2.06585, P = 0.127; 可见3项指标的方差基本整齐(P值均大于0.05)。
Cochran C检验和Bartlett-Box F检验对考查协方差矩阵的相等性比较方便,但还不够。于是系统接着分别输出了三类地区(即各个单元)各生长发育指标的离均差平方和交叉乘积矩阵和方差协方差矩阵。之后作Box M检验,Box M检验提供矩阵一致性的多元测试,本例Boxs M = 36.93910,在基于方差分析的显著性检验中F = 2.92393;在基于χ2的显著性检验中χ2 = 35.09922, 两者P
下面系统输出将三类地区看成一个大样本时的离均差平方和交叉乘积矩阵。如X1、X2和X3的离均差平方和分别为662.884、121.562和114.902。在此基础上,进行多元差异的检验。通常有四种方法:
1、Pillai轨迹:V = 1Σ1λi1
1Π1λi1
sssi 2、Wilks λ值:W = i
3、Hotelling轨迹:T = 1Σ1λi1
si
4、Roy最大根:R = λmaxΣ1λmaxi1
式中λmax为最大特征值, λi为第i个特征值,s为非零特征值个数。根据这些值变换的F检验均有显著性(P
X2: SS = 121.56200, F = 10.04439
X3: SS = 114.90200, F = 7.49893
差别均有显著性,说明三项生长发育指标各地区间的差别均有显著性。
之后按单元输出各项指标的观察值均数(Obs.Mean)、调整均数(Adj.Mean)、估计均数(Est.Mean)、粗误差(Raw Resid)、标准化误差(Std.Resid)以及不分地区的总均数(Comined Adjusted Means for G)。
最后,系统输出各变量的离差参数。用户可据此计算预测值,
预测值 Y = 总均数 + 该变量离差参数 + 变量间交互效应的离差参数 如本例因无变量间交互效应的离差参数,故甲地区8岁男生的身高预测值为 Y = 126.46667 + (-1.71555551)= 124.7511145。
上式中126.46667可从系统输出的Combined Adjusted Means for G一栏中得到,离差参数-1.71555551 = 0 - 3.83111111 - (-2.1155556),这是因为离差参数的合计总为0的缘故。余同,在此不作赘述。
学知网推荐:企业培训 管理培训 研修班 总裁研修班 营销管理研修班 房地产研修班 清华大学总裁班 企业管理研修班 北京大学总裁班 工商管理研修班 在职博士 在职硕士
返回主页