双因素(无重复)作用的方差分析
表1 调查结果综合统计数据表
根据本次调查结果综合统计数据表列出的基础数据,将影响专家评分的因素分为专家个人差异和问题自身差异两个方面,以“问题”表示来自问卷中不同问题的差异,“专家”表示来自于不同专家评价和不同单位的差异,采用两因素方差分析方法进行分析。
表2 调查结果综合统计数据两因素方差分析表
表2中对本次调查的原始数据进行的方差分析结果为“问题”的F-统计值为4.7302,其伴随概率为2.67983E-06;“专家”的F-统计值更是高达15.4799,其伴随概率为1.93464E-10。说明“问题”和“专家”都是问卷中评分差异的显
著性成因。
利用SPSS 15.0软件,采用分层聚类(hierarchical cluster )聚类方法,对本次调查的16项问题进行聚类分析。
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
CASE 0 5 10 15 20 25 Num +----------+----------+----------+----------+----------+ 13 ⇩ 15 ⇩⇳⇩⇩⇩ 10 ⇩ ⇩ 11 ⇩ ⇔ ⇔
12 ⇩⇳⇩⇩⇩ ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ 14 ⇩ ⇔ ⇔ 8 ⇩✗⇩⇩⇩⇩⇩ ⇔
9 ⇩ ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ 6 ⇩⇩⇩✗⇩⇩⇩ ⇔ ⇔ 7 ⇩⇩⇩ ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ ⇔ ⇔ 2 ⇩⇩⇩✗⇩⇩⇩ -⇩ ⇔ 5 ⇩⇩⇩ ⇔ ⇔ 1 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ ⇔ 3 ⇩⇩⇩⇩⇩⇩⇩⇩⇩✗⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ ⇔ 16 ⇩⇩⇩⇩⇩⇩⇩⇩⇩ ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ 4 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩
图1 调查结果综合统计数据分层聚类树形图
取聚类评判距离为5,可以将本次调查的16项问题大致地划分为3大类,第一类为问题8、9、10、11、12、13、14、15共8项;第二类为问题6、7、2、5共4项;第三类为问题1、3、16、4共4项。其中,由图1可知,第一类和第二类为具有共同属性的划分,而第三类由前两类划分之后剩余的部分组成,存在着明显的差异。因此,又可以将第三类划分为问题1,4,3与16三个小类。以下在分层聚类的基础上,对各类问题进行深入分析。
首先,对第一类进行分析,先对这一类中所包括的8项问题进行两因素方差分析。
表3 第一类问题的两因素方差分析表
表3中对本次调查第一类问题的原始数据进行的方差分析结果表明,“问题”的F-统计值为仅为0.6292,其伴随概率为0.7284,不能拒绝“问题”对评分差异不具有显著的零假设。“专家”的F-统计值仍然高达49.6752,其伴随概率趋于零。说明在第一类的8项问题中,“专家”个体和所处单位的差异构成了评分差异的显著性成因。
表4 第一类问题的调查结果综合统计数据表
由表4可知,第一类的8项问题的各自均值水平非常接近,围绕在该类均值4.1875的上下,呈微小波动,属于同一层面的特征明显。7位被调查者在第一类8项问题上的均值却呈现出显著差异,最大值为6.1250,最小值为0.2500。由此说明,在被调查者的主观评价差异显著的条件下,通过分层聚类分析,科学和有效地将具有普遍共性特征的问题聚集到一起了。
方差分析中的多重比较
其次,对第二类进行分析。同样先对这一类中所包括的4项问题进行两因素方差分析。
表5 第二类问题的两因素方差分析表
表5中对本次调查第二类问题进行的方差分析结果表明,“问题”的F-统计值仅为1.1905,其伴随概率为0.3469,显然不为小概率事件,因此不能拒绝“问题”对评分差异不具有显著的零假设。“专家”的F-统计值还是高达6.1048,其伴随概率为0.0028,非常显著。说明在第一类的4项问题中,“专家”个体和所处单位的差异构成了评分差异的显著性成因。
表6 第二类问题的调查结果综合统计数据表
同样由表6可知,第二类的4项问题的各自均值水平非常接近,围绕在该类均值5.2917做微幅波动。7位被调查者在第二类的4项问题上的均值却呈现出显著差异,最大值为6.2500,最小值为3.2500。
最后,分析第三类,对这一类中所包括的4项问题进行两因素方差分析。由于第三类由前两类划分之后剩余的部分组成,所以在这4项问题之间存在着明显的差异。
表7 第三类问题的两因素方差分析表
表7中对本次调查第三类问题进行的方差分析结果表明,“问题”的F-统计值为3.3784,其伴随概率为0.0464,小于5%,属于小概率事件,因此拒绝“问题”对评分差异不具有显著的零假设。“专家”的F-统计值反而降为1.7447,其伴随概率为0.1852,不再成为评分差异的显著性因素。
表8 第三类问题的调查结果综合统计数据表
在表8中,问题3与16的评分最低,并且在图1的分层聚类树形图中,在聚类评判距离为5时,问题3与16已经聚合为一类了,因此可以将问题3与16作为一类。问题1和问题4差异明显,应单独分析。这样第三类划分为1、4、3与16三个小类。
表10 基于分层聚类的评分情况综合分析表
在表10的数据基础上,再进行两因素方差分析。
表11 基于分层聚类的评分情况两因素方差分析表
由表11可知,经过分层聚类之后,每一类问题内部的差异最小化,而各类问题之间的差距显著化,使得“问题”的F-统计值高达19.3772,其伴随概率趋于零,因此拒绝“问题”对评分差异不具有显著的零假设,各类“问题”成为0.1695,不构成评分差异的显著性成因。进一步说明对本次调查的以上分类是正确的,将问题划分为三大类,并且将第三类划分为1、4、3与16三个小类的分类过程,体现了所研究问题的本质特征和内在联系。
根据表10和表11分析的结果,从调查问题的角度分析。
双因素(无重复)作用的方差分析
表1 调查结果综合统计数据表
根据本次调查结果综合统计数据表列出的基础数据,将影响专家评分的因素分为专家个人差异和问题自身差异两个方面,以“问题”表示来自问卷中不同问题的差异,“专家”表示来自于不同专家评价和不同单位的差异,采用两因素方差分析方法进行分析。
表2 调查结果综合统计数据两因素方差分析表
表2中对本次调查的原始数据进行的方差分析结果为“问题”的F-统计值为4.7302,其伴随概率为2.67983E-06;“专家”的F-统计值更是高达15.4799,其伴随概率为1.93464E-10。说明“问题”和“专家”都是问卷中评分差异的显
著性成因。
利用SPSS 15.0软件,采用分层聚类(hierarchical cluster )聚类方法,对本次调查的16项问题进行聚类分析。
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
CASE 0 5 10 15 20 25 Num +----------+----------+----------+----------+----------+ 13 ⇩ 15 ⇩⇳⇩⇩⇩ 10 ⇩ ⇩ 11 ⇩ ⇔ ⇔
12 ⇩⇳⇩⇩⇩ ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ 14 ⇩ ⇔ ⇔ 8 ⇩✗⇩⇩⇩⇩⇩ ⇔
9 ⇩ ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ 6 ⇩⇩⇩✗⇩⇩⇩ ⇔ ⇔ 7 ⇩⇩⇩ ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ ⇔ ⇔ 2 ⇩⇩⇩✗⇩⇩⇩ -⇩ ⇔ 5 ⇩⇩⇩ ⇔ ⇔ 1 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ ⇔ 3 ⇩⇩⇩⇩⇩⇩⇩⇩⇩✗⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ ⇔ 16 ⇩⇩⇩⇩⇩⇩⇩⇩⇩ ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩ 4 ⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩
图1 调查结果综合统计数据分层聚类树形图
取聚类评判距离为5,可以将本次调查的16项问题大致地划分为3大类,第一类为问题8、9、10、11、12、13、14、15共8项;第二类为问题6、7、2、5共4项;第三类为问题1、3、16、4共4项。其中,由图1可知,第一类和第二类为具有共同属性的划分,而第三类由前两类划分之后剩余的部分组成,存在着明显的差异。因此,又可以将第三类划分为问题1,4,3与16三个小类。以下在分层聚类的基础上,对各类问题进行深入分析。
首先,对第一类进行分析,先对这一类中所包括的8项问题进行两因素方差分析。
表3 第一类问题的两因素方差分析表
表3中对本次调查第一类问题的原始数据进行的方差分析结果表明,“问题”的F-统计值为仅为0.6292,其伴随概率为0.7284,不能拒绝“问题”对评分差异不具有显著的零假设。“专家”的F-统计值仍然高达49.6752,其伴随概率趋于零。说明在第一类的8项问题中,“专家”个体和所处单位的差异构成了评分差异的显著性成因。
表4 第一类问题的调查结果综合统计数据表
由表4可知,第一类的8项问题的各自均值水平非常接近,围绕在该类均值4.1875的上下,呈微小波动,属于同一层面的特征明显。7位被调查者在第一类8项问题上的均值却呈现出显著差异,最大值为6.1250,最小值为0.2500。由此说明,在被调查者的主观评价差异显著的条件下,通过分层聚类分析,科学和有效地将具有普遍共性特征的问题聚集到一起了。
方差分析中的多重比较
其次,对第二类进行分析。同样先对这一类中所包括的4项问题进行两因素方差分析。
表5 第二类问题的两因素方差分析表
表5中对本次调查第二类问题进行的方差分析结果表明,“问题”的F-统计值仅为1.1905,其伴随概率为0.3469,显然不为小概率事件,因此不能拒绝“问题”对评分差异不具有显著的零假设。“专家”的F-统计值还是高达6.1048,其伴随概率为0.0028,非常显著。说明在第一类的4项问题中,“专家”个体和所处单位的差异构成了评分差异的显著性成因。
表6 第二类问题的调查结果综合统计数据表
同样由表6可知,第二类的4项问题的各自均值水平非常接近,围绕在该类均值5.2917做微幅波动。7位被调查者在第二类的4项问题上的均值却呈现出显著差异,最大值为6.2500,最小值为3.2500。
最后,分析第三类,对这一类中所包括的4项问题进行两因素方差分析。由于第三类由前两类划分之后剩余的部分组成,所以在这4项问题之间存在着明显的差异。
表7 第三类问题的两因素方差分析表
表7中对本次调查第三类问题进行的方差分析结果表明,“问题”的F-统计值为3.3784,其伴随概率为0.0464,小于5%,属于小概率事件,因此拒绝“问题”对评分差异不具有显著的零假设。“专家”的F-统计值反而降为1.7447,其伴随概率为0.1852,不再成为评分差异的显著性因素。
表8 第三类问题的调查结果综合统计数据表
在表8中,问题3与16的评分最低,并且在图1的分层聚类树形图中,在聚类评判距离为5时,问题3与16已经聚合为一类了,因此可以将问题3与16作为一类。问题1和问题4差异明显,应单独分析。这样第三类划分为1、4、3与16三个小类。
表10 基于分层聚类的评分情况综合分析表
在表10的数据基础上,再进行两因素方差分析。
表11 基于分层聚类的评分情况两因素方差分析表
由表11可知,经过分层聚类之后,每一类问题内部的差异最小化,而各类问题之间的差距显著化,使得“问题”的F-统计值高达19.3772,其伴随概率趋于零,因此拒绝“问题”对评分差异不具有显著的零假设,各类“问题”成为0.1695,不构成评分差异的显著性成因。进一步说明对本次调查的以上分类是正确的,将问题划分为三大类,并且将第三类划分为1、4、3与16三个小类的分类过程,体现了所研究问题的本质特征和内在联系。
根据表10和表11分析的结果,从调查问题的角度分析。