问卷的信度与效度评价

・174・

问卷的信度与效度评价

刘朝杰

摘要　国内目前虽有不少采用问卷作为测量工具的科学研究,但有关问卷信度和效度评价的文献却极少,忽视信度和效度评价便不能保证调查质量,对此应引起足够的重视。作者广泛研讨了有关文献,结合我国现状,从数理理论、心理测量学概念、至具体的应用,对信度和效度评价作了深入的探讨。

关键词　问卷　信度　效度

TheAssessmentoftheReliabilityandValidityofQuestionnaire　LiuChaojie.,WestChinaUniversityofMedicalSci2

ences,Chengdu(610041)

Abstract　TherehavealreadybeenmanystudiesusingquestionnaireasstudyinstrumentsinChina.Butunfortunately,fewofthemreportedtheirreliabilityandvalidity.Weshouldpaymuchmoreattentiontothisproblem.Thequalityofasur2veycannotbeguaranteedwithoutenoughreliabilityandvalidityoftheinstruments.Theauthorreviewedabundantlitera2ture,andcompiledthispaperwhichfocusedonthemainprobleminChina.The10thousandswordspapercanbedividedintotwoparts,regardingthereliabilityandvalidityrespectively.ThecontentscoveredtherangfromthestatisticstheoryandtheconceptsofPsychometricstotheirpracticaluse.Theinductionofthemathematicsformulacanbeignoredbythosewholearnlittleinmathematicsandstatistics.

Keywords　Questionnaire　Reliability　Validity

　　问卷的本质是测量工具,用于测量人们的某些特征(如个性、态度等)。所以,选用问卷进行科学研究必须首先考虑问卷的质量问题。

1　信度(Reliability)

信度指测量工具的稳定性,它代表反复测量结果的接近程度〔1〕。其评价指标是信度

)与测量值方系数(R),可以用误差值方差(Ρe差(Ρ2)表达为:R=

1-2

(o≤R≤1)。平行测试模Ρ2

中测量两次,评价两次测量的相关性。两次测

量可以由不同的人进行,也可以由同一人进行,前者称为评价者间信度,误差主要来源于调查员对问卷理解的差异及其对研究对象的影响,信度系数通常在0165至0195之间,一般要求宜高于0185〔4〕。后者称为复测信度,应用最广泛,个体评价对复测信度的要求往往很高,但在比较群体时,要求相对较低。一般而言,复测信度系数能达到0170以上即可〔4〕。重复测量有两个缺陷:首先,研究对象的特征可能随时间发生变化,那么两次测量的差异就不单纯由误差引起;其次,重复测量受前一次测量的影响,不一定能真实反映研究对象的特征。因此,重复测量的间隔时间不宜太长,也不宜太短,多数学者认为以2～4周较为合适。

112　复本测量　设计另外一种与研究问卷在测量内容、应答形式等方面高度类似的问卷,同时测量研究对象。该法最接近平行测试模型,且能避免重复测量的两个缺陷,但要设计并保证真正在复本问卷是非常困难的。113　折半测量　鉴于设计复本问卷非常困

型是估算信度系数的主要模式。按照此模型,如果存在两种形式的测量工具,能够测量同样的值,那么在同一人群中测量结果的差异,就完全由两种工具的误差值引起。通过数学推理可以证明:这样两种测量工具测量结果的相关系数就等于信度系数〔2,3〕。理想的平行测量工具在实际工作中是不存在的。为此,人们提出了四种近似的方法。

111　重复测量　采用一个问卷在同一人群

本题由CMB老年学项目资助

作者单位:四川成都华西医科大学社会医学教研室

(610041)

・175・

问卷的信度系数为:R=

(rij为

1+(k-1)rij

难,可以将一个问卷分拆为两半,分别作为各自的复本。但由于分拆的方法很多,不同分拆方法可能得出不同的信度系烽。两半问卷的相关系数等于半个问卷的信度系数,而一个完整问卷的条目增加了一倍,其信度系数可

=同样道理,以用下式进行换算:Rθ

1+R=长度增至K倍时,Rθ

1+(k-1)R

K条

目间相关系数的平均值)。在这里,R值常被称为CronbachθsΑ系数,代表了问卷条目的内部一致性。它等于所有可能组合的折半法信度系数的平均值〔2〕。值得注意的是,许多问卷测量的内容包括几个领域,宜分别对其估算Α系数,否则整个问卷的内部一致性较低。一般要求问卷的Α系数大于0180。

115　通用理论　通用理论的主要目的在于通过估算测量过程中可能发生的各种变异,提出减少误差的最佳方案,而不是简单回答测量的信度有多高。例如,某研究采用自填和访谈的方式,分别在两月内对20人进行了3次测量,方差分析的结果如下:

均方(MS)

[***********]SDF2SDF2SDF

问卷

114　内部一致性〔7〕　问卷对每个概念的测

量往往都要用一系列的条目,因而根据这些条目之间的相关性也可以评价信度。假如我们将一个条目视为一个初始问卷的话,那么K条目问卷就相当于将K-1个平行问卷与初始问卷相连接,组成了长度为初始问卷K倍的新问卷。根据前面提供的公式,K条目

方　差　来　源

研究对象(S)调查时间(D)填表方式(F)二维交互作用

调查对象×调查时间(S×D)调查对象×填表方式(S×F)调查时间×填表方式(D×F)三维交互作用

(设计水平

2032

表1　方差分析表

期望均方(EMS)

Ρ+2Ρ+3Ρ+6Ρ

Ρ+2Ρ+20Ρ+40ΡD

Ρ+3Ρ+20Ρ+60ΡF

2SD2SD2SF

2SF2DF2DF

Ρ2SDF+2ΡSD22ΡSDF+3ΡSF

Ρ2SDF+20ΡDF

方差

6010155102按照Glass等人的观点〔6〕,每个因素的均方中,均包含了其自身的方差以及该因素与其他各因素交互作用的方差,因而可以将均方分解成表1中第四栏的形式。等式中的方差需乘以不含该方差来源的其他因素的水平

数。例如,ΡD须乘以S和F的水平数(20×2)。据此,得到各因素的方差值(表1第5

的差异较大,宜多重复几次。如果重复测量四次,与时间相关的方差减至原来的1

・174・

问卷的信度与效度评价

刘朝杰

关键词　问卷　信度　效度

TheAssessmentoftheReliabilityandValidityofQuestionnaire　LiuChaojie.,WestChinaUniversityofMedicalSci2

ences,Chengdu(610041)

Keywords　Questionnaire　Reliability　Validity

　　问卷的本质是测量工具,用于测量人们的某些特征(如个性、态度等)。所以,选用问卷进行科学研究必须首先考虑问卷的质量问题。

1　信度(Reliability)

信度指测量工具的稳定性,它代表反复测量结果的接近程度〔1〕。其评价指标是信度

)与测量值方系数(R),可以用误差值方差(Ρe差(Ρ2)表达为:R=

1-2

(o≤R≤1)。平行测试模Ρ2

中测量两次,评价两次测量的相关性。两次测

111　重复测量　采用一个问卷在同一人群

本题由CMB老年学项目资助

作者单位:四川成都华西医科大学社会医学教研室

(610041)

・175・

问卷的信度系数为:R=

(rij为

1+(k-1)rij

=同样道理,以用下式进行换算:Rθ

1+R=长度增至K倍时,Rθ

1+(k-1)R

K条

均方(MS)

[***********]SDF2SDF2SDF

问卷

114　内部一致性〔7〕　问卷对每个概念的测

方　差　来　源

研究对象(S)调查时间(D)填表方式(F)二维交互作用

调查对象×调查时间(S×D)调查对象×填表方式(S×F)调查时间×填表方式(D×F)三维交互作用

(设计水平

2032

表1　方差分析表

期望均方(EMS)

Ρ+2Ρ+3Ρ+6Ρ

Ρ+2Ρ+20Ρ+40ΡD

Ρ+3Ρ+20Ρ+60ΡF

2SD2SD2SF

2SF2DF2DF

Ρ2SDF+2ΡSD22ΡSDF+3ΡSF

Ρ2SDF+20ΡDF

方差

数。例如,ΡD须乘以S和F的水平数(20×2)。据此,得到各因素的方差值(表1第5

的差异较大,宜多重复几次。如果重复测量四次,与时间相关的方差减至原来的1

问卷的信度与效度评价

相关文章