心理测量与评价复习重点
1、 现代心理测量的思想可溯源于中国古代的孔孟!
2、 科举制度被中外学者公认为世界上最早的心理测验的实践。
3、 西方的文官考试制度是19世纪模仿中国科举而起。
4、 科学心理测验诞生于工业革命后19世纪的欧洲。
5、 科学心理测验诞生的标志:1905年,法国的比内编制了世界上第一个心理测验《比内—西盟量表》。
6、 科学心理测验的首倡者:弗朗西斯. 高尔顿(F.Galton )。
7、 “心理测验”概念的提出者:詹姆斯. 麦金. 卡特尔(J.M.Cattell )。
8、 心理测验创始人:阿尔弗雷德. 比内(A.Binet ) 。
心理测量概论
1、 测量就是依据一定的法则用数字对事物加以确定。
2、 测量包括三个要素:对象、法则、数字结果。
3、 同一性和区分性
4、 测量的要素:参照点——计算的起点(绝对零点、相对零点);单位(确定的意义、相等的价值)
5、 量表就是一个定有单位和参照点的连续体。
6、 史蒂文斯根据测量的精确程度,将测量从低级到高级分成四种水平:
类别测量——类别(命名)量表 (最低水平)
等级测量——等级(顺序)量表 (次低水平)
等距测量——等距量表 (较高水平)
比率测量——等比量表 (最高水平)
7、 命名量表(类别量表):性别、国籍;次数(频次)统计,如百分比、χ(卡方)检验等。
8、 顺序量表(等级量表):如大小、高矮、名次、优良中差;中位数、百分位数、等级相关、肯德尔和谐系数(w )等。
9、 等距量表:如摄氏温度;如均数、积差相关系数、T 检验、F 检验等。
10、等比量表:几何平均数等。
11、心理测量是活动,心理测验是工具和方法。心理测验是心理测量方法之一,还有生理测验等。
12、 心理测量:根据一定的法则用数字对人的行为加以确定。特点:间接性(通过行为)、相对性(与常模对比)、客观性。
13、 心理测量只具有等级量表的特征。 2
14、 心理测验的三要素:行为样组、标准化、客观性(不受主观支配)。
15、 心理测量与心理测验的联系和区别:在很多场合,心理测量和心理测验常被作为同义词
来使用。心理测验是了解人心理的工具,而心理测量则是运用测验为工具,达到了解人类心理的实践活动。因此,相对而言,心理测量的意义范围更广一些。
16、 心理测验的种类:
按测验功能分类(智力测验 特殊能力测验 人格测验);
按测验的材料分类(文字测验 操作测验);
按测验材料的严谨程度分类(客观测验 投射测验);
按测验的方式分类(个别测验 团体测验);
按测验的要求分类( 最高行为测验(有对错) 典型行为测验(无对错) )
17、正确的测验观:
①心理测验是重要的心理学研究方法之一,是决策的辅助工具
②心理测验作为研究方法和测量工具尚不完善
智力测验
1、心理测验技能
智力测验:韦氏儿童智力量表(WISC )、联合型瑞文推理测验(CRT )
人格测验:明尼苏达多相人格测验(MMPI )、卡氏16种人格因素测验(16PF )、艾森
克人格问卷(EPQ )
心理与行为问题评估:90项症状清单(SCL-90)、抑郁自评量表(SDS )、焦虑自评
量表(SAS )、社会支持评定量表
职业兴趣测验:霍兰德职业兴趣测验
2、1908版比-西量表首先采用智龄来度量智力(最早应用)。
3、比率智商由德国心理学家施太伦提出。
4、韦克斯勒提出离差智商的概念
5、韦氏儿童智力测验(WISC -CR )
适用范围:6.5~16岁的少年儿童;城市与农村被试共用一套测验
结构:分言语测验和操作测验两部分,共12个分测验。言语测验6个分测验:常识(30项)、类同(17项)、 算术(19项)、词汇(32项)、理解(17项)、背数(顺背8项、倒背7项)(备用) ;操作测验 6个分测验:填图(26项)、排列(13项)、积木(11项)、拼图(5项)、译码甲(8岁以下,50项)、译码乙(8岁及以上,93项)、迷津(9项)(备用) 。 使用:言语测验和操作测验交叉进行;测验通常都是一次完成,对于容易疲劳或动作缓慢者也可分次完成。
WISC-CR 的记分方法:实足年龄的计算:年、月、日;量表分和智商的换算
原始分计算的三个纬度:
反应的正确性
反应的速度
反应的质量
言语量表分VS 、操作量表分PS 、总量表分FS
言语智商VIQ 、操作智商PIQ 、总 智 商FIQ
6、联合型瑞文测验(CRT )
适用范围:适用于5~75岁以内的幼儿、儿童、成人、老年;三个常模:成人、城市儿童、农村儿童。
结构:由瑞文推理测验的标准型与彩色型联合而成。72幅图案,分六个单元(A 、A B 、B 、C 、
D 、E ):前三个单元为彩色图案,后三为黑白图案。
要求:本测验40分钟内交卷,测验进行到20分钟及30分钟各报一次时间;幼儿及弱智者在个别施测时,A 、A B 、B 系列全部完成,C 、D 、E 三单元如连续3题不通过,则该单元不再往下测。
二级评分:答对记1分,答错记0分。原始分等于答对题数
7、中国比内测验:1982年,吴天敏,中文版第三次修订,共51个测题,由易到难排列,适用于2~18岁被试,城市农村共用。
人格测验
1、明尼苏达多相人格测验(MMPI )
构成: 10个临床量表,4个效度量表 ;原版MMPI 共566题,其中1~399题是与临床量表有关的题目, 分出10个临床量表;第400~566题与另外一些研究量表有关,分出4个效度量表 。有评分套版。
4个效度量表:
说谎分数(L):共15个题目,在此量表上分数较低,说明诚实、自信、富于自我批评精神。 诈病分数(F):共64个题目,在此量表上得高分可能是蓄意装病。回答不认真或真的有病,如妄想、幻觉、思维障碍等。
校正分数(K):由30个对装假敏感的题目组成,高K分可能表示装好的企图,低K分可表示过分坦率、自我批评或装坏的企图。
疑问分数(Q ):表示漏答,无法答或“是”、“否”均作回答的题目数,超过30题则答卷无效。
10个临床量表(高分者特征)
⏹ 疑病(Hs ):不愉快、自我中心
⏹ 抑郁(D ):抑郁、感情易变、胆小、依赖、悲观
⏹ 癔病(Hy ):用否认和压抑来处理精神压力
⏹ 病态人格(Pd ):反社会行为、反抗、违规、不成熟、不可信任、外露
⏹ 妄想(Pa ):多疑、孤独、精明、警惕、责怪
⏹ 男性化—女性化(Mf ):
⏹ 男性高分:敏感,爱美,女性化
⏹ 女性高分:好攻击,粗鲁,爱冒险,男性化
精神衰弱(Pt ):紧张,焦虑,强迫思想
⏹ 精神分裂症(Sc ):退缩,胆小,混乱,易变,离奇的念头,古怪的行为
⏹ 轻躁狂(Ma ):善交际,外露,冲动,精力充沛,乐观,纵容
⏹ 社会内向(Si ):内向,胆小,退缩,社交沉默,紧张,过分自我控制
疑病(Hs )、抑郁(D )、癔病(Hy )、病态人格(Pd )、妄想(Pa )、男性化—女性化(Mf )、 精神衰弱(Pt )、精神分裂症(Sc )、轻躁狂(Ma )、社会内向(Si )。
一般认为临床量表中某一量表T 分达到或超过70时便有临床意义。如D 量表T 分>70或以上, 便可解释此人有抑郁症状。
2、卡氏16种人格因素测验(16PF )
16PF 属于团体实施量表,当然也可以个别实施
每一测题有a 、b 、c 三个答案,分别记0、1、2或2、1、0。
聪慧性(B 因素)量表,答对记1分,答错记0分。
测验结果的解释:1~3分为低分,8~10分为高分
A :乐群性、B :聪慧性C :稳定性、E :恃强性、F :兴奋性、G :有恒性、H :敢为性、I :敏感性、L :怀疑性、M :幻想性、N :世故性、O :忧虑性、Q1:实验性、Q2:独立性、Q3:自律性、Q4:紧张性
3、艾森克人格问卷(EPQ )
P:精神质、E:内、外向、N:神经质、L:掩饰虚假
1.典型的外向(E分特高)
2.典型的内向(E分特低)
3.典型情绪不稳(N分特高)
4.情绪稳定(N分很低)
5.(P分高的成人)
独身,不关心人,常有麻烦,在哪里都不合适,可能是残忍的,不人道的,缺乏
同情心,感觉迟钝,对人抱敌意,即令是对亲友也如此。进攻,即使是喜爱的人。喜欢一些古怪的不平常的事情,不惧安危,喜恶作剧,总要捣乱。
心理健康测验
1、90项症状清单(SCL-90)
构成:有90个项目,五级计分,共十个因子。
适用范围:精神科或非精神科门诊的成年人。
评定的时间范围是“现在”或“最近一个星期”。
阳性项目:达到或超过两分的项目;阴性项目:选一的项目,因子分(最高5分):因子总分除以项目数。(计算)
结果:总分超过160分,或阳性项目数超过43项,或任一因子分超过2分,可考虑筛查阳性,需要做进一步的检查。
2、抑郁自评量表(SDS )
SDS 由20个陈述句和相应问题条目组成;每一条目相当于一个有关症状,均按四级评分。主要评定项目为定义的症状出现的频率。
适用范围:具有抑郁症状的成年人。“过去一周”的实际感觉。
结果解释:总粗分的正常上限参考值为41分,超过41有抑郁症状;标准分:总粗分*1.25(取整),正常上限参考值为53分。53-62(轻度抑郁)、63-72(中度抑郁)、72以上(重度抑郁)。
3、焦虑自评量表(SAS )
构成:SAS 共20个项目,分4级,主要评定项目为定义的症状出现的频率。
适用范围:具有焦虑症状的成年人。“过去一周”的实际感觉。
结果解释:总粗分的正常上限参考值为40分;标准分:总粗分*1.25(取整),正常上限参考值为50分。50-59(轻度焦虑)、60-69(中度焦虑)、69以上(重度焦虑)。
4、社会支持评定量表
构成:共十个条目,包括客观支持(3条)、主观支持(4条)、对社会支持的利用度(3条)三个维度。
经典测量理论的基本假设
1、心理特质:指表现在一个人身上,所特有的相对稳定的行为方式。
2、心理特质的可测性:首先,心理特质是一种客观存在;其次,心理测量,没有物理测量那么容易,只能是一种间接测验。
3、测量误差的含义:是指在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。
4、测量误差的种类:随机误差、系统误差
5、测量误差的来源
⏹ 来自心理测量工具(测验的信度、效度)
⏹ 来自测量对象(身体原因、焦虑紧张、应试技巧、应试动机、练习等)
⏹ 来自施测过程 (物理环境 、主试因素 、意外因素 )
6、真分数的含义:反映被试某种心理特质真正水平的那个数值称为该特质的真分数(T )。
7、实际测量得到的分数称为观察分数
8、真分数只是一个理想值
9、数学模型及假设
CTT 的数学模型
X=T +E
观察分数(记为X )与真分数(T )之间是一种线性关系,并只相差一个随机误差(记为E )
信度
1、信度的操作性定义:是指同一被试在不同时间内用同一测验(或两个等值测验)重复测量,所得结果的一致程度。
2、理论定义:指一个测验的稳定性程度。
3、推导公式(PPT)
◆ 信度系数 rxx =S T /SX =rXT
◆ 信度指数
rXT =S T /SX 信度指数的平方即信度系数
◆ 测量标准误 SE=S X
信度越高,标准误越小;信度越低,标准误越大。
4、四类信度系数:重测信度、复本信度、内部一致性信度(分半信度、同质性信度)、评分者信度
同质性信 22 22⎛∑S i ⎫k α =1-2⎪ 克伦巴赫 α系数(适用于多重记分测验) k -1⎝S x ⎭
225、各种信度系数相应误差方差的来源 其中K 为测验的题目数, S i 为某一题目分数的变异数, S x 为测
信度系数类型 误差方差来源
重测信度 时间取样
复本信度 内容取样
重测复本信度 时间和内容取样
分半信度 内容取样
同质性信度 内容的同质性
评分者信度 评分者之间的差异
效度
1、效度是指所测量的与所要测量的心理特点之间的符合程度。
2、效度的方差解释,是有效方差与总方差的比率。
3、信度高,效度未必高;信度低,效度一定低。效度受信度制约 。 r xy ≤r xx
4、内容效度,测题对内容或行为取样的代表性。(专家判断法、统计分析法、经验推测法、)
5、构想效度,是指测验能够测量到理论上的构想或特质的程度。(对测验本身的分析、测验间的相互比较、效标效度的研究证明)
6、效标效度:是指测验对某一行为表现的预测能力的高低
7、好效标的四个条件:有效、稳定、可测、易操作。
8、同时效度:测验所得分数可与效标同时验证
9、预测效度:效标资料需要一段时间才可以搜集到
10、效度的影响因素:测验本身的因素、测验实施中的干扰因素、样本团体的性质、效标的
性质。
项目分析
1、 难度是指项目的难易程度。
2、区分度的定义。也称鉴别力,是指测验项目对被试的心理特性的区分能力。
3、中等难度的项目区分度最高。
导出分数与常模
1、根据测验指导直接计算出来的测验分数叫做原始分数。
2、导出分数就是从原始分数转换而来的具有一定参照点和单位的测验量表上的数值,就是与原始分数等值的量表分数。
3、常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。
4、四种主要的取样方法:简单随机抽样、系统抽样(等距抽样)、分组抽样、分层随机抽样。
5、常模分数:常模分数是将原始分按照一定规则转换出来的导出分数。
6、常模:常模分数构成的分布,就是通常所说的常模。
7、发展性常模:智龄、年级当量、发展顺序表。
8、组内常模:百分位常模、标准分数。
测验的编制
1、 心理测验的编制:
①确定测验的目的
②分析测量目标
③测题的产生
④测验的标准化
⑤测验基本特征的鉴定
2、搜集资料:已出版的标准测验、理论和专家的经验、临床观察和记录
3、测题常见的编排方式:并列直进式、混合螺旋式
测验的使用
1、主试的资格:知识结构、专业理论知识和专业技能、职业道德
2、测验结果的报告:
①不报告具体结果(分数)
②结果严格保密
③让被试了解分数的意义,用发展的观点解读并提供建议
心理测量与评价复习重点
1、 现代心理测量的思想可溯源于中国古代的孔孟!
2、 科举制度被中外学者公认为世界上最早的心理测验的实践。
3、 西方的文官考试制度是19世纪模仿中国科举而起。
4、 科学心理测验诞生于工业革命后19世纪的欧洲。
5、 科学心理测验诞生的标志:1905年,法国的比内编制了世界上第一个心理测验《比内—西盟量表》。
6、 科学心理测验的首倡者:弗朗西斯. 高尔顿(F.Galton )。
7、 “心理测验”概念的提出者:詹姆斯. 麦金. 卡特尔(J.M.Cattell )。
8、 心理测验创始人:阿尔弗雷德. 比内(A.Binet ) 。
心理测量概论
1、 测量就是依据一定的法则用数字对事物加以确定。
2、 测量包括三个要素:对象、法则、数字结果。
3、 同一性和区分性
4、 测量的要素:参照点——计算的起点(绝对零点、相对零点);单位(确定的意义、相等的价值)
5、 量表就是一个定有单位和参照点的连续体。
6、 史蒂文斯根据测量的精确程度,将测量从低级到高级分成四种水平:
类别测量——类别(命名)量表 (最低水平)
等级测量——等级(顺序)量表 (次低水平)
等距测量——等距量表 (较高水平)
比率测量——等比量表 (最高水平)
7、 命名量表(类别量表):性别、国籍;次数(频次)统计,如百分比、χ(卡方)检验等。
8、 顺序量表(等级量表):如大小、高矮、名次、优良中差;中位数、百分位数、等级相关、肯德尔和谐系数(w )等。
9、 等距量表:如摄氏温度;如均数、积差相关系数、T 检验、F 检验等。
10、等比量表:几何平均数等。
11、心理测量是活动,心理测验是工具和方法。心理测验是心理测量方法之一,还有生理测验等。
12、 心理测量:根据一定的法则用数字对人的行为加以确定。特点:间接性(通过行为)、相对性(与常模对比)、客观性。
13、 心理测量只具有等级量表的特征。 2
14、 心理测验的三要素:行为样组、标准化、客观性(不受主观支配)。
15、 心理测量与心理测验的联系和区别:在很多场合,心理测量和心理测验常被作为同义词
来使用。心理测验是了解人心理的工具,而心理测量则是运用测验为工具,达到了解人类心理的实践活动。因此,相对而言,心理测量的意义范围更广一些。
16、 心理测验的种类:
按测验功能分类(智力测验 特殊能力测验 人格测验);
按测验的材料分类(文字测验 操作测验);
按测验材料的严谨程度分类(客观测验 投射测验);
按测验的方式分类(个别测验 团体测验);
按测验的要求分类( 最高行为测验(有对错) 典型行为测验(无对错) )
17、正确的测验观:
①心理测验是重要的心理学研究方法之一,是决策的辅助工具
②心理测验作为研究方法和测量工具尚不完善
智力测验
1、心理测验技能
智力测验:韦氏儿童智力量表(WISC )、联合型瑞文推理测验(CRT )
人格测验:明尼苏达多相人格测验(MMPI )、卡氏16种人格因素测验(16PF )、艾森
克人格问卷(EPQ )
心理与行为问题评估:90项症状清单(SCL-90)、抑郁自评量表(SDS )、焦虑自评
量表(SAS )、社会支持评定量表
职业兴趣测验:霍兰德职业兴趣测验
2、1908版比-西量表首先采用智龄来度量智力(最早应用)。
3、比率智商由德国心理学家施太伦提出。
4、韦克斯勒提出离差智商的概念
5、韦氏儿童智力测验(WISC -CR )
适用范围:6.5~16岁的少年儿童;城市与农村被试共用一套测验
结构:分言语测验和操作测验两部分,共12个分测验。言语测验6个分测验:常识(30项)、类同(17项)、 算术(19项)、词汇(32项)、理解(17项)、背数(顺背8项、倒背7项)(备用) ;操作测验 6个分测验:填图(26项)、排列(13项)、积木(11项)、拼图(5项)、译码甲(8岁以下,50项)、译码乙(8岁及以上,93项)、迷津(9项)(备用) 。 使用:言语测验和操作测验交叉进行;测验通常都是一次完成,对于容易疲劳或动作缓慢者也可分次完成。
WISC-CR 的记分方法:实足年龄的计算:年、月、日;量表分和智商的换算
原始分计算的三个纬度:
反应的正确性
反应的速度
反应的质量
言语量表分VS 、操作量表分PS 、总量表分FS
言语智商VIQ 、操作智商PIQ 、总 智 商FIQ
6、联合型瑞文测验(CRT )
适用范围:适用于5~75岁以内的幼儿、儿童、成人、老年;三个常模:成人、城市儿童、农村儿童。
结构:由瑞文推理测验的标准型与彩色型联合而成。72幅图案,分六个单元(A 、A B 、B 、C 、
D 、E ):前三个单元为彩色图案,后三为黑白图案。
要求:本测验40分钟内交卷,测验进行到20分钟及30分钟各报一次时间;幼儿及弱智者在个别施测时,A 、A B 、B 系列全部完成,C 、D 、E 三单元如连续3题不通过,则该单元不再往下测。
二级评分:答对记1分,答错记0分。原始分等于答对题数
7、中国比内测验:1982年,吴天敏,中文版第三次修订,共51个测题,由易到难排列,适用于2~18岁被试,城市农村共用。
人格测验
1、明尼苏达多相人格测验(MMPI )
构成: 10个临床量表,4个效度量表 ;原版MMPI 共566题,其中1~399题是与临床量表有关的题目, 分出10个临床量表;第400~566题与另外一些研究量表有关,分出4个效度量表 。有评分套版。
4个效度量表:
说谎分数(L):共15个题目,在此量表上分数较低,说明诚实、自信、富于自我批评精神。 诈病分数(F):共64个题目,在此量表上得高分可能是蓄意装病。回答不认真或真的有病,如妄想、幻觉、思维障碍等。
校正分数(K):由30个对装假敏感的题目组成,高K分可能表示装好的企图,低K分可表示过分坦率、自我批评或装坏的企图。
疑问分数(Q ):表示漏答,无法答或“是”、“否”均作回答的题目数,超过30题则答卷无效。
10个临床量表(高分者特征)
⏹ 疑病(Hs ):不愉快、自我中心
⏹ 抑郁(D ):抑郁、感情易变、胆小、依赖、悲观
⏹ 癔病(Hy ):用否认和压抑来处理精神压力
⏹ 病态人格(Pd ):反社会行为、反抗、违规、不成熟、不可信任、外露
⏹ 妄想(Pa ):多疑、孤独、精明、警惕、责怪
⏹ 男性化—女性化(Mf ):
⏹ 男性高分:敏感,爱美,女性化
⏹ 女性高分:好攻击,粗鲁,爱冒险,男性化
精神衰弱(Pt ):紧张,焦虑,强迫思想
⏹ 精神分裂症(Sc ):退缩,胆小,混乱,易变,离奇的念头,古怪的行为
⏹ 轻躁狂(Ma ):善交际,外露,冲动,精力充沛,乐观,纵容
⏹ 社会内向(Si ):内向,胆小,退缩,社交沉默,紧张,过分自我控制
疑病(Hs )、抑郁(D )、癔病(Hy )、病态人格(Pd )、妄想(Pa )、男性化—女性化(Mf )、 精神衰弱(Pt )、精神分裂症(Sc )、轻躁狂(Ma )、社会内向(Si )。
一般认为临床量表中某一量表T 分达到或超过70时便有临床意义。如D 量表T 分>70或以上, 便可解释此人有抑郁症状。
2、卡氏16种人格因素测验(16PF )
16PF 属于团体实施量表,当然也可以个别实施
每一测题有a 、b 、c 三个答案,分别记0、1、2或2、1、0。
聪慧性(B 因素)量表,答对记1分,答错记0分。
测验结果的解释:1~3分为低分,8~10分为高分
A :乐群性、B :聪慧性C :稳定性、E :恃强性、F :兴奋性、G :有恒性、H :敢为性、I :敏感性、L :怀疑性、M :幻想性、N :世故性、O :忧虑性、Q1:实验性、Q2:独立性、Q3:自律性、Q4:紧张性
3、艾森克人格问卷(EPQ )
P:精神质、E:内、外向、N:神经质、L:掩饰虚假
1.典型的外向(E分特高)
2.典型的内向(E分特低)
3.典型情绪不稳(N分特高)
4.情绪稳定(N分很低)
5.(P分高的成人)
独身,不关心人,常有麻烦,在哪里都不合适,可能是残忍的,不人道的,缺乏
同情心,感觉迟钝,对人抱敌意,即令是对亲友也如此。进攻,即使是喜爱的人。喜欢一些古怪的不平常的事情,不惧安危,喜恶作剧,总要捣乱。
心理健康测验
1、90项症状清单(SCL-90)
构成:有90个项目,五级计分,共十个因子。
适用范围:精神科或非精神科门诊的成年人。
评定的时间范围是“现在”或“最近一个星期”。
阳性项目:达到或超过两分的项目;阴性项目:选一的项目,因子分(最高5分):因子总分除以项目数。(计算)
结果:总分超过160分,或阳性项目数超过43项,或任一因子分超过2分,可考虑筛查阳性,需要做进一步的检查。
2、抑郁自评量表(SDS )
SDS 由20个陈述句和相应问题条目组成;每一条目相当于一个有关症状,均按四级评分。主要评定项目为定义的症状出现的频率。
适用范围:具有抑郁症状的成年人。“过去一周”的实际感觉。
结果解释:总粗分的正常上限参考值为41分,超过41有抑郁症状;标准分:总粗分*1.25(取整),正常上限参考值为53分。53-62(轻度抑郁)、63-72(中度抑郁)、72以上(重度抑郁)。
3、焦虑自评量表(SAS )
构成:SAS 共20个项目,分4级,主要评定项目为定义的症状出现的频率。
适用范围:具有焦虑症状的成年人。“过去一周”的实际感觉。
结果解释:总粗分的正常上限参考值为40分;标准分:总粗分*1.25(取整),正常上限参考值为50分。50-59(轻度焦虑)、60-69(中度焦虑)、69以上(重度焦虑)。
4、社会支持评定量表
构成:共十个条目,包括客观支持(3条)、主观支持(4条)、对社会支持的利用度(3条)三个维度。
经典测量理论的基本假设
1、心理特质:指表现在一个人身上,所特有的相对稳定的行为方式。
2、心理特质的可测性:首先,心理特质是一种客观存在;其次,心理测量,没有物理测量那么容易,只能是一种间接测验。
3、测量误差的含义:是指在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。
4、测量误差的种类:随机误差、系统误差
5、测量误差的来源
⏹ 来自心理测量工具(测验的信度、效度)
⏹ 来自测量对象(身体原因、焦虑紧张、应试技巧、应试动机、练习等)
⏹ 来自施测过程 (物理环境 、主试因素 、意外因素 )
6、真分数的含义:反映被试某种心理特质真正水平的那个数值称为该特质的真分数(T )。
7、实际测量得到的分数称为观察分数
8、真分数只是一个理想值
9、数学模型及假设
CTT 的数学模型
X=T +E
观察分数(记为X )与真分数(T )之间是一种线性关系,并只相差一个随机误差(记为E )
信度
1、信度的操作性定义:是指同一被试在不同时间内用同一测验(或两个等值测验)重复测量,所得结果的一致程度。
2、理论定义:指一个测验的稳定性程度。
3、推导公式(PPT)
◆ 信度系数 rxx =S T /SX =rXT
◆ 信度指数
rXT =S T /SX 信度指数的平方即信度系数
◆ 测量标准误 SE=S X
信度越高,标准误越小;信度越低,标准误越大。
4、四类信度系数:重测信度、复本信度、内部一致性信度(分半信度、同质性信度)、评分者信度
同质性信 22 22⎛∑S i ⎫k α =1-2⎪ 克伦巴赫 α系数(适用于多重记分测验) k -1⎝S x ⎭
225、各种信度系数相应误差方差的来源 其中K 为测验的题目数, S i 为某一题目分数的变异数, S x 为测
信度系数类型 误差方差来源
重测信度 时间取样
复本信度 内容取样
重测复本信度 时间和内容取样
分半信度 内容取样
同质性信度 内容的同质性
评分者信度 评分者之间的差异
效度
1、效度是指所测量的与所要测量的心理特点之间的符合程度。
2、效度的方差解释,是有效方差与总方差的比率。
3、信度高,效度未必高;信度低,效度一定低。效度受信度制约 。 r xy ≤r xx
4、内容效度,测题对内容或行为取样的代表性。(专家判断法、统计分析法、经验推测法、)
5、构想效度,是指测验能够测量到理论上的构想或特质的程度。(对测验本身的分析、测验间的相互比较、效标效度的研究证明)
6、效标效度:是指测验对某一行为表现的预测能力的高低
7、好效标的四个条件:有效、稳定、可测、易操作。
8、同时效度:测验所得分数可与效标同时验证
9、预测效度:效标资料需要一段时间才可以搜集到
10、效度的影响因素:测验本身的因素、测验实施中的干扰因素、样本团体的性质、效标的
性质。
项目分析
1、 难度是指项目的难易程度。
2、区分度的定义。也称鉴别力,是指测验项目对被试的心理特性的区分能力。
3、中等难度的项目区分度最高。
导出分数与常模
1、根据测验指导直接计算出来的测验分数叫做原始分数。
2、导出分数就是从原始分数转换而来的具有一定参照点和单位的测验量表上的数值,就是与原始分数等值的量表分数。
3、常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。
4、四种主要的取样方法:简单随机抽样、系统抽样(等距抽样)、分组抽样、分层随机抽样。
5、常模分数:常模分数是将原始分按照一定规则转换出来的导出分数。
6、常模:常模分数构成的分布,就是通常所说的常模。
7、发展性常模:智龄、年级当量、发展顺序表。
8、组内常模:百分位常模、标准分数。
测验的编制
1、 心理测验的编制:
①确定测验的目的
②分析测量目标
③测题的产生
④测验的标准化
⑤测验基本特征的鉴定
2、搜集资料:已出版的标准测验、理论和专家的经验、临床观察和记录
3、测题常见的编排方式:并列直进式、混合螺旋式
测验的使用
1、主试的资格:知识结构、专业理论知识和专业技能、职业道德
2、测验结果的报告:
①不报告具体结果(分数)
②结果严格保密
③让被试了解分数的意义,用发展的观点解读并提供建议