第二章因素型心理实验设计

《实验心理学》教案(3) 应用心理学 2002 级03班

第二章 因素型心理实验设计

实验设计是进行心理学实验研究的基本过程和重要保证。我们将分三个内容来讨论有关于心理实验设计问题:一是因素型实验设计,这是讨论的重点;二是心理学的生态化运动和准实验设计,这是近年来开始受到心理学家关注的新课题;三是实验心理学的逻辑。我们希望在这三部分内容学习之后,不仅对心理实验设计的方法有所了解,更重要的是对心理学的实验研究方法有一个正确的估价,同时能够培养一种正确的又不是保守和僵化的思想方法。

本章对心理学的实验设计类型进行分析之后,专门讨论因素型心理实验设计。

一、心理实验设计的类型分析

什么叫做心理实验设计?那我们先说什么是心理实验:创设或改变一定的条件,以引起被试的某种心理活动以进行观察的心理学研究方法。其在本质上,还是要进行观察,只不过这种观察不再是被动的,是研究者对被试施加了某种影响或控制,所以心理实验又叫做有控制的观察。这样一来,我们可以把观察和实验表示成一个维度上的两端,如图2-1所示。观察法是在保证被研究对象完全真实自然存在的条件下,对其心理和行为的外在表现进行观察,然后推断其心理活动规律的方法;实验法则是在严密控制实验中可能的额外变量的情况下,操纵自变量,观察被研究对象的心理和行为的外在表现,然后推断其心理活动规律的方法;准实验方法和自然实验法均为介于观察法和实验法之间的心理学研究方法,这两种方法都是指对被研究对象有一定的干预和影响,但对实验中可能的额外变量未作严格控制的研究方法,其在一定程度上保证了研究对象的自然存在性。在图2-1中的坐标上,越靠近右端,实验中对额外变量的控制越严格;越靠近左端,研究中对额外变量的控制越少。

这里不再讨论观察法,所以讨论的范围就被界定为准实验设计和真实验设计。真实验设计就是要在实验过程中尽量严密地控制实验条件,以探求被试心理活动的因果关系;准实验设计就是不严密的实验设计,其中不求对实验条件进行严密控制,更强调研究情境的自然性和真实性。所以准实验法、自然实验法、实验室实验法三者之间的区别是相对的。

要考虑的第二个问题是:心理学实证研究的目的是什么?归纳来说,其目的大都属于三方面:第一是为了测定人的心理特征,比如测定其感受性、视敏度、记忆力、智商水平、气质特征等,这类研究可以用实验方法进行测试、可以用观察法进行鉴定、还可以使用心理测验量表进行测定,我们统称之为测验式实验;第二是为了初步探测某一心理现象的可能影响因素或其对其它心理现象可能存在的影响效应,采用大样本的多维度测验,然后进行相关分析,这一类研究可以称之为相关实验研究或相关研究;第三,就是为了直接探明某种心理现象与其他心理现象或内外因素的因果关系,这叫做因素型实验或函数型实

验。我们准备讨论的实验设计主要从因素型实验的角度考虑。因果关系的研究可以是观察法、准实验法和实验法。观察法不在本课程的讨论范围,我们就讨论因素型实验设计和因素型准实验设计。

那么,因素型实验设计包括哪些类型呢?这需要从三个维度来分析:第一,自变量的个数和水平数,比如我要研究选择反应时间是否受到灯光刺激颜色的影响,那自变量就是一个,即刺激光的颜色。如果在设计实验中,采用了四种不同颜色的灯光作为刺激,那么灯光的颜色就是有四种变化,这个自变量就是四个水平。还比如,要研究对于不同音高的声频刺激左右耳的感受性是否存在差异,则研究中的自变量有两个,其中左右耳变量是两个水平,声频可以根据研究者对研究精确性、条件许可程度设置两个或两个以上的水平,比如以低音、中音、高音三个档次,或以500HZ、2KHZ、10KHZ等,这就是三个水平,这样构成的实验设计就叫做2×3实验设计。第二,被试的选择和分组方法,就是看实验被试是如何选取和分组的,选取和分组的方法可以是随机抽取的,即从研究对象的总体中随机抽取一定量的被试数,在分组时也是按照随机的方法;也可以采用匹配法,即对被试先进行某些心理品质的预测,根据预测的结果把某种心理品质接近的被试分配到不同的实验处理中,以使各实验组被试基本相等。第三,实验的程序,主要是看实验程序的编排上,是让各个实验组独立地完成一个实验处理呢?还是在多种实验处理条件下重复地完成实验,于是实验设计就有独立组设计和重复实验设计之分,而当实验中考虑到一个或多个额外变量的影响,并采用轮回等方式编排实验程序以平衡这些额外变量可能带来的影响,这就有了拉丁方实验设计。从这三方面考虑,可以把心理学中的因素型实验设计方法划分成如图2-2所示的各种类型。

要按照哪种方法来设计实验,需根据实验的具体课题和实验的条件来制订。下边我们就以具体的一些例子来讨论一些基本的心理实验设计的方法及其数据处理方法。

二、多因素完全随机实验设计

对于单因素完全随机实验设计来说,实验的处理数就是自变量的水平数,将被试随机分配到各个处理组上就可以了。多因素完全随机实验设计则是多个因素的多种水平相互结合,构成多个处理的结合,如二因素二水平,就是有两个自变量,每个自变量有两个水平,则处理的结合共有四个,这种实验设计称为是2×2实验设计;如果一个自变量两个水平,另一个变量是三个水平,则共有6个实验处理,这种实验设计就是2×3实验设计;如果有三个自变量,其中两个自变量是2个水平,另一个变量有3个

水平,则这种实验设计有12个实验处理,叫做2×2×3设计。所有自变量的各水平结合成多少种实验处理,就需要多少组实验被试。现在我们就以最简单的多因素完全随机实验设计来说明。

举例:现在为了研究广东人对普通话听力材料和粤语听力材料的理解是否有差异,而且同时考察听力材料是男声朗读还是女声朗读对理解是否有影响,我们可以做这样的一个二因素二水平的完全随机实验设计。首先选取20个被试,这20个被试在教育程度、语言学习背景(都为地道的广东人)、知识水平等因素基本相当。采用随机分组方法把他们分成4组,每一组接受一种实验处理,这四种实验处理就是听下列四种不同的听力材料:

普通话男声(A1B1)、普通话女声(A1B2)、粤语男声(A2B1)、粤语女声(A2B2)

各组实验是独立的,组与组之间不存在相关。实验中各组被试听到的材料内容是完全一样的,使用的测试问卷也是一样的。我们假定得到表2-1所示的数据。

表2-1 广东人对普通话与粤语听力材料理解性的比较

B1 70 50 75 60 60

A1

B2 70 80 80 75 85

B1 80 60 90 85 95

A2

B2 75 80 70 80 90

下边我们先给出方差分析的实际计算过程,然后再给出SPSS程序,并比较二者的计算结果。两因素完全随机实验设计的方差分析表如表2-2所示。

表2-2 两因素完全随机实验设计的方差分析表

变异来源 A的主效应 B的主效应 AB交互效应

误差 合计

SSA SSB SSAB SSE SST

平方和

a-1 b-1 (a-1)(b-1) ab(n-1) abn-1

自由度

MSA MSB MSAB MSE

均方

F MSA/MSE MSB/MSE MSAB/MSE

P

如何计算表中的各项平方和是方差分析的关键。计算过程如下:

表2-3 广东人对普通话与粤语理解性的比较

315 390 410 395 1510

全部数据的和的平方=2280100

则SSA=[(315+390)2/10+(410+395)2/10]-2280100/20=49702.5+64802.5-114005=500 SSB=[(315+410)2/10+(390+395)2/10]-114005=52562.5+61622.5-114005=180 SSAB=(3152/5+3902/5+4102/5+3952/5)-SSA-SSB-114005 =19845+30420+33620+31205-500-180-114005=405

SST=20225+30550+34350+31425-114005=2545(所有观测值的平方和-所有观测值和的平方除以被试数) SSE=SST-SSA-SSB-SSAB=2545-500-180-405=1460

对照表2-2我们得到这一实验的方差分析表,如表2-4所示。

表2-4 广东人对普通话和粤语理解程度实验方差分析表(手工计算结果)

变异来源 A的主效应 500 B的主效应 180 AB交互效应 405

误差 合计

平方和

1 1 1 16 19

自由度

500 180 405

均方 F 5.479 1.973 4.438

P 0.05 >0.05

1460 2545

91.25

附F(1,16)|(0.05)=4.49 F(1,16)|(0.01)=8.53

从方差分析表可以看出,变自量A的主效应达到显著水平,自变量B的主效应没有达到显著性水平,A和B的交互效应接近显著性水平但没有达到显著性水平。因此,可以得到结论:广东人对普通话和对粤语的理解程度不同,材料朗读的男声或女声有一定的影响但不十分显著。那么,我们如果采用SPSS软件来进行分析,会得到什么样的结果呢?我们使用下列程序对之进行方差分析。

DATA LIST FIXED/A 1 B 2 R 3-4. BEGING DATA. 1170 1150 1175 1160 1160 1270 1280 1280 1275 1285 2180 2160 2190 2185 2195 2275 2280 2270 2280

2290 END DATA.

ANOVA R BY A(1,2) B(1,2) /STATISTICS=ALL. 程序运行输出的结果为:

表2-5 广东人对普通话和粤语理解程度实验的方差分析表(SPSS程序运行结果)

R

2-Way

Interactions

Model Residual Total

Unique Method Sum of Squares

680.000 500.000 180.000 405.000 1085.000 1460.000 2545.000

A B A * B

2 1 1 1 3 16 19

F

Sig. .047 .033 .179 .051 .027

df Mean Square

Main Effects (Combined) 340.000 3.726 500.000 5.479 180.000 1.973 405.000 4.438 361.667 3.963 91.250 133.947

这一结果与我们不使用统计软件计算的结果完全一致。

在后续的实验设计中,我们就不再详细地介绍各种实验设计的数据分析过程,有些常用的可以给出数据处理的SPSS程序。

关于多因素完全随机实验设计,我们再举一个例子:

研究者希望对影响学生阅读理解的因素作细致深入的研究,如他同时想探讨文章的生字密度、文章的类型和文章的句子长短对学生阅读理解的影响。他设计的两种生字密度是5:1(A1)和20:1(A2)、两种文章类型是说明文(B1)和叙述文(B2)、两种句子长度是平均20个字(C1)和平均30个字(C2)。研究者按照这八种处理的结合,选择了8篇特点不同的文章,将32名学生随机分成8组,每组4人阅读一篇文章并进行阅读理解测验。

数据模式:

表2-6 2×2×2实验设计的数据模式

B1 C1 3 6 4 3

对于这一实验处理,我们可以按照上述同样的方法,将变异源进行分解。三因素的实验设计中其变异源包括以下几个方面:

C2 5 7 5 2

A1

C1 4 6 4 2

B2

C2 4 5 3 3

C1 8 9 8 7

B1

C2 5 6 7 6 A2 C1 9 8 8 7

B2

C2 12 13 12 11

变量A的主效应 变量B的主效应 变量C的主效应

变量A和变量B的交互效应 变量B和变量C的交互效应 变量C和变量A的交互效应 变量A、变量B和变量C的交互效应 误差因素

方差分析的SPSS程序是: DATA LIST FREE/A B C SCORE. BEGIN DATA. 1 1 1 3 1 1 1 6 1 1 1 4 1 1 1 3 1 1 2 5 1 1 2 7 1 1 2 5 1 1 2 2 1 2 1 4 1 2 1 6 1 2 1 4 1 2 1 2 1 2 2 4 1 2 2 5 1 2 2 3 1 2 2 3 2 1 1 8 2 1 1 9 2 1 1 8 2 1 1 7 2 1 2 5 2 1 2 6 2 1 2 7 2 1 2 6 2 2 1 9 2 2 1 8 2 2 1 8 2 2 1 7 2 2 2 12

2 2 2 13 2 2 2 12 2 2 2 11 END DATA.

ANOVA SCORE BY A(1,2) B(1,2) C(1,2). 程序运行输出的结果是:

表2-7 2×2×2完全随机实验设计的方差分析结果

SCORE

a SCORE by A, B, C

从程序运行的结果可以看出,自变量A和B的主效应显著,自变量C的主效应不显著,A和B、B和C、A和B和C的交互效应显著,其它的交互效应未达到显著性水平。

Interactions

Interactions

Model Residual Total

231.375 7 37.500 24 268.875 31

33.054 21.154 1.563 8.673

.000

A * B A * C B * C

24.500 1 1.125 1 12.500 1 24.500 1

24.500 15.680 1.125

.720

12.500 8.000 24.500 15.680

.001 .405 .009 .001

Unique Method

F

Sig. .000 .000 .009 .170 .001

Sum of Squares df Mean Square

168.750 3 153.125 1 12.500 1 3.125 1 38.125 3

A B C

Main Effects (Combined) 56.250 36.000 153.125 98.000 12.500 8.000 3.125 2.000 12.708 8.133

2-Way (Combined)

3-Way A * B * C

三、多因素重复实验设计

多因素重复实验设计中,每个被试都参加所有实验处理的结合,比如有三个因素的水平数分别是p、q、r,则其结合的处理数是三者之乘,这就是每个被试参加的实验数。很显然,这种实验设计使用的被试数是最少的,因此带进实验的被试间的个体差异也最少。当实验中的自变量都适合于做被试内变量,且实验任务较简单,每次实验不费很多时间,就可以使用多因素重复实验设计。我们还以上述实验的数据为例,只不过这一数据的获得是在重复实验中获得的,所以数据处理的程序就不同了。其数据处理程序是:

DATA LIST FREE/A1B1C1 A1B1C2 A1B2C1 A1B2C2 A2B1C1 A2B1C2 A2B2C1 A2B2C2. BEGIN DATA. 3 5 4 4 8 5 9 12 6 7 6 5 9 6 8 12

4 5 4 3 8 7 8 12 3 2 2 3 7 6 7 11 END DATA.

MANOVA A1B1C1 A1B1C2 A1B2C1 A1B2C2 A2B1C1 A2B1C2 A2B2C1 A2B2C2 /WSFACTORS=A(2) B(2) C(2).

程序运行的结果:

表2-8 2×2×2多因素重复实验设计的方差分析结果

-

* * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests of Between-Subjects Effects.

Tests of Significance for T1 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 20.34 3 6.78

CONSTANT 1262.53 1 1262.53 186.18 .001 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A' Within-Subject Effect.

Tests of Significance for T2 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 7.09 3 2.36

A 148.78 1 148.78 62.92 .004 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'B' Within-Subject Effect.

Tests of Significance for T3 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 2.09 3 .70

B 11.28 1 11.28 16.16 .028 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'C' Within-Subject Effect.

Tests of Significance for T4 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS .34 3 .11

C 2.53 1 2.53 22.09 .018 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A BY B' Within-Subject Effect.

Tests of Significance for T5 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS .59 3 .20

A BY B 22.78 1 22.78 115.11 .002 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A BY C' Within-Subject Effect.

Tests of Significance for T6 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 2.09 3 .70

A BY C .78 1 .78 1.12 .368 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'B BY C' Within-Subject Effect.

Tests of Significance for T7 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 1.09 3 .36

B BY C 11.28 1 11.28 30.94 .011 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A BY B BY C' Within-Subject Effect. Tests of Significance for T8 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 2.59 3 .86

A BY B BY C 22.78 1 22.78 26.35 .014 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

从方差分析结果可以看出,自变量A、B、C的主效应均显著,A与B、B与C、A与B与C的交互效应也都显著,A与C的交互效应未达到显著性水平。

四、多因素混合实验设计

混合设计指在一个因素实验中,包含至少一个被试内因素、一个被试间因素的设计。如二因素实验中,有一个被试内因素和一个被试间因素;三因素实验中,有一个被试内因素和两个被试间因素,或者是有两个被试内因素、一个被试间因素。下边我们以四因素实验中有两个被试内因素、两个被试间因素为例来说明其实验过程和数据分析。

问题模式:假如研究者要研究生字密度、文章类型、句子长度和主题熟悉度四个因素对学生阅读理解的影响,他为每个因素设置两个水平,把生字密度(A)和文章类型(B)作为被试内因素,把主题熟悉度(C)和句子长度(D)作为被试间因素,这就需要采用混合实验设计来进行实验了。

实验设计模式:这一实验设计模式可以表示成表2-9所示的形式。

表2-9 四因素重复测量二因素实验设计模式

生字密度A1 议论文B1

叙事文B2

生字密度A2 议论文B1

叙事文B2

在这一实验设计中,共选取被试8名,每一被试都接受因素A和因素B结合形成的四种实验的处理,但在因素C和因素D结合形成的四种实验处理中,某一被试只接受其中的一种实验处理,所以A和B是被试内因素、C和D则是被试间因素。

假定以上述实验设计模式进行实际研究得到的数据如表2-10 所示。

表2-10 四因素重复测量二因素实验设计模式

这一实验数据的分析程序如下:

* Four-Factor Mixed Experiment Anova. * With Two Repeated Factors.

DATA LIST Fixed/C 1 D 2 A1B1 3 A1B2 4 A2B1 5 A2B2 6-7. BEGIN DATA. 113657 115889 126678 124768 2149812 2178714

生字密度A1 议论文B1

叙事文B2

生字密度A2 议论文B1

叙事文B2

2237611 2258410 END DATA.

MANOVA A1B1 A1B2 A2B1 A2B2 BY C(1,2) D(1,2) /WSFACTORS=A(2)B(2) /PRINT=CELLINFO(MEANS) /DESIGN.

该程序运行输出的方差分析结果如下:

表2-11 四因素二重复实验设计的方差分析结果

* * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests of Between-Subjects Effects.

Tests of Significance for T1 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F

WITHIN CELLS 11.75 4 2.94

C 12.50 1 12.50 4.26 .108 D 6.12 1 6.12 2.09 .222 C BY D 8.00 1 8.00 2.72 .174 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tests involving 'A' Within-Subject Effect.

Tests of Significance for T2 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 4.75 4 1.19

A 36.13 1 36.13 30.42 .005 C BY A 2.00 1 2.00 1.68 .264 D BY A 1.12 1 1.12 .95 .386 C BY D BY A .50 1 .50 .42 .552 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'B' Within-Subject Effect.

Tests of Significance for T3 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 2.25 4 .56

B 78.13 1 78.13 138.89 .000 C BY B 12.50 1 12.50 22.22 .009 D BY B .12 1 .12 .22 .662 C BY D BY B .50 1 .50 .89 .399 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A BY B' Within-Subject Effect.

Tests of Significance for T4 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 7.25 4 1.81

A BY B 1.13 1 1.13 .62 .475 C BY A BY B 4.50 1 4.50 2.48 .190 D BY A BY B .13 1 .13 .07 .806 C BY D BY A BY B .50 1 .50 .28 .627

从这一分析结果可以看出,自变量A、B的主效应显著,自变量C、D的主效应不显著,C和B的交互效应显著,其它的交互效应不显著

对于多因素混合实验设计,编制方差分析程序的规律可以总结如下:

(1)实验中所有因素都要出现在DATA LIST 语句中,其中斜线后边首先给出的是被试间因素,然后是被试内因素的水平或水平的结合;

(2)MANOVA语句中首先给出被试内因素的水平或水平的结合,其顺序应与DATA LIST 中一致。被试间因素放在BY之后,每个因素名后面的括号中是其水平的最小值和最大值;

(3)在WSFACTORS分命令中,仅列被试内因素及其水平数。如果实验中有多个被试内因素,注意以合适的顺序排列被试内因素,即遵循“变化较慢”的因素在先、“变化较快”的因素在后的原则;

(4)BEGIN DATA后面的数据的列数与DATA LIST语句中相对应,其中每个被试间因素应有一列表示其水平的编码,被试内因素的各水平的观测值应在同一行内排列,其列数与水平数或水平结合数相同。

五、单因素随机区组实验设计

我们已经学习过单因素的组间设计,也就是将被试随机分成相等的多组,各组被试各自完成一种实验处理,然后比较各组被试之间反应的差异。我们可以使用t检验(两个小样本组)、Z检验(两个大样本组)和方差分析(三组以上被试)。方差分析是最能体现差异检验的性质的。组间设计的方差分析是将所有观测值的总体变异分解成两部分:组间变异、组内变异(包括组内被试的差异和其它因素导致的变异,可以统称为是残差)。组间变异就是由自变量的变化带来的,组内变异则是由自变量以外的因素引起的。方差分析的目的就是将自变量引起的误差与残差比较,如果相对较大则说明自变量明显地引起了被试反应的差异;如果相对较小,则说明自变量带来的被试反应变化较小,不能明显区别于其它因素导致的误差,也就难以确定自变量是否真的对因变量有明显的影响。很明显,如果自变量的影响是确定的,那么残差越大,自变量的影响越是不容易显示出来,因为在这种情况下就难以确定组间的变异是自变量引起的呢?还是未知因素影响的?

上述分析,启发我们,残差部分越大越是不能显示出自变量的影响效应。如果在实验设计中考虑到被试的差异,从设计上能保证把被试差异带来的变异中的一部分分离出来,即减少未知因素带来的误差项即残差,方差分析就更灵敏地将自变量的效应显示出来。由此我们介绍单因素的随机区组实验设计及其数据处理过程。

现有15名被试参加缪勒错觉实验。实验的目的是想考察箭头角度的变化对错觉量的影响,因此设计的箭头张合角度分为300、450和600。考虑教育训练的可能影响,15名被试中3人来自数学系、3人来自物理系、3人来自化学系、3人来自中文系、3人来自历史系。那么我们需要把教育训练作为一个额外变量来考虑,就要采用区组实验设计,即有5个区组,每个区组3人各自接受自变量三个水平中的一

个水平即一种实验处理。这种设计虽然也有多个被试组,但是这些被试不是按照随机方式进行分组的,他们之间不是完全独立的了,他们的反应可能会存在一定的相关性。

这样的设计不仅考虑了自变量的影响,而且也考虑了被试本身的某一方面特征的影响,将被试间的差异作为一个区组变量,这样就可以至少部分地把被试间差异引起的反应变异从残差中分离出来。

我们假设上述实验设计实际得到的观测数据如表2-12所示。

表2-12 箭头张合角度与缪勒错觉量的关系

区组 1 2 3 4 5

300 6 8 7 9 8 38

450 5 4 7 6 8 30

600 3 4 4 6 7 24

14 16 18 21 23 92

对于这一实验设计模型,其数据如何处理呢?我们只能采取方差分析的方法来分析。其方差分析的计算可以按照表2-13所示项目和示例进行。

表2-13 单因素随机区组实验设计的方差分析表

方差来源

处理(组间)

区组 误差 合计

平方和 SS处理

SS区组 SS误差 SS总

自由度

a-1 b-1 (a-1)(b-1) ab-1

均方

MS处理 MS区组 MS误差

F值

MS处理/MS误差 MS区组/MS误差

P

在这样的分析中,我们将自变量以外因素带来的变异又分成了两部分:被试所在区组不同导致的差异和其他不明因素带来的差异(即残差),而自变量变异的显著性主要是在与残差部分比较中衡量的,所以残差部分的减少就使得自变量的影响效应更容易显现出来。现在我们以表2-1的数据为例进行计算:

SS处理=382/5+302/5+242/5-922/15=20

SS区组=142/3+162/3+182/3+212/3+232/3-922/15=18 SS总=Σyij2-922/15=46 SS误差=46-20-18=8

MS处理=20/2=10 MS区组=18/4=4.5 MS误差=8/8=1

MS处理/MS误差=10> 8.65 则 P7.01 则 P

由此分析可以得到结论:在缪勒错觉实验中,箭头张合角度不同导致错觉量的显著差异,即箭头张合角度对缪勒错觉量具有显著影响。实验中不同被试的错觉量也差异明显。

这一实验设计的SPSS程序是:

DATA LIST FREE/muller1 TO muller3. BEGIN DATA. 6 5 3 8 4 4 7 7 4 9 6 6 8 8 7 END DATA.

MANOVA muller1 muller2 muller3 /WSFACTORS=muler(3) /PRINT=CELLINFO(MEANS) /DESIGN.

程序运行输出结果如表2-14所示。

表2-14 单因素随机区组实验设计方差分析表

Tests involving 'MULER' Within-Subject Effect.

Source of Variation SS DF MS F Sig of F MULER 19.73 2 9.87 9.55 .008 WITHIN CELLS 8.27 8 1.03

这一程序实际上是把上述设计看作匹配组设计来处理的,其结果与前述的计算结果基本一致,但也

有一些差异,这差异来自何处?作为匹配组设计处理,只是考虑到以区组变量作为匹配变量导致的组间的不独立性,即组间数据的相关性,没能考虑到即使是来自同一区组,被试间还是有差异的,所以并不能将被试变异分离彻底。应该说,这一分析程序将区组设计粗略地看作了匹配组设计。

区组实验设计一般是在被试选取或分组过程中,有些被试变量不拟控制时使用的。而且需要注意的是,在进行区组实验设计的时候,每个区组中的被试数必须是实验处理数的倍数,这样才能将每个区组中的被试匹配地分到各个实验处理当中。此外,区组实验设计还有一个假设前提,那就是:区组变量与自变量之间没有交互作用,如果已经知道某变量与自变量有交互作应,就不能将其作为区组变量。

六、多因素随机区组实验设计

在多因素完全随机实验设计中,被试是随机分组,因此我们对被试的差异没有特别关注,被试差异带来的变异混淆在残差当中,这也同样会影响方差分析的敏感度。当我们考虑某一被试因素可能会对研究结论带来混淆时,可以采用多因素随机区组实验设计。

区组设计来自于农业试验等领域。比如,我想试验不同的水稻品种及下种的时间对产量的影响。自变量包括两个,即种子类别和下种时间。但是同时,我又考虑到不同土质对水稻生长及收成的影响,就需要划定几个不同土质的试验田,这每一个试验田就是一个区组。再把每一个区组分成小块,每一个小块按照特定的种植方式下种(在某一时间下种某一品种),并且保证在每一个区组内包含所有的种植方式,即种植时间与不同品种的所有结合。这一试验模式可以表示成如图2-3所示的形式。

下边我们用教法实验说明这一设计模型。如为了试验新教材更适宜的教学方法,研究者考虑到学生学习成绩的影响,选择优中差各12个班进行试验。经过一学年的教学过程然后进行学生学习成绩的比较,即年终各班平均的考试成绩如表2-15所示。

表2-15 教学实验一年后考试成绩

区组 优等班 中等班 差等班

教材1

教法1 50 40 50 40 40 30 20 30 30

教法2 60 50 70 50 50 40 50 40 40

教法1 50 40 60 40 50 50 30 40 30

教材2

教法2 80 70 90 70 60 60 50 40 50

这一实验结果可以近似地按照混合实验设计进行分析,即将两个自变量(记为A和B)作为组内变量、将区组变量(记为C)作为组间变量来编写分析程序,程序如下:

DATA LIST FREE/C A1B1 A1B2 A2B1 A2B2. BEGIN DATA. 1 50 60 50 80 1 40 50 40 70 1 50 70 60 90 2 40 50 40 70 2 40 50 50 60 2 30 40 50 60

3 20 50 30 50 3 30 40 40 40 3 30 40 30 50 END DATA.

MANOVA A1B1 A1B2 A2B1 A2B2 BY C(1,2) /WSFACTORS=A(2)B(2) /PRINT=CELLINFO(MEANS) /DESIGN.

这一程序运行的结果如下:

表2-16 多因素随机区组实验设计的方差分析结果

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Cell Means and Standard Deviations Variable .. A1B1

FACTOR CODE Mean Std. Dev. N C 1 46.667 5.774 3 C 2 36.667 5.774 3 C 3 26.667 5.774 3 For entire sample 36.667 10.000 9 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Variable .. A1B2

FACTOR CODE Mean Std. Dev. N C 1 60.000 10.000 3 C 2 46.667 5.774 3 C 3 43.333 5.774 3 For entire sample 50.000 10.000 9 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Variable .. A2B1

FACTOR CODE Mean Std. Dev. N C 1 50.000 10.000 3 C 2 46.667 5.774 3 C 3 33.333 5.774 3 For entire sample 43.333 10.000 9 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Variable .. A2B2

FACTOR CODE Mean Std. Dev. N C 1 80.000 10.000 3 C 2 63.333 5.774 3 C 3 46.667 5.774 3 For entire sample 63.333 15.811 9

* * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests of Between-Subjects Effects.

Tests of Significance for T1 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 683.33 6 113.89

C 2816.67 2 1408.33 12.37 .007 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A' Within-Subject Effect.

Tests of Significance for T2 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 83.33 6 13.89

A 900.00 1 900.00 64.80 .000 C BY A 116.67 2 58.33 4.20 .072 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'B' Within-Subject Effect.

Tests of Significance for T3 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 283.33 6 47.22

B 2500.00 1 2500.00 52.94 .000 C BY B 116.67 2 58.33 1.24 .355 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A BY B' Within-Subject Effect.

Tests of Significance for T4 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 150.00 6 25.00

A BY B 100.00 1 100.00 4.00 .092 C BY A BY B 150.00 2 75.00 3.00 .125 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

从分析结果看,区组变量与自变量A和B均无显著的交互效应,符合区组实验设计的前提假设。区组变量C、自变量A和自变量B的主效应均达到显著性水平,变量间的交互效应均未达到显著性水平。

六、单因素拉丁方实验设计

区组实验设计是在考察自变量的影响效应的实验中,考虑到某一个额外变量的影响,就将这个额外变量作为区组变量,以便将该区组变量引起的变异从残差中分离出来。如果将区组实验设计进一步进行扩展,即考虑两个额外变量的影响而欲将这两个额外变量引起的变异从残差项中分离出来的时候,就可以采用拉丁方实验设计。

拉丁方是一个含P行P列,把P个处理分配给P×P方格的管理方案,它便于在复杂程序中有条理地管理各个工作单元,并平衡各种因素的影响。在工农业生产试验和心理与教育研究中,拉丁方都得到普遍应用。在这种实验设计中,首先根据自变量处理的水平数确定两个额外变量的水平数,然后利用两个额外变量的各个水平结合在一起构造一个方格,最后再将自变量的不同处理平衡地安排在这个方格中,其结果要使自变量的每一个水平在拉丁方格的每一行和每一列都只出现一次,就构成了一个研究方案。很明显自变量的水平数、额外变量的水平数必须相等。根据这样的原则,我们举例说明按照4×4拉丁方格设计一个实验方案。

问题模式:为了研究简单反应时间与光刺激的颜色和强度的关系,研究者同时考虑到被试的气质类型及年龄因素可能对反应时间具有明显影响,为了将这两个因素的影响从变异的残差项中分离出去,研究者采用了拉丁方实验设计。具体设计方案如下:

(1)拉丁方格的组成:

拉丁方格由实验的额外变量气质类型和年龄档次组成:分别从13、14、15、16岁四个年龄档的中学生中选出四种气质类型的学生各2人,这样就有共计32个被试,每个拉丁方格中的一个格子中有两名被试。然后根据气质类型和年龄档次组成拉丁方格以决定各个被试参加何种实验。拉丁方格的形式如下,每一个格子中有两个被试:

表2-17 4×4拉丁方格

被 试 年 龄 档 次

(2)实验处理组成:

实验中的自变量有两个,即光的颜色和光的强度。自变量的颜色取两个水平,分别为红光和绿光;光的强度也取两个水平,相对强度分别为:1和1/4。于是两个自变量结合而成的实验处理分别为:

A——红光+1(即光的颜色为红光、光的相对强度为1,以下与此相似) B——红光+1/4 C——绿光+1 D——绿光+1/4 (3)实验处理的编排:

现在有A、B、C、D四种实验处理,有4×4拉丁方格,可以按照拉丁方实验设计的基本原则,将四种实验处理安排在拉丁方格中,某种实验处理被分配到拉丁方格中的某一个方各中,该方格中对应的两个被试就要完成这一种实验处理。

首先,我们给出一个基本的拉丁方设计形式,如表2-18所示。

表2-18 4×4拉丁方格

被试气质类型

多血质

胆汁质

粘液质

抑郁质

13

14 15 16

被 试 年 龄 档 次

被试气质类型

多血质

胆汁质

粘液质

抑郁质

13

14 15 16

表2-18所示的实验设计方案就是一个标准的或基本的4×4拉丁方的实验设计。有了这样的设计方案之后,实验程序的编排就非常清晰了,不仅将能将两个额外变量的效应从残差项中分离出来,而且也有利于增进复杂实验过程的条理性。有了表2-18所示的实验方案,每个被试需要完成什么样的实验就很清晰了,比如14岁胆汁质的两个学生只需完成C实验处理,即“绿光+1”实验处理、16岁粘液质的两个学生只需完成B实验处理,即“红光+1/4”实验处理。

有了表2-18所示的基本的拉丁方实验设计方案之后,还可以将该方案中的任何两行或任何两列对换,就可以得到另外一个拉丁方实验设计方案。比如将其中的第1列和第四列对换就可以得到下边这个拉丁方实验设计方案:

表2-19 4×4拉丁方格

被 试 年 龄 档 次

被试气质类型

多血质

胆汁质

粘液质

抑郁质

13

14 15 16

把表2-19中的第2行和第3行对换就可以得到表2-20所示的拉丁方实验设计。

表2-20 4×4拉丁方格

被 试 年 龄 档 次

被试气质类型

多血质

胆汁质

粘液质

抑郁质

13

14 15 16

按照这些变换得来的拉丁方设计也同样可以达到该研究所要求的实验效果。

拉丁方实验设计的数据分析比较复杂,我们在此不再讨论。

拉丁方实验设计既有优点也有缺点。其优点是,在许多研究情境中,这种设计比完全随机和随机区组设计更加有效,它可以使研究者分离出两个额外变量的影响,因而减小实验误差,可获得对实验处理效应的更精确的估价。另外,通过对方格单元内误差与残差的F检验,可以检验额外变量与自变量是否有交互作用,以检验采用拉丁方设计是否合适。拉丁方设计的缺点是,它的关于自变量与额外变量不存在交互作用的假设在很多情况下都难以保证,尤其当实验中含有多个自变量的时候。因此,拉丁方实验设计在多因素实验中不常用。另外,拉丁方实验设计要求每个额外变量的水平数与实验处理数必须相等也在一定程度上限制了拉丁方实验设计的使用1。

建议阅读材料

1. 朱滢 主编.实验心理学.北京:北京大学出版社.2000,19-36. 2. 杨治良 主编. 基础实验心理学.兰州:甘肃人民出版社. 1988,20-52. 3. 杨治良 编著. 实验心理学.杭州:浙江教育出版社. 1998,44-102.

4. 孟庆茂,常建华 编著.实验心理学.北京:北京师大出版社.30-40.舒华 编著. 心理与教育研究中

的多因素实验设计. 北京师范大学出版社. 1994.

复习思考题

1. 如何理解:重复实验设计、完全随机实验设计、混合实验设计、区组实验设计、拉丁方实验设计、

方差分析、变异源、残差、2析因实验设计、交互作用或交互效应? 2. 多因素实验设计的类型主要有哪些?

3. 如何进行单因素完全随机实验设计的数据分析? 4. 如何进行多因素完全随机实验设计的数据分析? 5. 如何进行重复实验设计的数据分析? 6. 如何进行区组实验设计?

7.

k

如何进行拉丁方实验设计?8. 使用多因素实验设计方法编制一个心理实验研究方案。

1

舒华 编著. 心理与教育研究中的多因素实验设计. 北京:北京师范大学出版社. 1994,58

《实验心理学》教案(3) 应用心理学 2002 级03班

第二章 因素型心理实验设计

实验设计是进行心理学实验研究的基本过程和重要保证。我们将分三个内容来讨论有关于心理实验设计问题:一是因素型实验设计,这是讨论的重点;二是心理学的生态化运动和准实验设计,这是近年来开始受到心理学家关注的新课题;三是实验心理学的逻辑。我们希望在这三部分内容学习之后,不仅对心理实验设计的方法有所了解,更重要的是对心理学的实验研究方法有一个正确的估价,同时能够培养一种正确的又不是保守和僵化的思想方法。

本章对心理学的实验设计类型进行分析之后,专门讨论因素型心理实验设计。

一、心理实验设计的类型分析

什么叫做心理实验设计?那我们先说什么是心理实验:创设或改变一定的条件,以引起被试的某种心理活动以进行观察的心理学研究方法。其在本质上,还是要进行观察,只不过这种观察不再是被动的,是研究者对被试施加了某种影响或控制,所以心理实验又叫做有控制的观察。这样一来,我们可以把观察和实验表示成一个维度上的两端,如图2-1所示。观察法是在保证被研究对象完全真实自然存在的条件下,对其心理和行为的外在表现进行观察,然后推断其心理活动规律的方法;实验法则是在严密控制实验中可能的额外变量的情况下,操纵自变量,观察被研究对象的心理和行为的外在表现,然后推断其心理活动规律的方法;准实验方法和自然实验法均为介于观察法和实验法之间的心理学研究方法,这两种方法都是指对被研究对象有一定的干预和影响,但对实验中可能的额外变量未作严格控制的研究方法,其在一定程度上保证了研究对象的自然存在性。在图2-1中的坐标上,越靠近右端,实验中对额外变量的控制越严格;越靠近左端,研究中对额外变量的控制越少。

这里不再讨论观察法,所以讨论的范围就被界定为准实验设计和真实验设计。真实验设计就是要在实验过程中尽量严密地控制实验条件,以探求被试心理活动的因果关系;准实验设计就是不严密的实验设计,其中不求对实验条件进行严密控制,更强调研究情境的自然性和真实性。所以准实验法、自然实验法、实验室实验法三者之间的区别是相对的。

要考虑的第二个问题是:心理学实证研究的目的是什么?归纳来说,其目的大都属于三方面:第一是为了测定人的心理特征,比如测定其感受性、视敏度、记忆力、智商水平、气质特征等,这类研究可以用实验方法进行测试、可以用观察法进行鉴定、还可以使用心理测验量表进行测定,我们统称之为测验式实验;第二是为了初步探测某一心理现象的可能影响因素或其对其它心理现象可能存在的影响效应,采用大样本的多维度测验,然后进行相关分析,这一类研究可以称之为相关实验研究或相关研究;第三,就是为了直接探明某种心理现象与其他心理现象或内外因素的因果关系,这叫做因素型实验或函数型实

验。我们准备讨论的实验设计主要从因素型实验的角度考虑。因果关系的研究可以是观察法、准实验法和实验法。观察法不在本课程的讨论范围,我们就讨论因素型实验设计和因素型准实验设计。

那么,因素型实验设计包括哪些类型呢?这需要从三个维度来分析:第一,自变量的个数和水平数,比如我要研究选择反应时间是否受到灯光刺激颜色的影响,那自变量就是一个,即刺激光的颜色。如果在设计实验中,采用了四种不同颜色的灯光作为刺激,那么灯光的颜色就是有四种变化,这个自变量就是四个水平。还比如,要研究对于不同音高的声频刺激左右耳的感受性是否存在差异,则研究中的自变量有两个,其中左右耳变量是两个水平,声频可以根据研究者对研究精确性、条件许可程度设置两个或两个以上的水平,比如以低音、中音、高音三个档次,或以500HZ、2KHZ、10KHZ等,这就是三个水平,这样构成的实验设计就叫做2×3实验设计。第二,被试的选择和分组方法,就是看实验被试是如何选取和分组的,选取和分组的方法可以是随机抽取的,即从研究对象的总体中随机抽取一定量的被试数,在分组时也是按照随机的方法;也可以采用匹配法,即对被试先进行某些心理品质的预测,根据预测的结果把某种心理品质接近的被试分配到不同的实验处理中,以使各实验组被试基本相等。第三,实验的程序,主要是看实验程序的编排上,是让各个实验组独立地完成一个实验处理呢?还是在多种实验处理条件下重复地完成实验,于是实验设计就有独立组设计和重复实验设计之分,而当实验中考虑到一个或多个额外变量的影响,并采用轮回等方式编排实验程序以平衡这些额外变量可能带来的影响,这就有了拉丁方实验设计。从这三方面考虑,可以把心理学中的因素型实验设计方法划分成如图2-2所示的各种类型。

要按照哪种方法来设计实验,需根据实验的具体课题和实验的条件来制订。下边我们就以具体的一些例子来讨论一些基本的心理实验设计的方法及其数据处理方法。

二、多因素完全随机实验设计

对于单因素完全随机实验设计来说,实验的处理数就是自变量的水平数,将被试随机分配到各个处理组上就可以了。多因素完全随机实验设计则是多个因素的多种水平相互结合,构成多个处理的结合,如二因素二水平,就是有两个自变量,每个自变量有两个水平,则处理的结合共有四个,这种实验设计称为是2×2实验设计;如果一个自变量两个水平,另一个变量是三个水平,则共有6个实验处理,这种实验设计就是2×3实验设计;如果有三个自变量,其中两个自变量是2个水平,另一个变量有3个

水平,则这种实验设计有12个实验处理,叫做2×2×3设计。所有自变量的各水平结合成多少种实验处理,就需要多少组实验被试。现在我们就以最简单的多因素完全随机实验设计来说明。

举例:现在为了研究广东人对普通话听力材料和粤语听力材料的理解是否有差异,而且同时考察听力材料是男声朗读还是女声朗读对理解是否有影响,我们可以做这样的一个二因素二水平的完全随机实验设计。首先选取20个被试,这20个被试在教育程度、语言学习背景(都为地道的广东人)、知识水平等因素基本相当。采用随机分组方法把他们分成4组,每一组接受一种实验处理,这四种实验处理就是听下列四种不同的听力材料:

普通话男声(A1B1)、普通话女声(A1B2)、粤语男声(A2B1)、粤语女声(A2B2)

各组实验是独立的,组与组之间不存在相关。实验中各组被试听到的材料内容是完全一样的,使用的测试问卷也是一样的。我们假定得到表2-1所示的数据。

表2-1 广东人对普通话与粤语听力材料理解性的比较

B1 70 50 75 60 60

A1

B2 70 80 80 75 85

B1 80 60 90 85 95

A2

B2 75 80 70 80 90

下边我们先给出方差分析的实际计算过程,然后再给出SPSS程序,并比较二者的计算结果。两因素完全随机实验设计的方差分析表如表2-2所示。

表2-2 两因素完全随机实验设计的方差分析表

变异来源 A的主效应 B的主效应 AB交互效应

误差 合计

SSA SSB SSAB SSE SST

平方和

a-1 b-1 (a-1)(b-1) ab(n-1) abn-1

自由度

MSA MSB MSAB MSE

均方

F MSA/MSE MSB/MSE MSAB/MSE

P

如何计算表中的各项平方和是方差分析的关键。计算过程如下:

表2-3 广东人对普通话与粤语理解性的比较

315 390 410 395 1510

全部数据的和的平方=2280100

则SSA=[(315+390)2/10+(410+395)2/10]-2280100/20=49702.5+64802.5-114005=500 SSB=[(315+410)2/10+(390+395)2/10]-114005=52562.5+61622.5-114005=180 SSAB=(3152/5+3902/5+4102/5+3952/5)-SSA-SSB-114005 =19845+30420+33620+31205-500-180-114005=405

SST=20225+30550+34350+31425-114005=2545(所有观测值的平方和-所有观测值和的平方除以被试数) SSE=SST-SSA-SSB-SSAB=2545-500-180-405=1460

对照表2-2我们得到这一实验的方差分析表,如表2-4所示。

表2-4 广东人对普通话和粤语理解程度实验方差分析表(手工计算结果)

变异来源 A的主效应 500 B的主效应 180 AB交互效应 405

误差 合计

平方和

1 1 1 16 19

自由度

500 180 405

均方 F 5.479 1.973 4.438

P 0.05 >0.05

1460 2545

91.25

附F(1,16)|(0.05)=4.49 F(1,16)|(0.01)=8.53

从方差分析表可以看出,变自量A的主效应达到显著水平,自变量B的主效应没有达到显著性水平,A和B的交互效应接近显著性水平但没有达到显著性水平。因此,可以得到结论:广东人对普通话和对粤语的理解程度不同,材料朗读的男声或女声有一定的影响但不十分显著。那么,我们如果采用SPSS软件来进行分析,会得到什么样的结果呢?我们使用下列程序对之进行方差分析。

DATA LIST FIXED/A 1 B 2 R 3-4. BEGING DATA. 1170 1150 1175 1160 1160 1270 1280 1280 1275 1285 2180 2160 2190 2185 2195 2275 2280 2270 2280

2290 END DATA.

ANOVA R BY A(1,2) B(1,2) /STATISTICS=ALL. 程序运行输出的结果为:

表2-5 广东人对普通话和粤语理解程度实验的方差分析表(SPSS程序运行结果)

R

2-Way

Interactions

Model Residual Total

Unique Method Sum of Squares

680.000 500.000 180.000 405.000 1085.000 1460.000 2545.000

A B A * B

2 1 1 1 3 16 19

F

Sig. .047 .033 .179 .051 .027

df Mean Square

Main Effects (Combined) 340.000 3.726 500.000 5.479 180.000 1.973 405.000 4.438 361.667 3.963 91.250 133.947

这一结果与我们不使用统计软件计算的结果完全一致。

在后续的实验设计中,我们就不再详细地介绍各种实验设计的数据分析过程,有些常用的可以给出数据处理的SPSS程序。

关于多因素完全随机实验设计,我们再举一个例子:

研究者希望对影响学生阅读理解的因素作细致深入的研究,如他同时想探讨文章的生字密度、文章的类型和文章的句子长短对学生阅读理解的影响。他设计的两种生字密度是5:1(A1)和20:1(A2)、两种文章类型是说明文(B1)和叙述文(B2)、两种句子长度是平均20个字(C1)和平均30个字(C2)。研究者按照这八种处理的结合,选择了8篇特点不同的文章,将32名学生随机分成8组,每组4人阅读一篇文章并进行阅读理解测验。

数据模式:

表2-6 2×2×2实验设计的数据模式

B1 C1 3 6 4 3

对于这一实验处理,我们可以按照上述同样的方法,将变异源进行分解。三因素的实验设计中其变异源包括以下几个方面:

C2 5 7 5 2

A1

C1 4 6 4 2

B2

C2 4 5 3 3

C1 8 9 8 7

B1

C2 5 6 7 6 A2 C1 9 8 8 7

B2

C2 12 13 12 11

变量A的主效应 变量B的主效应 变量C的主效应

变量A和变量B的交互效应 变量B和变量C的交互效应 变量C和变量A的交互效应 变量A、变量B和变量C的交互效应 误差因素

方差分析的SPSS程序是: DATA LIST FREE/A B C SCORE. BEGIN DATA. 1 1 1 3 1 1 1 6 1 1 1 4 1 1 1 3 1 1 2 5 1 1 2 7 1 1 2 5 1 1 2 2 1 2 1 4 1 2 1 6 1 2 1 4 1 2 1 2 1 2 2 4 1 2 2 5 1 2 2 3 1 2 2 3 2 1 1 8 2 1 1 9 2 1 1 8 2 1 1 7 2 1 2 5 2 1 2 6 2 1 2 7 2 1 2 6 2 2 1 9 2 2 1 8 2 2 1 8 2 2 1 7 2 2 2 12

2 2 2 13 2 2 2 12 2 2 2 11 END DATA.

ANOVA SCORE BY A(1,2) B(1,2) C(1,2). 程序运行输出的结果是:

表2-7 2×2×2完全随机实验设计的方差分析结果

SCORE

a SCORE by A, B, C

从程序运行的结果可以看出,自变量A和B的主效应显著,自变量C的主效应不显著,A和B、B和C、A和B和C的交互效应显著,其它的交互效应未达到显著性水平。

Interactions

Interactions

Model Residual Total

231.375 7 37.500 24 268.875 31

33.054 21.154 1.563 8.673

.000

A * B A * C B * C

24.500 1 1.125 1 12.500 1 24.500 1

24.500 15.680 1.125

.720

12.500 8.000 24.500 15.680

.001 .405 .009 .001

Unique Method

F

Sig. .000 .000 .009 .170 .001

Sum of Squares df Mean Square

168.750 3 153.125 1 12.500 1 3.125 1 38.125 3

A B C

Main Effects (Combined) 56.250 36.000 153.125 98.000 12.500 8.000 3.125 2.000 12.708 8.133

2-Way (Combined)

3-Way A * B * C

三、多因素重复实验设计

多因素重复实验设计中,每个被试都参加所有实验处理的结合,比如有三个因素的水平数分别是p、q、r,则其结合的处理数是三者之乘,这就是每个被试参加的实验数。很显然,这种实验设计使用的被试数是最少的,因此带进实验的被试间的个体差异也最少。当实验中的自变量都适合于做被试内变量,且实验任务较简单,每次实验不费很多时间,就可以使用多因素重复实验设计。我们还以上述实验的数据为例,只不过这一数据的获得是在重复实验中获得的,所以数据处理的程序就不同了。其数据处理程序是:

DATA LIST FREE/A1B1C1 A1B1C2 A1B2C1 A1B2C2 A2B1C1 A2B1C2 A2B2C1 A2B2C2. BEGIN DATA. 3 5 4 4 8 5 9 12 6 7 6 5 9 6 8 12

4 5 4 3 8 7 8 12 3 2 2 3 7 6 7 11 END DATA.

MANOVA A1B1C1 A1B1C2 A1B2C1 A1B2C2 A2B1C1 A2B1C2 A2B2C1 A2B2C2 /WSFACTORS=A(2) B(2) C(2).

程序运行的结果:

表2-8 2×2×2多因素重复实验设计的方差分析结果

-

* * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests of Between-Subjects Effects.

Tests of Significance for T1 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 20.34 3 6.78

CONSTANT 1262.53 1 1262.53 186.18 .001 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A' Within-Subject Effect.

Tests of Significance for T2 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 7.09 3 2.36

A 148.78 1 148.78 62.92 .004 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'B' Within-Subject Effect.

Tests of Significance for T3 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 2.09 3 .70

B 11.28 1 11.28 16.16 .028 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'C' Within-Subject Effect.

Tests of Significance for T4 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS .34 3 .11

C 2.53 1 2.53 22.09 .018 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A BY B' Within-Subject Effect.

Tests of Significance for T5 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS .59 3 .20

A BY B 22.78 1 22.78 115.11 .002 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A BY C' Within-Subject Effect.

Tests of Significance for T6 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 2.09 3 .70

A BY C .78 1 .78 1.12 .368 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'B BY C' Within-Subject Effect.

Tests of Significance for T7 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 1.09 3 .36

B BY C 11.28 1 11.28 30.94 .011 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A BY B BY C' Within-Subject Effect. Tests of Significance for T8 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 2.59 3 .86

A BY B BY C 22.78 1 22.78 26.35 .014 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

从方差分析结果可以看出,自变量A、B、C的主效应均显著,A与B、B与C、A与B与C的交互效应也都显著,A与C的交互效应未达到显著性水平。

四、多因素混合实验设计

混合设计指在一个因素实验中,包含至少一个被试内因素、一个被试间因素的设计。如二因素实验中,有一个被试内因素和一个被试间因素;三因素实验中,有一个被试内因素和两个被试间因素,或者是有两个被试内因素、一个被试间因素。下边我们以四因素实验中有两个被试内因素、两个被试间因素为例来说明其实验过程和数据分析。

问题模式:假如研究者要研究生字密度、文章类型、句子长度和主题熟悉度四个因素对学生阅读理解的影响,他为每个因素设置两个水平,把生字密度(A)和文章类型(B)作为被试内因素,把主题熟悉度(C)和句子长度(D)作为被试间因素,这就需要采用混合实验设计来进行实验了。

实验设计模式:这一实验设计模式可以表示成表2-9所示的形式。

表2-9 四因素重复测量二因素实验设计模式

生字密度A1 议论文B1

叙事文B2

生字密度A2 议论文B1

叙事文B2

在这一实验设计中,共选取被试8名,每一被试都接受因素A和因素B结合形成的四种实验的处理,但在因素C和因素D结合形成的四种实验处理中,某一被试只接受其中的一种实验处理,所以A和B是被试内因素、C和D则是被试间因素。

假定以上述实验设计模式进行实际研究得到的数据如表2-10 所示。

表2-10 四因素重复测量二因素实验设计模式

这一实验数据的分析程序如下:

* Four-Factor Mixed Experiment Anova. * With Two Repeated Factors.

DATA LIST Fixed/C 1 D 2 A1B1 3 A1B2 4 A2B1 5 A2B2 6-7. BEGIN DATA. 113657 115889 126678 124768 2149812 2178714

生字密度A1 议论文B1

叙事文B2

生字密度A2 议论文B1

叙事文B2

2237611 2258410 END DATA.

MANOVA A1B1 A1B2 A2B1 A2B2 BY C(1,2) D(1,2) /WSFACTORS=A(2)B(2) /PRINT=CELLINFO(MEANS) /DESIGN.

该程序运行输出的方差分析结果如下:

表2-11 四因素二重复实验设计的方差分析结果

* * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests of Between-Subjects Effects.

Tests of Significance for T1 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F

WITHIN CELLS 11.75 4 2.94

C 12.50 1 12.50 4.26 .108 D 6.12 1 6.12 2.09 .222 C BY D 8.00 1 8.00 2.72 .174 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Tests involving 'A' Within-Subject Effect.

Tests of Significance for T2 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 4.75 4 1.19

A 36.13 1 36.13 30.42 .005 C BY A 2.00 1 2.00 1.68 .264 D BY A 1.12 1 1.12 .95 .386 C BY D BY A .50 1 .50 .42 .552 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'B' Within-Subject Effect.

Tests of Significance for T3 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 2.25 4 .56

B 78.13 1 78.13 138.89 .000 C BY B 12.50 1 12.50 22.22 .009 D BY B .12 1 .12 .22 .662 C BY D BY B .50 1 .50 .89 .399 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A BY B' Within-Subject Effect.

Tests of Significance for T4 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 7.25 4 1.81

A BY B 1.13 1 1.13 .62 .475 C BY A BY B 4.50 1 4.50 2.48 .190 D BY A BY B .13 1 .13 .07 .806 C BY D BY A BY B .50 1 .50 .28 .627

从这一分析结果可以看出,自变量A、B的主效应显著,自变量C、D的主效应不显著,C和B的交互效应显著,其它的交互效应不显著

对于多因素混合实验设计,编制方差分析程序的规律可以总结如下:

(1)实验中所有因素都要出现在DATA LIST 语句中,其中斜线后边首先给出的是被试间因素,然后是被试内因素的水平或水平的结合;

(2)MANOVA语句中首先给出被试内因素的水平或水平的结合,其顺序应与DATA LIST 中一致。被试间因素放在BY之后,每个因素名后面的括号中是其水平的最小值和最大值;

(3)在WSFACTORS分命令中,仅列被试内因素及其水平数。如果实验中有多个被试内因素,注意以合适的顺序排列被试内因素,即遵循“变化较慢”的因素在先、“变化较快”的因素在后的原则;

(4)BEGIN DATA后面的数据的列数与DATA LIST语句中相对应,其中每个被试间因素应有一列表示其水平的编码,被试内因素的各水平的观测值应在同一行内排列,其列数与水平数或水平结合数相同。

五、单因素随机区组实验设计

我们已经学习过单因素的组间设计,也就是将被试随机分成相等的多组,各组被试各自完成一种实验处理,然后比较各组被试之间反应的差异。我们可以使用t检验(两个小样本组)、Z检验(两个大样本组)和方差分析(三组以上被试)。方差分析是最能体现差异检验的性质的。组间设计的方差分析是将所有观测值的总体变异分解成两部分:组间变异、组内变异(包括组内被试的差异和其它因素导致的变异,可以统称为是残差)。组间变异就是由自变量的变化带来的,组内变异则是由自变量以外的因素引起的。方差分析的目的就是将自变量引起的误差与残差比较,如果相对较大则说明自变量明显地引起了被试反应的差异;如果相对较小,则说明自变量带来的被试反应变化较小,不能明显区别于其它因素导致的误差,也就难以确定自变量是否真的对因变量有明显的影响。很明显,如果自变量的影响是确定的,那么残差越大,自变量的影响越是不容易显示出来,因为在这种情况下就难以确定组间的变异是自变量引起的呢?还是未知因素影响的?

上述分析,启发我们,残差部分越大越是不能显示出自变量的影响效应。如果在实验设计中考虑到被试的差异,从设计上能保证把被试差异带来的变异中的一部分分离出来,即减少未知因素带来的误差项即残差,方差分析就更灵敏地将自变量的效应显示出来。由此我们介绍单因素的随机区组实验设计及其数据处理过程。

现有15名被试参加缪勒错觉实验。实验的目的是想考察箭头角度的变化对错觉量的影响,因此设计的箭头张合角度分为300、450和600。考虑教育训练的可能影响,15名被试中3人来自数学系、3人来自物理系、3人来自化学系、3人来自中文系、3人来自历史系。那么我们需要把教育训练作为一个额外变量来考虑,就要采用区组实验设计,即有5个区组,每个区组3人各自接受自变量三个水平中的一

个水平即一种实验处理。这种设计虽然也有多个被试组,但是这些被试不是按照随机方式进行分组的,他们之间不是完全独立的了,他们的反应可能会存在一定的相关性。

这样的设计不仅考虑了自变量的影响,而且也考虑了被试本身的某一方面特征的影响,将被试间的差异作为一个区组变量,这样就可以至少部分地把被试间差异引起的反应变异从残差中分离出来。

我们假设上述实验设计实际得到的观测数据如表2-12所示。

表2-12 箭头张合角度与缪勒错觉量的关系

区组 1 2 3 4 5

300 6 8 7 9 8 38

450 5 4 7 6 8 30

600 3 4 4 6 7 24

14 16 18 21 23 92

对于这一实验设计模型,其数据如何处理呢?我们只能采取方差分析的方法来分析。其方差分析的计算可以按照表2-13所示项目和示例进行。

表2-13 单因素随机区组实验设计的方差分析表

方差来源

处理(组间)

区组 误差 合计

平方和 SS处理

SS区组 SS误差 SS总

自由度

a-1 b-1 (a-1)(b-1) ab-1

均方

MS处理 MS区组 MS误差

F值

MS处理/MS误差 MS区组/MS误差

P

在这样的分析中,我们将自变量以外因素带来的变异又分成了两部分:被试所在区组不同导致的差异和其他不明因素带来的差异(即残差),而自变量变异的显著性主要是在与残差部分比较中衡量的,所以残差部分的减少就使得自变量的影响效应更容易显现出来。现在我们以表2-1的数据为例进行计算:

SS处理=382/5+302/5+242/5-922/15=20

SS区组=142/3+162/3+182/3+212/3+232/3-922/15=18 SS总=Σyij2-922/15=46 SS误差=46-20-18=8

MS处理=20/2=10 MS区组=18/4=4.5 MS误差=8/8=1

MS处理/MS误差=10> 8.65 则 P7.01 则 P

由此分析可以得到结论:在缪勒错觉实验中,箭头张合角度不同导致错觉量的显著差异,即箭头张合角度对缪勒错觉量具有显著影响。实验中不同被试的错觉量也差异明显。

这一实验设计的SPSS程序是:

DATA LIST FREE/muller1 TO muller3. BEGIN DATA. 6 5 3 8 4 4 7 7 4 9 6 6 8 8 7 END DATA.

MANOVA muller1 muller2 muller3 /WSFACTORS=muler(3) /PRINT=CELLINFO(MEANS) /DESIGN.

程序运行输出结果如表2-14所示。

表2-14 单因素随机区组实验设计方差分析表

Tests involving 'MULER' Within-Subject Effect.

Source of Variation SS DF MS F Sig of F MULER 19.73 2 9.87 9.55 .008 WITHIN CELLS 8.27 8 1.03

这一程序实际上是把上述设计看作匹配组设计来处理的,其结果与前述的计算结果基本一致,但也

有一些差异,这差异来自何处?作为匹配组设计处理,只是考虑到以区组变量作为匹配变量导致的组间的不独立性,即组间数据的相关性,没能考虑到即使是来自同一区组,被试间还是有差异的,所以并不能将被试变异分离彻底。应该说,这一分析程序将区组设计粗略地看作了匹配组设计。

区组实验设计一般是在被试选取或分组过程中,有些被试变量不拟控制时使用的。而且需要注意的是,在进行区组实验设计的时候,每个区组中的被试数必须是实验处理数的倍数,这样才能将每个区组中的被试匹配地分到各个实验处理当中。此外,区组实验设计还有一个假设前提,那就是:区组变量与自变量之间没有交互作用,如果已经知道某变量与自变量有交互作应,就不能将其作为区组变量。

六、多因素随机区组实验设计

在多因素完全随机实验设计中,被试是随机分组,因此我们对被试的差异没有特别关注,被试差异带来的变异混淆在残差当中,这也同样会影响方差分析的敏感度。当我们考虑某一被试因素可能会对研究结论带来混淆时,可以采用多因素随机区组实验设计。

区组设计来自于农业试验等领域。比如,我想试验不同的水稻品种及下种的时间对产量的影响。自变量包括两个,即种子类别和下种时间。但是同时,我又考虑到不同土质对水稻生长及收成的影响,就需要划定几个不同土质的试验田,这每一个试验田就是一个区组。再把每一个区组分成小块,每一个小块按照特定的种植方式下种(在某一时间下种某一品种),并且保证在每一个区组内包含所有的种植方式,即种植时间与不同品种的所有结合。这一试验模式可以表示成如图2-3所示的形式。

下边我们用教法实验说明这一设计模型。如为了试验新教材更适宜的教学方法,研究者考虑到学生学习成绩的影响,选择优中差各12个班进行试验。经过一学年的教学过程然后进行学生学习成绩的比较,即年终各班平均的考试成绩如表2-15所示。

表2-15 教学实验一年后考试成绩

区组 优等班 中等班 差等班

教材1

教法1 50 40 50 40 40 30 20 30 30

教法2 60 50 70 50 50 40 50 40 40

教法1 50 40 60 40 50 50 30 40 30

教材2

教法2 80 70 90 70 60 60 50 40 50

这一实验结果可以近似地按照混合实验设计进行分析,即将两个自变量(记为A和B)作为组内变量、将区组变量(记为C)作为组间变量来编写分析程序,程序如下:

DATA LIST FREE/C A1B1 A1B2 A2B1 A2B2. BEGIN DATA. 1 50 60 50 80 1 40 50 40 70 1 50 70 60 90 2 40 50 40 70 2 40 50 50 60 2 30 40 50 60

3 20 50 30 50 3 30 40 40 40 3 30 40 30 50 END DATA.

MANOVA A1B1 A1B2 A2B1 A2B2 BY C(1,2) /WSFACTORS=A(2)B(2) /PRINT=CELLINFO(MEANS) /DESIGN.

这一程序运行的结果如下:

表2-16 多因素随机区组实验设计的方差分析结果

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Cell Means and Standard Deviations Variable .. A1B1

FACTOR CODE Mean Std. Dev. N C 1 46.667 5.774 3 C 2 36.667 5.774 3 C 3 26.667 5.774 3 For entire sample 36.667 10.000 9 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Variable .. A1B2

FACTOR CODE Mean Std. Dev. N C 1 60.000 10.000 3 C 2 46.667 5.774 3 C 3 43.333 5.774 3 For entire sample 50.000 10.000 9 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Variable .. A2B1

FACTOR CODE Mean Std. Dev. N C 1 50.000 10.000 3 C 2 46.667 5.774 3 C 3 33.333 5.774 3 For entire sample 43.333 10.000 9 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Variable .. A2B2

FACTOR CODE Mean Std. Dev. N C 1 80.000 10.000 3 C 2 63.333 5.774 3 C 3 46.667 5.774 3 For entire sample 63.333 15.811 9

* * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests of Between-Subjects Effects.

Tests of Significance for T1 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 683.33 6 113.89

C 2816.67 2 1408.33 12.37 .007 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A' Within-Subject Effect.

Tests of Significance for T2 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 83.33 6 13.89

A 900.00 1 900.00 64.80 .000 C BY A 116.67 2 58.33 4.20 .072 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'B' Within-Subject Effect.

Tests of Significance for T3 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 283.33 6 47.22

B 2500.00 1 2500.00 52.94 .000 C BY B 116.67 2 58.33 1.24 .355 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - * * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * * Tests involving 'A BY B' Within-Subject Effect.

Tests of Significance for T4 using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F WITHIN CELLS 150.00 6 25.00

A BY B 100.00 1 100.00 4.00 .092 C BY A BY B 150.00 2 75.00 3.00 .125 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

从分析结果看,区组变量与自变量A和B均无显著的交互效应,符合区组实验设计的前提假设。区组变量C、自变量A和自变量B的主效应均达到显著性水平,变量间的交互效应均未达到显著性水平。

六、单因素拉丁方实验设计

区组实验设计是在考察自变量的影响效应的实验中,考虑到某一个额外变量的影响,就将这个额外变量作为区组变量,以便将该区组变量引起的变异从残差中分离出来。如果将区组实验设计进一步进行扩展,即考虑两个额外变量的影响而欲将这两个额外变量引起的变异从残差项中分离出来的时候,就可以采用拉丁方实验设计。

拉丁方是一个含P行P列,把P个处理分配给P×P方格的管理方案,它便于在复杂程序中有条理地管理各个工作单元,并平衡各种因素的影响。在工农业生产试验和心理与教育研究中,拉丁方都得到普遍应用。在这种实验设计中,首先根据自变量处理的水平数确定两个额外变量的水平数,然后利用两个额外变量的各个水平结合在一起构造一个方格,最后再将自变量的不同处理平衡地安排在这个方格中,其结果要使自变量的每一个水平在拉丁方格的每一行和每一列都只出现一次,就构成了一个研究方案。很明显自变量的水平数、额外变量的水平数必须相等。根据这样的原则,我们举例说明按照4×4拉丁方格设计一个实验方案。

问题模式:为了研究简单反应时间与光刺激的颜色和强度的关系,研究者同时考虑到被试的气质类型及年龄因素可能对反应时间具有明显影响,为了将这两个因素的影响从变异的残差项中分离出去,研究者采用了拉丁方实验设计。具体设计方案如下:

(1)拉丁方格的组成:

拉丁方格由实验的额外变量气质类型和年龄档次组成:分别从13、14、15、16岁四个年龄档的中学生中选出四种气质类型的学生各2人,这样就有共计32个被试,每个拉丁方格中的一个格子中有两名被试。然后根据气质类型和年龄档次组成拉丁方格以决定各个被试参加何种实验。拉丁方格的形式如下,每一个格子中有两个被试:

表2-17 4×4拉丁方格

被 试 年 龄 档 次

(2)实验处理组成:

实验中的自变量有两个,即光的颜色和光的强度。自变量的颜色取两个水平,分别为红光和绿光;光的强度也取两个水平,相对强度分别为:1和1/4。于是两个自变量结合而成的实验处理分别为:

A——红光+1(即光的颜色为红光、光的相对强度为1,以下与此相似) B——红光+1/4 C——绿光+1 D——绿光+1/4 (3)实验处理的编排:

现在有A、B、C、D四种实验处理,有4×4拉丁方格,可以按照拉丁方实验设计的基本原则,将四种实验处理安排在拉丁方格中,某种实验处理被分配到拉丁方格中的某一个方各中,该方格中对应的两个被试就要完成这一种实验处理。

首先,我们给出一个基本的拉丁方设计形式,如表2-18所示。

表2-18 4×4拉丁方格

被试气质类型

多血质

胆汁质

粘液质

抑郁质

13

14 15 16

被 试 年 龄 档 次

被试气质类型

多血质

胆汁质

粘液质

抑郁质

13

14 15 16

表2-18所示的实验设计方案就是一个标准的或基本的4×4拉丁方的实验设计。有了这样的设计方案之后,实验程序的编排就非常清晰了,不仅将能将两个额外变量的效应从残差项中分离出来,而且也有利于增进复杂实验过程的条理性。有了表2-18所示的实验方案,每个被试需要完成什么样的实验就很清晰了,比如14岁胆汁质的两个学生只需完成C实验处理,即“绿光+1”实验处理、16岁粘液质的两个学生只需完成B实验处理,即“红光+1/4”实验处理。

有了表2-18所示的基本的拉丁方实验设计方案之后,还可以将该方案中的任何两行或任何两列对换,就可以得到另外一个拉丁方实验设计方案。比如将其中的第1列和第四列对换就可以得到下边这个拉丁方实验设计方案:

表2-19 4×4拉丁方格

被 试 年 龄 档 次

被试气质类型

多血质

胆汁质

粘液质

抑郁质

13

14 15 16

把表2-19中的第2行和第3行对换就可以得到表2-20所示的拉丁方实验设计。

表2-20 4×4拉丁方格

被 试 年 龄 档 次

被试气质类型

多血质

胆汁质

粘液质

抑郁质

13

14 15 16

按照这些变换得来的拉丁方设计也同样可以达到该研究所要求的实验效果。

拉丁方实验设计的数据分析比较复杂,我们在此不再讨论。

拉丁方实验设计既有优点也有缺点。其优点是,在许多研究情境中,这种设计比完全随机和随机区组设计更加有效,它可以使研究者分离出两个额外变量的影响,因而减小实验误差,可获得对实验处理效应的更精确的估价。另外,通过对方格单元内误差与残差的F检验,可以检验额外变量与自变量是否有交互作用,以检验采用拉丁方设计是否合适。拉丁方设计的缺点是,它的关于自变量与额外变量不存在交互作用的假设在很多情况下都难以保证,尤其当实验中含有多个自变量的时候。因此,拉丁方实验设计在多因素实验中不常用。另外,拉丁方实验设计要求每个额外变量的水平数与实验处理数必须相等也在一定程度上限制了拉丁方实验设计的使用1。

建议阅读材料

1. 朱滢 主编.实验心理学.北京:北京大学出版社.2000,19-36. 2. 杨治良 主编. 基础实验心理学.兰州:甘肃人民出版社. 1988,20-52. 3. 杨治良 编著. 实验心理学.杭州:浙江教育出版社. 1998,44-102.

4. 孟庆茂,常建华 编著.实验心理学.北京:北京师大出版社.30-40.舒华 编著. 心理与教育研究中

的多因素实验设计. 北京师范大学出版社. 1994.

复习思考题

1. 如何理解:重复实验设计、完全随机实验设计、混合实验设计、区组实验设计、拉丁方实验设计、

方差分析、变异源、残差、2析因实验设计、交互作用或交互效应? 2. 多因素实验设计的类型主要有哪些?

3. 如何进行单因素完全随机实验设计的数据分析? 4. 如何进行多因素完全随机实验设计的数据分析? 5. 如何进行重复实验设计的数据分析? 6. 如何进行区组实验设计?

7.

k

如何进行拉丁方实验设计?8. 使用多因素实验设计方法编制一个心理实验研究方案。

1

舒华 编著. 心理与教育研究中的多因素实验设计. 北京:北京师范大学出版社. 1994,58


相关文章

  • 发展心理学课后练习
  • 发展心理学课后练习 一.历史与理论 1.历史 发展心理学作为一门学科出现的重要性是什么? 儿童心理学的奠基人是谁?对于儿童心理学的产生起怎样的作用? 发展心理学中国化的基本途径是什么? 2.代表人物与理论(皮亚杰.维果斯基) 试述皮亚杰的认 ...查看


  • 心理学研究方法
  • <心理学研究方法>复习提要 第一章 心理学与科学 一.名词解释 1.分析单位2.证伪性3.内省法4.知情同意 1:具有所要研究的那些特征的事物 2:科学结论不是放之四海而皆准的,它总是在一定条件下被证实,一旦超出了条件就会被证伪 ...查看


  • 心理学研究方法自制
  • 第一章 一:科学研究的特征: 1.对证伪性的认识: p11(课本) 评价某一理论的新证据,必须看在收集该新证据时,是否有可能证实该理论是错的. 如果一个理论的预测包括了所有可能观察到的数据,那么这个理论将永远不需要.也不会修改,当然也就不会 ...查看


  • 工程心理学-教学大纲
  • <工程心理学>课程教学大纲 (理论课程) ◆课程编号:060122 ◆课程英文名称:Engineering Psychology ◆学分/学时:3学分/51学时 ◆课程类型:  通识通修课程  通识通选课程  学科基础必修 ...查看


  • 我国老年抑郁心理干预研究的方法学分析
  • 我国老年抑郁心理干预研究的方法学分 析 (作者:___________单位: ___________邮编: ___________) [关键词] 心理干预:抑郁:老年人 人口老龄化进程的加快使社会更加关注老年群体,在关注老年人身体健康的同时 ...查看


  • 心理与教育研究方法知识点
  • 心理与教育研究方法重点 1.科学研究的特征:继承性.创新性.系统性.控制性 p4 2.第二节:心理与教育研究的特殊性(看一下) p8 一.研究对象与研究者的特殊性 研究者与研究对象是人,其特殊性有以下几方面 (1)作为心理与教育科学研究对象 ...查看


  • [实验心理学]期末考卷
  • 期末考试试卷(A卷) 1.下列关于研究说法正确的有 a实验本质上是一种有控制的观察 b自然观察可以得到变量间明确的因果关系 c科学研究只有操纵和控制有关变量才能得到比较明确的因果关系 d 实验研究中额外变量的控制程度决定了内部效度和外部效度 ...查看


  • 单因素实验设计
  • 第11讲 单因素实验设计 Single-factor Experimental Design 要 点 � 被试间设计与被试内设计 � 单因素实验常用设计模型 完全随机设计 � 随机区组设计 � 拉丁方设计 � 重复测量设计 � 心理学研究方 ...查看


  • 2015年春季高级中学教师资格试讲题目
  • 成都市2015年春季高级中学教师资格认定考试注意事项 1. 本次试讲考试日期是6月28日. 2. 考生可在 "成都教育人才网"( www.cdjyrc.com)首页右上角"教师资格登记"处打印准考证. ...查看


热门内容