正交试验设计
5.1 试验设计方法概述
试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。
例5-1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。
对此实例该如何进行试验方案的设计呢?
很容易想到的是全面搭配法方案(如图5-1所示):
此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达3=27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数
3
愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。
试验设计方法常用的术语定义如下。
试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。
因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。
水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T表示,下标1、2、3表示因素的不同水平,分别记为T1、T2、T3。
常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试
验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2 正交试验设计方法的优点和特点
用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。
从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢?
先固定T1和p1,只改变m,观察因素m不同水平的影响,做了如图2-2(1)所示的三次实验,发现 m=m2时的实验效果最好(好的用 □ 表示),合格产品的产量最高,因此认为在后面的实验中因素m应取m2水平。
固定T1和m2,改变p的三次实验如图5-2(2)所示,发现p=p3时的实验效果最好,因此认为因素p应取p3水平。
固定p3和m2,改变T 的三次实验如图5-2(3)所示,发现因素T 宜取T2水平。
因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T2p3m2。与全面搭配法方案相比,简单比较法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。因为,①在改变m值(或p值,或T值)的三次实验中,说m2(或p3或T2 )水平最好是有条件的。在T ≠T1,p ≠p1时,m2 水平不是最好的可能性是有的。②在改变m的三次实验中,固定T =T2,p =p3 应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。③用这种方法比较条件好坏时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的干扰。
运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。
正交试验设计方法是用正交表来安排试验的。对于例1适用的正交表是L9(34),其试验安排见表5-2。
所有的正交表与L9(34)正交表一样,都具有以下两个特点:
(1) 在每一列中,各个不同的数字出现的次数相同。在表L9(34)中,每一列有三个水平,水平1、2、3都是各出现3次。
(2) 表中任意两列并列在一起形成若干个数字对,不同数字对出现的次数也都相同。
4在表L(中,任意两列并列在一起形成的数字对共有9个:(1,1),(1,2),(1,3),(2,1),93)
(2,2),(2,3),(3,1),(3,2),(3,3),每一个数字对各出现一次。
表5-2 试验安排表
这两个特点称为正交性。正是由于正交表具有上述特点,就保证了用正交表安排的试验方案中因素水平是均衡搭配的,数据点的分布是均匀的。因素、水平数愈多,运用正交试验设计方法,愈发能显示出它的优越性,如上述提到的6因素3水平试验,用全面搭配方案需729次,若用正交表L27(313)来安排,则只需做27次试验。
在化工生产中, 因素之间常有交互作用。 如果上述的因素T的数值和水平发生变化时,试验指标随因素p变化的规律也发生变化,或反过来,因素p的数值和水平发生变化时,试验指标随因素T变化的规律也发生变化。这种情况称为因素T、p间有交互作用,记为T×p 。 5. 3 正交表
使用正交设计方法进行试验方案的设计,就必须用到正交表。正交表请查阅有关参考书。 5.3.1 各列水平数均相同的正交表
各列水平数均相同的正交表,也称单一水平正交表。这类正交表名称的写法举例如下:
各列水平均为2的常用正交表有:L4(23),L8(27),L12(211),L16(215),L20(219),L32(231)。
各列水平数均为3的常用正交表有:L9(34),L27(313)。 各列水平数均为4的常用正交表有:L16(45) 各列水平数均为3的常用正交表有:L25(56)
5.3.2 混合水平正交表
各列水平数不相同的正交表,叫混合水平正交表,下面就是一个混合水平正交表名称的写法:
L 8(41×24)常简写为L 8(4×24)。此混合水平正交表含有1 个4水平列,4个2水平列,共有1+4=5列。 5.3.3 选择正交表的基本原则
一般都是先确定试验的因素、水平和交互作用,后选择适用的L表。在确定因素的水平数时,主要因素宜多安排几个水平,次要因素可少安排几个水平。
(1)先看水平数。若各因素全是2水平,就选用L(2)表;若各因素全是3水平,就选L(3)表。若各因素的水平数不相同,就选择适用的混合水平表。
(2)每一个交互作用在正交表中应占一列或二列。要看所选的正交表是否足够大,能否容纳得下所考虑的因素和交互作用。为了对试验结果进行方差分析或回归分析,还必须至少留一个空白列,作为“误差”列,在极差分析中要作为“其他因素”列处理。 (3)要看试验精度的要求。若要求高,则宜取实验次数多的L表。
(4)若试验费用很昂贵,或试验的经费很有限,或人力和时间都比较紧张,则不宜选实验次数太多的L表。
(5)按原来考虑的因素、水平和交互作用去选择正交表,若无正好适用的正交表可选,简便且可行的办法是适当修改原定的水平数。
(6)对某因素或某交互作用的影响是否确实存在没有把握的情况下,选择L表时常为该选大表还是选小表而犹豫。若条件许可,应尽量选用大表,让影响存在的可能性较大的因素和交互作用各占适当的列。某因素或某交互作用的影响是否真的存在,留到方差分析进行显著性检验时再做结论。这样既可以减少试验的工作量,又不致于漏掉重要的信息。 5.3.4 正交表的表头设计
所谓表头设计,就是确定试验所考虑的因素和交互作用,在正交表中该放在哪一列的问题。
(1)有交互作用时,表头设计则必须严格地按规定办事。因篇幅限制,此处不讨论,请查阅有关书籍。
(2)若试验不考虑交互作用,则表头设计可以是任意的。如在例5-1中,对L 9(3 4)表头设计,表5-3所列的各种方案都是可用的。但是正交表的构造是组合数学问题,必须满足5.2中所述的特点。对试验之初不考虑交互作用而选用较大的正交表,空列较多时,最好仍与有交互作用时一样,按规定进行表头设计。只不过将有交互作用的列先视为空列,待
*
*
试验结束后再加以判定。
5.4 正交试验的操作方法
(1)分区组。对于一批试验,如果要使用几台不同的机器,或要使用几种原料来进行,为了防止机器或原料的不同而带来误差,从而干扰试验的分析,可在开始做实验之前,用L表中未排因素和交互作用的一个空白列来安排机器或原料。
与此类似,若试验指标的检验需要几个人(或几台机器)来做,为了消除不同人(或仪器)检验的水平不同给试验分析带来干扰,也可采用在L表中用一空白列来安排的办法。这样一种作法叫做分区组法。
(2)因素水平表排列顺序的随机化。如在例5-1中,每个因素的水平序号从小到大时,因素的数值总是按由小到大或由大到小的顺序排列。按正交表做试验时,所有的1水平要碰在一起,而这种极端的情况有时是不希望出现的,有时也没有实际意义。因此在排列因素水平表时,最好不要简单地按因素数值由小到大或由大到小的顺序排列。从理论上讲,最好能使用一种叫做随机化的方法。所谓随机化就是采用抽签或查随机数值表的办法,来决定排列的别有顺序。
(3)试验进行的次序没必要完全按照正交表上试验号码的顺序。为减少试验中由于先后实验操作熟练的程度不匀带来的误差干扰,理论上推荐用抽签的办法来决定试验的次序。 (4)在确定每一个实验的实验条件时,只需考虑所确定的几个因素和分区组该如何取值,而不要(其实也无法)考虑交互作用列和误差列怎么办的问题。交互作用列和误差列的取值问题由实验本身的客观规律来确定,它们对指标影响的大小在方差分析时给出。 (5)做实验时,要力求严格控制实验条件。这个问题在因素各水平下的数值差别不大时更为重要。例如,例5-1中的因素(加碱量)m的三个水平:m1=2.0,m2=2.5,m3=3.0,在以m=m2=2.5为条件的某一个实验中,就必须严格认真地让m2=2.5。若因为粗心和不负责任,造成m2=2.2或造成m2=3.0,那就将使整个试验失去正交试验设计方法的特点,使极差和方差分析方法的应用丧失了必要的前提条件,因而得不到正确的试验结果。 5.5 正交试验结果分析方法
正交试验方法之所以能得到科技工作者的重视并在实践中得到广泛的应用,其原因不仅在于能使试验的次数减少,而且能够用相应的方法对试验结果进行分析并引出许多有价值的结论。因此,有正交试验法进行实验,如果不对试验结果进行认真的分析,并引出应该引出的结论,那就失去用正交试验法的意义和价值。
5.5.1 极差分析方法
下面以表5-4为例讨论L4(23)正交试验结果的极差分析方法。极差指的是各列中各水平对应的试验指标平均值的最大值与最小值之差。从表5-4的计算结果可知,用极差法分析正交试验结果可引出以下几个结论:
(1)在试验范围内,各列对试验指标的影响从大到小的排队。某列的极差最大,表示该列的数值在试验范围内变化时,使试验指标数值的变化最大。所以各列对试验指标的影响从大到小的排队,就是各列极差D的数值从大到小的排队。
(2)试验指标随各因素的变化趋势。为了能更直观地看到变化趋势,常将计算结果绘制成图。
(3)使试验指标最好的适宜的操作条件(适宜的因素水平搭配)。 (4)可对所得结论和进一步的研究方向进行讨论。 5.5.2 方差分析方法 5.5.2.1 计算公式和项目
n
试验指标的加和值=
i1
yi
,试验指标的平均值y
1n
n
i1
yi
,以第j列为例:
⑴ ⑵ ⑷
Ⅰj __ Ⅱj —— kj
“1”水平所对应的试验指标的数值之和 “2”水平所对应的试验指标的数值之和
⑶ „„
—— 同一水平出现的次数。等于试验的次数除以第j列的水平数
“1”水平所对应的试验指标的平均值
⑸ Ⅰj/ kj —— “1”水平所对应的试验指标的平均值 ⑹ Ⅱj/ kj —— ⑺ „„
以上7项的计算方法同极差法(见表5-4)。 ⑻ 偏差平方和 Sj
Ijkjkj
2
IIj
kjkj
2
IIIj
kjk
j
2
⑼ fj ——自由度。fj =第j列的水平数-1。 ⑽ Vj ——方差。Vj =Sj /fj 。
⑾ Ve ——误差列的方差。Ve =Se /fe 。式中,e为正交表的误差列。 ⑿ Fj ——方差之比 Fj =Vj /Ve 。
⒀ 查F分布数值表(F分布数值表请查阅有关参考书)做显著性检验。
n
⒁ 总的偏差平方和 S总
i1
yi
2
m
⒂ 总的偏差平方和等于各列的偏差平方和之和。即 S总=
j1
S
j
式中,m为正交表的列数。
若误差列由5个单列组成,则误差列的偏差平方和Se等于5个单列的偏差平方和之和,即:Se =Se1 +Se2 +Se3 +Se4 +Se5 ;也可用Se =S总 +S来计算,其中S为安排有因素或交互作用的各列的偏差平方和之和。 5.5.2.2 可引出的结论
与极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,在什么水平上显著。在数理统计上,这是一个很重要的问题。显著性检验强调试验在分析每列对指标影响中所起的作用。如果某列对指标影响不显著,那么,讨论试验指标随它的变化趋势是毫无意义的。因为在某列对指标的影响不显著时,即使从表中的数据可以看出该列水平变化时,对应的试验指标的数值与在以某种“规律”发生变化,但那很可能是由于实验误差所致,将它作为客观规律是不可靠的。有了各列的显著性检验之后,最后应将影响不显著的交互作用列与原来的“误差列”合并起来。组成新的“误差列”,重新检验各列的显著性。
5.6 正交试验方法在化工原理实验中的应用举例
例5-2 为提高真空吸滤装置的生产能力,请用正交试验方法确定恒压过滤的最佳操作条件。其恒压过滤实验的方法、原始数据采集和过滤常数计算等见《过滤实验》部分。影响实验的主要因素和水平见表5-5(a)。表中Δp为过滤压强差;T为浆液温度;w为浆液
,,
,,
质量分数;M为过滤介质(材质属多孔陶瓷)。
解:(1)试验指标的确定:恒压过滤常数K(m2/s)
(2)选正交表:根据表5-5(a)的因素和水平,可选用L 8(4×24)表。 (3)制定实验方案:按选定的正交表,应完成8次实验。实验方案见表5-5(b)。 (4)实验结果:将所计算出的恒压过滤常数K(m2/s)列于表5-5(b)。 表5-5(a) 过滤实验因素和水平
* G2 、G3为过滤漏斗的型号。过滤介质孔径:G2 为30~50μm、G3为16~30μm。
表2-5(b)正交试验的试验方案和实验结果
(5)指标K的极差分析和方差分析:
分析结果见表5-5(c)。以第2列为例说明计算过程:
Ⅰ2 =4.01×10+5.21×10+4.83×10+5.11×10=1.92×10 Ⅱ2 =2.93×10+5.55×10+1.02×10+1.10×10=2.97×10
k2=4
Ⅰ2/ k2=1.92×10/4=4.79×10
Ⅱ2/ k2=2.97×10/4=7.42×10
D2=7.42×10
-4
-4
-3
-4
-4
-3
-4
-4
-4
-3
-3
-3
-4
-4
-4
-4
-3
- 4.79×10=2.63×10
2
ΣK=4.88×10
-3
K
6.11×104
-
2
-
-4
-
-
S2=k2(Ⅰ2/ k2-K)+k2(Ⅱ2/ k2-K)
=4(4.79×10-6.11×104 )2 +4(7.42×10-6.11×104 )2 =1.38×107
-4
f2=第二列的水平数-1=2-1=1 V2=S2/f2=1.38×107/1=1.38×107
-
-
Se=S5=k5(Ⅰ5/ k5-K)+k5(Ⅱ5/ k5-K)
=4(6.22×10-6.11×104 )2 +4(5.99×10-6.11×104 )2 =1.06×109
-4
-
-4
-
-
22
fe=f5=1
Ve=Se/fe=1.06×109/1=1.06×109
-
-
F2 =V2/Ve=1.38×107/1.06×109=130.2
-
-
查《F 分布数值表》可知:
F(а=0.01,f1=1,f2=1)=4052 > F2 F(а=0.05,f1=1,f2=1)=161.4 >F2 F(а=0.10,f1=1,f2=1)=39.9
(其中:f1 为分子的自由度,f2 分母的自由度)
所以第二列对试验指标的影响在=0.10水平上显著。其他列的计算结果见表2-5(c)。
表5-5(c) K的极差分析和方差分析
(6)由极差分析结果引出的结论:请同学们自己分析。
(7)由方差分析结果引出的结论。
① 第1、2列上的因素 Δp、T 在=0.10水平上显著;第3列上的因素w在=0.05水平上显著;第4列上的因素M 在=0.25水平上仍不显著。
② 各因素、水平对K的影响变化趋势见图5-3。图5-3是用表5-5(a)的水平、因素和表5-5(c)的Ⅰj/ kj 、Ⅱj/ kj 、Ⅲj/ kj 、Ⅳj/ k值来标绘的。从图中可看出: A.过滤压强差增大,K值增大; B.过滤温度增大,K值增大; C.过滤浓度增大,K值减小;
D.过滤介质由1水平变为2水平,多孔陶瓷微孔直径减小, K值减小。因为第4列对K值的影响在=0.25水平上不显著,所以此变化趋势是不可信的。
③ 适宜操作条件的确定。由恒压过滤速率议程式可知,试验指标K值愈大愈好。为此,本例的适宜操作条件是各水平下K的平均值最大时的条件: 过滤压强差为4水平,5.88kPa
过滤温度为2水平,33℃ 过滤浆液浓度为1水平,稀滤液
过滤介质为1水平或2水平(这是因为第4列对K值的影响在=0.25水平上不显著。为此可优先选择价格便宜或容易得到者)。
上述条件恰好是正交表中第8个试验号。
正交试验设计
5.1 试验设计方法概述
试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。
例5-1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。
对此实例该如何进行试验方案的设计呢?
很容易想到的是全面搭配法方案(如图5-1所示):
此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达3=27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数
3
愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。
试验设计方法常用的术语定义如下。
试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。
因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。
水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T表示,下标1、2、3表示因素的不同水平,分别记为T1、T2、T3。
常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试
验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。 5.2 正交试验设计方法的优点和特点
用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。
从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比较法方案又如何呢?
先固定T1和p1,只改变m,观察因素m不同水平的影响,做了如图2-2(1)所示的三次实验,发现 m=m2时的实验效果最好(好的用 □ 表示),合格产品的产量最高,因此认为在后面的实验中因素m应取m2水平。
固定T1和m2,改变p的三次实验如图5-2(2)所示,发现p=p3时的实验效果最好,因此认为因素p应取p3水平。
固定p3和m2,改变T 的三次实验如图5-2(3)所示,发现因素T 宜取T2水平。
因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T2p3m2。与全面搭配法方案相比,简单比较法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。因为,①在改变m值(或p值,或T值)的三次实验中,说m2(或p3或T2 )水平最好是有条件的。在T ≠T1,p ≠p1时,m2 水平不是最好的可能性是有的。②在改变m的三次实验中,固定T =T2,p =p3 应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。③用这种方法比较条件好坏时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的干扰。
运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。
正交试验设计方法是用正交表来安排试验的。对于例1适用的正交表是L9(34),其试验安排见表5-2。
所有的正交表与L9(34)正交表一样,都具有以下两个特点:
(1) 在每一列中,各个不同的数字出现的次数相同。在表L9(34)中,每一列有三个水平,水平1、2、3都是各出现3次。
(2) 表中任意两列并列在一起形成若干个数字对,不同数字对出现的次数也都相同。
4在表L(中,任意两列并列在一起形成的数字对共有9个:(1,1),(1,2),(1,3),(2,1),93)
(2,2),(2,3),(3,1),(3,2),(3,3),每一个数字对各出现一次。
表5-2 试验安排表
这两个特点称为正交性。正是由于正交表具有上述特点,就保证了用正交表安排的试验方案中因素水平是均衡搭配的,数据点的分布是均匀的。因素、水平数愈多,运用正交试验设计方法,愈发能显示出它的优越性,如上述提到的6因素3水平试验,用全面搭配方案需729次,若用正交表L27(313)来安排,则只需做27次试验。
在化工生产中, 因素之间常有交互作用。 如果上述的因素T的数值和水平发生变化时,试验指标随因素p变化的规律也发生变化,或反过来,因素p的数值和水平发生变化时,试验指标随因素T变化的规律也发生变化。这种情况称为因素T、p间有交互作用,记为T×p 。 5. 3 正交表
使用正交设计方法进行试验方案的设计,就必须用到正交表。正交表请查阅有关参考书。 5.3.1 各列水平数均相同的正交表
各列水平数均相同的正交表,也称单一水平正交表。这类正交表名称的写法举例如下:
各列水平均为2的常用正交表有:L4(23),L8(27),L12(211),L16(215),L20(219),L32(231)。
各列水平数均为3的常用正交表有:L9(34),L27(313)。 各列水平数均为4的常用正交表有:L16(45) 各列水平数均为3的常用正交表有:L25(56)
5.3.2 混合水平正交表
各列水平数不相同的正交表,叫混合水平正交表,下面就是一个混合水平正交表名称的写法:
L 8(41×24)常简写为L 8(4×24)。此混合水平正交表含有1 个4水平列,4个2水平列,共有1+4=5列。 5.3.3 选择正交表的基本原则
一般都是先确定试验的因素、水平和交互作用,后选择适用的L表。在确定因素的水平数时,主要因素宜多安排几个水平,次要因素可少安排几个水平。
(1)先看水平数。若各因素全是2水平,就选用L(2)表;若各因素全是3水平,就选L(3)表。若各因素的水平数不相同,就选择适用的混合水平表。
(2)每一个交互作用在正交表中应占一列或二列。要看所选的正交表是否足够大,能否容纳得下所考虑的因素和交互作用。为了对试验结果进行方差分析或回归分析,还必须至少留一个空白列,作为“误差”列,在极差分析中要作为“其他因素”列处理。 (3)要看试验精度的要求。若要求高,则宜取实验次数多的L表。
(4)若试验费用很昂贵,或试验的经费很有限,或人力和时间都比较紧张,则不宜选实验次数太多的L表。
(5)按原来考虑的因素、水平和交互作用去选择正交表,若无正好适用的正交表可选,简便且可行的办法是适当修改原定的水平数。
(6)对某因素或某交互作用的影响是否确实存在没有把握的情况下,选择L表时常为该选大表还是选小表而犹豫。若条件许可,应尽量选用大表,让影响存在的可能性较大的因素和交互作用各占适当的列。某因素或某交互作用的影响是否真的存在,留到方差分析进行显著性检验时再做结论。这样既可以减少试验的工作量,又不致于漏掉重要的信息。 5.3.4 正交表的表头设计
所谓表头设计,就是确定试验所考虑的因素和交互作用,在正交表中该放在哪一列的问题。
(1)有交互作用时,表头设计则必须严格地按规定办事。因篇幅限制,此处不讨论,请查阅有关书籍。
(2)若试验不考虑交互作用,则表头设计可以是任意的。如在例5-1中,对L 9(3 4)表头设计,表5-3所列的各种方案都是可用的。但是正交表的构造是组合数学问题,必须满足5.2中所述的特点。对试验之初不考虑交互作用而选用较大的正交表,空列较多时,最好仍与有交互作用时一样,按规定进行表头设计。只不过将有交互作用的列先视为空列,待
*
*
试验结束后再加以判定。
5.4 正交试验的操作方法
(1)分区组。对于一批试验,如果要使用几台不同的机器,或要使用几种原料来进行,为了防止机器或原料的不同而带来误差,从而干扰试验的分析,可在开始做实验之前,用L表中未排因素和交互作用的一个空白列来安排机器或原料。
与此类似,若试验指标的检验需要几个人(或几台机器)来做,为了消除不同人(或仪器)检验的水平不同给试验分析带来干扰,也可采用在L表中用一空白列来安排的办法。这样一种作法叫做分区组法。
(2)因素水平表排列顺序的随机化。如在例5-1中,每个因素的水平序号从小到大时,因素的数值总是按由小到大或由大到小的顺序排列。按正交表做试验时,所有的1水平要碰在一起,而这种极端的情况有时是不希望出现的,有时也没有实际意义。因此在排列因素水平表时,最好不要简单地按因素数值由小到大或由大到小的顺序排列。从理论上讲,最好能使用一种叫做随机化的方法。所谓随机化就是采用抽签或查随机数值表的办法,来决定排列的别有顺序。
(3)试验进行的次序没必要完全按照正交表上试验号码的顺序。为减少试验中由于先后实验操作熟练的程度不匀带来的误差干扰,理论上推荐用抽签的办法来决定试验的次序。 (4)在确定每一个实验的实验条件时,只需考虑所确定的几个因素和分区组该如何取值,而不要(其实也无法)考虑交互作用列和误差列怎么办的问题。交互作用列和误差列的取值问题由实验本身的客观规律来确定,它们对指标影响的大小在方差分析时给出。 (5)做实验时,要力求严格控制实验条件。这个问题在因素各水平下的数值差别不大时更为重要。例如,例5-1中的因素(加碱量)m的三个水平:m1=2.0,m2=2.5,m3=3.0,在以m=m2=2.5为条件的某一个实验中,就必须严格认真地让m2=2.5。若因为粗心和不负责任,造成m2=2.2或造成m2=3.0,那就将使整个试验失去正交试验设计方法的特点,使极差和方差分析方法的应用丧失了必要的前提条件,因而得不到正确的试验结果。 5.5 正交试验结果分析方法
正交试验方法之所以能得到科技工作者的重视并在实践中得到广泛的应用,其原因不仅在于能使试验的次数减少,而且能够用相应的方法对试验结果进行分析并引出许多有价值的结论。因此,有正交试验法进行实验,如果不对试验结果进行认真的分析,并引出应该引出的结论,那就失去用正交试验法的意义和价值。
5.5.1 极差分析方法
下面以表5-4为例讨论L4(23)正交试验结果的极差分析方法。极差指的是各列中各水平对应的试验指标平均值的最大值与最小值之差。从表5-4的计算结果可知,用极差法分析正交试验结果可引出以下几个结论:
(1)在试验范围内,各列对试验指标的影响从大到小的排队。某列的极差最大,表示该列的数值在试验范围内变化时,使试验指标数值的变化最大。所以各列对试验指标的影响从大到小的排队,就是各列极差D的数值从大到小的排队。
(2)试验指标随各因素的变化趋势。为了能更直观地看到变化趋势,常将计算结果绘制成图。
(3)使试验指标最好的适宜的操作条件(适宜的因素水平搭配)。 (4)可对所得结论和进一步的研究方向进行讨论。 5.5.2 方差分析方法 5.5.2.1 计算公式和项目
n
试验指标的加和值=
i1
yi
,试验指标的平均值y
1n
n
i1
yi
,以第j列为例:
⑴ ⑵ ⑷
Ⅰj __ Ⅱj —— kj
“1”水平所对应的试验指标的数值之和 “2”水平所对应的试验指标的数值之和
⑶ „„
—— 同一水平出现的次数。等于试验的次数除以第j列的水平数
“1”水平所对应的试验指标的平均值
⑸ Ⅰj/ kj —— “1”水平所对应的试验指标的平均值 ⑹ Ⅱj/ kj —— ⑺ „„
以上7项的计算方法同极差法(见表5-4)。 ⑻ 偏差平方和 Sj
Ijkjkj
2
IIj
kjkj
2
IIIj
kjk
j
2
⑼ fj ——自由度。fj =第j列的水平数-1。 ⑽ Vj ——方差。Vj =Sj /fj 。
⑾ Ve ——误差列的方差。Ve =Se /fe 。式中,e为正交表的误差列。 ⑿ Fj ——方差之比 Fj =Vj /Ve 。
⒀ 查F分布数值表(F分布数值表请查阅有关参考书)做显著性检验。
n
⒁ 总的偏差平方和 S总
i1
yi
2
m
⒂ 总的偏差平方和等于各列的偏差平方和之和。即 S总=
j1
S
j
式中,m为正交表的列数。
若误差列由5个单列组成,则误差列的偏差平方和Se等于5个单列的偏差平方和之和,即:Se =Se1 +Se2 +Se3 +Se4 +Se5 ;也可用Se =S总 +S来计算,其中S为安排有因素或交互作用的各列的偏差平方和之和。 5.5.2.2 可引出的结论
与极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,在什么水平上显著。在数理统计上,这是一个很重要的问题。显著性检验强调试验在分析每列对指标影响中所起的作用。如果某列对指标影响不显著,那么,讨论试验指标随它的变化趋势是毫无意义的。因为在某列对指标的影响不显著时,即使从表中的数据可以看出该列水平变化时,对应的试验指标的数值与在以某种“规律”发生变化,但那很可能是由于实验误差所致,将它作为客观规律是不可靠的。有了各列的显著性检验之后,最后应将影响不显著的交互作用列与原来的“误差列”合并起来。组成新的“误差列”,重新检验各列的显著性。
5.6 正交试验方法在化工原理实验中的应用举例
例5-2 为提高真空吸滤装置的生产能力,请用正交试验方法确定恒压过滤的最佳操作条件。其恒压过滤实验的方法、原始数据采集和过滤常数计算等见《过滤实验》部分。影响实验的主要因素和水平见表5-5(a)。表中Δp为过滤压强差;T为浆液温度;w为浆液
,,
,,
质量分数;M为过滤介质(材质属多孔陶瓷)。
解:(1)试验指标的确定:恒压过滤常数K(m2/s)
(2)选正交表:根据表5-5(a)的因素和水平,可选用L 8(4×24)表。 (3)制定实验方案:按选定的正交表,应完成8次实验。实验方案见表5-5(b)。 (4)实验结果:将所计算出的恒压过滤常数K(m2/s)列于表5-5(b)。 表5-5(a) 过滤实验因素和水平
* G2 、G3为过滤漏斗的型号。过滤介质孔径:G2 为30~50μm、G3为16~30μm。
表2-5(b)正交试验的试验方案和实验结果
(5)指标K的极差分析和方差分析:
分析结果见表5-5(c)。以第2列为例说明计算过程:
Ⅰ2 =4.01×10+5.21×10+4.83×10+5.11×10=1.92×10 Ⅱ2 =2.93×10+5.55×10+1.02×10+1.10×10=2.97×10
k2=4
Ⅰ2/ k2=1.92×10/4=4.79×10
Ⅱ2/ k2=2.97×10/4=7.42×10
D2=7.42×10
-4
-4
-3
-4
-4
-3
-4
-4
-4
-3
-3
-3
-4
-4
-4
-4
-3
- 4.79×10=2.63×10
2
ΣK=4.88×10
-3
K
6.11×104
-
2
-
-4
-
-
S2=k2(Ⅰ2/ k2-K)+k2(Ⅱ2/ k2-K)
=4(4.79×10-6.11×104 )2 +4(7.42×10-6.11×104 )2 =1.38×107
-4
f2=第二列的水平数-1=2-1=1 V2=S2/f2=1.38×107/1=1.38×107
-
-
Se=S5=k5(Ⅰ5/ k5-K)+k5(Ⅱ5/ k5-K)
=4(6.22×10-6.11×104 )2 +4(5.99×10-6.11×104 )2 =1.06×109
-4
-
-4
-
-
22
fe=f5=1
Ve=Se/fe=1.06×109/1=1.06×109
-
-
F2 =V2/Ve=1.38×107/1.06×109=130.2
-
-
查《F 分布数值表》可知:
F(а=0.01,f1=1,f2=1)=4052 > F2 F(а=0.05,f1=1,f2=1)=161.4 >F2 F(а=0.10,f1=1,f2=1)=39.9
(其中:f1 为分子的自由度,f2 分母的自由度)
所以第二列对试验指标的影响在=0.10水平上显著。其他列的计算结果见表2-5(c)。
表5-5(c) K的极差分析和方差分析
(6)由极差分析结果引出的结论:请同学们自己分析。
(7)由方差分析结果引出的结论。
① 第1、2列上的因素 Δp、T 在=0.10水平上显著;第3列上的因素w在=0.05水平上显著;第4列上的因素M 在=0.25水平上仍不显著。
② 各因素、水平对K的影响变化趋势见图5-3。图5-3是用表5-5(a)的水平、因素和表5-5(c)的Ⅰj/ kj 、Ⅱj/ kj 、Ⅲj/ kj 、Ⅳj/ k值来标绘的。从图中可看出: A.过滤压强差增大,K值增大; B.过滤温度增大,K值增大; C.过滤浓度增大,K值减小;
D.过滤介质由1水平变为2水平,多孔陶瓷微孔直径减小, K值减小。因为第4列对K值的影响在=0.25水平上不显著,所以此变化趋势是不可信的。
③ 适宜操作条件的确定。由恒压过滤速率议程式可知,试验指标K值愈大愈好。为此,本例的适宜操作条件是各水平下K的平均值最大时的条件: 过滤压强差为4水平,5.88kPa
过滤温度为2水平,33℃ 过滤浆液浓度为1水平,稀滤液
过滤介质为1水平或2水平(这是因为第4列对K值的影响在=0.25水平上不显著。为此可优先选择价格便宜或容易得到者)。
上述条件恰好是正交表中第8个试验号。