图片:
图片:
图片:
请教:PB-design,最陡爬坡实验,CCD等中的响应面分析的相关问题
请教:PB-design中的相关问题
在实验设计的过程中,通过阅读文献了解到了很多的,但是同时也积累了很多问题解决不了,希望各位高手们指点一二不胜感激.
1 在PB设计中出现的dummy variable的具体含义到底是什么?是对照组吗?如果不是应该遵循什么样的原则去设计呢?
2 在PB中实验组数应该是变量数加1,那么在相关的文献中看到15个变量设计为:15+1+4,其中4是dummy variable,但是表格中这4个变量也是有高低水平的变化的,那么设计时是作为15个变量来考虑还是19个呢?
3 想问问在最陡爬坡实验中,步长的选择有什么要求吗?纯经验还是有公式的? 4 在设计CCD试验那的时候是否要包括全因子实验设计?
5 什么是中轴点?
各位高手帮帮忙啊,谢谢了
小妹我也正在做这块试验,是培养基优化的
刚做完单因素试验
正在想下面该怎么设计呢?是PB?还是最陡爬坡?还是两个都要做??
反正最后是要做响应面的~~希望大虾们多多多指点一下下……
另外,关于PB,我也在想,是不是必须要做空白项的呢?
那么空白项里面的+1,-1是没有具体的水平值的亚,那么在实验中具体该怎么操作呢?? 谢谢各位不吝指教了……
我自己是怎么想的:单因子实验只是为了保险使PB实验的结果更加明显而进行的预实验,PB实验本身就是有筛选单因子的功能,如果有把握是可以直接做PB的.而我的实验是先进行单因子,然后是PB,根据PB的实验分析数据做最陡爬坡实验,否则不能很好的确定爬坡的方向以及步长.
最陡爬坡实验的步长的选择:
根据前面PB实验的结果,做一阶方程的法线,法线方向就是爬坡方向,步长就根据回归系数和规范变量的比值在通过自然变量来换算,算到的结果在综合实际的情况就可以基本确定步长了
这个是最近看文献理解到的一些,希望哪位高手指点一下
dummy variable 不是对照组。如果你的实验次数为4的整数倍。那么看你考察的因素是多少个。比如你有9个,那么至少要使用 runs=12次 的PB设计。此时,有3个空列。一般的处理方法是,等间距空列。实在不行,你就随机选吧。这并不妨碍你的实验结果。空列只是为了估算误差。
2. 这样吧,如果我这样表述,看你是否能够理解。
我刚好有15个因素,想做PB,正好 runs=16 符合我的要求。可是,这样一来,估算误差呢?因为没有多余空列了。那么,再往上加列,只有再加4列。刚好19因素,20次实验,其中有4个空列。
你认为这多出来的一列(16-15=1),我想你是这样算的吧。那你运行一下软件,看看15因素的PB, runs=16,到底是15列,还是16列?列是因素,行是实验次数。并不是列数=行数。
描述:如何确定步长:
图片:
图片:
图片:
描述:4 在设计CCD试验那的时候是否要包括全因子实验设计?
图片:
看了这张图,我想答案应该是不言而喻了!
描述:CCD各个设计点的作用:
图片:
综合最后两个问题.如有异议,欢迎继续发帖,大家共同学习!
几篇用响应面优化培养基的文章!
这几篇都是用响应面优化培养基的文章。响应面现在是比较常用的优化培养基的方法,但是好多人(包括我在内)都不是很清楚。由于最近我要进行培养基的优化,所以找了很多文章来研究。一般的文章都是一带而过,看了也不明白。这几篇过程还算详细,对理解有一定的帮助。希望对大家有所帮助。
我在看文章的过程中,我总结出了优化培养基的步骤。拿出来跟大家分享一下,共同学习和交流一下。有错误的话希望大家及时提出。
第一步:在众多实验因素中找出主要因素。
在这步实验中你可以应用正交试验(因素比较少)和PB(Plackett-Burman)实验。这两种方法都可以找出主要因素。尤其是PB实验,它可以在很多的因素中,用较少的实验筛选出主要因素(一般选取大于90%)。通过PB实验还可以看出各因素的作用效果,即是增加还是减少浓度会使响应值向最优移动。
第二步:是主要因素的取值逼近中心点,最陡爬坡实验
这步实验不是必须做的,如果你确定你的实验取值已经逼近中心点,那么你可以直接进行第三步的分析。但是你要是不能确定或不相信这些取值那你就要进行最陡爬坡实验。这步实验
根据第一步实验进行。为了尽快逼近最优值,增加步长通常取最大。
我现在还没找到取最大步长的公式,有谁知道的话麻烦发一下。细履平沙版主,帮忙解决一下,谢谢。这样就能找到中心点。
第三步:响应面分析
现在常用的有中心复合法和BB法(Box-Behnken
)。在这步实验时最好因素不要太多,因素太多直接影响到试验次数,现在经典的一般是三因素。通过这步分析可以的回归方程,进而得到最优培养基。并且还能得到因素相互作用对响应值的影响。
在这里我对△x,即
+1、—1的取值还不太清楚,α的取值也不是很清晰,希望大家帮忙解答一下。
这是我最近的学习结果,希望大家批评和指正。
[ 此贴被细履平沙在2008-06-05 18:55重新编辑 ]
附件: 采用响应面分析法优化吩嗪
_1_
羧酸的发酵条件.pdf (180 K) 下载次数:4 需要经验值:20
附件: 发酵法产氢培养基的响应面分析优化.pdf (908 K) 下载次数:4 需要经验值:20
附件: 酵母内海藻糖积累条件的优化.pdf (213 K) 下载次数:4 需要经验值:20
附件: 响应面法优化纳豆激酶液体发酵.pdf (217 K) 下载次数:5 需要经验值:20
关于培养基的优化试验套路
正交试验和均匀设计方法进行培养基优化已取得诸多成功的例子。
正交试验适合因子较多而因子水平不多的试验设计,从试验次数上看,是至少为因子数的平方。
均匀设计适合于因子少,而水平多的试验,从试验次数看,至少是因子数的两倍。 两种方法虽然多从拉丁方设计衍生而来,不过效率却更高。
现如今,大多流行响应曲面设计来优化培养基。
首先,我们要从众多培养基成分及影响的环境因素中筛选出具有主效应的因子。这时,通常采用筛选试验。主要有全因子因析设计和Plackett-Burman设计。两种筛选试验,各有千秋,但都能以最少的试验次数筛选出主效应因子。其中全因子设计能够表现出因子的三级以上交互作用,而Plackett-Burman设计由于是两水平设计,所以交互作用只在二级交互作用。另外还有部分因子因析设计。
筛选到了主效应因子,我们就可以开始进行下一步优化试验。此时,主要有中心复合设计和Box-Behnken设计。
中心组合设计是一种国际上较为常用的响应面法,是一种5水平的实验设计法。采用该法能够在有限的实验次数下,对影响生物过程的因子及其交互作用进行评价,而且还能对各因子进行优化,以获得影响过程的最佳条件。
Box- Behnken设计是另一种国际上较为常用的响应面法,是一种3水平的实验设计法。同样具有响应面法的优点。近年来利用该法进行生物过程优化的文献比用中心组合设计法的明显地少。
通常以上说的响应曲面设计和数据分析,都可以通过一些统计软件来运行,十分简便。 为此,我将本人一直在使用的Mintab绿色软件上传,希望大家能够好好利用,搞好试验设计,节省人力无力,为经济带来腾飞(别忘了日本很大程度上就是因为田口宏一的正交设计表,在二战后迅速崛起!)
谢谢西风,看你的回复我很有同感,我当时刚开始做RSM也是摸不到头脑,没办法,只有看文献一步一步的摸索过来的。
为了不让帖子沉了,也为了有需要的战友节省时间,心中对试验设计有个大概的框架,我先抛砖引玉,简单讲下我做培养基优化的一点体会。
可能有些战友认为,试验设计优化培养基就是找几种培养基成分放在一起做几个组合进行试验就行了,其实这样做往往是得不到最适的结果的,尤其在做响应面分析(RSM)的时候,试验得到的图形可能不是一个完美的曲面图,我见过一些别人发的文章,它的曲面图是一个扭曲的图形,高点根本没有出现在图形中,那试验得到的根本不是最适的培养基组分,当然这种文章一般不会出现在核心期刊上的。这种情况一般都是没有在做RSM前,做“爬坡试验”的结果,“爬坡试验”的目的在于找出RSM设计的中心点,保证结果的准确性。另外一点需要提出的是RSM的一个缺点就是分析的因素不能太多,经典的是三因素的试验设计,如果你的因素比较多,那不妨试试方开泰的均匀设计。要做RSM就要先找出有显著影响的因素,剔除一些对结果影响不显著的因素,所以在“爬坡试验”之前还需要一个PB试验,PB能从众多因素中很简单的找出对试验结果影响最为显著的因素,排除一些影响不显著的因素,降低后续试验的工作量,又能保证结果的准确性。PB和“爬坡试验”对于刚接触试验设计的战友,比较陌生点,加上发表文章中很少,全面的把整个试验设计写出来的,一般的都是只写RSM这部分,也有几篇文章是PB+RSM的,还有先做RSM后做“爬坡试验”的。我个人认为PB--“爬坡试验”--RS,这种试验设计的思路比较符合逻辑,又比较全面。如果做毕业论文的培养基优化部分,可以使内容比较丰富。当然如果是做毕业论文的话,在综合试验设计之前,还有个更基础的工作,就是单因素试验,那种放弃单因素试验的想法也完全错误的,尤其是没有一个基础配方的时候。我做的菌种是我自己从本实验室菌种库筛出来,然后又做了诱变育种,所以是没有合适的培养基的,所以做了很多工作,用单因素试验首先大致确定C、N、P、无机盐、微量元素的种类及水平。大致讲了一下,说的比较散乱,或许不太好明白。希望大家把问题提出来,我们一起针对具体问题具体分析。
讲得不错,都是很好的心得。先用PB进行显著性分析是一个很好的建议。
另外可以从历史数据中找到合适的数据,然后再用软件进行分析,就可以不用再做实验就可找到影响显著的因素和水平范围。
响应面分析,其实用我们常见的软件就可以做出来。首先对各个单因素的试验结果进行归纳,后选择变量的变化区间还变化间隔就可以,常见的软件如DPS就可以了。用这个软件可以完成你所需的所有工作,要是想让你的响应面好看,用MATLAB也可以,三维,四维的都可以,在MATLAB区中有我写的现成的用MATLAB语句实现第四维的表示方法,很好用。另外用SARS软件也是可以的,不过语句能比MATLAB复杂一点点。EXCEL也可以,不过做出的响应面,美观程度差一点点。
我有个想法,能不能在初始时用正交实验确定出中心点的范围,然后将数据用SAS中的主成份分析,得到影响最显著的几个因素,然后用RSM做,这样主要影响因素有了,中心点也有了。做起来也好做,不会PB等软件的战友也可以轻松操作。
不知这样可不可行?希望大家讨论讨论
PB实验设计的数据处理
我使用SAS进行试验设计的,11个因素+4个dummy variables,做16次实验。 PB实验设计的数据已经出来了,但是怎么分析不了。
用Analysist→Statistics→Regression→Linear分析出来的结果像图里面这样,
怎么回事呢?后面几列的Standard Error, t value 以及p值都没有。
我给试验设计的表也列出来吧,请各位高手分析一下,到底是哪方面原因导致的。
表中X2,X4,X8,X15这4列是dummy variables,没有赋值,其余11个是考查的因素。 y是考查指标(转化率%)
上面是图片,顺便给表格放在word里面,以附件传上来,请大家帮分析分析。
想知道的几个问题:
1.试验设计有没有问题?
2.就按照表中设计的试验做了16次实验,没有将每次重复3遍取平均值,是不是可以?
3.这些数据该怎么处理,怎么用SAS处理会出现上面的情况,没有标准误差,t值以及p值? 谢谢了先~
附件:
Coded Design.rar (7 K) 下载次数:5
很想问一下,那个虚拟变量如何设置啊 一般多少个
还有最重要的是 实验过程中到底如何进行啊 小妹真的没有概念
虚拟变量好像一般设个三个左右
实验次数都为四的的倍数,如果你要测定8个因素,实验次数仍为12,那么就可以设三个虚拟变量。
8+3=11
记住k个因素和实验次数之间的关系是 K小于或等于n-1
具体实验过程中,我个人觉得就是高低水平都为-,就是什么都不加,只是增加了实验次数,控制误差的作用。
实验过程中控制误差可以通过重复试验达到。而实验误差的计算可以通过增加中心点次数实现。如果不能进行误差分析,那么就谈不上数据分析了。
我也是刚刚起步,幸亏有发酵人,大家可以一起交流!
一般来说,试验设计的时候k次实验的话,
(考查因素+虚拟变量)=k-1。
比如,12次实验,考查8个因素,那么剩下的3个变量就可以不赋值,
仍为uncoded。
不过这种dummy variables选择国内期刊和国外期刊有所不同:
国内的:如版友们所说,随机选择的比较多。
外文期刊:1.没有标出dummy variables,比如12次实验,设计表就列出了8个考查因素,而3个dummy variables没有标出;
2.标出了,但是给dummy variables都列在一块,比如就放最后几列。
3.也看到就根本没有设 dummy variables的,比如12次实验就考查11个因素的。 初学求教:什么是PB实验和爬坡实验啊
什么是PB实验和爬坡实验啊
刚开始做实验,什么都不知道,万望各位赐教!!
pb是plackett-Burman的缩写,是一种筛选试验。就是从众多影响因素中筛选出具有主效应的因子。至于最陡爬坡我也不太清楚。我也想知道。
额要点名了,细履平沙斑竹,指点一下吧。
谢谢了!
斑竹,给大家讲解一下吧,我也特别想知道什么是最陡爬坡,我看过你的帖子,知道你是试验设计的行家。望斑竹不吝赐教。
最陡爬坡实验它能最快逼近最大响应面区域,确定中心组合实验的中心点,能保证响应面分析结果的准确有效性.
我只知道这么一点吧.还望楼下的人能补充细化一下呢.
一般都会作,但是如果实验结果由方差分析发现选取的水平已接近最大响应区域,那么就可以不再进行最陡爬坡实验,最后用中心复合设计及响应面分析来确定主要影响因子的最佳浓度。
你可以看看有关资料.一般是先作部分因素实验(FFD),再做最陡爬坡实验.再利用中心组合实验确定中心点,
如果采用PB实验,一般不作最陡爬坡实验,直接用中心组合实验确定中心点.具体原理我不记不清了.明天我上传一个这个方面的资料吧. 上传一篇文章.可能对你有帮助
.
[ 此贴被细履平沙在2008-06-08 15:02重新编辑 ]
附件: 生物过程的优化.pdf (358 K) 下载次数:63 需要经验值:30
怎么又方差分析看所选水平是否已经接近最大响应区域呢?谢谢!
PB试验可以用来筛选培养基中不同成分对试验结果的影响,通过PB试验得到影响较大的试验因素;爬坡试验就是从PB试验的中心点开始,根据PB试验的得出的每种因子的系数来确定爬坡方向以及步长,爬坡试验主要目的是逼近主要试验因子的最适添加水平;之后根据爬坡试验的结果就可以做相应面了,也就可以最后确定每种重要因子的添加量了。 嘿嘿,我也是初学者,希望这些能对你有帮助
请教一下:响应曲面1.414到-1.414中间5个水平的步长如何设计? 0
还需要看回归系数吗?设计的时候凭经验还是有具体的公式?
紧急求救~
0是中间,1如果相当于中间偏大2.0水平,那么1.414就相当于中间偏大2.828水平.我是这么理解的,这个不能靠经验,而是根据程序要求。
关于PB设计中的t检验和P检验
请问各位大侠,PB设计中的t 检验和P检验的功能是否是一样的?如何通过t 检验来认定显著因素?另外,某因子的显著性大于90%或80%等是如何判断的?
感谢赐教
P的意思是概率,不是P检验,是根据T值查到的概率和F值查到的概率。
楼主可能没有学习过数理统计。进行实验设计,一些数学基本知识还是要具备的。 关于最陡爬坡(最速上升)的问题
我下了发酵人上的“Path of steepest ascent /descent”。在学习中有些地方不明白,希望大虾能给予帮助。
在设计中需要编写一个“最速上升宏”命令,请问这个“最速上升宏”在Minitab15这个版本中有没有,如果有在哪里?(本人愚钝,如果翻译错误望大虾指出以便更正)
还有我点击“编辑器(D)——启动命令(E)”然后按照minitab技术支持文件上所给出的方法在会话窗口里输入以下命令:
ascent y x.1-x.n;
sore u.1-u.j;
step s;
base b;
descent;
runs r.
然后回车出现“* 错误* 未知 Minitab 命令: ASCE
MTB > ”
我不知道这个命令应该在哪里输入。望高手指点啊!
最陡爬坡必须要输入命令才能完成吗?可不可以像pb一样直接用minitab软件现有的程序就可以完成设计和分析?
最陡爬坡实验
我觉得最陡爬坡实验不需要软件分析的,直接观察数据变化的趋势,找到极点值,附近找到因子参数范围再做下一步的响应面实验和分析就可以了。可以参考http://www.fajiaoren.com/read.php?tid=9060
PB试验设计
外文资料里面dummy variables要么没有列出来,有些就根本没有设(比如8次试验就做7个因素),要么所有的dummy variables就全部都列在一起,只有看到国内的文章才是将dummy variables随机的列出来。
在版上也看到说要有dummy variables,并且要随机的选择。
那么dummy variables到底要不要,要的话是不列出来,还是所有的就放最后几列呢? 我认为dummy variables的位置 不影响分析结果。但是这个参数应该有。
有道理,
另外,每一组试验只做一次,还是做个重复比如同一组做3次,然后取他们的平均值呢? 要是只做一次会不会误差比较大,影响试验结果?
重复多次可以减少某些异常点引入的误差,减少噪音,提高模型显著性。
有两种方法,一种是在程序中设置3个重复,实验结果都输入实验表,也可以在程序中设1个duplication,然后将数值平均后输入实验表。
从pb到最陡爬坡,如何设计步长,求救啊~
pb做完了,也做了重复,现在真是不会确定步长
真的是很笨,希望高手指点一下
求救啊~
细心看看以前的贴子,有详细的介绍。
一个参数(A)根据自己的经验确定,其它参数根据PB试验公式中的系数来确定。具体找贴子吧。
看下面的贴子,topmit有介绍。
http://fajiaoren.com/read.php?tid=6999&keyword=%E7%88%AC%E5%9D%A1
做了响应曲面分析,图形不对,麻烦大家看看哪里出了问题
图片:
我是先单因素----pb----最陡爬坡----响应曲面的
结果很不如意啊,想听听大家的意见,修改一下,继续向前挺进
呵呵大家多提意见啊
hope59你好,我想请教一下你爬坡实验怎么设计的,是用minitab设计的吗?
关于爬坡步长
我看了些文献,关于爬坡步长的说法不一。
有文献这样确定最陡爬坡的,步长公式=e×△j ×bj, 其中bj为一次回归的回归系数,△j为变化半径.这样看来,回归系数越大,步长应该越大啊。
而有的文献又说回归系数越大,步长应该越小。我觉得这种说法也对,因为回归系数大,说明对响应值的影响越大啊,响应值对因素变化非常灵敏,所以步长取值应该小点,以免错过最优点。不知我的理解对不对,请大家指教。
求助:可不可以用pb方法进行非培养基优化的发酵实验啊
小女子刚接触发酵实验,对很多东西不是太了解,最近查文献资料发现PB方法进行实验优化很方便,但是所查的资料都是关于培养基优化的,很想知道是不是可以用PB进行其他非培养基优化的实验?比如说有很多因素像温度、PH、钙离子浓度等。如果可以用PB法优化,那在进行“确定因素水平”阶段是不是也可以用“最陡爬坡实验”进行非培养基优化的实验呢?希望高手给予解决,小女子不胜感激
没有问题,可以用。但是进行试验之前,要考虑好试验的目的,不能只是为了试验而试验,而要考虑试验的结果是不是能够达到某种效果和实验条件能不能实现。
优化包括:培养基优化(碳源,氮源,无机盐等),培养条件优化(温度、PH、转速,装液量等)
实验设计:根据需要,自由组合,可以同时优化众多因素,不必拘泥于是培养基还是培养条件。
响应面设计的三个阶段
It is possible to separate an optimization study using RSM into three stages. The first stage is the preliminary work in which the determination of the independent parameters and their levels are carried out. The second stage is the selection of the experimental design and the prediction and verification of the model equation. The last
one is obtaining the response surface plot and contour plot of the response as a function of the independent parameters and determination of optimum points. 三个阶段。
1,准备阶段,决定独立变量及其水平。
2,实验设计的选择及模型的验证
3,根据响应面来确定优化条件。
求救:pb试验我做了好几次,总是找不到影响显著的因子
我做了好几次pb试验,可是总也找不到影响显著的因子,就是大于95%的两个到三个因子,我的基本都在80%左右,很是郁闷啊
备受打击,但是郁闷完了,还是想找找问题,调整浓度继续筛选
不知道大家有没有遇到类似的问题?都从哪里入手调节?
对了,我看很多文献上都说,高水平一般是低水平的1.25倍,这个很固定吗
我都是按照1.25倍做的,不会是这里有问题吧
还是要focus到上面的问题,遇到显著性不高的问题,应该如何调整?
希望高手多多指教!
试试高水平是低水平的1.5倍看看~
生物过程存在严重的交互作用,而PB实验次数少,因此在交互作用解决上有一定的问题。所以在生物领域先进行单因素考察,然后再进行组合试验是有一定道理的。我感觉也可以先进行PB实验多考察一些因素,然后再减少因素并进一步探索因素间的交互作用。 首先:你考察的是几个因素?如果存在交互作用,确实会存在上述情况。
第二:你的响应量是什么,该数据是否可靠?
比如,我们做糖的,响应量就是胞外多糖,胞内多糖。测糖的方法是浓硫酸苯酚法。如果实验设计者对该方法掌握不好,就算是同一个样品,测定结果差别甚大,那么,这就不是实验设计分析本身的错误,而是实验设计者的错误!
只要大于75%就行了
我是以生物量作为指标,用涂平板检测的
我用了七个因子,用minitab设计的12次试验,经过分析,只有一个因子的可性度在90%以上
在此之前,我做过比较全面的单因子试验,但是由于单因子试验用的是化合物能清楚的知道碳浓度、氮浓度等详细的参数
现在做工业发酵,用的都是豆饼粉之类的,所以在量上还是需要摸索
后期要做响应面,所以pb试验做的比较谨慎,怕后期出现更大的错误。
我这周重复一下上次的试验,再把倍数扩大到1.5试试看
非常感谢大家这么热心的帮助我,真是很感动哦
不知道我现在的设计有没有什么地方不合适?
希望大家多多批评指正!
不知道楼主,为什么7个因子要用12次实验设计呢?
minitab上自动生成的啊
还有就是每次生成的图表都不一样呢,很是奇怪
版主是不是觉得我的设计有问题啊
我刚准备瓶子,准备做了,呵呵,看样子是有问题了哦
我回去再看看,晚上再做吧,版主加我qq吧 43787903
可能需要和您好好讨论一下呢
谢谢,我在线等
首先:7个因子,做8次实验足够。不知道你设计过程中是否有哪一步没选好。
其次:低水平和高水平的倍数,一般在1.5左右,多了少了并没太大关系。只要不是认为的胡乱加大水平值,PB筛选还是比较可靠的。
再次:我实验室是不准安装QQ等聊天软件的。所以,只能我回家加你了。
关于爬坡实验的疑问!
爬坡试验需要软件设计吗?我刚做完pb试验,筛选完重要因子,然后是不是应该以高水平为中心,上下筛选几个浓度(一般也要七八个浓度吧),这时候步长设计有什么要求吗?浓度个数设置有要求吗?需要软件设计吗?
版主快来指导一下吧!
最爬坡试验最后要达到什么要求才能进一步进行响应曲面试验?
爬坡试验需要或者能用minitab设计吗? 我看到的论文上好像只是将得到的数据比较产量高低呢?
puzzled and help!
你做完了PB从分析的数据上就可以看出每个因子的影响是正还是负!所以设计的时候一定注意不要搞错了!
步长的设置也要看你自己实验本身,不能套用!所选择几个比较好,能达到你的实验目的,就是逼近最有的响应区域!越逼近越有利于下一步的实验!
回归与相关
回归与相关
--------------------------------------------------------------------------------
一、直线回归分析
直线回归是用直线回归方程表示两个数量变量间依存关系的统计分析方法,属双变量分析的范畴。
1. 直线回归方程的求法
(1)回归方程的概念:
直线回归方程的一般形式是Ý(音y hat)=a+bx,其中x为自变量,一般为资料中能精确测定和控制的量,Y为应变量,指在x规定范围内随机变化的量。a为截距,是回归直线与纵轴的交点,b为斜率,意为x每改变一个单位时,Ý的变化量。
(2)直线回归方程的求法
确定直线回归方程利用的是最小二乘法原理,基本步骤为:
1)先求 b,基本公式为b=lxy/lxx=SSxy/SSxx ,其中lxy为X,Y的离均差积和,lxx为X的离均差平方和;
2)再求a,根据回归方程 a等于Y的均值减去x均值与b乘积的差值。
(3)回归方程的图示:
根据回归方程,在坐标轴上任意取相距较远的两点,连接上述两点就可得到回归方程的图示。应注意的是,连出的回归直线不应超过x的实测值范围.
2. 回归关系的检验
回归关系的检验又称回归方程的检验,其目的是检验求得的回归方程在总体中是否成立,即是否样本代表的总体也有直线回归关系。方法有以下两种:
(1)方差分析
其基本思想是将总变异分解为SS回归和SS剩余,然后利用F检验来判断回归方程是否成立。
(2)t检验
其基本思想是利用样本回归系数b与总体均数回归系数ß进行比较来判断回归方程是否成立,实际应用中因为回归系数b的检验过程较为复杂,而相关系数r的检验过程简单并与之等价,故一般用相关系数r的检验来代替回归系数b的检验。
3. 直线回归方程的应用
(1)描述两变量之间的依存关系;
利用直线回归方程即可定量描述两个变量间依存的数量关系
(2)利用回归方程进行预测;
把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。
(3)利用回归方程进行统计控制
规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。
4. 应用直线回归的注意事项
(1)做回归分析要有实际意义;
(2)回归分析前,最好先作出散点图;
(3)回归直线不要外延。
二、直线相关分析
1. 直线相关的概念
直线相关分析是描述两变量间是否有直线关系以及直线关系的方向和密切程度的分析方法。用以描述两变量间相关关系的指标是相关系数(常用r表示),两变量间相关关系的种类有正相关(0
2. 相关系数的计算
相关系数是x,Y的离均差积和lxy除以X的离均差平方和lxx与Y的离均差平方和lyy之积的算术平方根的商。故此相关系数又被称为积差相关系数。
3.相关系数的假设检验
相关系数检验的目的是判断两变量的总体是否有相关关系,方法有t检验和查表法,t检验法是样本与总体的比较,查表法是直接查相关系数界值表得到相应的概率p。
三、直线相关与回归的区别与联系
区别:1. 相关说明相关关系,回归说明依存关系;
2. r与b有区别;
3. 资料要求不同。
联系:1. r与b值可相互换算;
2. r与b正负号一致;
3. r与b的假设检验等价;
4. 回归可解释相关。相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。
四、等级相关分析
等级相关分析适用于资料不是正态双变量或总体分布未知,数据一端或两端有不确定值的资料或等级资料。常用的Spearman等级相关系数rs是利用x,Y的秩次来进行直线相关分析的。因此当x,Y的相同秩次较多时,计算出的rs需矫正。同样的,等级相关系数rs也需要进行假设检验。
五、相关分析应用中的注意事项
1. 相关分析要有实际意义;
2. 相关关系不一定都是“因果”关系;
3. 相关系数r假设检验中p的大小不能说明相关的密切程度;
4. 直线相关和等级相关有各自不同的适用条件
方差分析
方差分析
--------------------------------------------------------------------------------
一、方差分析的基本思想
1. 方差分析的概念
方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括单因素方差分析即完全随机设计或成组设计的方差分析和两因素方差分析即配伍组设计的方差分析。
2. 方差分析的基本思想
下面我们用一个简单的例子来说明方差分析的基本思想:
如某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下,
患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
问该地克山病患者与健康人的血磷值是否不同?
从以上资料可以看出,24个患者与健康人的血磷值各不相同,如果用离均差平方和(SS)描述其围绕总均数的变异情况,则总变异有以下两个来源:
(1)组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;
(2)组间变异,即由于克山病的影响使得患者与健康人组的血磷值均数大小不等。
而且:SS总=SS组间+SS组内 v总=v组间+v组内
如果用均方(即自由度v去除离均差平方和的商)代替离均差平方和以消除各组样本数不同的影响,则方差分析就是用组内均方去除组间均方的商(即F值)与1相比较,若F值接近1,则说明各组均数间的差异没有统计学意义,若F值远大于1,则说明各组均数间的差异有统计学意义。实际应用中检验假设成立条件下F值大于特定值的概率可通过查阅F界值表(方差分析用)获得。
3. 方差分析的应用条件
应用方差分析对资料进行统计推断之前应注意其使用条件,包括:
(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。
(2)正态性,即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。
(3)方差齐性,即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。
二、方差分析的主要内容
根据资料设计类型的不同,有以下两种方差分析的方法:
1. 对成组设计的多个样本均数比较,应采用完全随机设计的方差分析,即单因素方差分析。
2. 对随机区组设计的多个样本均数比较,应采用配伍组设计的方差分析,即两因素方差分析。
两类方差分析的基本步骤相同,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异(随机误差),即:SS总=SS组间+SS组内,而对配伍组设计的资料,总变异除了分解为处理组变异和随机误差外还包括配伍组变异,即:SS总=SS处理+SS配伍+SS误差。整个方差分析的基本步骤如下:
(1) 建立检验假设;
H0:多个样本总体均数相等。
H1:多个样本总体均数不相等或不全等。
检验水准为0.05。
(2) 计算检验统计量F值;
(3) 确定P值并作出推断结果。
三、多个样本均数的两两比较
经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。
1. 多个样本均数间两两比较
多个样本均数间两两比较常用q检验的方法,即 Newman-kueuls法,其基本步骤为:
建立检验假设-->样本均数排序-->计算q值-->查q界值表判断结果。
2. 多个实验组与一个对照组均数间两两比较
多个实验组与一个对照组均数间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q’界值表。
t检验和u检验
t检验和u检验
--------------------------------------------------------------------------------
简而言之,t检验和u检验就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。
一、样本均数与总体均数比较的t检验
样本均数与总体均数比较的t检验实际上是推断该样本来自的总体均数µ与已知的某一总体均数µ0(常为理论值或标准值) 有无差别。如根据大量调查,已知健康成年男性的脉搏均数为72次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为74.2次/分,标准差为6.0次/分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性。
上述两个均数不等既可能是抽样误差所致,也有可能真是环境差异的影响,为此,可用t检验进行判断,检验过程如下:
1. 建立假设
H0:µ=µ0=72次/分,H0:µ>µ0,检验水准为单侧0.05。
2. 计算统计量
进行样本均数与总体均数比较的t检验时t值为样本均数与总体均数差值的绝对值除以标准误的商,其中标准误为标准差除以样本含量算术平方根的商。
3. 确定概率,作出判断
以自由度v(样本含量n减1)查t界值表,0.025
应注意的是,当样本含量n较大时,可用u检验代替t检验。
二、配对设计的t检验
配对设计是一种比较特殊的设计方式,能够很好地控制非实验因素对结果的影响,有自身配对和非自身配对之分。配对设计资料的t检验实际上是用配对差值与总体均数“0”进行比较,即推断差数的总体均数是否为“0”。故其检验过程与样本均数与总体均数比较的t检验类似,即:
1. 建立假设
H0:µd=0,即差值的总体均数为“0”,H1:µd>0或µd
2. 计算统计量
进行配对设计t检验时 t值为差值均数与0之差的绝对值除以差值标准误的商,其中差值标
准误为差值标准差除以样本含量算术平方根的商。
3. 确定概率,作出判断
以自由度v(对子数减1)查t界值表,若P=0.05,则还不能拒绝H0。
三、成组设计两样本均数比较的t检验
成组设计两样本均数比较的t检验又称成组比较或完全随机设计的t检验,其目的是推断两个样本分别代表的总体均数是否相等。其检验过程与上述两种t检验也没有大的差别,只是假设的表达和t值的计算公式不同。
两样本均数比较的t检验,其假设一般为:H0:µ1=µ2,即两样本来自的总体均数相等,H1:µ1>µ2或µ1
计算t统计量时是用两样本均数差值的绝对值除以两样本均数差值的标准误。
应注意的是当样本含量n较大时(如大于100时)可用u检验代替t检验,此时u值的计算公式较t值的计算公式要简单的多。
四、t检验的应用条件和注意事项
两个小样本均数比较的t检验有以下应用条件:
(1)两样本来自的总体均符合正态分布,
(2)两样本来自的总体方差齐。
故在进行两小样本均数比较的t检验之前,要用方差齐性检验来推断两样本代表的总体方差是否相等,方差齐性检验的方法使用F检验,其原理是看较大样本方差与较小样本方差的商是否接近“1”。若接近“1”,则可认为两样本代表的总体方差齐。判断两样本来自的总体是否符合正态分布,可用正态性检验的方法。
若两样本来自的总体方差不齐,也不符合正态分布,对符合对数正态分布的资料可用其几何均数进行t检验,对其他资料可用t’检验或秩和检验进行分析。
实验设计基本概念
实验设计
--------------------------------------------------------------------------------
一、实验设计的概念、特点和分类
1.实验设计的概念
将一组随机抽取的实验对象随机分配到两种或多种处理组,观察比较不同处理的效应,这种研究称为“实验研究”.
“实验设计”是为实验研究做的周密计划。
2.实验研究的特点
(1)能有效地控制误差,节省人、财、物力,提高效率。
(2)研究者能人为地设置处理因素。
(3)受试对象接受何种处理及处理因素的水平是随机分配的。
3.实验研究的分类
(1)动物实验:在动物身上进行的实验研究。
(2)临床实验:在临床患病人群中进行的试验研究。
(3)社区干预实验:在某地区所有人群中进行的试验研究。
二、实验设计的基本要素
1.处理因素
又称研究因素,一般是外部施加的因素,确定处理因素时应注意:
(1)抓住实(试)验中的主要因素。
(2)确定和控制非处理因素。
(3)处理因素要标准化。
2.受试对象
即研究的对象,一般有人和动物两类。
人的选择:要注意病人和正常人的正确区分,诊断要明确,受试对象依从性要好等。
动物选择:注意所选动物的种类、品系、年龄、性别、窝别、体重等。
3.实验效应
即处理因素的效果,应注意:
(1)正确选用观察指标来反映实验效应。所选指标要灵敏、精确、客观,最好选用定量指标。
(2)指标观察时应避免偏性,可采用盲法。
三、实验设计的基本原则
1.对照原则:即实(试)验要设立对照,使得除实验因素外,对照组与实验组其余因素保持一致,常用的对照有:空白对照、安
慰剂对照、标准对照、实验对照、自身对照和历史对照等。
2.重复原则:即研究对象要有一定的数量,或者说样本含量应足够。根据每个具体研究,可有不同的方法来进行样本含量估计。
3.随机化原则:即应保证每个实验对象都有同等机会进入实验或接受某种处理。常用方法有查随机数字表和随机排列表等。随机化是保证均衡性的重要手段。
4.均衡原则:即各处理组非实验因素的条件基本一致,以消除其影响。
四、常用的实验设计方法
1.完全随机设计
将实验对象随机分配至两个或多个处理组去进行实验观察,又称单因素设计、成组设计。
优点:操作简单、应用广泛。
缺点:效率低,只能分析单因素的效应。
资料处理方法:t,u检验,方差分析、秩和检验、卡方检验等。
2.配对(伍)设计
将受试对象配成对子或配伍组,以消除非实验因素的影响。配伍设计又称随机区组设计。配对有自身配对和不同个体配对,配
伍实际上是配对的推广。
优点:所需样本数和效率均高于成组设计,而且很好地控制了混杂因素的作用。
缺点:配对条件不宜满足。
资料处理方法:配对t, u检验,秩和检验、配伍组方差分析、配对四格表卡方检验等。
3.其它实验设计方法:
(1)交叉设计:在配对设计基础上再加入时间因素,可分析不同阶段的效应。
(2)析因设计、拉丁方设计和正交设计等。
实验设计的意义、原则与基本内容
实验设计的意义、原则与基本内容
一、实验设计的意义
实验设计是科学研究计划内关于研究方法与步骤的一项内容。在医学科研工作中,无论实验室研究、临床疗效观察或现场调查,在制订研究计划时,都应根据实验的目的和条例,结合统计学的要求,针对实验的全过程,认真考虑实验设计问题。一个周密而完善的实验设计,能合理地安排各种实验因素,严格地控制实验误差,从而用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料。反之,如果实验设计存在着缺点,就可能造成不应有的浪费,且足以减损研究结果的价值。总之,实验设计是实验过程的依据,是实验数据处理的前提,也是提高科研成果质量的一个重要保证。
二、实验设计的原则
实验设计有属于专业方面的,有属于统计方面的。从统计方面说,主要应当考虑对照、重复、随机化等问题,这就是所谓实验设计的三原则。其具体内容我们将在第二、三、四节介绍。
三、实验设计的基本内容
(一)拟定相互比较的处理 所谓处理,指的是在实验研究中欲施加给受试对象的某些因素。如营养实验的各种饲料,治疗某病的几种疗法或药物,药理研究中某药的各种剂量等。在实验的全过程中,处理因素要始终如一保持不变,按一个标准进行实验。如果实验的处理因素是药物,那么药物的成份、含量、出厂批号等必须保持不变。如果实验的处理因素是手术,那么就不能开始时不熟练,而应该在实验之前使熟练程度稳定一致。
(二)确定实验对象及数量 这里指的是实验所用的动物或活体组织标本等。在实验设计中,要根据实验观察的目的与内容,明确规定采用什么样的实验对象,实验对象中的每个实验单位必须具备的条件与要求,以保证受试对象的一致性。实验对象需要有一定的数量,例数不能太少,也不宜过多。如何估计例数,详见第四节。
(三)确定将各实验单位分配到各种处理中去的原则 这主要是随机分配或随机化问题。
第三节将介绍几种常用的随机分组方法。
(四)拟定观察项目和登记表 要根据研究目的和任务,选择对说明实验结论最有意义,并具有一定特异性、灵敏性、客观性的观察项目。必要的项目不可遗漏,数据资料应当完整无
缺;而无关紧要的项目就不必设立,以免耗费人力物力,拖延整个实验的时间,尔后,要按照观察项目之间的逻辑关系与顺序,编制成便于填写和统计的登记表,以便随时记录实验过程中获得的数据资料。同一项目的度量衡单位必须统一符号(如+、++、+++等),应有明确的定义。
(五)拟定对资料整理分析的预案 这就是对将获得的数据资料准备如何进行整理?要计算哪些统计指标?用什么统计分析方法?事先必须有个初步的设想。例如对计数资料,是计算率还是百分比?若计算率,分子是什么?分母是什么?各组同一项目的某个率或百分比如何进行比较?又如对计量资料,是计算算术均数、几何均数还是中位数?同一项目各均数间应采用什么方法作比较?切忌实验设计时不认真考虑,实验过后拿数字去找统计方法。 Blocking 是什么?
Blocking is a technique used to remove the expected variation caused by some change during the course of the experiment. For example, you may need to use two different raw material batches to complete the experiment, or the experiment may take place over the course of several shifts or days. Design-Expert provides various options for blocking, depending on how many runs you choose to perform. The default of 1 block really means "no blocking."
For example, in experiments with 16 runs, you may choose to carry out the experiment in 2 or 4 blocks. Two blocks might be helpful if, for some reason, you must do half the runs on one day and the other half the next day. In this case, day to day variation may be removed from the analysis by blocking.
When you choose to block your design, one or more effects will no longer be estimable. You can look at the alias structure to see which effects have been "lost to blocks." This is especially important when you have 4 or more blocks. In certain cases, a two-factor interaction may be lost and so then you will want to make sure that the interaction is not one that you are interested in.
Another note about blocking - it is assumed that the block variable does not interact with the factors. The effect must only be a linear shift, and not be dependent on the level of one or more of the factors under study.
Important: If you try to block on a factor, that factor will be aliased with the block and you will not get any statistical details on the effect of that factor. Only block on things that you are NOT interested in studying.
Example: You are trying to determine the effects of factors in a coating process such as speed, temperature, and pressure on your product’s tensile and elongation properties. Due to the number of runs involved, you will need to use two different batches of raw material. You expect that variations in the raw material may have an effect on the response, but you are not interested in studying that effect at this tim
e. Therefore, raw material is NOT a factor and you should block on it instead. This will remove the effect of raw material on tensile and elongation from the ANOVA and allow you to better identify the other factor effects.
On the other hand, if you want to study the effect of raw material batch variation, then it should be included as a factor and you should NOT set up blocks on this factor. You may need to restrict the randomization by modifying the run order. Be aware that unidentified time-based effects could influence the results of your experiment when you restrict randomization.
[原创 来自发酵人]区块化设计有利于提高分析质量。在培养基优化过程中由于因素之间的交互性和生物反应的复杂性,任何其它因素都有可能对实验产生巨大的干扰现象。为了尽可能减少其它因素的作用,而突出主因素效应,选择blocking是很有意义的。比较在实验过程中一次BB设计需要60多个RUNS。那么因为消毒锅不能同时灭菌,接种时间长,放瓶时间长等,这样我们就可以设计2个blocking。将实验分成两次,这样将消除灭菌时间不同的影响和减少接种和放瓶时间长度。这是一个例子,也不一定合理,因为分两次做的时候会带来种子的差异,这种差异通过对照实验不一定能很好的消除。所以它只是用来解释一下blocking 设计可以将几个不想分析的干扰去除,合理性大家可以讨论。
另外区块化实验可以使实验的风险大大降低,一次在的试验如果失败,损失也会很大,同时特别打击人的积极性。而区块化之后可以将一次大的实验分成几次完成,这就是sequential experimentation的一项重要措施。
Blocking in Central Composite Designs( from design expert hel
p)
Blocking in Central Composite Designs(中心组合中的区块化)
Central composite designs may be carried out in blocks. Blocking is advantageous when all of the experiments cannot be carried out in one day or with one batch of material. The factorial points can be divided in such a way that the blocked effect is eliminated before computation of the model. The first one or more blocks consists of the factorial design with some center points. The remaining block consists of the star points(也叫轴向点) with additional center points.(两个区块中都包括中心点,这是进行误差分析必须的)
Blocking schemes vary depending on the design and the number of factors. A sample blocking selection for a central composite design with 4 factors is shown below. (4因素实验需要的run)
1 Block : 30 experiments
2 Blocks : 20 experiments, 10 experiments
3 Blocks : 10 exp., 10 exp., 10 exp.
1 block is really no blocking. 2 blocks split the design into the factorial portion and the star points. For 3 blocks the factorial design portion is split into two blocks w
hile the star points make up the third block.
Various blocking patterns are offered as options for the central composite designs. In addition, the block assignments can be changed after the design is created. (Right click on the block column header in the design layout screen.)
When the experiment is blocked, there will be an additional choice of the alpha level to use. The choice is between the alpha value for perfect rotatability and the alpha value for perfect orthogonality of the blocks. Often, these values are close enough to make the difference unimportant.(有两种alpha值,一个是为了旋转分析需要,一种是正交分析需要,这些值经常比较接近,这样可能减少差异) The default is the value for rotatability.
[求助]数据分析
大家帮忙看看我做的响应曲面数据如何?谢谢!
Response 1
ANOVA for Response Surface Quadratic Model
Analysis of variance table [Partial sum of squares - Type III]
Sum of Mean F p-value
Source Squares df Square Value Prob > F
Model 12.14 9 1.35 27.25 0.0001 significant
A-时间 2.42 1 2.42 48.90 0.0002
B-功率 2.92 1 2.92 58.92 0.0001
C-料液比 0.14 1 0.14 2.89 0.1328
AB 0.58 1 0.58 11.67 0.0112
AC 0.25 1 0.25 5.05 0.0594
BC 0.33 1 0.33 6.68 0.0362
A^2 3.69 1 3.69 74.49
B^2 1.20 1 1.20 24.19 0.0017
C^2 0.20 1 0.20 4.05 0.0840
Residual 0.35 7 0.049
Lack of Fit 0.29 3 0.095 6.22 0.0548 not significant
Pure Error 0.061 4 0.015
Cor Total 12.48 16
Std. Dev. 0.22 R-Squared 0.9722
Mean 7.95 Adj R-Squared 0.9366
C.V. % 2.80 Pred R-Squared 0.6267
PRESS 4.66 Adeq Precision 19.201
Adj R-Squared 0.9366
这一项合格吗?
模型显著,失拟不显著。看起来不错。应该是合格。
[实验设计]什么是爬坡试验,如何设计呀?
什么是爬坡试验,如何设计呀?谢谢大家指点!
帮我看看决定是否做最陡爬坡试验的一句英文的意思
As long as lack of fit (due to pure quadratic curvature and interactions) is very small compared to the main effects, steepest ascent can be attempted. 请各位高手帮我看看这句话什么意思,以及其背后的意义。
看文献时,没有发现这样的分析。
当平方项和交互项占的比例高时,需要进行析因实验以确定主因素的影响,但是当他们占的比例到多少时,需要做析因实验?这个问题与楼主的问题看起来是相似的。
我想如果主效应的方差分析是显著的,而失拟不显著应该算合适了。
这样上面的英文翻译:
当失拟影响(因平方项与交互项引起)与主效应相比很小时,可以考虑应用最陡爬坡试验。 这是当你的主要因素数值不是最佳数值的时候,应用最陡爬坡实验. 简单的说就是你所设计的影响显著因素的数值不是最适宜的,你可以,设定步长,使数值增加以达到影响显著的效果, 一般应用这个的是SAS软件,你可以下载一些这方面的中文文献,很详细的
关于最陡爬坡试验
想请教一下大家,在PB做完后哪些数据是用来做最陡爬坡试验的?还是需要重新设计试验,那么minitab里的什么程序可以来设计和分析呢??谢谢大家不吝赐教啊~ 还有就是PB做完一定有必要做最陡爬坡试验么??
我来回答吧
PB后不一定做最陡试验 要看你的试验结果
如果你对你自己的试验数据了解很好的话,应该估计出中心点的值
那么从PB后确定主效果因子后,选择该值做为CCD的中心点优化即可
当然如果你估计不出来,或者不相信,还是要做的
对PB试验的结果应该是选择P值小的,应该是在0。1以下为好,选择好后利用CCD优化(design expert)
想请问各位,在做最陡爬坡实验时,步长值如何才能确定呢?还是自己定
关于步长,可以先粗略的试一下,然后在细化,就可以了.
响应面优化
在响应面优化时:在使用最陡爬坡实验时,步长如何确定?
根据因素的标准偏回归系数的大小确定步长
步长先大点,效果不理想再进行补充实验.
关于placket-burman的求教!!!!
1、我是用minitab软件进行placket-burman试验设计,本来是7因素,但是考虑到空列,所以为11列,共12 次处理(runs),出来的结果是用该软件里面的软件能分析出来吗??
如果不行的话,用其它软件分析,那分析是方差分析还是t检验呢?/能出来回归方程??
2、设计好表头后如何确定哪几列作为因素列(空列)?其选择有什么原则??
关于Plackett-Burman的求教!
请楼主注意名称的拼写。
发文章我们都写成:Plackett-Burman design.
多谢楼下的更正了我一贯的拼写。
关于placket-burman的求教!!!!
老大,发文章的时候大部分是
plackett-burman design吧
我查很多文章都是这么写的,当然我的也写错了
用SAS很简单的 分析结果也可以显示出来的
sas 是可以办到。可是有多少人用得了sas,我说的是普及率问题,要价太高!
统计软件多种多样,实用才是最重要的。
三楼同志,有机会我们一起讨论一下心得。谢谢。
PB实验设计中的问题,请大家指教!
我在做PB设计的时候,选择7个因素,4个空项,16次实验进行设计,为什么minitab中没有16次实验的设计表格呢?只有12和20呢?我不知道这是为什么!!
我正准备用PB设计,刚刚接触这方面,很白痴,呵呵:请大家多多指教!不胜感激!!
图片:
描述:步骤二
图片:
图片:
针对你的问题:
谢谢!!
可为什么我看的文献中的设计没有0这一个设计呢
看图:表2 M=16的Plackett-Burman实验设计与结果
Table 2 Experimental design and result of M=16Plackett-Burman 序号 A
B C D E F G H I J K L M N O 酶活 u/ml
1 + + + + - + - + + - - + - - - 110.4 2 - + - - - + + + + - + - + + - 267.3 3 - - + - - - + + + + - + - + + 169.4 4 + + + - + - + + - - + - + + + 126.1 5 + - + - + + - - + - - - + + + 103.7 6 + - - + - - - + + + + - + - + 202.9 7 + + - + - + + - - + - - - + + 223.0 8 - - - - - - - - - - - - - - - 81.4
9 - - + + + + - + - + + - - + - 123.2 10 + - + + - - + - - - + + + + - 137.4 11 - - - + + + + - + - + + - - + 131.8 12 - + + - - + - - - + + + + - + 321.7 13 + - - - + + + + - + - + + - - 184.1
14 - + + + + - + - + + - - + - - 194.5 15 + + - - + - - - + + + + - + - 140.5 16 - + - + + - - + - - - + + + + 205.3 Prob>F*10-2
0.8
1.35
5.75
13.6
25.5
16.8
24.7
9.4
6.53
3.12
8.23
R-squared 0.9726
AdjR-Squared 0.9589
我怎样才能做出文献中做的这种设计呢??
中心点我们一般要求重复3次,以利于估计模型的误差.
文献中,缺少这样一个设计.所以没有中心点.也就是0水平的实验.
在因素设计中,不是已经设计了4个空项了吗?他们不就是用来估计误差的吗?? 我用minitab 怎样设计才能设计出如文献所述的设计呢??
在这方面我懂得的很少
请大家指教,不胜感激!!!
Runs x 1 x 2 x 3 Biomass (g/l)
1 −1 −1 0 6.49
2 −1 1 0 8.41
3 1 −1 0 7.66
4 1 1 0 10.21
5 0 −1 −1 6.68
6 0 −1 1 8.05
7 0 1 −1 8.84
8 0 1 1 10.45
9 −1 0 −1 6.34
10 1 0 −1 8.58
11 −1 0 1 8.11
12 1 0 1 10.3
13 0 0 0 10.09
14 0 0 0 9.26
15 0 0 0 9.78
怎样对其进行RSM设计的多元二次模型和变量分析情况?请大家指教,不胜感激!!!!!!!! 大家帮帮忙 关于plackett-burman
小弟最近做发酵实验用到SAS进行培养基优化,在做plackett-burman设计时对虚构变量(空白对照)的安插问题吧是很明白。
请问各位高手前辈其安插顺序是不是随意的,还是另有要求?
我没有用过SAS,但是从实验原理来讲:虚构变量的用途是进行误差分析和交互分析用的。应该没有顺序之分,但是一些软件(如正交表)在考虑交互作用时,安排了特定的列,这可能与它算法有关。
试试design expert吧,很好用!
刚发了!
多谢老大的帮忙
我自己又查了点资料,发现好多人都是随意安插的。
请教最陡爬坡实验问题
在做响应面优化培养基过程中,一般先是用Placket-Burman(或其他)筛选出重要影响因子,再进行最陡爬坡实验,最后进行中心复合设计。我想请教两个问题:
(1) 如何判断要不要进行最陡爬坡实验?
(2)在进行最陡爬坡时培养基浓度变化有没有原则依据?
最陡爬坡实验一般都是要进行的,因为要确定CCD试验的中心点,保证结果的准确性,要不很难保证你的RSM图形有最高点。爬坡实验因素的变化步长一般根据PB试验中个因素的显著性大小确定。
一般是要做的
不过最近看了很多文章,可以不做的,
但是必须保证,PB试验后的最大值在整个试验中是最显著的,可以通过T检验得之 至少第二个问题,可以看看CCD文章,有很多。
帮帮忙!plackett-burman实验结果分析
实验所得结果如下,只知道CDE是影响显著的因子,不知道这几个因子是取高水平还是低水平,是不是看前面的系数,正取高,负取低?
系数标
项 效应 系数 准误 T P
常量 17.144 2.703 6.34 0.003
A 0.730 0.365 2.703 0.14 0.899
B 6.139 3.069 2.703 1.14 0.320
C 7.540 3.770 2.703 1.39 0.235
D 8.152 4.076 2.703 1.51 0.206
E 25.622 12.811 2.703 4.74 0.009
F -1.915 -0.958 2.703 -0.35 0.741
G -5.508 -2.754 2.703 -1.02 0.366
H 1.006 0.503 2.703 0.19 0.861
J -6.120 -3.060 2.703 -1.13 0.321
K -1.145 -0.573 2.703 -0.21 0.843
L 0.730 0.365 2.703 0.14 0.899
M 0.868 0.434 2.703 0.16 0.880
N 2.684 1.342 2.703 0.50 0.646
O 1.816 0.908 2.703 0.34 0.754
P -1.481 -0.740 2.703 -0.27 0.798
是一个简单的方法,也可以看偏导的变化。
请教下
偏导在哪看啊
可以手工求
就看前面的系数行不?
我是刚刚才接触这个软件
还有一点:因素D是空白
你的效应值是正的,所以说明增加该因子的量,对你最终的结果起到正的影响;如果是负的那就要降低该因子的含量,所以应该选择高水平的,进一步优化
你的效应值是正的,所以说明增加该因子的量,对你最终的结果起到正的影响;如果是负的那就要降低该因子的含量,所以应该选择高水平的,进一步优化
是负选择高水平的?正的选择低水平的?
这要看你要求最大值还是求最小值。
楼主的说法是正确的
但是做这种试验,你最好把回归方程表示出来
方法是 点击 regression 中的分析 就会出来了
系数的正负表明对响应值的效应 大小表示显著性 可以通过大小决定下一步的最陡爬坡步长 或者是CCD的步长
请教:PB-design,最陡爬坡实验,CCD等中的响应面分析的相关问题
请教:PB-design中的相关问题
在实验设计的过程中,通过阅读文献了解到了很多的,但是同时也积累了很多问题解决不了,希望各位高手们指点一二不胜感激.
1 在PB设计中出现的dummy variable的具体含义到底是什么?是对照组吗?如果不是应该遵循什么样的原则去设计呢?
2 在PB中实验组数应该是变量数加1,那么在相关的文献中看到15个变量设计为:15+1+4,其中4是dummy variable,但是表格中这4个变量也是有高低水平的变化的,那么设计时是作为15个变量来考虑还是19个呢?
3 想问问在最陡爬坡实验中,步长的选择有什么要求吗?纯经验还是有公式的? 4 在设计CCD试验那的时候是否要包括全因子实验设计?
5 什么是中轴点?
各位高手帮帮忙啊,谢谢了
小妹我也正在做这块试验,是培养基优化的
刚做完单因素试验
正在想下面该怎么设计呢?是PB?还是最陡爬坡?还是两个都要做??
反正最后是要做响应面的~~希望大虾们多多多指点一下下……
另外,关于PB,我也在想,是不是必须要做空白项的呢?
那么空白项里面的+1,-1是没有具体的水平值的亚,那么在实验中具体该怎么操作呢?? 谢谢各位不吝指教了……
我自己是怎么想的:单因子实验只是为了保险使PB实验的结果更加明显而进行的预实验,PB实验本身就是有筛选单因子的功能,如果有把握是可以直接做PB的.而我的实验是先进行单因子,然后是PB,根据PB的实验分析数据做最陡爬坡实验,否则不能很好的确定爬坡的方向以及步长.
我也是才刚刚接触这个课题希望大家能够多多交流哟
最陡爬坡实验的步长的选择:
根据前面PB实验的结果,做一阶方程的法线,法线方向就是爬坡方向,步长就根据回归系数和规范变量的比值在通过自然变量来换算,算到的结果在综合实际的情况就可以基本确定步长了
这个是最近看文献理解到的一些,希望哪位高手指点一下
1. dummy variable 不是对照组。如果你的实验次数为4的整数倍。那么看你考察的因素
是多少个。比如你有9个,那么至少要使用 runs=12次 的PB设计。此时,有3个空列。一般的处理方法是,等间距空列。实在不行,你就随机选吧。这并不妨碍你的实验结果。空列只是为了估算误差。
2. 这样吧,如果我这样表述,看你是否能够理解。
我刚好有15个因素,想做PB,正好 runs=16 符合我的要求。可是,这样一来,估算误差呢?因为没有多余空列了。那么,再往上加列,只有再加4列。刚好19因素,20次实验,其中有4个空列。
你认为这多出来的一列(16-15=1),我想你是这样算的吧。那你运行一下软件,看看15因素的PB, runs=16,到底是15列,还是16列?列是因素,行是实验次数。并不是列数=行数。
描述:如何确定步长:
图片:
描述:如何steepest ascent 实验,红色字体为最佳条件
图片:
3 想问问在最陡实验中,步长的选择有什么要求吗?纯经验还是有公式的?
图片:
看了这张图,我想答案应该是不言而喻了!
图片:
看了这张图,我想答案应该是不言而喻了!
描述:CCD各个设计点的作用:
图片:
综合最后两个问题.如有异议,欢迎继续发帖,大家共同学习!
谢谢Topmit如此详尽的回答,非常感谢.
由于我现在是在准备开题,所以还没有开始使用软件,现在只是在进行理论上的学习 小妹我实在愚钝,看了回帖后还是有几个疑问:
1 在PB实验中,实验组数是4的倍数是约定俗成的?还是方法本身的要求?在准备过程中参考了一些外文文献发现他们的设计中似乎没有什么规则,有时候就像你上面说的是随机设置的
2 还是关于虚拟变量的问题,在PB实验中似乎不一定需要设置虚拟变量,而且如果要设定是在什么样的情况下才需要呢?设置了和不设置有什么差别?
3 在上面CCD图中提到的角点就是四面体的8个顶点吧,那么轴点和星点是不是就是数量上相等的不同轴上的点的不同叫法?还有就是这两个点是怎么定的?数学意义是什么啊? 4 a主要是用来评价旋转性的吧?那么在实验的设计过程中如何体现a的价值呢?
真是不好意思,基础太差,问题很多,请多多指教啊
【交流】最权威的Plackett-Burman实验问答(要求加精)
作者: 雪狼乖乖 (站内联系TA) 发布: 2009-09-07
近日收到一封某科研院一位硕士研究生的来信,就我好几年前一篇利用Plackett-Burman方
法和响应面设计进行发酵条件优化的论文提出了几个问题。虽然这部分研究是6、7年前做的了,但由于印象还比较深刻,我根据自己的理解对这几个问题一一进行了解答。考虑到这位同学所提的问题对利用Plackett-Burman方法和响应面设计进行条件优化具有普遍意义,所以在征得这位同学的同意下,特把来信和我的解答公布在此处,以便供其他有类似困惑的同行参考。
-------------------------
来信:
您好!我是中国**科学院的一位研究生,看到您在****学报*卷第*期****年*月出版的,题目“*******************发酵条件优化”,请教一些问题:
1.您的文章中的Plackett-Burman设计中设计了空列用来进行误差的估计,那在进行软件分析的时候,怎么操作?要把空列也当做模型的一部分选入,进行相应的可信度,贡献率等的分析吗?
2.看到有些文章中做Plackett-Burman试验时没有设计空列,比如要考察11个因素,那么就采用12次试验点的PB设计,这样可以吗?是否必须加空列?
3. 看到有一篇文章中也做了11个因素的,采用的是以下设计:12次试验加中心点试验1次,共13次试验,每次试验还进行了重复,这种设计中用到的中心点试验的目的是什么?做重复有必要吗?
4.PB设计中的中心点和空列如果是用来估计误差的,那么它们分别是估计哪部分的误差,它们是什么关系?
5.PB设计中的每个试验点都必须做重复吗?
6.您的CCD设计中选择的星号点的a=1.682,这样的话是保证了设计的旋转性还是正交性,或是二者兼顾了?
7.在MINITAB软件的PB设计中,如果选择11因素的PB设计时,只有20次试验的选择,没有16次这一选项,不知是什么原因?
8.Two-level factorial designs和PB试验的关系是什么样的?
------------------------------
解答;同学,您好:
不好意思,耽搁了好几天才回复。这部分工作是差不多六、七年前做的了,其后就没有再继续直接进行类似的应用,所以有些地方自己也拿不准了。虽然自己亲自做的东西印象比较深
刻,但一则自己当时也是自学的,对相关概念和原理的理解和应用就有可能不准确,二则长时间不涉及相关工作,的确有些生疏了。故我的意见仅供你参考,希望能对您有所帮助。 以下就逐条就您的问题作一回答:
1、2: 关于空项"N次实验 Plackett-Burman设计至多可研究N-1个因素, 其中至少应设置3个空项以估计实验误差,每个因素均取高、低两个水平。该方法数据处理简单,在N次实验中,每个因素高、低水平分别出现N/2;而且,当某个因素处于高(低)水平时,其余因素均各出现高、低水平N/4次。因此,分别计算这个因素在高、低水平时实验响应的均值并求两均值之差就可得到此因素的效应,其中空项效应的均方和为标准差估计值。各因素效应进行t检验,可信度高的因素作为重要因素作进一步考察"。
以我的数据为例:
计算每个因素的效应时,首先分别求取该因素为+时N/ 2次实验的响应值的和(∑+),再求取该因素为—时N/2次实验的响应值的和(∑-),然后计算(∑+)-(∑-),就得到该因素的效应。空项的效应得到后,求取均方和,就得到标准差估计值。因为在理论上空项不应该产生效应,那么得到的效应就应该是误差导致的,所以求取误差效应的均方和就可以作为整个实验的标准差估计值。其他效应是否显著(即是真的存在还是因为误差产生的?),就根据它们与误差效应的比值来判断。这样得到各个因素效应的可信度(通过t检验,看显著与否)。
可见,空项是必要的,否则无法说明和判断实验中误差的大小, 也不能判断各个因素的效应是否可信,是否显著。一般说来,为了保证误差估计的可信度,至少应设计三个空项。所以如有11个因素待考察的话,最好不要选择N=12的设计。
问题3、4、5:
加一个中心点实验可能是为了考察误差的大小。 这个是从一般的统计学原理来研究随机误差的,因为体现的也是实验的重现精度。一般而言,在进行PB实验时,本身就应对实验进行重复,取多次实验的结果均值来进行分析,以排除实验中随机误差的影响,提高实验结果的精度。但要注意,精度和准确度是两个不同的概念,相关内容可以参加实验统计或实验设计的教材。
你问的第四个问题很有深度,很好。就我个人理解而言, 这两个误差实质上是一样的,但作用不同。进行重复实验是为了减小随机误差对实验结果的影响,提高实验的精度,但无法提供随机误差有多大的信息。而设计空项,目的就在于提供信息来估计随机误差,进而为判
别因素效应的大小和显著性提供依据。我相信,如果重复实验的波动小,那么对应的差效应的均方和也应该相应较小。但要注意,随机误差小并不等于实验结果一定就可靠。如果存在系统误差的话,实验的可信度就受影响了。
问题6、选择星号臂长为a=1. 682是为了使设计具有旋转性和通用性。
问题7、PB实验分析很简单,用excel就可以很方便的得到结果, 手算也没有问题。minitab没有N=16的选择原因不明。但如果你了解原理的话,就不会受制于软件了。
问题8、Two-level factorial designs顾名思义是一种两水平的部分因子实验。 它与PB实验的共性在于,大家都是两水平实验;它们的差异在于简化取样点的方法不同,进而导致所得结果的代表性有差异。具体的理论分析请参加《工业实验的设计与分析》这本书,介绍很详细。如果没有的话我再重新看看来回答,不过还是建议您自己先看一看,如果能亲自弄懂的话会很有成就感的。
如果有我没说清楚的地方还请来信。祝实验顺利!
-------------------------------
这位同学收到我的回复后再次提出了如下问题:
1.我看到您建议我看的参考文献中的PB试验中的酶活力的值是进行了16次试验后在检测酶活力的时候做了平行的检测然后取得是均值,这样的话是否就是表明在进行PB试验时,发酵时不用做重复了?
2.您在最陡爬坡试验的时,步长是怎么确定的,步长确定的依据是什么?在确定步长之前是不是还有一个一阶模型之类的方程用以来确定在PB中所选择的各个参数之间的关系呢? ------------------------
解答:
PB实验每一轮是16个样本,但做了两轮,即最终的结果是两轮实验的均值。
步长根据考察因素的效应来确定,保持大家比例与效应的比例相当, 使得变化具有可比性。这个关系就是它们效应的相对大小。
************************************************************************************************
第三次问题:
您的PB试验、CCD试验和爬坡试验所用的设计和分析软件是哪种?
回答:
我当时都是在excel上处理的,PB很简单,手算都可以。爬坡实验也是一样的。但CCD的响应面分析比较麻烦,当时还没有找到合适的软件,所以回归拟合以及检验我都是根据原理一步步自己算的。不过当时借助EXCEL 自己编制了一张表,只要你输入实验结果,自动就能得到最终的结果和检验。但后来作图是用的statistics。现在我觉得你可以用sas来做,毕竟里面有模块的,很方便。
Plackett-Burman设计至多可研究N-1个因素, 其中至少应设置3个空项以估计实验误差,每个因素均取高、低两个水平。该方法数据处理简单,在N次实验中,每个因素高、低水平分别出现N/2;而且,当某个因素处于高(低)水平时,其余因素均各出现高、低水平N/4次。因此,分别计算这个因素在高、低水平时实验响应的均值并求两均值之差就可得到此因素的效应,其中空项效应的均方和为标准差估计值。各因素效应进行t检验,可信度高的因素作为重要因素作进一步考察"。
计算每个因素的效应时,首先分别求取该因素为+时N/ 2次实验的响应值的和(∑+),再求取该因素为—时N/2次实验的响应值的和(∑-),然后计算(∑+)-(∑-),就得到该因素的效应。空项的效应得到后,求取均方和,就得到标准差估计值。因为在理论上空项不应该产生效应,那么得到的效应就应该是误差导致的,所以求取误差效应的均方和就可以作为整个实验的标准差估计值。其他效应是否显著(即是真的存在还是因为误差产生的?),就根据它们与误差效应的比值来判断。这样得到各个因素效应的可信度(通过t检验,看显著与否)。
可见,空项是必要的,否则无法说明和判断实验中误差的大小, 也不能判断各个因素的效应是否可信,是否显著。一般说来,为了保证误差估计的可信度,至少应设计三个空项。所以如有11个因素待考察的话,最好不要选择N=12的设计。
你可以自己看minitab和Design expert 上的PB试验设计。因素只有以下几个:11,19,23,27,31.初学者可以用现成的。根据“在N次实验中,每个因素高、低水平分别出现N/2”的原理,明白的话可以自己设计实验,只要让高低水平分别出现N/2次,就可以了。这样就不用受软件限制,之后把结果输入去分析就好。
还有就是高低水平的确定,并不是一定有1.5—2的倍数关系,我还经常见高低水平有4,5倍的差异,这个要自己试,不要看别人怎么做就模仿,不要偷懒,多做单因素的几个预试验,可能更有利于高低水平的确定。多看些外文文献,实话说CNKI上这方面文章真的不敢恭维。 这是我看别人的评论和自己对PB实验的一些见解,如有错误,请大家指正。
B实验的目的在于从众多相关因素中筛选出对目的响应具有显著效应、也就是影响最大、最关键的几个。所谓“打蛇要打七寸”,做任何事都要抓住要害,“抓住主要矛盾”。只有把要害或主要矛盾抓住了,才可能有针对性地、事半功倍地解决问题。我们做科研有个得天独厚的好处,就是从小到大学了不少辩证法的知识,所以如果能活学活用、以辩证法的思想指导我们的行为的化,那么在解决问题的策略和方法上就占有优势。PB实验就是合乎辩证法思想的,所以才在实际应用中显示出其威力,因为它能快速、准确地识别出影响目标响应的重要因素。
通过PB实验确定出重要因素后该怎么办呢,自然就是对这些重要因素进行比较详尽和全面的考察,以了解它们与目标响应间的关系,进而为选择合适的条件以便实现目标响应的最优化创造条件。
进一步的考察方法有多种,简单的有单因素实验,正交实验,复杂点的有析因实验,响应面实验,均匀设计等。具体选择哪一种方法要根据具体的情况进行判断。这个个人认为不是越复杂越好,只要能有好的效果、满足需要就可以了。
如果要进行响应面实验的话,在PB实验之后有必要进行最陡爬坡实验。其原因在于响应面实验考察的范围比较窄,如果不先确定存在最大响应值的区域的话,很有可能在响应面实验时无法得到最值。在B&B上有一篇文章就通过具体的实例证明了这一点:第一次响应面没有得到最值,经过分析发现考察区域本身不存在最指点。经过进一步搜索后确定了一个存在最值的区域,再进行响应面实验就成功了。最陡爬坡法就是一个经典的搜索考察区域、逼近最值空间的方法。
最陡爬坡法在运用中存在两个问题,一是爬坡的方向,二是爬坡的步长。前者根据效应的正负就可以确定:如果某个因素是正效应,那么爬坡时就增加因素的水平;反之,即减少因素水平。而对应爬坡步长,则要稍微复杂些。
前几天一个同学又写信来同我交流了这个问题,我想就以我们的问答来具体的说明如何选择步长吧。
问:
现在我进行了PB实验,进行分析之后选择了碳源氮源和发酵时间为显著的因素,下面我应该怎么做?
我对PB试验中的11个因素进行了回归分析,得到了一个方程,拟和的还可以,预测值的组合在我的实验中出现了,但是预测值要小于我的实验实测值,下面我可以按照11个因素得到的回归方程将其余的8个因素剔除之后,进行相应的步长和实验安排吗?这样做是否合适?
你的文章《****液体发酵条件的优化》中最陡爬坡试验中的表3,做了4次试验,但是后面的3个因素是成对,也就是以组合的形式出现的,这是怎么确定的?为什么做4次?第4个组合是PB试验的预测得到的最优组合的含量为出发点的吗?我看到蛋白胨是1-4为从低到高的含量,但是磷酸氢二钠和种龄却是有高到底的顺序,这是为什么?
答:
①选择了碳源氮源和发酵时间为显著的因素,下面我应该怎么做?
我想既然确定了显著因素,那么就可以对这三个因素进行进一步的比较精细地优化。可以采用正交实验进行三因素多水平的优化,也可以采用其他的统计优化方法进行优化,比如响应面或均匀设计。这个可觉得倒不是越复杂越好,只要能有好的效果就可以了。
至于PB实验的预测值小于真实值,这也是很正常的。生物实验本身就存在比较大的波动,而且如果在PB实验时存在系统误差的话(如温度的规律性变化),那么预测值是会与真实值有差异的。
只有这三个因素经PB实验验证是显著性因素,那么就可以选择这三个因素进行进一步
的实验。
②关于最陡爬坡实验:
爬坡实验的次数是根据需要确定的,如果四次实验还没有确定最大值,即趋势还是增加,那么就有必要进行第五次、第六次实验,直至确定出爬坡的最大值,即趋势开始下降。 我进行爬坡实验时因为胰蛋白胨是正效应,磷酸氢二钠和种龄是负效应,所以前者是一直增加的,后两个是持续减小的。胰蛋白胨和磷酸氢二钠在爬坡时的步长都是PB实验时步长的1/4,之所以确定为这个值是考虑到步长小一些的话可以对爬坡路径上响应的变化做一个相对精确的考察。由于种龄的自由度有限,所以就取1h为步长。所以就最陡爬坡而言,是否需要严格保持各因素的步调一致还有待研究,不过我觉得如果可能的话,最好能保持步长一直,这样一则可以对应于PB实验的分析结果,二则也可以避免因为步调不一致导致的响应不协调现象。
另外我觉得还可以根据因素的效应值设定步长:对应效应大的因素,步长应小一些;效应小的因素,步长应大一些。而且他们间的步长大小关系应该与他们的效应大小成反比。其原因在于,效应大的因素发生的变化可以使响应有更敏感的改变,所以步长应小;同理,效应小的因素步长自然应该大一些。
-------------以上为引用
具体请参考 博客
首先,选择最高的那组,以显著因素的高低水平的均值作为爬坡的起点。关于步长你可以选择PB实验步长的三分之一到一倍。其他不显著因素,选择最高那组的配比。关于正爬坡还是负爬坡的问题是:pb实验会拟合一个一次方程,因素前面的系数是正就是正爬坡,系数是负的就是负爬坡。至于软件的操作方面不好语言描述啊,你自己看看相关资料吧。
图片:
图片:
图片:
请教:PB-design,最陡爬坡实验,CCD等中的响应面分析的相关问题
请教:PB-design中的相关问题
在实验设计的过程中,通过阅读文献了解到了很多的,但是同时也积累了很多问题解决不了,希望各位高手们指点一二不胜感激.
1 在PB设计中出现的dummy variable的具体含义到底是什么?是对照组吗?如果不是应该遵循什么样的原则去设计呢?
2 在PB中实验组数应该是变量数加1,那么在相关的文献中看到15个变量设计为:15+1+4,其中4是dummy variable,但是表格中这4个变量也是有高低水平的变化的,那么设计时是作为15个变量来考虑还是19个呢?
3 想问问在最陡爬坡实验中,步长的选择有什么要求吗?纯经验还是有公式的? 4 在设计CCD试验那的时候是否要包括全因子实验设计?
5 什么是中轴点?
各位高手帮帮忙啊,谢谢了
小妹我也正在做这块试验,是培养基优化的
刚做完单因素试验
正在想下面该怎么设计呢?是PB?还是最陡爬坡?还是两个都要做??
反正最后是要做响应面的~~希望大虾们多多多指点一下下……
另外,关于PB,我也在想,是不是必须要做空白项的呢?
那么空白项里面的+1,-1是没有具体的水平值的亚,那么在实验中具体该怎么操作呢?? 谢谢各位不吝指教了……
我自己是怎么想的:单因子实验只是为了保险使PB实验的结果更加明显而进行的预实验,PB实验本身就是有筛选单因子的功能,如果有把握是可以直接做PB的.而我的实验是先进行单因子,然后是PB,根据PB的实验分析数据做最陡爬坡实验,否则不能很好的确定爬坡的方向以及步长.
最陡爬坡实验的步长的选择:
根据前面PB实验的结果,做一阶方程的法线,法线方向就是爬坡方向,步长就根据回归系数和规范变量的比值在通过自然变量来换算,算到的结果在综合实际的情况就可以基本确定步长了
这个是最近看文献理解到的一些,希望哪位高手指点一下
dummy variable 不是对照组。如果你的实验次数为4的整数倍。那么看你考察的因素是多少个。比如你有9个,那么至少要使用 runs=12次 的PB设计。此时,有3个空列。一般的处理方法是,等间距空列。实在不行,你就随机选吧。这并不妨碍你的实验结果。空列只是为了估算误差。
2. 这样吧,如果我这样表述,看你是否能够理解。
我刚好有15个因素,想做PB,正好 runs=16 符合我的要求。可是,这样一来,估算误差呢?因为没有多余空列了。那么,再往上加列,只有再加4列。刚好19因素,20次实验,其中有4个空列。
你认为这多出来的一列(16-15=1),我想你是这样算的吧。那你运行一下软件,看看15因素的PB, runs=16,到底是15列,还是16列?列是因素,行是实验次数。并不是列数=行数。
描述:如何确定步长:
图片:
图片:
图片:
描述:4 在设计CCD试验那的时候是否要包括全因子实验设计?
图片:
看了这张图,我想答案应该是不言而喻了!
描述:CCD各个设计点的作用:
图片:
综合最后两个问题.如有异议,欢迎继续发帖,大家共同学习!
几篇用响应面优化培养基的文章!
这几篇都是用响应面优化培养基的文章。响应面现在是比较常用的优化培养基的方法,但是好多人(包括我在内)都不是很清楚。由于最近我要进行培养基的优化,所以找了很多文章来研究。一般的文章都是一带而过,看了也不明白。这几篇过程还算详细,对理解有一定的帮助。希望对大家有所帮助。
我在看文章的过程中,我总结出了优化培养基的步骤。拿出来跟大家分享一下,共同学习和交流一下。有错误的话希望大家及时提出。
第一步:在众多实验因素中找出主要因素。
在这步实验中你可以应用正交试验(因素比较少)和PB(Plackett-Burman)实验。这两种方法都可以找出主要因素。尤其是PB实验,它可以在很多的因素中,用较少的实验筛选出主要因素(一般选取大于90%)。通过PB实验还可以看出各因素的作用效果,即是增加还是减少浓度会使响应值向最优移动。
第二步:是主要因素的取值逼近中心点,最陡爬坡实验
这步实验不是必须做的,如果你确定你的实验取值已经逼近中心点,那么你可以直接进行第三步的分析。但是你要是不能确定或不相信这些取值那你就要进行最陡爬坡实验。这步实验
根据第一步实验进行。为了尽快逼近最优值,增加步长通常取最大。
我现在还没找到取最大步长的公式,有谁知道的话麻烦发一下。细履平沙版主,帮忙解决一下,谢谢。这样就能找到中心点。
第三步:响应面分析
现在常用的有中心复合法和BB法(Box-Behnken
)。在这步实验时最好因素不要太多,因素太多直接影响到试验次数,现在经典的一般是三因素。通过这步分析可以的回归方程,进而得到最优培养基。并且还能得到因素相互作用对响应值的影响。
在这里我对△x,即
+1、—1的取值还不太清楚,α的取值也不是很清晰,希望大家帮忙解答一下。
这是我最近的学习结果,希望大家批评和指正。
[ 此贴被细履平沙在2008-06-05 18:55重新编辑 ]
附件: 采用响应面分析法优化吩嗪
_1_
羧酸的发酵条件.pdf (180 K) 下载次数:4 需要经验值:20
附件: 发酵法产氢培养基的响应面分析优化.pdf (908 K) 下载次数:4 需要经验值:20
附件: 酵母内海藻糖积累条件的优化.pdf (213 K) 下载次数:4 需要经验值:20
附件: 响应面法优化纳豆激酶液体发酵.pdf (217 K) 下载次数:5 需要经验值:20
关于培养基的优化试验套路
正交试验和均匀设计方法进行培养基优化已取得诸多成功的例子。
正交试验适合因子较多而因子水平不多的试验设计,从试验次数上看,是至少为因子数的平方。
均匀设计适合于因子少,而水平多的试验,从试验次数看,至少是因子数的两倍。 两种方法虽然多从拉丁方设计衍生而来,不过效率却更高。
现如今,大多流行响应曲面设计来优化培养基。
首先,我们要从众多培养基成分及影响的环境因素中筛选出具有主效应的因子。这时,通常采用筛选试验。主要有全因子因析设计和Plackett-Burman设计。两种筛选试验,各有千秋,但都能以最少的试验次数筛选出主效应因子。其中全因子设计能够表现出因子的三级以上交互作用,而Plackett-Burman设计由于是两水平设计,所以交互作用只在二级交互作用。另外还有部分因子因析设计。
筛选到了主效应因子,我们就可以开始进行下一步优化试验。此时,主要有中心复合设计和Box-Behnken设计。
中心组合设计是一种国际上较为常用的响应面法,是一种5水平的实验设计法。采用该法能够在有限的实验次数下,对影响生物过程的因子及其交互作用进行评价,而且还能对各因子进行优化,以获得影响过程的最佳条件。
Box- Behnken设计是另一种国际上较为常用的响应面法,是一种3水平的实验设计法。同样具有响应面法的优点。近年来利用该法进行生物过程优化的文献比用中心组合设计法的明显地少。
通常以上说的响应曲面设计和数据分析,都可以通过一些统计软件来运行,十分简便。 为此,我将本人一直在使用的Mintab绿色软件上传,希望大家能够好好利用,搞好试验设计,节省人力无力,为经济带来腾飞(别忘了日本很大程度上就是因为田口宏一的正交设计表,在二战后迅速崛起!)
谢谢西风,看你的回复我很有同感,我当时刚开始做RSM也是摸不到头脑,没办法,只有看文献一步一步的摸索过来的。
为了不让帖子沉了,也为了有需要的战友节省时间,心中对试验设计有个大概的框架,我先抛砖引玉,简单讲下我做培养基优化的一点体会。
可能有些战友认为,试验设计优化培养基就是找几种培养基成分放在一起做几个组合进行试验就行了,其实这样做往往是得不到最适的结果的,尤其在做响应面分析(RSM)的时候,试验得到的图形可能不是一个完美的曲面图,我见过一些别人发的文章,它的曲面图是一个扭曲的图形,高点根本没有出现在图形中,那试验得到的根本不是最适的培养基组分,当然这种文章一般不会出现在核心期刊上的。这种情况一般都是没有在做RSM前,做“爬坡试验”的结果,“爬坡试验”的目的在于找出RSM设计的中心点,保证结果的准确性。另外一点需要提出的是RSM的一个缺点就是分析的因素不能太多,经典的是三因素的试验设计,如果你的因素比较多,那不妨试试方开泰的均匀设计。要做RSM就要先找出有显著影响的因素,剔除一些对结果影响不显著的因素,所以在“爬坡试验”之前还需要一个PB试验,PB能从众多因素中很简单的找出对试验结果影响最为显著的因素,排除一些影响不显著的因素,降低后续试验的工作量,又能保证结果的准确性。PB和“爬坡试验”对于刚接触试验设计的战友,比较陌生点,加上发表文章中很少,全面的把整个试验设计写出来的,一般的都是只写RSM这部分,也有几篇文章是PB+RSM的,还有先做RSM后做“爬坡试验”的。我个人认为PB--“爬坡试验”--RS,这种试验设计的思路比较符合逻辑,又比较全面。如果做毕业论文的培养基优化部分,可以使内容比较丰富。当然如果是做毕业论文的话,在综合试验设计之前,还有个更基础的工作,就是单因素试验,那种放弃单因素试验的想法也完全错误的,尤其是没有一个基础配方的时候。我做的菌种是我自己从本实验室菌种库筛出来,然后又做了诱变育种,所以是没有合适的培养基的,所以做了很多工作,用单因素试验首先大致确定C、N、P、无机盐、微量元素的种类及水平。大致讲了一下,说的比较散乱,或许不太好明白。希望大家把问题提出来,我们一起针对具体问题具体分析。
讲得不错,都是很好的心得。先用PB进行显著性分析是一个很好的建议。
另外可以从历史数据中找到合适的数据,然后再用软件进行分析,就可以不用再做实验就可找到影响显著的因素和水平范围。
响应面分析,其实用我们常见的软件就可以做出来。首先对各个单因素的试验结果进行归纳,后选择变量的变化区间还变化间隔就可以,常见的软件如DPS就可以了。用这个软件可以完成你所需的所有工作,要是想让你的响应面好看,用MATLAB也可以,三维,四维的都可以,在MATLAB区中有我写的现成的用MATLAB语句实现第四维的表示方法,很好用。另外用SARS软件也是可以的,不过语句能比MATLAB复杂一点点。EXCEL也可以,不过做出的响应面,美观程度差一点点。
我有个想法,能不能在初始时用正交实验确定出中心点的范围,然后将数据用SAS中的主成份分析,得到影响最显著的几个因素,然后用RSM做,这样主要影响因素有了,中心点也有了。做起来也好做,不会PB等软件的战友也可以轻松操作。
不知这样可不可行?希望大家讨论讨论
PB实验设计的数据处理
我使用SAS进行试验设计的,11个因素+4个dummy variables,做16次实验。 PB实验设计的数据已经出来了,但是怎么分析不了。
用Analysist→Statistics→Regression→Linear分析出来的结果像图里面这样,
怎么回事呢?后面几列的Standard Error, t value 以及p值都没有。
我给试验设计的表也列出来吧,请各位高手分析一下,到底是哪方面原因导致的。
表中X2,X4,X8,X15这4列是dummy variables,没有赋值,其余11个是考查的因素。 y是考查指标(转化率%)
上面是图片,顺便给表格放在word里面,以附件传上来,请大家帮分析分析。
想知道的几个问题:
1.试验设计有没有问题?
2.就按照表中设计的试验做了16次实验,没有将每次重复3遍取平均值,是不是可以?
3.这些数据该怎么处理,怎么用SAS处理会出现上面的情况,没有标准误差,t值以及p值? 谢谢了先~
附件:
Coded Design.rar (7 K) 下载次数:5
很想问一下,那个虚拟变量如何设置啊 一般多少个
还有最重要的是 实验过程中到底如何进行啊 小妹真的没有概念
虚拟变量好像一般设个三个左右
实验次数都为四的的倍数,如果你要测定8个因素,实验次数仍为12,那么就可以设三个虚拟变量。
8+3=11
记住k个因素和实验次数之间的关系是 K小于或等于n-1
具体实验过程中,我个人觉得就是高低水平都为-,就是什么都不加,只是增加了实验次数,控制误差的作用。
实验过程中控制误差可以通过重复试验达到。而实验误差的计算可以通过增加中心点次数实现。如果不能进行误差分析,那么就谈不上数据分析了。
我也是刚刚起步,幸亏有发酵人,大家可以一起交流!
一般来说,试验设计的时候k次实验的话,
(考查因素+虚拟变量)=k-1。
比如,12次实验,考查8个因素,那么剩下的3个变量就可以不赋值,
仍为uncoded。
不过这种dummy variables选择国内期刊和国外期刊有所不同:
国内的:如版友们所说,随机选择的比较多。
外文期刊:1.没有标出dummy variables,比如12次实验,设计表就列出了8个考查因素,而3个dummy variables没有标出;
2.标出了,但是给dummy variables都列在一块,比如就放最后几列。
3.也看到就根本没有设 dummy variables的,比如12次实验就考查11个因素的。 初学求教:什么是PB实验和爬坡实验啊
什么是PB实验和爬坡实验啊
刚开始做实验,什么都不知道,万望各位赐教!!
pb是plackett-Burman的缩写,是一种筛选试验。就是从众多影响因素中筛选出具有主效应的因子。至于最陡爬坡我也不太清楚。我也想知道。
额要点名了,细履平沙斑竹,指点一下吧。
谢谢了!
斑竹,给大家讲解一下吧,我也特别想知道什么是最陡爬坡,我看过你的帖子,知道你是试验设计的行家。望斑竹不吝赐教。
最陡爬坡实验它能最快逼近最大响应面区域,确定中心组合实验的中心点,能保证响应面分析结果的准确有效性.
我只知道这么一点吧.还望楼下的人能补充细化一下呢.
一般都会作,但是如果实验结果由方差分析发现选取的水平已接近最大响应区域,那么就可以不再进行最陡爬坡实验,最后用中心复合设计及响应面分析来确定主要影响因子的最佳浓度。
你可以看看有关资料.一般是先作部分因素实验(FFD),再做最陡爬坡实验.再利用中心组合实验确定中心点,
如果采用PB实验,一般不作最陡爬坡实验,直接用中心组合实验确定中心点.具体原理我不记不清了.明天我上传一个这个方面的资料吧. 上传一篇文章.可能对你有帮助
.
[ 此贴被细履平沙在2008-06-08 15:02重新编辑 ]
附件: 生物过程的优化.pdf (358 K) 下载次数:63 需要经验值:30
怎么又方差分析看所选水平是否已经接近最大响应区域呢?谢谢!
PB试验可以用来筛选培养基中不同成分对试验结果的影响,通过PB试验得到影响较大的试验因素;爬坡试验就是从PB试验的中心点开始,根据PB试验的得出的每种因子的系数来确定爬坡方向以及步长,爬坡试验主要目的是逼近主要试验因子的最适添加水平;之后根据爬坡试验的结果就可以做相应面了,也就可以最后确定每种重要因子的添加量了。 嘿嘿,我也是初学者,希望这些能对你有帮助
请教一下:响应曲面1.414到-1.414中间5个水平的步长如何设计? 0
还需要看回归系数吗?设计的时候凭经验还是有具体的公式?
紧急求救~
0是中间,1如果相当于中间偏大2.0水平,那么1.414就相当于中间偏大2.828水平.我是这么理解的,这个不能靠经验,而是根据程序要求。
关于PB设计中的t检验和P检验
请问各位大侠,PB设计中的t 检验和P检验的功能是否是一样的?如何通过t 检验来认定显著因素?另外,某因子的显著性大于90%或80%等是如何判断的?
感谢赐教
P的意思是概率,不是P检验,是根据T值查到的概率和F值查到的概率。
楼主可能没有学习过数理统计。进行实验设计,一些数学基本知识还是要具备的。 关于最陡爬坡(最速上升)的问题
我下了发酵人上的“Path of steepest ascent /descent”。在学习中有些地方不明白,希望大虾能给予帮助。
在设计中需要编写一个“最速上升宏”命令,请问这个“最速上升宏”在Minitab15这个版本中有没有,如果有在哪里?(本人愚钝,如果翻译错误望大虾指出以便更正)
还有我点击“编辑器(D)——启动命令(E)”然后按照minitab技术支持文件上所给出的方法在会话窗口里输入以下命令:
ascent y x.1-x.n;
sore u.1-u.j;
step s;
base b;
descent;
runs r.
然后回车出现“* 错误* 未知 Minitab 命令: ASCE
MTB > ”
我不知道这个命令应该在哪里输入。望高手指点啊!
最陡爬坡必须要输入命令才能完成吗?可不可以像pb一样直接用minitab软件现有的程序就可以完成设计和分析?
最陡爬坡实验
我觉得最陡爬坡实验不需要软件分析的,直接观察数据变化的趋势,找到极点值,附近找到因子参数范围再做下一步的响应面实验和分析就可以了。可以参考http://www.fajiaoren.com/read.php?tid=9060
PB试验设计
外文资料里面dummy variables要么没有列出来,有些就根本没有设(比如8次试验就做7个因素),要么所有的dummy variables就全部都列在一起,只有看到国内的文章才是将dummy variables随机的列出来。
在版上也看到说要有dummy variables,并且要随机的选择。
那么dummy variables到底要不要,要的话是不列出来,还是所有的就放最后几列呢? 我认为dummy variables的位置 不影响分析结果。但是这个参数应该有。
有道理,
另外,每一组试验只做一次,还是做个重复比如同一组做3次,然后取他们的平均值呢? 要是只做一次会不会误差比较大,影响试验结果?
重复多次可以减少某些异常点引入的误差,减少噪音,提高模型显著性。
有两种方法,一种是在程序中设置3个重复,实验结果都输入实验表,也可以在程序中设1个duplication,然后将数值平均后输入实验表。
从pb到最陡爬坡,如何设计步长,求救啊~
pb做完了,也做了重复,现在真是不会确定步长
真的是很笨,希望高手指点一下
求救啊~
细心看看以前的贴子,有详细的介绍。
一个参数(A)根据自己的经验确定,其它参数根据PB试验公式中的系数来确定。具体找贴子吧。
看下面的贴子,topmit有介绍。
http://fajiaoren.com/read.php?tid=6999&keyword=%E7%88%AC%E5%9D%A1
做了响应曲面分析,图形不对,麻烦大家看看哪里出了问题
图片:
我是先单因素----pb----最陡爬坡----响应曲面的
结果很不如意啊,想听听大家的意见,修改一下,继续向前挺进
呵呵大家多提意见啊
hope59你好,我想请教一下你爬坡实验怎么设计的,是用minitab设计的吗?
关于爬坡步长
我看了些文献,关于爬坡步长的说法不一。
有文献这样确定最陡爬坡的,步长公式=e×△j ×bj, 其中bj为一次回归的回归系数,△j为变化半径.这样看来,回归系数越大,步长应该越大啊。
而有的文献又说回归系数越大,步长应该越小。我觉得这种说法也对,因为回归系数大,说明对响应值的影响越大啊,响应值对因素变化非常灵敏,所以步长取值应该小点,以免错过最优点。不知我的理解对不对,请大家指教。
求助:可不可以用pb方法进行非培养基优化的发酵实验啊
小女子刚接触发酵实验,对很多东西不是太了解,最近查文献资料发现PB方法进行实验优化很方便,但是所查的资料都是关于培养基优化的,很想知道是不是可以用PB进行其他非培养基优化的实验?比如说有很多因素像温度、PH、钙离子浓度等。如果可以用PB法优化,那在进行“确定因素水平”阶段是不是也可以用“最陡爬坡实验”进行非培养基优化的实验呢?希望高手给予解决,小女子不胜感激
没有问题,可以用。但是进行试验之前,要考虑好试验的目的,不能只是为了试验而试验,而要考虑试验的结果是不是能够达到某种效果和实验条件能不能实现。
优化包括:培养基优化(碳源,氮源,无机盐等),培养条件优化(温度、PH、转速,装液量等)
实验设计:根据需要,自由组合,可以同时优化众多因素,不必拘泥于是培养基还是培养条件。
响应面设计的三个阶段
It is possible to separate an optimization study using RSM into three stages. The first stage is the preliminary work in which the determination of the independent parameters and their levels are carried out. The second stage is the selection of the experimental design and the prediction and verification of the model equation. The last
one is obtaining the response surface plot and contour plot of the response as a function of the independent parameters and determination of optimum points. 三个阶段。
1,准备阶段,决定独立变量及其水平。
2,实验设计的选择及模型的验证
3,根据响应面来确定优化条件。
求救:pb试验我做了好几次,总是找不到影响显著的因子
我做了好几次pb试验,可是总也找不到影响显著的因子,就是大于95%的两个到三个因子,我的基本都在80%左右,很是郁闷啊
备受打击,但是郁闷完了,还是想找找问题,调整浓度继续筛选
不知道大家有没有遇到类似的问题?都从哪里入手调节?
对了,我看很多文献上都说,高水平一般是低水平的1.25倍,这个很固定吗
我都是按照1.25倍做的,不会是这里有问题吧
还是要focus到上面的问题,遇到显著性不高的问题,应该如何调整?
希望高手多多指教!
试试高水平是低水平的1.5倍看看~
生物过程存在严重的交互作用,而PB实验次数少,因此在交互作用解决上有一定的问题。所以在生物领域先进行单因素考察,然后再进行组合试验是有一定道理的。我感觉也可以先进行PB实验多考察一些因素,然后再减少因素并进一步探索因素间的交互作用。 首先:你考察的是几个因素?如果存在交互作用,确实会存在上述情况。
第二:你的响应量是什么,该数据是否可靠?
比如,我们做糖的,响应量就是胞外多糖,胞内多糖。测糖的方法是浓硫酸苯酚法。如果实验设计者对该方法掌握不好,就算是同一个样品,测定结果差别甚大,那么,这就不是实验设计分析本身的错误,而是实验设计者的错误!
只要大于75%就行了
我是以生物量作为指标,用涂平板检测的
我用了七个因子,用minitab设计的12次试验,经过分析,只有一个因子的可性度在90%以上
在此之前,我做过比较全面的单因子试验,但是由于单因子试验用的是化合物能清楚的知道碳浓度、氮浓度等详细的参数
现在做工业发酵,用的都是豆饼粉之类的,所以在量上还是需要摸索
后期要做响应面,所以pb试验做的比较谨慎,怕后期出现更大的错误。
我这周重复一下上次的试验,再把倍数扩大到1.5试试看
非常感谢大家这么热心的帮助我,真是很感动哦
不知道我现在的设计有没有什么地方不合适?
希望大家多多批评指正!
不知道楼主,为什么7个因子要用12次实验设计呢?
minitab上自动生成的啊
还有就是每次生成的图表都不一样呢,很是奇怪
版主是不是觉得我的设计有问题啊
我刚准备瓶子,准备做了,呵呵,看样子是有问题了哦
我回去再看看,晚上再做吧,版主加我qq吧 43787903
可能需要和您好好讨论一下呢
谢谢,我在线等
首先:7个因子,做8次实验足够。不知道你设计过程中是否有哪一步没选好。
其次:低水平和高水平的倍数,一般在1.5左右,多了少了并没太大关系。只要不是认为的胡乱加大水平值,PB筛选还是比较可靠的。
再次:我实验室是不准安装QQ等聊天软件的。所以,只能我回家加你了。
关于爬坡实验的疑问!
爬坡试验需要软件设计吗?我刚做完pb试验,筛选完重要因子,然后是不是应该以高水平为中心,上下筛选几个浓度(一般也要七八个浓度吧),这时候步长设计有什么要求吗?浓度个数设置有要求吗?需要软件设计吗?
版主快来指导一下吧!
最爬坡试验最后要达到什么要求才能进一步进行响应曲面试验?
爬坡试验需要或者能用minitab设计吗? 我看到的论文上好像只是将得到的数据比较产量高低呢?
puzzled and help!
你做完了PB从分析的数据上就可以看出每个因子的影响是正还是负!所以设计的时候一定注意不要搞错了!
步长的设置也要看你自己实验本身,不能套用!所选择几个比较好,能达到你的实验目的,就是逼近最有的响应区域!越逼近越有利于下一步的实验!
回归与相关
回归与相关
--------------------------------------------------------------------------------
一、直线回归分析
直线回归是用直线回归方程表示两个数量变量间依存关系的统计分析方法,属双变量分析的范畴。
1. 直线回归方程的求法
(1)回归方程的概念:
直线回归方程的一般形式是Ý(音y hat)=a+bx,其中x为自变量,一般为资料中能精确测定和控制的量,Y为应变量,指在x规定范围内随机变化的量。a为截距,是回归直线与纵轴的交点,b为斜率,意为x每改变一个单位时,Ý的变化量。
(2)直线回归方程的求法
确定直线回归方程利用的是最小二乘法原理,基本步骤为:
1)先求 b,基本公式为b=lxy/lxx=SSxy/SSxx ,其中lxy为X,Y的离均差积和,lxx为X的离均差平方和;
2)再求a,根据回归方程 a等于Y的均值减去x均值与b乘积的差值。
(3)回归方程的图示:
根据回归方程,在坐标轴上任意取相距较远的两点,连接上述两点就可得到回归方程的图示。应注意的是,连出的回归直线不应超过x的实测值范围.
2. 回归关系的检验
回归关系的检验又称回归方程的检验,其目的是检验求得的回归方程在总体中是否成立,即是否样本代表的总体也有直线回归关系。方法有以下两种:
(1)方差分析
其基本思想是将总变异分解为SS回归和SS剩余,然后利用F检验来判断回归方程是否成立。
(2)t检验
其基本思想是利用样本回归系数b与总体均数回归系数ß进行比较来判断回归方程是否成立,实际应用中因为回归系数b的检验过程较为复杂,而相关系数r的检验过程简单并与之等价,故一般用相关系数r的检验来代替回归系数b的检验。
3. 直线回归方程的应用
(1)描述两变量之间的依存关系;
利用直线回归方程即可定量描述两个变量间依存的数量关系
(2)利用回归方程进行预测;
把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。
(3)利用回归方程进行统计控制
规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。
4. 应用直线回归的注意事项
(1)做回归分析要有实际意义;
(2)回归分析前,最好先作出散点图;
(3)回归直线不要外延。
二、直线相关分析
1. 直线相关的概念
直线相关分析是描述两变量间是否有直线关系以及直线关系的方向和密切程度的分析方法。用以描述两变量间相关关系的指标是相关系数(常用r表示),两变量间相关关系的种类有正相关(0
2. 相关系数的计算
相关系数是x,Y的离均差积和lxy除以X的离均差平方和lxx与Y的离均差平方和lyy之积的算术平方根的商。故此相关系数又被称为积差相关系数。
3.相关系数的假设检验
相关系数检验的目的是判断两变量的总体是否有相关关系,方法有t检验和查表法,t检验法是样本与总体的比较,查表法是直接查相关系数界值表得到相应的概率p。
三、直线相关与回归的区别与联系
区别:1. 相关说明相关关系,回归说明依存关系;
2. r与b有区别;
3. 资料要求不同。
联系:1. r与b值可相互换算;
2. r与b正负号一致;
3. r与b的假设检验等价;
4. 回归可解释相关。相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。
四、等级相关分析
等级相关分析适用于资料不是正态双变量或总体分布未知,数据一端或两端有不确定值的资料或等级资料。常用的Spearman等级相关系数rs是利用x,Y的秩次来进行直线相关分析的。因此当x,Y的相同秩次较多时,计算出的rs需矫正。同样的,等级相关系数rs也需要进行假设检验。
五、相关分析应用中的注意事项
1. 相关分析要有实际意义;
2. 相关关系不一定都是“因果”关系;
3. 相关系数r假设检验中p的大小不能说明相关的密切程度;
4. 直线相关和等级相关有各自不同的适用条件
方差分析
方差分析
--------------------------------------------------------------------------------
一、方差分析的基本思想
1. 方差分析的概念
方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括单因素方差分析即完全随机设计或成组设计的方差分析和两因素方差分析即配伍组设计的方差分析。
2. 方差分析的基本思想
下面我们用一个简单的例子来说明方差分析的基本思想:
如某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下,
患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
问该地克山病患者与健康人的血磷值是否不同?
从以上资料可以看出,24个患者与健康人的血磷值各不相同,如果用离均差平方和(SS)描述其围绕总均数的变异情况,则总变异有以下两个来源:
(1)组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;
(2)组间变异,即由于克山病的影响使得患者与健康人组的血磷值均数大小不等。
而且:SS总=SS组间+SS组内 v总=v组间+v组内
如果用均方(即自由度v去除离均差平方和的商)代替离均差平方和以消除各组样本数不同的影响,则方差分析就是用组内均方去除组间均方的商(即F值)与1相比较,若F值接近1,则说明各组均数间的差异没有统计学意义,若F值远大于1,则说明各组均数间的差异有统计学意义。实际应用中检验假设成立条件下F值大于特定值的概率可通过查阅F界值表(方差分析用)获得。
3. 方差分析的应用条件
应用方差分析对资料进行统计推断之前应注意其使用条件,包括:
(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。
(2)正态性,即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。
(3)方差齐性,即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。
二、方差分析的主要内容
根据资料设计类型的不同,有以下两种方差分析的方法:
1. 对成组设计的多个样本均数比较,应采用完全随机设计的方差分析,即单因素方差分析。
2. 对随机区组设计的多个样本均数比较,应采用配伍组设计的方差分析,即两因素方差分析。
两类方差分析的基本步骤相同,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异(随机误差),即:SS总=SS组间+SS组内,而对配伍组设计的资料,总变异除了分解为处理组变异和随机误差外还包括配伍组变异,即:SS总=SS处理+SS配伍+SS误差。整个方差分析的基本步骤如下:
(1) 建立检验假设;
H0:多个样本总体均数相等。
H1:多个样本总体均数不相等或不全等。
检验水准为0.05。
(2) 计算检验统计量F值;
(3) 确定P值并作出推断结果。
三、多个样本均数的两两比较
经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。
1. 多个样本均数间两两比较
多个样本均数间两两比较常用q检验的方法,即 Newman-kueuls法,其基本步骤为:
建立检验假设-->样本均数排序-->计算q值-->查q界值表判断结果。
2. 多个实验组与一个对照组均数间两两比较
多个实验组与一个对照组均数间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q’界值表。
t检验和u检验
t检验和u检验
--------------------------------------------------------------------------------
简而言之,t检验和u检验就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。
一、样本均数与总体均数比较的t检验
样本均数与总体均数比较的t检验实际上是推断该样本来自的总体均数µ与已知的某一总体均数µ0(常为理论值或标准值) 有无差别。如根据大量调查,已知健康成年男性的脉搏均数为72次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为74.2次/分,标准差为6.0次/分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性。
上述两个均数不等既可能是抽样误差所致,也有可能真是环境差异的影响,为此,可用t检验进行判断,检验过程如下:
1. 建立假设
H0:µ=µ0=72次/分,H0:µ>µ0,检验水准为单侧0.05。
2. 计算统计量
进行样本均数与总体均数比较的t检验时t值为样本均数与总体均数差值的绝对值除以标准误的商,其中标准误为标准差除以样本含量算术平方根的商。
3. 确定概率,作出判断
以自由度v(样本含量n减1)查t界值表,0.025
应注意的是,当样本含量n较大时,可用u检验代替t检验。
二、配对设计的t检验
配对设计是一种比较特殊的设计方式,能够很好地控制非实验因素对结果的影响,有自身配对和非自身配对之分。配对设计资料的t检验实际上是用配对差值与总体均数“0”进行比较,即推断差数的总体均数是否为“0”。故其检验过程与样本均数与总体均数比较的t检验类似,即:
1. 建立假设
H0:µd=0,即差值的总体均数为“0”,H1:µd>0或µd
2. 计算统计量
进行配对设计t检验时 t值为差值均数与0之差的绝对值除以差值标准误的商,其中差值标
准误为差值标准差除以样本含量算术平方根的商。
3. 确定概率,作出判断
以自由度v(对子数减1)查t界值表,若P=0.05,则还不能拒绝H0。
三、成组设计两样本均数比较的t检验
成组设计两样本均数比较的t检验又称成组比较或完全随机设计的t检验,其目的是推断两个样本分别代表的总体均数是否相等。其检验过程与上述两种t检验也没有大的差别,只是假设的表达和t值的计算公式不同。
两样本均数比较的t检验,其假设一般为:H0:µ1=µ2,即两样本来自的总体均数相等,H1:µ1>µ2或µ1
计算t统计量时是用两样本均数差值的绝对值除以两样本均数差值的标准误。
应注意的是当样本含量n较大时(如大于100时)可用u检验代替t检验,此时u值的计算公式较t值的计算公式要简单的多。
四、t检验的应用条件和注意事项
两个小样本均数比较的t检验有以下应用条件:
(1)两样本来自的总体均符合正态分布,
(2)两样本来自的总体方差齐。
故在进行两小样本均数比较的t检验之前,要用方差齐性检验来推断两样本代表的总体方差是否相等,方差齐性检验的方法使用F检验,其原理是看较大样本方差与较小样本方差的商是否接近“1”。若接近“1”,则可认为两样本代表的总体方差齐。判断两样本来自的总体是否符合正态分布,可用正态性检验的方法。
若两样本来自的总体方差不齐,也不符合正态分布,对符合对数正态分布的资料可用其几何均数进行t检验,对其他资料可用t’检验或秩和检验进行分析。
实验设计基本概念
实验设计
--------------------------------------------------------------------------------
一、实验设计的概念、特点和分类
1.实验设计的概念
将一组随机抽取的实验对象随机分配到两种或多种处理组,观察比较不同处理的效应,这种研究称为“实验研究”.
“实验设计”是为实验研究做的周密计划。
2.实验研究的特点
(1)能有效地控制误差,节省人、财、物力,提高效率。
(2)研究者能人为地设置处理因素。
(3)受试对象接受何种处理及处理因素的水平是随机分配的。
3.实验研究的分类
(1)动物实验:在动物身上进行的实验研究。
(2)临床实验:在临床患病人群中进行的试验研究。
(3)社区干预实验:在某地区所有人群中进行的试验研究。
二、实验设计的基本要素
1.处理因素
又称研究因素,一般是外部施加的因素,确定处理因素时应注意:
(1)抓住实(试)验中的主要因素。
(2)确定和控制非处理因素。
(3)处理因素要标准化。
2.受试对象
即研究的对象,一般有人和动物两类。
人的选择:要注意病人和正常人的正确区分,诊断要明确,受试对象依从性要好等。
动物选择:注意所选动物的种类、品系、年龄、性别、窝别、体重等。
3.实验效应
即处理因素的效果,应注意:
(1)正确选用观察指标来反映实验效应。所选指标要灵敏、精确、客观,最好选用定量指标。
(2)指标观察时应避免偏性,可采用盲法。
三、实验设计的基本原则
1.对照原则:即实(试)验要设立对照,使得除实验因素外,对照组与实验组其余因素保持一致,常用的对照有:空白对照、安
慰剂对照、标准对照、实验对照、自身对照和历史对照等。
2.重复原则:即研究对象要有一定的数量,或者说样本含量应足够。根据每个具体研究,可有不同的方法来进行样本含量估计。
3.随机化原则:即应保证每个实验对象都有同等机会进入实验或接受某种处理。常用方法有查随机数字表和随机排列表等。随机化是保证均衡性的重要手段。
4.均衡原则:即各处理组非实验因素的条件基本一致,以消除其影响。
四、常用的实验设计方法
1.完全随机设计
将实验对象随机分配至两个或多个处理组去进行实验观察,又称单因素设计、成组设计。
优点:操作简单、应用广泛。
缺点:效率低,只能分析单因素的效应。
资料处理方法:t,u检验,方差分析、秩和检验、卡方检验等。
2.配对(伍)设计
将受试对象配成对子或配伍组,以消除非实验因素的影响。配伍设计又称随机区组设计。配对有自身配对和不同个体配对,配
伍实际上是配对的推广。
优点:所需样本数和效率均高于成组设计,而且很好地控制了混杂因素的作用。
缺点:配对条件不宜满足。
资料处理方法:配对t, u检验,秩和检验、配伍组方差分析、配对四格表卡方检验等。
3.其它实验设计方法:
(1)交叉设计:在配对设计基础上再加入时间因素,可分析不同阶段的效应。
(2)析因设计、拉丁方设计和正交设计等。
实验设计的意义、原则与基本内容
实验设计的意义、原则与基本内容
一、实验设计的意义
实验设计是科学研究计划内关于研究方法与步骤的一项内容。在医学科研工作中,无论实验室研究、临床疗效观察或现场调查,在制订研究计划时,都应根据实验的目的和条例,结合统计学的要求,针对实验的全过程,认真考虑实验设计问题。一个周密而完善的实验设计,能合理地安排各种实验因素,严格地控制实验误差,从而用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料。反之,如果实验设计存在着缺点,就可能造成不应有的浪费,且足以减损研究结果的价值。总之,实验设计是实验过程的依据,是实验数据处理的前提,也是提高科研成果质量的一个重要保证。
二、实验设计的原则
实验设计有属于专业方面的,有属于统计方面的。从统计方面说,主要应当考虑对照、重复、随机化等问题,这就是所谓实验设计的三原则。其具体内容我们将在第二、三、四节介绍。
三、实验设计的基本内容
(一)拟定相互比较的处理 所谓处理,指的是在实验研究中欲施加给受试对象的某些因素。如营养实验的各种饲料,治疗某病的几种疗法或药物,药理研究中某药的各种剂量等。在实验的全过程中,处理因素要始终如一保持不变,按一个标准进行实验。如果实验的处理因素是药物,那么药物的成份、含量、出厂批号等必须保持不变。如果实验的处理因素是手术,那么就不能开始时不熟练,而应该在实验之前使熟练程度稳定一致。
(二)确定实验对象及数量 这里指的是实验所用的动物或活体组织标本等。在实验设计中,要根据实验观察的目的与内容,明确规定采用什么样的实验对象,实验对象中的每个实验单位必须具备的条件与要求,以保证受试对象的一致性。实验对象需要有一定的数量,例数不能太少,也不宜过多。如何估计例数,详见第四节。
(三)确定将各实验单位分配到各种处理中去的原则 这主要是随机分配或随机化问题。
第三节将介绍几种常用的随机分组方法。
(四)拟定观察项目和登记表 要根据研究目的和任务,选择对说明实验结论最有意义,并具有一定特异性、灵敏性、客观性的观察项目。必要的项目不可遗漏,数据资料应当完整无
缺;而无关紧要的项目就不必设立,以免耗费人力物力,拖延整个实验的时间,尔后,要按照观察项目之间的逻辑关系与顺序,编制成便于填写和统计的登记表,以便随时记录实验过程中获得的数据资料。同一项目的度量衡单位必须统一符号(如+、++、+++等),应有明确的定义。
(五)拟定对资料整理分析的预案 这就是对将获得的数据资料准备如何进行整理?要计算哪些统计指标?用什么统计分析方法?事先必须有个初步的设想。例如对计数资料,是计算率还是百分比?若计算率,分子是什么?分母是什么?各组同一项目的某个率或百分比如何进行比较?又如对计量资料,是计算算术均数、几何均数还是中位数?同一项目各均数间应采用什么方法作比较?切忌实验设计时不认真考虑,实验过后拿数字去找统计方法。 Blocking 是什么?
Blocking is a technique used to remove the expected variation caused by some change during the course of the experiment. For example, you may need to use two different raw material batches to complete the experiment, or the experiment may take place over the course of several shifts or days. Design-Expert provides various options for blocking, depending on how many runs you choose to perform. The default of 1 block really means "no blocking."
For example, in experiments with 16 runs, you may choose to carry out the experiment in 2 or 4 blocks. Two blocks might be helpful if, for some reason, you must do half the runs on one day and the other half the next day. In this case, day to day variation may be removed from the analysis by blocking.
When you choose to block your design, one or more effects will no longer be estimable. You can look at the alias structure to see which effects have been "lost to blocks." This is especially important when you have 4 or more blocks. In certain cases, a two-factor interaction may be lost and so then you will want to make sure that the interaction is not one that you are interested in.
Another note about blocking - it is assumed that the block variable does not interact with the factors. The effect must only be a linear shift, and not be dependent on the level of one or more of the factors under study.
Important: If you try to block on a factor, that factor will be aliased with the block and you will not get any statistical details on the effect of that factor. Only block on things that you are NOT interested in studying.
Example: You are trying to determine the effects of factors in a coating process such as speed, temperature, and pressure on your product’s tensile and elongation properties. Due to the number of runs involved, you will need to use two different batches of raw material. You expect that variations in the raw material may have an effect on the response, but you are not interested in studying that effect at this tim
e. Therefore, raw material is NOT a factor and you should block on it instead. This will remove the effect of raw material on tensile and elongation from the ANOVA and allow you to better identify the other factor effects.
On the other hand, if you want to study the effect of raw material batch variation, then it should be included as a factor and you should NOT set up blocks on this factor. You may need to restrict the randomization by modifying the run order. Be aware that unidentified time-based effects could influence the results of your experiment when you restrict randomization.
[原创 来自发酵人]区块化设计有利于提高分析质量。在培养基优化过程中由于因素之间的交互性和生物反应的复杂性,任何其它因素都有可能对实验产生巨大的干扰现象。为了尽可能减少其它因素的作用,而突出主因素效应,选择blocking是很有意义的。比较在实验过程中一次BB设计需要60多个RUNS。那么因为消毒锅不能同时灭菌,接种时间长,放瓶时间长等,这样我们就可以设计2个blocking。将实验分成两次,这样将消除灭菌时间不同的影响和减少接种和放瓶时间长度。这是一个例子,也不一定合理,因为分两次做的时候会带来种子的差异,这种差异通过对照实验不一定能很好的消除。所以它只是用来解释一下blocking 设计可以将几个不想分析的干扰去除,合理性大家可以讨论。
另外区块化实验可以使实验的风险大大降低,一次在的试验如果失败,损失也会很大,同时特别打击人的积极性。而区块化之后可以将一次大的实验分成几次完成,这就是sequential experimentation的一项重要措施。
Blocking in Central Composite Designs( from design expert hel
p)
Blocking in Central Composite Designs(中心组合中的区块化)
Central composite designs may be carried out in blocks. Blocking is advantageous when all of the experiments cannot be carried out in one day or with one batch of material. The factorial points can be divided in such a way that the blocked effect is eliminated before computation of the model. The first one or more blocks consists of the factorial design with some center points. The remaining block consists of the star points(也叫轴向点) with additional center points.(两个区块中都包括中心点,这是进行误差分析必须的)
Blocking schemes vary depending on the design and the number of factors. A sample blocking selection for a central composite design with 4 factors is shown below. (4因素实验需要的run)
1 Block : 30 experiments
2 Blocks : 20 experiments, 10 experiments
3 Blocks : 10 exp., 10 exp., 10 exp.
1 block is really no blocking. 2 blocks split the design into the factorial portion and the star points. For 3 blocks the factorial design portion is split into two blocks w
hile the star points make up the third block.
Various blocking patterns are offered as options for the central composite designs. In addition, the block assignments can be changed after the design is created. (Right click on the block column header in the design layout screen.)
When the experiment is blocked, there will be an additional choice of the alpha level to use. The choice is between the alpha value for perfect rotatability and the alpha value for perfect orthogonality of the blocks. Often, these values are close enough to make the difference unimportant.(有两种alpha值,一个是为了旋转分析需要,一种是正交分析需要,这些值经常比较接近,这样可能减少差异) The default is the value for rotatability.
[求助]数据分析
大家帮忙看看我做的响应曲面数据如何?谢谢!
Response 1
ANOVA for Response Surface Quadratic Model
Analysis of variance table [Partial sum of squares - Type III]
Sum of Mean F p-value
Source Squares df Square Value Prob > F
Model 12.14 9 1.35 27.25 0.0001 significant
A-时间 2.42 1 2.42 48.90 0.0002
B-功率 2.92 1 2.92 58.92 0.0001
C-料液比 0.14 1 0.14 2.89 0.1328
AB 0.58 1 0.58 11.67 0.0112
AC 0.25 1 0.25 5.05 0.0594
BC 0.33 1 0.33 6.68 0.0362
A^2 3.69 1 3.69 74.49
B^2 1.20 1 1.20 24.19 0.0017
C^2 0.20 1 0.20 4.05 0.0840
Residual 0.35 7 0.049
Lack of Fit 0.29 3 0.095 6.22 0.0548 not significant
Pure Error 0.061 4 0.015
Cor Total 12.48 16
Std. Dev. 0.22 R-Squared 0.9722
Mean 7.95 Adj R-Squared 0.9366
C.V. % 2.80 Pred R-Squared 0.6267
PRESS 4.66 Adeq Precision 19.201
Adj R-Squared 0.9366
这一项合格吗?
模型显著,失拟不显著。看起来不错。应该是合格。
[实验设计]什么是爬坡试验,如何设计呀?
什么是爬坡试验,如何设计呀?谢谢大家指点!
帮我看看决定是否做最陡爬坡试验的一句英文的意思
As long as lack of fit (due to pure quadratic curvature and interactions) is very small compared to the main effects, steepest ascent can be attempted. 请各位高手帮我看看这句话什么意思,以及其背后的意义。
看文献时,没有发现这样的分析。
当平方项和交互项占的比例高时,需要进行析因实验以确定主因素的影响,但是当他们占的比例到多少时,需要做析因实验?这个问题与楼主的问题看起来是相似的。
我想如果主效应的方差分析是显著的,而失拟不显著应该算合适了。
这样上面的英文翻译:
当失拟影响(因平方项与交互项引起)与主效应相比很小时,可以考虑应用最陡爬坡试验。 这是当你的主要因素数值不是最佳数值的时候,应用最陡爬坡实验. 简单的说就是你所设计的影响显著因素的数值不是最适宜的,你可以,设定步长,使数值增加以达到影响显著的效果, 一般应用这个的是SAS软件,你可以下载一些这方面的中文文献,很详细的
关于最陡爬坡试验
想请教一下大家,在PB做完后哪些数据是用来做最陡爬坡试验的?还是需要重新设计试验,那么minitab里的什么程序可以来设计和分析呢??谢谢大家不吝赐教啊~ 还有就是PB做完一定有必要做最陡爬坡试验么??
我来回答吧
PB后不一定做最陡试验 要看你的试验结果
如果你对你自己的试验数据了解很好的话,应该估计出中心点的值
那么从PB后确定主效果因子后,选择该值做为CCD的中心点优化即可
当然如果你估计不出来,或者不相信,还是要做的
对PB试验的结果应该是选择P值小的,应该是在0。1以下为好,选择好后利用CCD优化(design expert)
想请问各位,在做最陡爬坡实验时,步长值如何才能确定呢?还是自己定
关于步长,可以先粗略的试一下,然后在细化,就可以了.
响应面优化
在响应面优化时:在使用最陡爬坡实验时,步长如何确定?
根据因素的标准偏回归系数的大小确定步长
步长先大点,效果不理想再进行补充实验.
关于placket-burman的求教!!!!
1、我是用minitab软件进行placket-burman试验设计,本来是7因素,但是考虑到空列,所以为11列,共12 次处理(runs),出来的结果是用该软件里面的软件能分析出来吗??
如果不行的话,用其它软件分析,那分析是方差分析还是t检验呢?/能出来回归方程??
2、设计好表头后如何确定哪几列作为因素列(空列)?其选择有什么原则??
关于Plackett-Burman的求教!
请楼主注意名称的拼写。
发文章我们都写成:Plackett-Burman design.
多谢楼下的更正了我一贯的拼写。
关于placket-burman的求教!!!!
老大,发文章的时候大部分是
plackett-burman design吧
我查很多文章都是这么写的,当然我的也写错了
用SAS很简单的 分析结果也可以显示出来的
sas 是可以办到。可是有多少人用得了sas,我说的是普及率问题,要价太高!
统计软件多种多样,实用才是最重要的。
三楼同志,有机会我们一起讨论一下心得。谢谢。
PB实验设计中的问题,请大家指教!
我在做PB设计的时候,选择7个因素,4个空项,16次实验进行设计,为什么minitab中没有16次实验的设计表格呢?只有12和20呢?我不知道这是为什么!!
我正准备用PB设计,刚刚接触这方面,很白痴,呵呵:请大家多多指教!不胜感激!!
图片:
描述:步骤二
图片:
图片:
针对你的问题:
谢谢!!
可为什么我看的文献中的设计没有0这一个设计呢
看图:表2 M=16的Plackett-Burman实验设计与结果
Table 2 Experimental design and result of M=16Plackett-Burman 序号 A
B C D E F G H I J K L M N O 酶活 u/ml
1 + + + + - + - + + - - + - - - 110.4 2 - + - - - + + + + - + - + + - 267.3 3 - - + - - - + + + + - + - + + 169.4 4 + + + - + - + + - - + - + + + 126.1 5 + - + - + + - - + - - - + + + 103.7 6 + - - + - - - + + + + - + - + 202.9 7 + + - + - + + - - + - - - + + 223.0 8 - - - - - - - - - - - - - - - 81.4
9 - - + + + + - + - + + - - + - 123.2 10 + - + + - - + - - - + + + + - 137.4 11 - - - + + + + - + - + + - - + 131.8 12 - + + - - + - - - + + + + - + 321.7 13 + - - - + + + + - + - + + - - 184.1
14 - + + + + - + - + + - - + - - 194.5 15 + + - - + - - - + + + + - + - 140.5 16 - + - + + - - + - - - + + + + 205.3 Prob>F*10-2
0.8
1.35
5.75
13.6
25.5
16.8
24.7
9.4
6.53
3.12
8.23
R-squared 0.9726
AdjR-Squared 0.9589
我怎样才能做出文献中做的这种设计呢??
中心点我们一般要求重复3次,以利于估计模型的误差.
文献中,缺少这样一个设计.所以没有中心点.也就是0水平的实验.
在因素设计中,不是已经设计了4个空项了吗?他们不就是用来估计误差的吗?? 我用minitab 怎样设计才能设计出如文献所述的设计呢??
在这方面我懂得的很少
请大家指教,不胜感激!!!
Runs x 1 x 2 x 3 Biomass (g/l)
1 −1 −1 0 6.49
2 −1 1 0 8.41
3 1 −1 0 7.66
4 1 1 0 10.21
5 0 −1 −1 6.68
6 0 −1 1 8.05
7 0 1 −1 8.84
8 0 1 1 10.45
9 −1 0 −1 6.34
10 1 0 −1 8.58
11 −1 0 1 8.11
12 1 0 1 10.3
13 0 0 0 10.09
14 0 0 0 9.26
15 0 0 0 9.78
怎样对其进行RSM设计的多元二次模型和变量分析情况?请大家指教,不胜感激!!!!!!!! 大家帮帮忙 关于plackett-burman
小弟最近做发酵实验用到SAS进行培养基优化,在做plackett-burman设计时对虚构变量(空白对照)的安插问题吧是很明白。
请问各位高手前辈其安插顺序是不是随意的,还是另有要求?
我没有用过SAS,但是从实验原理来讲:虚构变量的用途是进行误差分析和交互分析用的。应该没有顺序之分,但是一些软件(如正交表)在考虑交互作用时,安排了特定的列,这可能与它算法有关。
试试design expert吧,很好用!
刚发了!
多谢老大的帮忙
我自己又查了点资料,发现好多人都是随意安插的。
请教最陡爬坡实验问题
在做响应面优化培养基过程中,一般先是用Placket-Burman(或其他)筛选出重要影响因子,再进行最陡爬坡实验,最后进行中心复合设计。我想请教两个问题:
(1) 如何判断要不要进行最陡爬坡实验?
(2)在进行最陡爬坡时培养基浓度变化有没有原则依据?
最陡爬坡实验一般都是要进行的,因为要确定CCD试验的中心点,保证结果的准确性,要不很难保证你的RSM图形有最高点。爬坡实验因素的变化步长一般根据PB试验中个因素的显著性大小确定。
一般是要做的
不过最近看了很多文章,可以不做的,
但是必须保证,PB试验后的最大值在整个试验中是最显著的,可以通过T检验得之 至少第二个问题,可以看看CCD文章,有很多。
帮帮忙!plackett-burman实验结果分析
实验所得结果如下,只知道CDE是影响显著的因子,不知道这几个因子是取高水平还是低水平,是不是看前面的系数,正取高,负取低?
系数标
项 效应 系数 准误 T P
常量 17.144 2.703 6.34 0.003
A 0.730 0.365 2.703 0.14 0.899
B 6.139 3.069 2.703 1.14 0.320
C 7.540 3.770 2.703 1.39 0.235
D 8.152 4.076 2.703 1.51 0.206
E 25.622 12.811 2.703 4.74 0.009
F -1.915 -0.958 2.703 -0.35 0.741
G -5.508 -2.754 2.703 -1.02 0.366
H 1.006 0.503 2.703 0.19 0.861
J -6.120 -3.060 2.703 -1.13 0.321
K -1.145 -0.573 2.703 -0.21 0.843
L 0.730 0.365 2.703 0.14 0.899
M 0.868 0.434 2.703 0.16 0.880
N 2.684 1.342 2.703 0.50 0.646
O 1.816 0.908 2.703 0.34 0.754
P -1.481 -0.740 2.703 -0.27 0.798
是一个简单的方法,也可以看偏导的变化。
请教下
偏导在哪看啊
可以手工求
就看前面的系数行不?
我是刚刚才接触这个软件
还有一点:因素D是空白
你的效应值是正的,所以说明增加该因子的量,对你最终的结果起到正的影响;如果是负的那就要降低该因子的含量,所以应该选择高水平的,进一步优化
你的效应值是正的,所以说明增加该因子的量,对你最终的结果起到正的影响;如果是负的那就要降低该因子的含量,所以应该选择高水平的,进一步优化
是负选择高水平的?正的选择低水平的?
这要看你要求最大值还是求最小值。
楼主的说法是正确的
但是做这种试验,你最好把回归方程表示出来
方法是 点击 regression 中的分析 就会出来了
系数的正负表明对响应值的效应 大小表示显著性 可以通过大小决定下一步的最陡爬坡步长 或者是CCD的步长
请教:PB-design,最陡爬坡实验,CCD等中的响应面分析的相关问题
请教:PB-design中的相关问题
在实验设计的过程中,通过阅读文献了解到了很多的,但是同时也积累了很多问题解决不了,希望各位高手们指点一二不胜感激.
1 在PB设计中出现的dummy variable的具体含义到底是什么?是对照组吗?如果不是应该遵循什么样的原则去设计呢?
2 在PB中实验组数应该是变量数加1,那么在相关的文献中看到15个变量设计为:15+1+4,其中4是dummy variable,但是表格中这4个变量也是有高低水平的变化的,那么设计时是作为15个变量来考虑还是19个呢?
3 想问问在最陡爬坡实验中,步长的选择有什么要求吗?纯经验还是有公式的? 4 在设计CCD试验那的时候是否要包括全因子实验设计?
5 什么是中轴点?
各位高手帮帮忙啊,谢谢了
小妹我也正在做这块试验,是培养基优化的
刚做完单因素试验
正在想下面该怎么设计呢?是PB?还是最陡爬坡?还是两个都要做??
反正最后是要做响应面的~~希望大虾们多多多指点一下下……
另外,关于PB,我也在想,是不是必须要做空白项的呢?
那么空白项里面的+1,-1是没有具体的水平值的亚,那么在实验中具体该怎么操作呢?? 谢谢各位不吝指教了……
我自己是怎么想的:单因子实验只是为了保险使PB实验的结果更加明显而进行的预实验,PB实验本身就是有筛选单因子的功能,如果有把握是可以直接做PB的.而我的实验是先进行单因子,然后是PB,根据PB的实验分析数据做最陡爬坡实验,否则不能很好的确定爬坡的方向以及步长.
我也是才刚刚接触这个课题希望大家能够多多交流哟
最陡爬坡实验的步长的选择:
根据前面PB实验的结果,做一阶方程的法线,法线方向就是爬坡方向,步长就根据回归系数和规范变量的比值在通过自然变量来换算,算到的结果在综合实际的情况就可以基本确定步长了
这个是最近看文献理解到的一些,希望哪位高手指点一下
1. dummy variable 不是对照组。如果你的实验次数为4的整数倍。那么看你考察的因素
是多少个。比如你有9个,那么至少要使用 runs=12次 的PB设计。此时,有3个空列。一般的处理方法是,等间距空列。实在不行,你就随机选吧。这并不妨碍你的实验结果。空列只是为了估算误差。
2. 这样吧,如果我这样表述,看你是否能够理解。
我刚好有15个因素,想做PB,正好 runs=16 符合我的要求。可是,这样一来,估算误差呢?因为没有多余空列了。那么,再往上加列,只有再加4列。刚好19因素,20次实验,其中有4个空列。
你认为这多出来的一列(16-15=1),我想你是这样算的吧。那你运行一下软件,看看15因素的PB, runs=16,到底是15列,还是16列?列是因素,行是实验次数。并不是列数=行数。
描述:如何确定步长:
图片:
描述:如何steepest ascent 实验,红色字体为最佳条件
图片:
3 想问问在最陡实验中,步长的选择有什么要求吗?纯经验还是有公式的?
图片:
看了这张图,我想答案应该是不言而喻了!
图片:
看了这张图,我想答案应该是不言而喻了!
描述:CCD各个设计点的作用:
图片:
综合最后两个问题.如有异议,欢迎继续发帖,大家共同学习!
谢谢Topmit如此详尽的回答,非常感谢.
由于我现在是在准备开题,所以还没有开始使用软件,现在只是在进行理论上的学习 小妹我实在愚钝,看了回帖后还是有几个疑问:
1 在PB实验中,实验组数是4的倍数是约定俗成的?还是方法本身的要求?在准备过程中参考了一些外文文献发现他们的设计中似乎没有什么规则,有时候就像你上面说的是随机设置的
2 还是关于虚拟变量的问题,在PB实验中似乎不一定需要设置虚拟变量,而且如果要设定是在什么样的情况下才需要呢?设置了和不设置有什么差别?
3 在上面CCD图中提到的角点就是四面体的8个顶点吧,那么轴点和星点是不是就是数量上相等的不同轴上的点的不同叫法?还有就是这两个点是怎么定的?数学意义是什么啊? 4 a主要是用来评价旋转性的吧?那么在实验的设计过程中如何体现a的价值呢?
真是不好意思,基础太差,问题很多,请多多指教啊
【交流】最权威的Plackett-Burman实验问答(要求加精)
作者: 雪狼乖乖 (站内联系TA) 发布: 2009-09-07
近日收到一封某科研院一位硕士研究生的来信,就我好几年前一篇利用Plackett-Burman方
法和响应面设计进行发酵条件优化的论文提出了几个问题。虽然这部分研究是6、7年前做的了,但由于印象还比较深刻,我根据自己的理解对这几个问题一一进行了解答。考虑到这位同学所提的问题对利用Plackett-Burman方法和响应面设计进行条件优化具有普遍意义,所以在征得这位同学的同意下,特把来信和我的解答公布在此处,以便供其他有类似困惑的同行参考。
-------------------------
来信:
您好!我是中国**科学院的一位研究生,看到您在****学报*卷第*期****年*月出版的,题目“*******************发酵条件优化”,请教一些问题:
1.您的文章中的Plackett-Burman设计中设计了空列用来进行误差的估计,那在进行软件分析的时候,怎么操作?要把空列也当做模型的一部分选入,进行相应的可信度,贡献率等的分析吗?
2.看到有些文章中做Plackett-Burman试验时没有设计空列,比如要考察11个因素,那么就采用12次试验点的PB设计,这样可以吗?是否必须加空列?
3. 看到有一篇文章中也做了11个因素的,采用的是以下设计:12次试验加中心点试验1次,共13次试验,每次试验还进行了重复,这种设计中用到的中心点试验的目的是什么?做重复有必要吗?
4.PB设计中的中心点和空列如果是用来估计误差的,那么它们分别是估计哪部分的误差,它们是什么关系?
5.PB设计中的每个试验点都必须做重复吗?
6.您的CCD设计中选择的星号点的a=1.682,这样的话是保证了设计的旋转性还是正交性,或是二者兼顾了?
7.在MINITAB软件的PB设计中,如果选择11因素的PB设计时,只有20次试验的选择,没有16次这一选项,不知是什么原因?
8.Two-level factorial designs和PB试验的关系是什么样的?
------------------------------
解答;同学,您好:
不好意思,耽搁了好几天才回复。这部分工作是差不多六、七年前做的了,其后就没有再继续直接进行类似的应用,所以有些地方自己也拿不准了。虽然自己亲自做的东西印象比较深
刻,但一则自己当时也是自学的,对相关概念和原理的理解和应用就有可能不准确,二则长时间不涉及相关工作,的确有些生疏了。故我的意见仅供你参考,希望能对您有所帮助。 以下就逐条就您的问题作一回答:
1、2: 关于空项"N次实验 Plackett-Burman设计至多可研究N-1个因素, 其中至少应设置3个空项以估计实验误差,每个因素均取高、低两个水平。该方法数据处理简单,在N次实验中,每个因素高、低水平分别出现N/2;而且,当某个因素处于高(低)水平时,其余因素均各出现高、低水平N/4次。因此,分别计算这个因素在高、低水平时实验响应的均值并求两均值之差就可得到此因素的效应,其中空项效应的均方和为标准差估计值。各因素效应进行t检验,可信度高的因素作为重要因素作进一步考察"。
以我的数据为例:
计算每个因素的效应时,首先分别求取该因素为+时N/ 2次实验的响应值的和(∑+),再求取该因素为—时N/2次实验的响应值的和(∑-),然后计算(∑+)-(∑-),就得到该因素的效应。空项的效应得到后,求取均方和,就得到标准差估计值。因为在理论上空项不应该产生效应,那么得到的效应就应该是误差导致的,所以求取误差效应的均方和就可以作为整个实验的标准差估计值。其他效应是否显著(即是真的存在还是因为误差产生的?),就根据它们与误差效应的比值来判断。这样得到各个因素效应的可信度(通过t检验,看显著与否)。
可见,空项是必要的,否则无法说明和判断实验中误差的大小, 也不能判断各个因素的效应是否可信,是否显著。一般说来,为了保证误差估计的可信度,至少应设计三个空项。所以如有11个因素待考察的话,最好不要选择N=12的设计。
问题3、4、5:
加一个中心点实验可能是为了考察误差的大小。 这个是从一般的统计学原理来研究随机误差的,因为体现的也是实验的重现精度。一般而言,在进行PB实验时,本身就应对实验进行重复,取多次实验的结果均值来进行分析,以排除实验中随机误差的影响,提高实验结果的精度。但要注意,精度和准确度是两个不同的概念,相关内容可以参加实验统计或实验设计的教材。
你问的第四个问题很有深度,很好。就我个人理解而言, 这两个误差实质上是一样的,但作用不同。进行重复实验是为了减小随机误差对实验结果的影响,提高实验的精度,但无法提供随机误差有多大的信息。而设计空项,目的就在于提供信息来估计随机误差,进而为判
别因素效应的大小和显著性提供依据。我相信,如果重复实验的波动小,那么对应的差效应的均方和也应该相应较小。但要注意,随机误差小并不等于实验结果一定就可靠。如果存在系统误差的话,实验的可信度就受影响了。
问题6、选择星号臂长为a=1. 682是为了使设计具有旋转性和通用性。
问题7、PB实验分析很简单,用excel就可以很方便的得到结果, 手算也没有问题。minitab没有N=16的选择原因不明。但如果你了解原理的话,就不会受制于软件了。
问题8、Two-level factorial designs顾名思义是一种两水平的部分因子实验。 它与PB实验的共性在于,大家都是两水平实验;它们的差异在于简化取样点的方法不同,进而导致所得结果的代表性有差异。具体的理论分析请参加《工业实验的设计与分析》这本书,介绍很详细。如果没有的话我再重新看看来回答,不过还是建议您自己先看一看,如果能亲自弄懂的话会很有成就感的。
如果有我没说清楚的地方还请来信。祝实验顺利!
-------------------------------
这位同学收到我的回复后再次提出了如下问题:
1.我看到您建议我看的参考文献中的PB试验中的酶活力的值是进行了16次试验后在检测酶活力的时候做了平行的检测然后取得是均值,这样的话是否就是表明在进行PB试验时,发酵时不用做重复了?
2.您在最陡爬坡试验的时,步长是怎么确定的,步长确定的依据是什么?在确定步长之前是不是还有一个一阶模型之类的方程用以来确定在PB中所选择的各个参数之间的关系呢? ------------------------
解答:
PB实验每一轮是16个样本,但做了两轮,即最终的结果是两轮实验的均值。
步长根据考察因素的效应来确定,保持大家比例与效应的比例相当, 使得变化具有可比性。这个关系就是它们效应的相对大小。
************************************************************************************************
第三次问题:
您的PB试验、CCD试验和爬坡试验所用的设计和分析软件是哪种?
回答:
我当时都是在excel上处理的,PB很简单,手算都可以。爬坡实验也是一样的。但CCD的响应面分析比较麻烦,当时还没有找到合适的软件,所以回归拟合以及检验我都是根据原理一步步自己算的。不过当时借助EXCEL 自己编制了一张表,只要你输入实验结果,自动就能得到最终的结果和检验。但后来作图是用的statistics。现在我觉得你可以用sas来做,毕竟里面有模块的,很方便。
Plackett-Burman设计至多可研究N-1个因素, 其中至少应设置3个空项以估计实验误差,每个因素均取高、低两个水平。该方法数据处理简单,在N次实验中,每个因素高、低水平分别出现N/2;而且,当某个因素处于高(低)水平时,其余因素均各出现高、低水平N/4次。因此,分别计算这个因素在高、低水平时实验响应的均值并求两均值之差就可得到此因素的效应,其中空项效应的均方和为标准差估计值。各因素效应进行t检验,可信度高的因素作为重要因素作进一步考察"。
计算每个因素的效应时,首先分别求取该因素为+时N/ 2次实验的响应值的和(∑+),再求取该因素为—时N/2次实验的响应值的和(∑-),然后计算(∑+)-(∑-),就得到该因素的效应。空项的效应得到后,求取均方和,就得到标准差估计值。因为在理论上空项不应该产生效应,那么得到的效应就应该是误差导致的,所以求取误差效应的均方和就可以作为整个实验的标准差估计值。其他效应是否显著(即是真的存在还是因为误差产生的?),就根据它们与误差效应的比值来判断。这样得到各个因素效应的可信度(通过t检验,看显著与否)。
可见,空项是必要的,否则无法说明和判断实验中误差的大小, 也不能判断各个因素的效应是否可信,是否显著。一般说来,为了保证误差估计的可信度,至少应设计三个空项。所以如有11个因素待考察的话,最好不要选择N=12的设计。
你可以自己看minitab和Design expert 上的PB试验设计。因素只有以下几个:11,19,23,27,31.初学者可以用现成的。根据“在N次实验中,每个因素高、低水平分别出现N/2”的原理,明白的话可以自己设计实验,只要让高低水平分别出现N/2次,就可以了。这样就不用受软件限制,之后把结果输入去分析就好。
还有就是高低水平的确定,并不是一定有1.5—2的倍数关系,我还经常见高低水平有4,5倍的差异,这个要自己试,不要看别人怎么做就模仿,不要偷懒,多做单因素的几个预试验,可能更有利于高低水平的确定。多看些外文文献,实话说CNKI上这方面文章真的不敢恭维。 这是我看别人的评论和自己对PB实验的一些见解,如有错误,请大家指正。
B实验的目的在于从众多相关因素中筛选出对目的响应具有显著效应、也就是影响最大、最关键的几个。所谓“打蛇要打七寸”,做任何事都要抓住要害,“抓住主要矛盾”。只有把要害或主要矛盾抓住了,才可能有针对性地、事半功倍地解决问题。我们做科研有个得天独厚的好处,就是从小到大学了不少辩证法的知识,所以如果能活学活用、以辩证法的思想指导我们的行为的化,那么在解决问题的策略和方法上就占有优势。PB实验就是合乎辩证法思想的,所以才在实际应用中显示出其威力,因为它能快速、准确地识别出影响目标响应的重要因素。
通过PB实验确定出重要因素后该怎么办呢,自然就是对这些重要因素进行比较详尽和全面的考察,以了解它们与目标响应间的关系,进而为选择合适的条件以便实现目标响应的最优化创造条件。
进一步的考察方法有多种,简单的有单因素实验,正交实验,复杂点的有析因实验,响应面实验,均匀设计等。具体选择哪一种方法要根据具体的情况进行判断。这个个人认为不是越复杂越好,只要能有好的效果、满足需要就可以了。
如果要进行响应面实验的话,在PB实验之后有必要进行最陡爬坡实验。其原因在于响应面实验考察的范围比较窄,如果不先确定存在最大响应值的区域的话,很有可能在响应面实验时无法得到最值。在B&B上有一篇文章就通过具体的实例证明了这一点:第一次响应面没有得到最值,经过分析发现考察区域本身不存在最指点。经过进一步搜索后确定了一个存在最值的区域,再进行响应面实验就成功了。最陡爬坡法就是一个经典的搜索考察区域、逼近最值空间的方法。
最陡爬坡法在运用中存在两个问题,一是爬坡的方向,二是爬坡的步长。前者根据效应的正负就可以确定:如果某个因素是正效应,那么爬坡时就增加因素的水平;反之,即减少因素水平。而对应爬坡步长,则要稍微复杂些。
前几天一个同学又写信来同我交流了这个问题,我想就以我们的问答来具体的说明如何选择步长吧。
问:
现在我进行了PB实验,进行分析之后选择了碳源氮源和发酵时间为显著的因素,下面我应该怎么做?
我对PB试验中的11个因素进行了回归分析,得到了一个方程,拟和的还可以,预测值的组合在我的实验中出现了,但是预测值要小于我的实验实测值,下面我可以按照11个因素得到的回归方程将其余的8个因素剔除之后,进行相应的步长和实验安排吗?这样做是否合适?
你的文章《****液体发酵条件的优化》中最陡爬坡试验中的表3,做了4次试验,但是后面的3个因素是成对,也就是以组合的形式出现的,这是怎么确定的?为什么做4次?第4个组合是PB试验的预测得到的最优组合的含量为出发点的吗?我看到蛋白胨是1-4为从低到高的含量,但是磷酸氢二钠和种龄却是有高到底的顺序,这是为什么?
答:
①选择了碳源氮源和发酵时间为显著的因素,下面我应该怎么做?
我想既然确定了显著因素,那么就可以对这三个因素进行进一步的比较精细地优化。可以采用正交实验进行三因素多水平的优化,也可以采用其他的统计优化方法进行优化,比如响应面或均匀设计。这个可觉得倒不是越复杂越好,只要能有好的效果就可以了。
至于PB实验的预测值小于真实值,这也是很正常的。生物实验本身就存在比较大的波动,而且如果在PB实验时存在系统误差的话(如温度的规律性变化),那么预测值是会与真实值有差异的。
只有这三个因素经PB实验验证是显著性因素,那么就可以选择这三个因素进行进一步
的实验。
②关于最陡爬坡实验:
爬坡实验的次数是根据需要确定的,如果四次实验还没有确定最大值,即趋势还是增加,那么就有必要进行第五次、第六次实验,直至确定出爬坡的最大值,即趋势开始下降。 我进行爬坡实验时因为胰蛋白胨是正效应,磷酸氢二钠和种龄是负效应,所以前者是一直增加的,后两个是持续减小的。胰蛋白胨和磷酸氢二钠在爬坡时的步长都是PB实验时步长的1/4,之所以确定为这个值是考虑到步长小一些的话可以对爬坡路径上响应的变化做一个相对精确的考察。由于种龄的自由度有限,所以就取1h为步长。所以就最陡爬坡而言,是否需要严格保持各因素的步调一致还有待研究,不过我觉得如果可能的话,最好能保持步长一直,这样一则可以对应于PB实验的分析结果,二则也可以避免因为步调不一致导致的响应不协调现象。
另外我觉得还可以根据因素的效应值设定步长:对应效应大的因素,步长应小一些;效应小的因素,步长应大一些。而且他们间的步长大小关系应该与他们的效应大小成反比。其原因在于,效应大的因素发生的变化可以使响应有更敏感的改变,所以步长应小;同理,效应小的因素步长自然应该大一些。
-------------以上为引用
具体请参考 博客
首先,选择最高的那组,以显著因素的高低水平的均值作为爬坡的起点。关于步长你可以选择PB实验步长的三分之一到一倍。其他不显著因素,选择最高那组的配比。关于正爬坡还是负爬坡的问题是:pb实验会拟合一个一次方程,因素前面的系数是正就是正爬坡,系数是负的就是负爬坡。至于软件的操作方面不好语言描述啊,你自己看看相关资料吧。