摘要
数理统计是具有广泛应用的数学分支,在生产过程和科学实验中,总会遇到多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们之间存在相互关系,这种相互关系可以分为确定性关系和相关关系。
变量之间的确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律性,这种函数称为回归函数或回归方程。
回归分析是一种处理变量之间相关关系最常用的统计方法,用它可以寻找隐藏在随机后面的统计规律。确定回归方程,检验回归方程的可信度等是回归分析的主要内容。按回归模型类型可划分为线性回归分析和非线性回归分析。 本文主要探究一元非线性回归分析,对于一元非线性问题,可用回归曲线y = f(x)来描述。在许多情形下,通过适当的线性变换,可将其转换为一元线性回归问题。气体的流量与压力之间的关系一般由经验公式M= cpb,此公式不是线性方程,如果对其进行如下变换:对其两边同时取常用对数 lgM = lg c + b*lg p
令 y = lg M ,x = lg p, a = lg c,则上述经过公式可以变换成一元线性方程: y = a+bx
用线性回归方法求出x与y之间的线性回归方程y = 0.5426x-0.2827,返回原来
的M和p之间的经验公式可表示为M= 0.5216p0.5426,回归方程的显著性检测:a.相关系数检验,b.F检验。所求得的经验公式非常显著。
关键词:相互关系;回归分析;一元非线性回归分析;线性回归方程;显著性检测
目录
1 设计目的„„„„„„„„„„„„„„„„„„„„„„„„„„„1 2 设计原理„„„„„„„„„„„„„„„„„„„„„„„„„„„1 2.1 线性回归方程的建立„„„„„„„„„„„„„„„„„„„„1 2.2 相关系数检验„„„„„„„„„„„„„„„„„„„„„„„2 3 设计题目„„„„„„„„„„„„„„„„„„„„„„„„„„„5 4 实现过程„„„„„„„„„„„„„„„„„„„„„„„„„„„5 4.1 回归方程建立„„„„„„„„„„„„„„„„„„„„„„„5 4.2 回归方程显著性检验„„„„„„„„„„„„„„„„„„„„7 5 设计总结„„„„„„„„„„„„„„„„„„„„„„„„„„„8 致谢„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„10 参考文献„„„„„„„„„„„„„„„„„„„„„„„„„„„„„10
1、设计目的
在许多实际问题中,变量之间的关系并不是线性的,这时就应该考虑采用非线性回归分析模型。在进行非线性回归分析时,必须着重解决两方面的问题:一是如何确定非线性函数的具体形式,与线性回归不同,非线性回归函数有多种多样的具体形式,需要根所研究的实际问题的性质和实验数据特点作出适当的选择;二是如何估计函数中的参数,非线性回归分析最常用的方法仍然是最小二乘法,但需要根据函数的不同情形,做适当的处理。使其转化为线性回归。是得问题简单化。熟悉Excel在试验数据处理中的应用,
2、设计原理
对于一元非线性问题,可用回归曲线 y = f(x)来描述。在许多情况下,通过适当的线性变换,可将其转化为一元线性回归问题。具体做法如下: ① 根据实验数据,在直角坐标系中画出散点图; ② 根据散点图,推测y 和x之间的函数关系; ③ 选择适当的变换,使之变成线性关系; ④ 用线性回归方法求出线回归方程;
⑤ 返回原来的函数关系,得到要求的回归方程。
如果凭借以往的经验和专业知识,预先知道变量之间存在一定的形式的非线性关系,上述的前两步可以省略;如果预先不清楚变量之间的函数类型,则可以依据实验数据的特点活散点图来选择对应的函数表达式。需要指出的是,在一定的试验范围内,可能用不同的函数拟合实验数据,都可以得到显著性较好的回归方程,这时应该选择其中数学形式较简单的一种。在回归方程显著性检测时也是根据线性回归方程而做出的显著性检测。 2.1线性回归方程的建立:
设有一组实验数据,实验值为xi,yi (i = 1,2,„,n),其中x是自变量,y是因变量。若x,y符合线性关系,则可以你何为直线方程,即:
yi = a + bxi 其中a,b称为回归系数。如果将yi与yi之间的偏差称为残差,
用ei表示,则有:ei= yi-yi
显然,只有各残差平方值之和最小时,回归方程预实验值的拟合程度最好。令
SSe=Q=ei=[yi(abxi)]2,其中xi,yi是已知实验值,故残差平方值SSe为
2
i1
i1
nn
a,b的函数,为使SSe值到达极小, 根据极值原理,只要将上式分别对a,b求偏导数得到
n
Q
a2(yiabxi)0i1
对方程组求解可得回归系数a,b的计算式: n
Q2(yabx)x0
iii
i1b
QQ
,,并令其等于零,即可求得a,b之值,根据最小二乘法,可以ab
a =y-bx
b
xyii
i1n
n
x
i1
2
i
2
式中,y,x分别为试验值xi,yi(i= 1,2,3,„,n)的算术平均值。从式中可以看出,回归直线通过点(x,y),为了方便计算。令:Lxy = xi-n(x)2
2
i1
10
Lyy= xiyi - nyx,则
i1
10
b =
LxyLyy
。
2.2相关系数检验
相关系数是用于描述变量x和y的线性相关程度的,常用r来表示。设有n(n>2)对试验值xi,yi(i = 1,2,„,n),则相关系数的计算式为: r =
LxyLxxLyyLxyLxxLyy
比较回归系数b与相关系数r的计算式,可得:
Lxx
,所以r与b 有相同的符号。相关系数r的平方未决系数Lxy
r = =b
r2具有以下特点: (1)r1;
SSe=Q=ei=[yi(abxi)]2,其中xi,yi是已知实验值,故残差平方值SSe为
2
i1
i1
nn
a,b的函数,为使SSe值到达极小, 根据极值原理,只要将上式分别对a,b求偏导数得到
n
Q
a2(yiabxi)0i1
对方程组求解可得回归系数a,b的计算式: n
Q2(yabx)x0
iii
i1b
QQ
,,并令其等于零,即可求得a,b之值,根据最小二乘法,可以ab
a =y-bx
b
xyii
i1n
n
x
i1
2
i
2
式中,y,x分别为试验值xi,yi(i= 1,2,3,„,n)的算术平均值。从式中可以看出,回归直线通过点(x,y),为了方便计算。令:Lxy = xi-n(x)2
2
i1
10
Lyy= xiyi - nyx,则
i1
10
b =
LxyLyy
。
2.2相关系数检验
相关系数是用于描述变量x和y的线性相关程度的,常用r来表示。设有n(n>2)对试验值xi,yi(i = 1,2,„,n),则相关系数的计算式为: r =
LxyLxxLyyLxyLxxLyy
比较回归系数b与相关系数r的计算式,可得:
Lxx
,所以r与b 有相同的符号。相关系数r的平方未决系数Lxy
r = =b
r2具有以下特点: (1)r1;
(2)如果r1,则表明x和y完全线性相关,这时x和y有精确的线性关系; (3) 大多数情况下0r1,即x和y之间存在一定的线性关系,当r>0时称x与y正相关,这时直线的斜率为正值,y随x的增加而增加,当r
(4)r = 0时,则表明x和y没有线形关系,但并不意味着x与y之间不存在其它类型的关系,所以先关系数更加精确的说法以偶那个该市线性相关系数。 上面的分析可知,相关系数r越接近1,x与y的线性先关程度越高,然而r的大小为你呢个回答其值达到多大时,x与y之间才存在线性相关,采用线性关系才属合理,所以须对相关系数r进行显著性检验。
对于给定的显著性水平,显著性检验要求rrmin时,才说明x与y之间存在密切的线性关系,其中rmin称为相关系数临界值,它与给定的显著性水平和实验数据组n(n>2)有关,可查表得出。 F检验
F检验实际就是方差分析,包括一下的主要内容。 (1) 离差平方和
试验值yi(i = 1,2,„,n)之间存在差异,这种差异可用试验值yi与其算 术平均数y的偏差平方和来表示,称为总离差平方和,即: SST =xiyi - nyx=Lyy
i110
试验值yi的这种波动是由于两个因素造成的:一个是由x的变化而引起y的变化,它可以用回归平方和来表示,即: SSR=(yiy)2
它表示的是回归值yi与yi的算术平均值y之间的偏差平方和;另一个因素是随机误差,它可以用残差平方和来表示,即 SSe=ei=
2
i1
n
[y
i1
n
i
(abxi)]2,它表
示的是试验值yi与对应的回归值yi之间的偏差平方和。显然,这三种平方和之
间有下述关系: SSY=SSR+SSe 。 (2)自由度
总离差平方和SSy的自由度为:dfT = n-1 回归平方和SSR的自由度为:dfR = 1 残差平方和SSe的自由度为:dfe = n -2 显然三种自由度之间的关系为:dfTdfRdfe (3)均方 MSR=
SSR
dfR
MSe=
SSR
dfe
(4)F检验 F =
SSR
SSe
F服从自由度为(1,n-2)F分布。在给定的显著性水平下,从F分布表种查得1-表示检验的可靠程度。若F
F0.05(1,,n2)F0.01(1,,n2),则称x与y有十分显著的线形关系,用“**”表示。后两种情况说明y的变化主要是由于x的变化造成的。最后将计算结果列成方差分析表
差异源
SS df MS F 显著性
回归 误差
SSR
1 n -2
MSR=SSR
SSe
SSF = R
SSe
MSe = SSE/ (n-2)
总和
SSy
n-1
残差分析
yi与yi之间的偏差称为残差,表示为ei= yi-yi,它能提供许多有用途的信息。
根据试验数值可以计算出参差的标准误差s
1n21
SSe=ei
n2i1n2
如果实验的随机误差服从正态分布,则试验值yi落在yi2s之内的概率为95%,对于一次试验数值,残差标准差s越小,说明曲线拟合的越好。
3、设计题目
气体的流量与压力之间的关系一般由经验公式Mcpb表示,式中M是压强为P时每分钟流过流量计的空气物质的量,c,b为常数,现进行一批试验,得到如表 课设-1所示的一组数据。试由这组数据定出常数c,b,建立M和p之间的经验关系式,并检测其显著性。(α=0.05)
课设-1 实验数据
4、实现过程
y = a+bx
已知试验次数 n = 10,根据上述变换,使用Excel对试验数据进行整理计算, 在Excel中建立如图课设-1的工作4.1回归方程的建立 经验公式不是线性方程,如果对其两边同时取常用对数,可得
lgM = lg c + b*lg p
如果令 y = lg M ,x = lg p, a = lg c,则上述经过公式可以变换成一元线性方程: ① 表格。
② 从Excel的常用工具栏中的“图表向导”按钮进入图表向导。做出XY散点图如课设-2所示,
③ 在Excel中建立如图课设-3所示的工作表格。并通过Excel中自带的数据处理工具进行相关数据的计算 课设-3 序号
2
pi Mi xi lgpi
yi lgMi
xi
2
yi
xiyi
1 2 3 4 5 6 7 8 9 10
2.01 1.78 1.75 1.73 1.68 1.62 1.4 1.36 0.93 0.53
10
0.763 0.303196 -0.11748 0.091928 0.0138 -0.03562
0.715 0.25042 -0.14569 0.06271 0.021227 -0.03648 0.71 0.243038 -0.14874 0.059067 0.022124 -0.03615 0.695 0.238046 -0.15802 0.056666 0.024969 -0.03761 0.698 0.225309 -0.15614 0.050764 0.024381 -0.03518 0.673 0.209515 -0.17198 0.043897 0.029579 -0.03603 0.63 0.146128 -0.20066 0.021353 0.040264 -0.02932 0.612 0.133539 -0.21325 0.017833 0.045475 -0.02848 0.498 -0.03152 -0.30277 0.000993 0.09167 0.009542 0.371 -0.27572 -0.43063 0.076024 0.185439 0.118734 6.365 1.44195 -2.04536 0.481235 0.498928 -0.1466
i1
10
14.79
110
i1
2
1.479 0.6365 0.144195 -0.20454
课设-2
从表课设-3,可知: x
= 0.1442,
y
10
= -0.2045,xi2= 0.4812,
i1
10
2
10
yi= 0.4989,i1
xiyi = -0.1466
i1
10
∴
Lxy = xi2
-n(x)2-0.4812-100.14422=0.2733
i1
10
Lyy = xiyi - nyx
= -0.1466 - 10(-0.2045)2=0.1483
i1
10
L2
2xy= yi-n(y)2=0.4989-10(-0.2045) = 0.0807
i1
b =
Lxy0.1483
L=
yy
0.2733
= 0.5426 a =
y- b
x=-0.2045-0.5460.1442= -0.2827
x与y之间的线性方程为:y = 0.5426x – 0.2827 又a = lgc
c= 10a= 10
-0.2827
= 0.5216
气体的流量M与压强p之间的经验公式可表示为: M = 0.5216 p0.5426
10
4.2回归方程显著性检验 a.相关系数检验
r =
LxyLxxLyy
=
0.1483.27330.0807
= 0.9986
根据= 0.05,n = 10,m = 1查相关系数临界值表你,得rmin= 0.6319
Lxy
=0.2733
Lyy=0.1483
SST = Lyy = 0.0807
SSR = bLxy = 0.54260.1483 = 0.0805
SSe = SST – SSR = 0.0807 – 0.0805 = 0.0002 方差分析结果见方差分析表课设-4。
课设-4 方差分析表
所求得的经验公式非常显著。
5、 设计总结
结果分析:在本例中,非线性回归分析问题经过变换,转化成线形回归分析,求解的回归方程很好的拟合了试验数据值,在一定的试验的范围内,可能用不同的函数拟合试验数据,都可以得到显著性较好的回归方程,这时就应该选择其中的数学形式较简单的一种。一般说来,数学形式越简单,其可操作性就越强,过于复杂的函数形式在实际的定量分析中,并没有太大的价值,以下给出一些常用的非线性函数的线性变换在课设-4中
11
通过这次的课程程设计学习,我们学到了更多的关于概率论与数理统计的知识,是我们获益匪浅。
12
致 谢
本论文是张玉春老师指导下完成的。她严肃的科学态度,严谨的治学精神,精益求精的工作作风,深深地感染和激励着我。在此,我向张老师致以诚挚的谢意和崇高的敬意。
同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助。我还要感谢我的论文中被我引用或参考的文献的作者。
参考文献
[1] 沈恒范.概率论与数理统计教程[M].第四版.高等教育出版社,2003.4:140-196
[2] Morris H.DeGroot,Mark J.Schervish[美].概率统计[M].叶中行,王蓉华,徐晓岭. 第三版.人民邮电出版社,2007.3,175-333
[3] 潘承毅,何迎辉.数理统计的原理与方法[M].同济大学出版社,1993 [4] 方世祖.概率论与数理统计教学探讨[J].广西大学学报(自然科学版),2008,33
[5]李云雁,胡传荣 实验设计与数据处理[M].化学工业出版社,2005.2
13
摘要
数理统计是具有广泛应用的数学分支,在生产过程和科学实验中,总会遇到多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们之间存在相互关系,这种相互关系可以分为确定性关系和相关关系。
变量之间的确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律性,这种函数称为回归函数或回归方程。
回归分析是一种处理变量之间相关关系最常用的统计方法,用它可以寻找隐藏在随机后面的统计规律。确定回归方程,检验回归方程的可信度等是回归分析的主要内容。按回归模型类型可划分为线性回归分析和非线性回归分析。 本文主要探究一元非线性回归分析,对于一元非线性问题,可用回归曲线y = f(x)来描述。在许多情形下,通过适当的线性变换,可将其转换为一元线性回归问题。气体的流量与压力之间的关系一般由经验公式M= cpb,此公式不是线性方程,如果对其进行如下变换:对其两边同时取常用对数 lgM = lg c + b*lg p
令 y = lg M ,x = lg p, a = lg c,则上述经过公式可以变换成一元线性方程: y = a+bx
用线性回归方法求出x与y之间的线性回归方程y = 0.5426x-0.2827,返回原来
的M和p之间的经验公式可表示为M= 0.5216p0.5426,回归方程的显著性检测:a.相关系数检验,b.F检验。所求得的经验公式非常显著。
关键词:相互关系;回归分析;一元非线性回归分析;线性回归方程;显著性检测
目录
1 设计目的„„„„„„„„„„„„„„„„„„„„„„„„„„„1 2 设计原理„„„„„„„„„„„„„„„„„„„„„„„„„„„1 2.1 线性回归方程的建立„„„„„„„„„„„„„„„„„„„„1 2.2 相关系数检验„„„„„„„„„„„„„„„„„„„„„„„2 3 设计题目„„„„„„„„„„„„„„„„„„„„„„„„„„„5 4 实现过程„„„„„„„„„„„„„„„„„„„„„„„„„„„5 4.1 回归方程建立„„„„„„„„„„„„„„„„„„„„„„„5 4.2 回归方程显著性检验„„„„„„„„„„„„„„„„„„„„7 5 设计总结„„„„„„„„„„„„„„„„„„„„„„„„„„„8 致谢„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„10 参考文献„„„„„„„„„„„„„„„„„„„„„„„„„„„„„10
1、设计目的
在许多实际问题中,变量之间的关系并不是线性的,这时就应该考虑采用非线性回归分析模型。在进行非线性回归分析时,必须着重解决两方面的问题:一是如何确定非线性函数的具体形式,与线性回归不同,非线性回归函数有多种多样的具体形式,需要根所研究的实际问题的性质和实验数据特点作出适当的选择;二是如何估计函数中的参数,非线性回归分析最常用的方法仍然是最小二乘法,但需要根据函数的不同情形,做适当的处理。使其转化为线性回归。是得问题简单化。熟悉Excel在试验数据处理中的应用,
2、设计原理
对于一元非线性问题,可用回归曲线 y = f(x)来描述。在许多情况下,通过适当的线性变换,可将其转化为一元线性回归问题。具体做法如下: ① 根据实验数据,在直角坐标系中画出散点图; ② 根据散点图,推测y 和x之间的函数关系; ③ 选择适当的变换,使之变成线性关系; ④ 用线性回归方法求出线回归方程;
⑤ 返回原来的函数关系,得到要求的回归方程。
如果凭借以往的经验和专业知识,预先知道变量之间存在一定的形式的非线性关系,上述的前两步可以省略;如果预先不清楚变量之间的函数类型,则可以依据实验数据的特点活散点图来选择对应的函数表达式。需要指出的是,在一定的试验范围内,可能用不同的函数拟合实验数据,都可以得到显著性较好的回归方程,这时应该选择其中数学形式较简单的一种。在回归方程显著性检测时也是根据线性回归方程而做出的显著性检测。 2.1线性回归方程的建立:
设有一组实验数据,实验值为xi,yi (i = 1,2,„,n),其中x是自变量,y是因变量。若x,y符合线性关系,则可以你何为直线方程,即:
yi = a + bxi 其中a,b称为回归系数。如果将yi与yi之间的偏差称为残差,
用ei表示,则有:ei= yi-yi
显然,只有各残差平方值之和最小时,回归方程预实验值的拟合程度最好。令
SSe=Q=ei=[yi(abxi)]2,其中xi,yi是已知实验值,故残差平方值SSe为
2
i1
i1
nn
a,b的函数,为使SSe值到达极小, 根据极值原理,只要将上式分别对a,b求偏导数得到
n
Q
a2(yiabxi)0i1
对方程组求解可得回归系数a,b的计算式: n
Q2(yabx)x0
iii
i1b
QQ
,,并令其等于零,即可求得a,b之值,根据最小二乘法,可以ab
a =y-bx
b
xyii
i1n
n
x
i1
2
i
2
式中,y,x分别为试验值xi,yi(i= 1,2,3,„,n)的算术平均值。从式中可以看出,回归直线通过点(x,y),为了方便计算。令:Lxy = xi-n(x)2
2
i1
10
Lyy= xiyi - nyx,则
i1
10
b =
LxyLyy
。
2.2相关系数检验
相关系数是用于描述变量x和y的线性相关程度的,常用r来表示。设有n(n>2)对试验值xi,yi(i = 1,2,„,n),则相关系数的计算式为: r =
LxyLxxLyyLxyLxxLyy
比较回归系数b与相关系数r的计算式,可得:
Lxx
,所以r与b 有相同的符号。相关系数r的平方未决系数Lxy
r = =b
r2具有以下特点: (1)r1;
SSe=Q=ei=[yi(abxi)]2,其中xi,yi是已知实验值,故残差平方值SSe为
2
i1
i1
nn
a,b的函数,为使SSe值到达极小, 根据极值原理,只要将上式分别对a,b求偏导数得到
n
Q
a2(yiabxi)0i1
对方程组求解可得回归系数a,b的计算式: n
Q2(yabx)x0
iii
i1b
QQ
,,并令其等于零,即可求得a,b之值,根据最小二乘法,可以ab
a =y-bx
b
xyii
i1n
n
x
i1
2
i
2
式中,y,x分别为试验值xi,yi(i= 1,2,3,„,n)的算术平均值。从式中可以看出,回归直线通过点(x,y),为了方便计算。令:Lxy = xi-n(x)2
2
i1
10
Lyy= xiyi - nyx,则
i1
10
b =
LxyLyy
。
2.2相关系数检验
相关系数是用于描述变量x和y的线性相关程度的,常用r来表示。设有n(n>2)对试验值xi,yi(i = 1,2,„,n),则相关系数的计算式为: r =
LxyLxxLyyLxyLxxLyy
比较回归系数b与相关系数r的计算式,可得:
Lxx
,所以r与b 有相同的符号。相关系数r的平方未决系数Lxy
r = =b
r2具有以下特点: (1)r1;
(2)如果r1,则表明x和y完全线性相关,这时x和y有精确的线性关系; (3) 大多数情况下0r1,即x和y之间存在一定的线性关系,当r>0时称x与y正相关,这时直线的斜率为正值,y随x的增加而增加,当r
(4)r = 0时,则表明x和y没有线形关系,但并不意味着x与y之间不存在其它类型的关系,所以先关系数更加精确的说法以偶那个该市线性相关系数。 上面的分析可知,相关系数r越接近1,x与y的线性先关程度越高,然而r的大小为你呢个回答其值达到多大时,x与y之间才存在线性相关,采用线性关系才属合理,所以须对相关系数r进行显著性检验。
对于给定的显著性水平,显著性检验要求rrmin时,才说明x与y之间存在密切的线性关系,其中rmin称为相关系数临界值,它与给定的显著性水平和实验数据组n(n>2)有关,可查表得出。 F检验
F检验实际就是方差分析,包括一下的主要内容。 (1) 离差平方和
试验值yi(i = 1,2,„,n)之间存在差异,这种差异可用试验值yi与其算 术平均数y的偏差平方和来表示,称为总离差平方和,即: SST =xiyi - nyx=Lyy
i110
试验值yi的这种波动是由于两个因素造成的:一个是由x的变化而引起y的变化,它可以用回归平方和来表示,即: SSR=(yiy)2
它表示的是回归值yi与yi的算术平均值y之间的偏差平方和;另一个因素是随机误差,它可以用残差平方和来表示,即 SSe=ei=
2
i1
n
[y
i1
n
i
(abxi)]2,它表
示的是试验值yi与对应的回归值yi之间的偏差平方和。显然,这三种平方和之
间有下述关系: SSY=SSR+SSe 。 (2)自由度
总离差平方和SSy的自由度为:dfT = n-1 回归平方和SSR的自由度为:dfR = 1 残差平方和SSe的自由度为:dfe = n -2 显然三种自由度之间的关系为:dfTdfRdfe (3)均方 MSR=
SSR
dfR
MSe=
SSR
dfe
(4)F检验 F =
SSR
SSe
F服从自由度为(1,n-2)F分布。在给定的显著性水平下,从F分布表种查得1-表示检验的可靠程度。若F
F0.05(1,,n2)F0.01(1,,n2),则称x与y有十分显著的线形关系,用“**”表示。后两种情况说明y的变化主要是由于x的变化造成的。最后将计算结果列成方差分析表
差异源
SS df MS F 显著性
回归 误差
SSR
1 n -2
MSR=SSR
SSe
SSF = R
SSe
MSe = SSE/ (n-2)
总和
SSy
n-1
残差分析
yi与yi之间的偏差称为残差,表示为ei= yi-yi,它能提供许多有用途的信息。
根据试验数值可以计算出参差的标准误差s
1n21
SSe=ei
n2i1n2
如果实验的随机误差服从正态分布,则试验值yi落在yi2s之内的概率为95%,对于一次试验数值,残差标准差s越小,说明曲线拟合的越好。
3、设计题目
气体的流量与压力之间的关系一般由经验公式Mcpb表示,式中M是压强为P时每分钟流过流量计的空气物质的量,c,b为常数,现进行一批试验,得到如表 课设-1所示的一组数据。试由这组数据定出常数c,b,建立M和p之间的经验关系式,并检测其显著性。(α=0.05)
课设-1 实验数据
4、实现过程
y = a+bx
已知试验次数 n = 10,根据上述变换,使用Excel对试验数据进行整理计算, 在Excel中建立如图课设-1的工作4.1回归方程的建立 经验公式不是线性方程,如果对其两边同时取常用对数,可得
lgM = lg c + b*lg p
如果令 y = lg M ,x = lg p, a = lg c,则上述经过公式可以变换成一元线性方程: ① 表格。
② 从Excel的常用工具栏中的“图表向导”按钮进入图表向导。做出XY散点图如课设-2所示,
③ 在Excel中建立如图课设-3所示的工作表格。并通过Excel中自带的数据处理工具进行相关数据的计算 课设-3 序号
2
pi Mi xi lgpi
yi lgMi
xi
2
yi
xiyi
1 2 3 4 5 6 7 8 9 10
2.01 1.78 1.75 1.73 1.68 1.62 1.4 1.36 0.93 0.53
10
0.763 0.303196 -0.11748 0.091928 0.0138 -0.03562
0.715 0.25042 -0.14569 0.06271 0.021227 -0.03648 0.71 0.243038 -0.14874 0.059067 0.022124 -0.03615 0.695 0.238046 -0.15802 0.056666 0.024969 -0.03761 0.698 0.225309 -0.15614 0.050764 0.024381 -0.03518 0.673 0.209515 -0.17198 0.043897 0.029579 -0.03603 0.63 0.146128 -0.20066 0.021353 0.040264 -0.02932 0.612 0.133539 -0.21325 0.017833 0.045475 -0.02848 0.498 -0.03152 -0.30277 0.000993 0.09167 0.009542 0.371 -0.27572 -0.43063 0.076024 0.185439 0.118734 6.365 1.44195 -2.04536 0.481235 0.498928 -0.1466
i1
10
14.79
110
i1
2
1.479 0.6365 0.144195 -0.20454
课设-2
从表课设-3,可知: x
= 0.1442,
y
10
= -0.2045,xi2= 0.4812,
i1
10
2
10
yi= 0.4989,i1
xiyi = -0.1466
i1
10
∴
Lxy = xi2
-n(x)2-0.4812-100.14422=0.2733
i1
10
Lyy = xiyi - nyx
= -0.1466 - 10(-0.2045)2=0.1483
i1
10
L2
2xy= yi-n(y)2=0.4989-10(-0.2045) = 0.0807
i1
b =
Lxy0.1483
L=
yy
0.2733
= 0.5426 a =
y- b
x=-0.2045-0.5460.1442= -0.2827
x与y之间的线性方程为:y = 0.5426x – 0.2827 又a = lgc
c= 10a= 10
-0.2827
= 0.5216
气体的流量M与压强p之间的经验公式可表示为: M = 0.5216 p0.5426
10
4.2回归方程显著性检验 a.相关系数检验
r =
LxyLxxLyy
=
0.1483.27330.0807
= 0.9986
根据= 0.05,n = 10,m = 1查相关系数临界值表你,得rmin= 0.6319
Lxy
=0.2733
Lyy=0.1483
SST = Lyy = 0.0807
SSR = bLxy = 0.54260.1483 = 0.0805
SSe = SST – SSR = 0.0807 – 0.0805 = 0.0002 方差分析结果见方差分析表课设-4。
课设-4 方差分析表
所求得的经验公式非常显著。
5、 设计总结
结果分析:在本例中,非线性回归分析问题经过变换,转化成线形回归分析,求解的回归方程很好的拟合了试验数据值,在一定的试验的范围内,可能用不同的函数拟合试验数据,都可以得到显著性较好的回归方程,这时就应该选择其中的数学形式较简单的一种。一般说来,数学形式越简单,其可操作性就越强,过于复杂的函数形式在实际的定量分析中,并没有太大的价值,以下给出一些常用的非线性函数的线性变换在课设-4中
11
通过这次的课程程设计学习,我们学到了更多的关于概率论与数理统计的知识,是我们获益匪浅。
12
致 谢
本论文是张玉春老师指导下完成的。她严肃的科学态度,严谨的治学精神,精益求精的工作作风,深深地感染和激励着我。在此,我向张老师致以诚挚的谢意和崇高的敬意。
同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助。我还要感谢我的论文中被我引用或参考的文献的作者。
参考文献
[1] 沈恒范.概率论与数理统计教程[M].第四版.高等教育出版社,2003.4:140-196
[2] Morris H.DeGroot,Mark J.Schervish[美].概率统计[M].叶中行,王蓉华,徐晓岭. 第三版.人民邮电出版社,2007.3,175-333
[3] 潘承毅,何迎辉.数理统计的原理与方法[M].同济大学出版社,1993 [4] 方世祖.概率论与数理统计教学探讨[J].广西大学学报(自然科学版),2008,33
[5]李云雁,胡传荣 实验设计与数据处理[M].化学工业出版社,2005.2
13