正态总体参数区间估计的MATLAB实现

2010年2月

第1期吉林师范大学学报(自然科学版) Journal of Jilin Normal University (NaturalScience Edition) l . 1Feb. 2010

正态总体参数区间估计的MATLAB 实现

陈少云

(四川建筑职业技术学院计算机系, 四川德阳618000)

摘 要:本文介绍了MATLAB 软件的normfit() 函数在求解正态总体参数的区间估计中的长处和短处, 结合实例编写了MATLAB 程序求解标准差R 已知时均值L 的置信区间和均值L 已知时标准差R 的置信区间, 弥补了normfit() 函数在该方面的不足.

关键词:正态总体; 均值; 标准差; 置信区间

中图分类号:O212. 2 文献标识码:A 文章编号:1674-3873-(2010) 01-0076-03

0 引言

总体参数的点估计作为待估参数的近似值给出了明确的数量描述, 在统计分析中有多方面的应用. 但点估计没有给出这种近似的精确程度和可信程度, 使其在实际应用中受到很大的限制, 区间估计却可以弥补这一不足.

在工程技术中广泛使用的数学软件MATLAB 提供了现成的函数normfit() 可以很方便地求出正态总体标准差R 未知时均值L 的置信区间和均值L 未知时标准差R 的置信区间, 与数理统计公式和查相关的临界值表计算的结果完全吻合.

其函数调用格式为:[muhat,sigmahat, muci, sigmaci]=normfit(x, alpha). 其中muhat, sigmahat 分别为正态分布的参数L 和R 的估计值, muci, sigmaci 分别为它们的置信区间, 置信度为(1-alpha) @100%, alpha 为显著性水平.

例1 商店用机器包装某种商品, 每包重量X 服从正态分布, 为检查包装的质量, 对机器包装的商品抽测8包, 其重量为

5. 08 4. 97 5. 12 5. 05 4. 95 4. 90 5. 00 5. 01

试估计机器包装的商品重量的均值L 和标准差R 的置信度为0. 95的置信区间

解 在MATLAB 的命令窗口输入如下语句

>>x =[5. 08 4. 97 5. 12 5. 05 4. 95 4. 90 5. 00 5. 01];

>>[muhat, sigmahat, muci, sigmaci]=nor mfit(x, 0. 05)

结果显示为

muhat=5. 0100

sigmahat=0. 0717

muci=4. 9500 5. 0700

sigmaci=0. 0474 0. 1460

结果表明均值L 的估计值为5. 0100, 其置信度为95%的置信区间为(4. 9500, 5. 0700) , 这与标准差R 未知时运用数理统计公式和查T 分布临界值表计算的结果一致; 标准差R 的估计值为0. 0717, 其置信度为95%的置信区间为(0. 0474, 0. 1460) , 这与均值L 未知时运用数理统计公式和查卡方分布临界值表计算的结果一致.

但在计算标准差R 已知时均值L 的置信区间和均值L 已知时标准差R 的置信区间方面有较大的误收稿日期:2010-01-05

作者简介:陈少云(1969-) , 男, 重庆合川人, 现为四川建筑职业技术学院副教授. 研究方向:高等数学教学.

差. 下面是结合数理统计知识设计的MATLAB 程序求解标准差R 已知时均值L 的置信区间和均值L 已知时标准差R 的置信区间的两个例子.

1 标准差R 已知时正态总体均值L 的区间估计

由数理统计知识, 标准差R 已知时正态总体均值的区间估计应采用U 统计量, 置信度为1-A 的L 置信区间为( x -u A /2R /n , x +u A /2R /n). 其中u A /2=u(1-A /2).

2例2 某课程命题初衷, 其成绩F ~N(L , 1315) , 考毕抽查其中10份试卷的成绩为:

74 95 81 43 62 52 86 78 74 67

试求该课程平均成绩L 的置信区间. (置信度1-A =0195)

解 在MATLAB 的编辑窗口建立如下的M-文件(并保存为myfun1. m) , 以便以后套用.

alpha=0. 05; %给定的显著性水平

sigma=13. 5;

n =length(x) ;

mu=mean(x)

u=norminv(1-alpha/2, 0, 1) ; %已知的标准差%计算样本容量%计算并显示样本均值%计算置信度为1-alpha/2的正态分布临界值x =[74 95 81 43 62 52 86 78 74 67];

muci=[mu-u*sqrt(sigma^2/n) , mu+u*sqrt(sigma^2/n) ] %输出置信区间

运行后显示结果为

mu=71. 2000

muci=62. 8328 79. 5672

即置信度为0. 95时均值L 的置信区间为(62. 8328, 79. 5672). 这与运用数理统计公式和查标准正态分布函数数值表计算的结果完全一致.

运用normfit() 函数计算该问题的结果为

muhat=71. 2000

muci=59. 9912 82. 4088

在相同置信度0. 95时均值L 的置信区间为(59. 9912, 82. 4088) , 误差较大.

2 均值L 已知时正态总体标准差R 的区间估计

根据数理统计知识, 均值L 已知时正态总体标准差R 的区间估计采用自由度为n 的卡方统计量, 置信度为1-A 的R 置信区间为E (F i -L ) =1

1

其中K 1=V (1-A /2; n) , K 2=V (A /2; n ).

例3 设总体F ~N (L , R 2) , R 为待估参数. 样本的一组观察值为(14. 6, 15. 1, 14. 9, 14. 8, 15. 2, 15. 1) , 置信度为95%, 求L =14. 5时R 的置信区间.

解 建立如下M -文件(并保存为myfun2. m)

alpha=0. 05; %给定的显著性水平

x =[14. 6, 15. 1, 14. 9, 14. 8, 15. 2, 15. 1];

n =length(x) ;

mu=14. 5;

chi2=sum((x-mu). ^2);

lambda1=chi2inv(1-alpha/2, n) ; %样本数据%计算样本容量%给定的样本均值%计算离差的平方和%计算卡方分布的临界值222,

E (F i -L ) =122

lambda2=chi2inv(alpha/2, n) ;

sigma=[sqrt(chi2/lambda1) , sqrt(chi2/lambda2) ] %计算方差的置信区间

运行后结果显示为

sigma=0. 3190 1. 0900

即置信度为95%时所求的置信区间为(0. 3190, 1. 0900) , 这与运用数理统计公式和查卡方分布临界值表计算的结果完全一致.

运用normfit() 函数计算该问题的结果为

sigmaci=0. 1410 0. 5539

在相同置信度95%下的置信区间为(0. 1410, 0. 5539) , 误差极大.

综上所述, 在计算标准差R 已知时均值L 的置信区间和均值L 已知时标准差R 的置信区间不能再套用MATLAB 所提供的现成函数normfit() , 而必须重新编写程序. 笔者在本文中写出的程序较好地解决了这两个问题的MATLAB 实现并且有较强的实用性, 有兴趣的读者只需调整显著性水平和更改样本数据便可求出实际问题在给定置信度下的相应置信区间.

参 考 文 献

[1]金炳陶. 概率论与数理统计[M]. 北京:高等教育出版社, 2002.

[2]薛定宇, 陈阳泉. 高等应用数学问题的MA TLAB 求解[M]. 北京:清华大学出版社, 2004.

Interval Estimation of Normal Population Parameter by MATLAB

C HE N Shao -yun

(Computer Science Department, Sichuan College of Archi tectural Tec hnology, Deyang 618000, Chi na)

Abstract:This article introduces the advantages and disadvantages of Normfit() function solution to interval estimation of normal population para meter in software MATLAB. With examples, the author has written a MATLAB program to solve the confidence interval of:1) the expec tation L when the standard deviation R is kno wn; and 2) the standard deviation R when the expectation L is known, which makes up the deficiency of Nor mfit() function.

Key words:nor mal population; e xpectation; standard deviation; c onfidence interval

(上接第75页)

References

[1]G. Q. Chen and D. H. Wang, The Cauchy Proble m for Euler Equations for compressi ble Fluids. Hanbook of Mathematical Fluid Dynamoics[J]. Vol. I, 421-543, North -Holland, Ams erda m, 2002.

[2]M.W. Yuen, Analytical Bl owup solutions to the 2-di mens ion. isothermal Euler -Possion equations of gaseous stars II. arXi v:0906. 0176v1

[3]M.W. Yuen, Analytical Bl owup solutions to the is othermal Euler -Possi on equations of gaseous s tars i n arXi v:0906. 0178v1

[4]T.C. Si deris, Formati on of singularitier i n Three -di mensi onal Compressible Fl uids, Comm. Math. Phys. 101(1985) , No. 4, 475-485

[5]P. L. Lions, M athe matical Topics in Fluid Mechanics. Volume 1, 2, 1998, Oxford:Clarendon Press, 1998.

[6]M.W. Yuen, Analytical soluti ons to the Navier -stokes equations. arXi v:0811. 0377v1[Math-Ph]3Nov. 2008.

[7]T.H. Li, Some s pecial solutions of the multidi mensional Euler equations i n, Comm. Pure Appl. Anal. 4(4) (2005) 757-762.

不可压纳维-斯托克斯方程的解析解

阎小丽, 邓慧琳

(河南理工大学数学与信息科学学院, 河南焦作454000)

摘 要:本文主要构造不可压纳维-斯托克斯方程的解析解.

-斯托克斯方程; 不可压关键词:欧拉方程; 纳维

2010年2月

第1期吉林师范大学学报(自然科学版) Journal of Jilin Normal University (NaturalScience Edition) l . 1Feb. 2010

正态总体参数区间估计的MATLAB 实现

陈少云

(四川建筑职业技术学院计算机系, 四川德阳618000)

摘 要:本文介绍了MATLAB 软件的normfit() 函数在求解正态总体参数的区间估计中的长处和短处, 结合实例编写了MATLAB 程序求解标准差R 已知时均值L 的置信区间和均值L 已知时标准差R 的置信区间, 弥补了normfit() 函数在该方面的不足.

关键词:正态总体; 均值; 标准差; 置信区间

中图分类号:O212. 2 文献标识码:A 文章编号:1674-3873-(2010) 01-0076-03

0 引言

总体参数的点估计作为待估参数的近似值给出了明确的数量描述, 在统计分析中有多方面的应用. 但点估计没有给出这种近似的精确程度和可信程度, 使其在实际应用中受到很大的限制, 区间估计却可以弥补这一不足.

在工程技术中广泛使用的数学软件MATLAB 提供了现成的函数normfit() 可以很方便地求出正态总体标准差R 未知时均值L 的置信区间和均值L 未知时标准差R 的置信区间, 与数理统计公式和查相关的临界值表计算的结果完全吻合.

其函数调用格式为:[muhat,sigmahat, muci, sigmaci]=normfit(x, alpha). 其中muhat, sigmahat 分别为正态分布的参数L 和R 的估计值, muci, sigmaci 分别为它们的置信区间, 置信度为(1-alpha) @100%, alpha 为显著性水平.

例1 商店用机器包装某种商品, 每包重量X 服从正态分布, 为检查包装的质量, 对机器包装的商品抽测8包, 其重量为

5. 08 4. 97 5. 12 5. 05 4. 95 4. 90 5. 00 5. 01

试估计机器包装的商品重量的均值L 和标准差R 的置信度为0. 95的置信区间

解 在MATLAB 的命令窗口输入如下语句

>>x =[5. 08 4. 97 5. 12 5. 05 4. 95 4. 90 5. 00 5. 01];

>>[muhat, sigmahat, muci, sigmaci]=nor mfit(x, 0. 05)

结果显示为

muhat=5. 0100

sigmahat=0. 0717

muci=4. 9500 5. 0700

sigmaci=0. 0474 0. 1460

结果表明均值L 的估计值为5. 0100, 其置信度为95%的置信区间为(4. 9500, 5. 0700) , 这与标准差R 未知时运用数理统计公式和查T 分布临界值表计算的结果一致; 标准差R 的估计值为0. 0717, 其置信度为95%的置信区间为(0. 0474, 0. 1460) , 这与均值L 未知时运用数理统计公式和查卡方分布临界值表计算的结果一致.

但在计算标准差R 已知时均值L 的置信区间和均值L 已知时标准差R 的置信区间方面有较大的误收稿日期:2010-01-05

作者简介:陈少云(1969-) , 男, 重庆合川人, 现为四川建筑职业技术学院副教授. 研究方向:高等数学教学.

差. 下面是结合数理统计知识设计的MATLAB 程序求解标准差R 已知时均值L 的置信区间和均值L 已知时标准差R 的置信区间的两个例子.

1 标准差R 已知时正态总体均值L 的区间估计

由数理统计知识, 标准差R 已知时正态总体均值的区间估计应采用U 统计量, 置信度为1-A 的L 置信区间为( x -u A /2R /n , x +u A /2R /n). 其中u A /2=u(1-A /2).

2例2 某课程命题初衷, 其成绩F ~N(L , 1315) , 考毕抽查其中10份试卷的成绩为:

74 95 81 43 62 52 86 78 74 67

试求该课程平均成绩L 的置信区间. (置信度1-A =0195)

解 在MATLAB 的编辑窗口建立如下的M-文件(并保存为myfun1. m) , 以便以后套用.

alpha=0. 05; %给定的显著性水平

sigma=13. 5;

n =length(x) ;

mu=mean(x)

u=norminv(1-alpha/2, 0, 1) ; %已知的标准差%计算样本容量%计算并显示样本均值%计算置信度为1-alpha/2的正态分布临界值x =[74 95 81 43 62 52 86 78 74 67];

muci=[mu-u*sqrt(sigma^2/n) , mu+u*sqrt(sigma^2/n) ] %输出置信区间

运行后显示结果为

mu=71. 2000

muci=62. 8328 79. 5672

即置信度为0. 95时均值L 的置信区间为(62. 8328, 79. 5672). 这与运用数理统计公式和查标准正态分布函数数值表计算的结果完全一致.

运用normfit() 函数计算该问题的结果为

muhat=71. 2000

muci=59. 9912 82. 4088

在相同置信度0. 95时均值L 的置信区间为(59. 9912, 82. 4088) , 误差较大.

2 均值L 已知时正态总体标准差R 的区间估计

根据数理统计知识, 均值L 已知时正态总体标准差R 的区间估计采用自由度为n 的卡方统计量, 置信度为1-A 的R 置信区间为E (F i -L ) =1

1

其中K 1=V (1-A /2; n) , K 2=V (A /2; n ).

例3 设总体F ~N (L , R 2) , R 为待估参数. 样本的一组观察值为(14. 6, 15. 1, 14. 9, 14. 8, 15. 2, 15. 1) , 置信度为95%, 求L =14. 5时R 的置信区间.

解 建立如下M -文件(并保存为myfun2. m)

alpha=0. 05; %给定的显著性水平

x =[14. 6, 15. 1, 14. 9, 14. 8, 15. 2, 15. 1];

n =length(x) ;

mu=14. 5;

chi2=sum((x-mu). ^2);

lambda1=chi2inv(1-alpha/2, n) ; %样本数据%计算样本容量%给定的样本均值%计算离差的平方和%计算卡方分布的临界值222,

E (F i -L ) =122

lambda2=chi2inv(alpha/2, n) ;

sigma=[sqrt(chi2/lambda1) , sqrt(chi2/lambda2) ] %计算方差的置信区间

运行后结果显示为

sigma=0. 3190 1. 0900

即置信度为95%时所求的置信区间为(0. 3190, 1. 0900) , 这与运用数理统计公式和查卡方分布临界值表计算的结果完全一致.

运用normfit() 函数计算该问题的结果为

sigmaci=0. 1410 0. 5539

在相同置信度95%下的置信区间为(0. 1410, 0. 5539) , 误差极大.

综上所述, 在计算标准差R 已知时均值L 的置信区间和均值L 已知时标准差R 的置信区间不能再套用MATLAB 所提供的现成函数normfit() , 而必须重新编写程序. 笔者在本文中写出的程序较好地解决了这两个问题的MATLAB 实现并且有较强的实用性, 有兴趣的读者只需调整显著性水平和更改样本数据便可求出实际问题在给定置信度下的相应置信区间.

参 考 文 献

[1]金炳陶. 概率论与数理统计[M]. 北京:高等教育出版社, 2002.

[2]薛定宇, 陈阳泉. 高等应用数学问题的MA TLAB 求解[M]. 北京:清华大学出版社, 2004.

Interval Estimation of Normal Population Parameter by MATLAB

C HE N Shao -yun

(Computer Science Department, Sichuan College of Archi tectural Tec hnology, Deyang 618000, Chi na)

Abstract:This article introduces the advantages and disadvantages of Normfit() function solution to interval estimation of normal population para meter in software MATLAB. With examples, the author has written a MATLAB program to solve the confidence interval of:1) the expec tation L when the standard deviation R is kno wn; and 2) the standard deviation R when the expectation L is known, which makes up the deficiency of Nor mfit() function.

Key words:nor mal population; e xpectation; standard deviation; c onfidence interval

(上接第75页)

References

[1]G. Q. Chen and D. H. Wang, The Cauchy Proble m for Euler Equations for compressi ble Fluids. Hanbook of Mathematical Fluid Dynamoics[J]. Vol. I, 421-543, North -Holland, Ams erda m, 2002.

[2]M.W. Yuen, Analytical Bl owup solutions to the 2-di mens ion. isothermal Euler -Possion equations of gaseous stars II. arXi v:0906. 0176v1

[3]M.W. Yuen, Analytical Bl owup solutions to the is othermal Euler -Possi on equations of gaseous s tars i n arXi v:0906. 0178v1

[4]T.C. Si deris, Formati on of singularitier i n Three -di mensi onal Compressible Fl uids, Comm. Math. Phys. 101(1985) , No. 4, 475-485

[5]P. L. Lions, M athe matical Topics in Fluid Mechanics. Volume 1, 2, 1998, Oxford:Clarendon Press, 1998.

[6]M.W. Yuen, Analytical soluti ons to the Navier -stokes equations. arXi v:0811. 0377v1[Math-Ph]3Nov. 2008.

[7]T.H. Li, Some s pecial solutions of the multidi mensional Euler equations i n, Comm. Pure Appl. Anal. 4(4) (2005) 757-762.

不可压纳维-斯托克斯方程的解析解

阎小丽, 邓慧琳

(河南理工大学数学与信息科学学院, 河南焦作454000)

摘 要:本文主要构造不可压纳维-斯托克斯方程的解析解.

-斯托克斯方程; 不可压关键词:欧拉方程; 纳维


相关文章

  • 第十章 数据的统计描述和分析
  • 第十章 数据的统计描述和分析 数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是 以 概率论为基础的一门应用学科. 数据样本少则几个,多则成千上万,人们希望能用少数几 个包含其多相关信息的 数值来体现数据样本总体的规律 ...查看


  • 概率统计建模讲义(重要分布举例卡方检验)
  • 数理统计例举 王晓谦 [email protected] 南京师范大学 主要内容 随机变量及其分布 经验分布函数和频率直方图 参数估计 假设检验 相关分析与回归分析简介 例题 例1能量供应问题(二项分布) 例2 放射性 (泊松) 例3正态分布 ...查看


  • 小样本统计
  • 第18课 小样本统计 小样本 当样本容量N 较小时,分布特性的估计量a (均值. 方差.90%百分位值等)通常不是正态分布的. 在这种情况下,估计值 和标准化统计量z 的 (用来得到置信区间和假设检验)可 以用随机模拟进行近似. 为了在随机 ...查看


  • 合金强度与碳含量的回归分析
  • 成 绩 评 定 表 课程设计任务书 摘 要 数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占有很重要的地位.对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论:对于非正态总体期望和方差的区间估计和假设检验问题,在 ...查看


  • matlab中normfit在正态分布中的使用技巧
  • matlab中normfit在正态分布中的使用技巧如下: 函数 normfit 格式 [muhat,sigmahat,muci,sigmaci] = normfit(X) [muhat,sigmahat,muci,sigmaci] = no ...查看


  • 银行不良贷款论文
  • 银行不良贷款问题 摘要 商业银行是对项目建设.固定资产投资等进行贷款.虽然我国银行贷款额平稳增长,但是商业银行普遍存在的比例较高的呆.坏帐和逾期贷款等不良贷款问题,使不良贷款率过高,给银行贷款业务的发展带来较大压力. 问题一,收集四大行相关 ...查看


  • 方差分析 线性回归
  • 1 线性回归 1.1 原理分析 要研究最大积雪深度x 与灌溉面积y 之间的关系,测试得到近10年的数据如下表: 使用线性回归的方法可以估计x 与y 之间的线性关系. 线性回归方程式: 对应的估计方程式为 线性回归完成的任务是,依据观测数据集 ...查看


  • 非平稳时间序列的建模研究
  • 非 平 稳 时 间 序 列 的 建 模 方 法 研 究 林 卉 武 汉 理 工 大 学 (申请理学硕士学位论文) 非平稳时间序列的建模方法研究 培养单位 :理学院 学科专业 :应用数学 研 究 生 :林 卉 指导教师 :童恒庆 教授 200 ...查看


  • 数学建模降价折扣券对消费者的影响
  • 数学建模 第四次大作业 姓 名 学 号 刘 维 20116554 林胜军 20116552 王 波 201165 降价折扣券对顾客消费行为的影响 [摘要]本文针对降价折扣券对顾客消费行为影响的研究,通过调查数据以及图表分析,建立统计回归模型 ...查看


热门内容