新乡学院数学与信息科学系
实验报告
实验项目名称 所属课程名称 实 验 类 型 实 验 日 期 数据的统计分析 数学实验 综合性实验 2013-5-20
班 学 姓 成
级 号 名 绩
一、实验概述:
【实验目的】 本实验利用 matlab 来清晰直观的画出概率密度函数曲线, 通过画图来对这些概率密度函数曲线 来有个直观的认识,对数据分布的形态猜测,对某些概率分布的密度函数的估计以及简单的正态 假设检验,来找到生活中的数据的一些规律。
【实验原理】 1. 概率密度函数 pdf 系列.以 normpdf( )为例,调用格式: y=normpdf(x, mu,sigma), 计算参数为 mu 和 sigma 的样本数据 x 的正态概率密度函数. 参数 sigma 必须为正. 其 中:mu 为均值,sigma 为标准差. 2. 参数估计 fit 系列.以 normfit( )为例,调用格式: [muhat, sigmahat, muci, sigmaci] = normfit(x, alpha), 对样本数据 x 进行参数估计,并计算置信度为 100(1-alpha)%的置信区间.如 alpha=0.01 时, 则给出置信度为 99%的置信区间. 不写明 alpha, 即表示 alpha 取 0.05. 3.load( )函数.调用格式: S = load('数据文件') 将纯数据文件(文本文件)中的数据导入 Matlab,S 是双精度的数组,其行数、 列数与数据文件相一致. 4. ttest(x,m,alpha) 函数: 假设检验函数. 此函数对样本数据 x 进行显著性水平为 alpha 的 t 假设检验,以检验正态分布样本 x(标准差未知)的均值是否为 m.h=1 表示拒绝 零假设,h=0 表示不能拒绝零假设. 【实验环境】 Matlab 7.1.0 Microsoft Windows 7
二、实验内容: 【实验方案】
1. 写出书中未介绍的 10 种概率分布的密度函数(Beta 分布,Gamma 分布,超几何分布,对数 正态分布、、,写出它们的密度函数表达式,并画出相应的图形。 、) 8. 用该函数求解如下问题:某种电子元件的寿命 X(以小时计)服从正态分布, , 均未知, 现测得 16 只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问当取 alpha=0.5 时, (1)是否有理由认为元件的平均寿命不大于 225 小时?(2)是否有理由
1
认为元件的平均寿命不大于 295 小时? 9. 查看函数 ttest2()的用法,并用于处理 Matlab 统计工具中的数据文件 gas.mat.回答问题:一月 份油价 price1 与二月份油价 price2 的均值是否相同?
【实验过程】 (实验步骤、记录、数据、分析)
1. (1) :Beta 函数的分布 密度函数如下:
x=-5:0.2:5; y=betapdf(x,0,1); y1=betapdf(x,1,2); y2=betapdf(x,3,2); y3=betapdf(x,0.5,2); y4=betapdf(x,2,0.5); plot(x,y,'.',x,y1,'-',x,y2,':',x,y3,'--',x,y4,'+')
2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 -5 data1 data2 data3 data4 data5
-4
-3
-2
-1
0
1
2
3
4
5
(2) Gamma 函数的分布
2
密度函数如
下:
x=-1:0.5:10; y=gampdf(x,0.5,2); y1=gampdf(x,1,2); y2=gampdf(x,1.5,2); y3=gampdf(x,2,2); y4=gampdf(x,3,2); plot(x,y,'.',x,y1,'-',x,y2,':',x,y3,'--',x,y4,'+')
0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -2 data1 data2 data3 data4 data5
0
2
4
6
8
10
(3) 超几何分布
x=0:8; y= hygepdf(x,100,20,10); plot(x,y);
3
0.35 data1 0.3
0.25
0.2
0.15
0.1
0.05
0
0
1
2
3
4
5
6
7
8
(4) 对数正态分布
密度函数如下
x = (10:100:10000); y = lognpdf(x,log(20000),1.0); plot(x,y);
4
3.5
x 10
-5
3
2.5
2
1.5
1
0.5
0
0
1000
2000
3000
4000
5000
6000
7000
8000
9000 10000
(5) 负二项分布
x=0:40; y=nbinpdf(x,10,0.6); plot(x,y)
5
0.14 data1 0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
30
35
40
(6) :F 分布
密度函数如下
;
x = (0.01:0.1:10.01); y= ncfpdf(x,5,20,10); plot(x,y);
6
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0
2
4
6
8
10
12
(7) 非负中心 t 分布
密度函数如下
( n 1 ) n 1 2 x^2 2 2 (1 ) n n n
p(x)=
x
x = (0:0.1:10); y= nctpdf(x,4,2); plot(x,y);
7
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0
1
2
3
4
5
6
7
8
9
10
(8) 非负中心卡方分布 密度函数如下 p(x)=
x
n2 exp 2
n x 2
n 2 2 ( ) 2
x>2
x=0:0.01:20; y=ncx2pdf(x,6,5); plot(x,y);
8
0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0
0
2
4
6
8
10
12
14
16
18
20
(9) 瑞利分布
其密度函数如下 p(x)=
x 2b ^ 2 ,
x^2
x=0:0.01:20; y=raylpdf(x,6); plot(x,y);
9
0.12
0.1
0.08
0.06
0.04
0.02
0
0
2
4
6
8
10
12
14
16
18
20
(10) Weibull 分布 密度函数如下 P(x)= x1 e x ,x>=0
x=0:0.01:5; y=weibpdf(x,1,6); plot(x,y);
10
2.5
2
1.5
1
0.5
0
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
8. 用该函数求解如下问题:某种电子元件的寿命 X(以小时计)服从正态分布, , 均未知,
现测得 16 只元件的寿命如下: 160 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170
问当取 alpha=0.5 时, (1)是否有理由认为元件的平均寿命不大于 225 小时?(2)是否有理由 认为元件的平均寿命不大于 295 小时?
解:
(1) 、认为元件的平均寿命不大于 225 小时是合理的。 x=[159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170] h=ttest(x,225,0.05,1) x= Columns 1 through 12 159 280 101 212 224 379 179 264 222 362 Columns 13 through 16 149 260 485 170 h=0 (2) 、认为元件的平均寿命不大于 295 小时是合理的。 x=[159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170] h=ttest(x,295,0.05,1) x= Columns 1 through 12 159 280 101 212 224 379 179 264 222 362 Columns 13 through 16 149 260 485 170
168
250
168
250
11
h=0 9. 查看函数 ttest2()的用法,并用于处理 Matlab 统计工具中的数据文件 gas.mat.回答问题:一 月份油价 price1 与二月份油价
price2 的均值是否相同? 解: load gas prices = [price1 price2]; [h,pvalue,ci] = ztest(price1/100,1.15,0.04) [h,pvalue,ci] = ttest(price2/100,1.15) [h,sig,ci] = ttest2(price1,price2) h=0 pvalue = 0.8668 ci = 1.1340 1.1690 h=1 pvalue = 4.9517e-004 ci =1.1675 1.2025 h=1 sig = 0.0083 ci =-5.7845 -0.9155 最后输出 h=1,所以一月份油价 price1 与二月份油价 price2 的均值不相同。
【实验小结】 (收获体会)
掌握用 matlab 求分布(如 Beta 分布, Gamma 分布,负二项分布,对数正态分布等分布 )的 方法,并求出它们的密度函数和画出它们的图形。通过对概率密度曲线的绘制,使我们更加直观 的认识到数据的统计分析的重要性,很好的掌握 ttest 函数的用法和均值的问题。 利用函数来快速找到数据之间的规律,来做些正态假设检验,方便简单。
12
新乡学院数学与信息科学系
实验报告
实验项目名称 所属课程名称 实 验 类 型 实 验 日 期 数据的统计分析 数学实验 综合性实验 2013-5-20
班 学 姓 成
级 号 名 绩
一、实验概述:
【实验目的】 本实验利用 matlab 来清晰直观的画出概率密度函数曲线, 通过画图来对这些概率密度函数曲线 来有个直观的认识,对数据分布的形态猜测,对某些概率分布的密度函数的估计以及简单的正态 假设检验,来找到生活中的数据的一些规律。
【实验原理】 1. 概率密度函数 pdf 系列.以 normpdf( )为例,调用格式: y=normpdf(x, mu,sigma), 计算参数为 mu 和 sigma 的样本数据 x 的正态概率密度函数. 参数 sigma 必须为正. 其 中:mu 为均值,sigma 为标准差. 2. 参数估计 fit 系列.以 normfit( )为例,调用格式: [muhat, sigmahat, muci, sigmaci] = normfit(x, alpha), 对样本数据 x 进行参数估计,并计算置信度为 100(1-alpha)%的置信区间.如 alpha=0.01 时, 则给出置信度为 99%的置信区间. 不写明 alpha, 即表示 alpha 取 0.05. 3.load( )函数.调用格式: S = load('数据文件') 将纯数据文件(文本文件)中的数据导入 Matlab,S 是双精度的数组,其行数、 列数与数据文件相一致. 4. ttest(x,m,alpha) 函数: 假设检验函数. 此函数对样本数据 x 进行显著性水平为 alpha 的 t 假设检验,以检验正态分布样本 x(标准差未知)的均值是否为 m.h=1 表示拒绝 零假设,h=0 表示不能拒绝零假设. 【实验环境】 Matlab 7.1.0 Microsoft Windows 7
二、实验内容: 【实验方案】
1. 写出书中未介绍的 10 种概率分布的密度函数(Beta 分布,Gamma 分布,超几何分布,对数 正态分布、、,写出它们的密度函数表达式,并画出相应的图形。 、) 8. 用该函数求解如下问题:某种电子元件的寿命 X(以小时计)服从正态分布, , 均未知, 现测得 16 只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问当取 alpha=0.5 时, (1)是否有理由认为元件的平均寿命不大于 225 小时?(2)是否有理由
1
认为元件的平均寿命不大于 295 小时? 9. 查看函数 ttest2()的用法,并用于处理 Matlab 统计工具中的数据文件 gas.mat.回答问题:一月 份油价 price1 与二月份油价 price2 的均值是否相同?
【实验过程】 (实验步骤、记录、数据、分析)
1. (1) :Beta 函数的分布 密度函数如下:
x=-5:0.2:5; y=betapdf(x,0,1); y1=betapdf(x,1,2); y2=betapdf(x,3,2); y3=betapdf(x,0.5,2); y4=betapdf(x,2,0.5); plot(x,y,'.',x,y1,'-',x,y2,':',x,y3,'--',x,y4,'+')
2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 -5 data1 data2 data3 data4 data5
-4
-3
-2
-1
0
1
2
3
4
5
(2) Gamma 函数的分布
2
密度函数如
下:
x=-1:0.5:10; y=gampdf(x,0.5,2); y1=gampdf(x,1,2); y2=gampdf(x,1.5,2); y3=gampdf(x,2,2); y4=gampdf(x,3,2); plot(x,y,'.',x,y1,'-',x,y2,':',x,y3,'--',x,y4,'+')
0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -2 data1 data2 data3 data4 data5
0
2
4
6
8
10
(3) 超几何分布
x=0:8; y= hygepdf(x,100,20,10); plot(x,y);
3
0.35 data1 0.3
0.25
0.2
0.15
0.1
0.05
0
0
1
2
3
4
5
6
7
8
(4) 对数正态分布
密度函数如下
x = (10:100:10000); y = lognpdf(x,log(20000),1.0); plot(x,y);
4
3.5
x 10
-5
3
2.5
2
1.5
1
0.5
0
0
1000
2000
3000
4000
5000
6000
7000
8000
9000 10000
(5) 负二项分布
x=0:40; y=nbinpdf(x,10,0.6); plot(x,y)
5
0.14 data1 0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
30
35
40
(6) :F 分布
密度函数如下
;
x = (0.01:0.1:10.01); y= ncfpdf(x,5,20,10); plot(x,y);
6
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0
2
4
6
8
10
12
(7) 非负中心 t 分布
密度函数如下
( n 1 ) n 1 2 x^2 2 2 (1 ) n n n
p(x)=
x
x = (0:0.1:10); y= nctpdf(x,4,2); plot(x,y);
7
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0
1
2
3
4
5
6
7
8
9
10
(8) 非负中心卡方分布 密度函数如下 p(x)=
x
n2 exp 2
n x 2
n 2 2 ( ) 2
x>2
x=0:0.01:20; y=ncx2pdf(x,6,5); plot(x,y);
8
0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0
0
2
4
6
8
10
12
14
16
18
20
(9) 瑞利分布
其密度函数如下 p(x)=
x 2b ^ 2 ,
x^2
x=0:0.01:20; y=raylpdf(x,6); plot(x,y);
9
0.12
0.1
0.08
0.06
0.04
0.02
0
0
2
4
6
8
10
12
14
16
18
20
(10) Weibull 分布 密度函数如下 P(x)= x1 e x ,x>=0
x=0:0.01:5; y=weibpdf(x,1,6); plot(x,y);
10
2.5
2
1.5
1
0.5
0
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
8. 用该函数求解如下问题:某种电子元件的寿命 X(以小时计)服从正态分布, , 均未知,
现测得 16 只元件的寿命如下: 160 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170
问当取 alpha=0.5 时, (1)是否有理由认为元件的平均寿命不大于 225 小时?(2)是否有理由 认为元件的平均寿命不大于 295 小时?
解:
(1) 、认为元件的平均寿命不大于 225 小时是合理的。 x=[159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170] h=ttest(x,225,0.05,1) x= Columns 1 through 12 159 280 101 212 224 379 179 264 222 362 Columns 13 through 16 149 260 485 170 h=0 (2) 、认为元件的平均寿命不大于 295 小时是合理的。 x=[159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170] h=ttest(x,295,0.05,1) x= Columns 1 through 12 159 280 101 212 224 379 179 264 222 362 Columns 13 through 16 149 260 485 170
168
250
168
250
11
h=0 9. 查看函数 ttest2()的用法,并用于处理 Matlab 统计工具中的数据文件 gas.mat.回答问题:一 月份油价 price1 与二月份油价
price2 的均值是否相同? 解: load gas prices = [price1 price2]; [h,pvalue,ci] = ztest(price1/100,1.15,0.04) [h,pvalue,ci] = ttest(price2/100,1.15) [h,sig,ci] = ttest2(price1,price2) h=0 pvalue = 0.8668 ci = 1.1340 1.1690 h=1 pvalue = 4.9517e-004 ci =1.1675 1.2025 h=1 sig = 0.0083 ci =-5.7845 -0.9155 最后输出 h=1,所以一月份油价 price1 与二月份油价 price2 的均值不相同。
【实验小结】 (收获体会)
掌握用 matlab 求分布(如 Beta 分布, Gamma 分布,负二项分布,对数正态分布等分布 )的 方法,并求出它们的密度函数和画出它们的图形。通过对概率密度曲线的绘制,使我们更加直观 的认识到数据的统计分析的重要性,很好的掌握 ttest 函数的用法和均值的问题。 利用函数来快速找到数据之间的规律,来做些正态假设检验,方便简单。
12