统计学
基础第七讲:假设检验甄峰中国人民大学统计学院2015年4
月
学习目标
•了解假设检验的基本思想和原理
•掌握一个总体参数的检验方法
•掌握两个总体参数的检验方法
内容
•假设检验的基本问题
•一个总体参数的检验
•
两个总体参数的检验
1.0 假设检验的地位
•为什么要进行假设检验:通过对样本的观察,发现•例:商家称某产品容量500克,但抽取n个样品,发现都低于500克,是抽样误差,还是总体本身有问题?
•假设检验:事先作出关于总体参数、分布形式、相互关系等的命题(假设),然后通过样本信息来判断该命题是否成立(检验)
•小概率事件在一次试验中几乎不会发生
•如总体假设真实(例如学生上课平均出勤率≥95%),那么不利于或不能支持这一假设的事件A(小概率事件,例如样本出勤率=55% )在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了(样本出勤率=55% ),就有理由怀疑该假设的真实性,拒绝提出的假设。•英国统计学家费希尔把小概率的标准定为0.05
1.2 假设检验的步骤
•根据实际问题提出一对假设(原假设和备择假设)
•构造某个适当的检验统计量,并确定其在原假设成立时的分布
•根据观测的样本计算检验统计量的值
•根据犯第一类错误的损失规定显著性水平α
•根据确定检验统计量的临界值并进而给出拒绝域,或者计算p值等
•结论:根据决策规则得出或原假设的结论注意“不能拒绝原假设”不同于“接受原假设”
1.3 关于‘假设’的基本概念
•什么是假设:对总体参数的具体数值所作的陈述•例:某地人均预期寿命为76岁
某行业的平均工资水平为5000元/月
某产品的合格率为99%
•原假设(零假设):研究者想搜集证据予以反对的,H0•备择假设:研究者想搜集证据予以支持的,H1–特点:原假设和备择假设互斥,即只有一个正确
等号必须出现在H0中
检验以“原假设为真”开始,出现矛盾则H1正确
•常用检验形式:双侧检验,左侧检验和右侧检验双侧检验单侧检验
左侧检验右侧检验
H0μ = μ0μ ≥μ0μ ≤μ0
H1μ ≠μ0μ μ0
原假设和备择假设的设定:
•把不能轻易否定的假设作为原假设
•把现状作为原假设(现状不能轻易否决,有存在的合理性)
•通常把研究者要证明的假设作为备择假设•将所作出的声明作为原假设
——不轻易否定现状!
1.3 关于‘假设’的基本概念• P5例: H0 : μ=500, H1 : μ ≠500 • 例2:某汽车平均每加仑汽油可以行驶24英里。一种新工 艺可提高每加仑汽油的行驶里程。为了检验新的工艺是否 有效: – 要证明μ>24:H0: μ≤24 H1:μ>24School of Statistics, Renmin University of China11
1.4 检验统计量与拒绝域• 检验统计量:根据样本观测结果计算出的对原假设和备择假 设做出决策的某个样本统计量。例如,大样本条件下总体均 x − μ0 类似于标准分数的转化 值的检验统计量为z=σ/ n• 拒绝域:检验统计量取值的集合中,当根据样本得到的检验 统计量的值属于该集合时,拒绝原假设School of Statistics, Renmin University of China12
1.4 检验统计量与拒绝域• 检验统计量的由来:从原始值到标准化值 • 以Η0 : μ =μ0为例,原假设成立下样本均值x 应在μ0附近x原始分布μ0f(x)α/2 1-α α/2a=-1.96School of Statistics, Renmin University of China0b=1.96ZN(0,1) 或t分布13
1.5 两类错误与显著性水平• 第Ⅰ类错误:原假设正确时拒绝原假设,发生概率为α • 第Ⅱ类错误:原假设错误时未拒绝原假设,发生概率为β • 显著性水平:能够容忍的犯第Ⅰ类错误的最大概率(上限值)实际情况 Η0为真 正确 第一类错误(α) 弃真 Η0为假 第二类错误(β) 取伪 正确决策 不拒绝Η0 拒绝Η0School of Statistics, Renmin University of China14
1.5 两类错误与显著性水平• 两类错误不可避免:对于一定样本量 n,要减小其中一种 错误,通常只能通过增加另一种错误的方法做到 • 假设检验中通常首先控制第一类错误的概率不超过某个小 概率水平α,在满足该条件的要求下使犯第二类错误的概 率尽量小 • 显著性水平 α 常取0.01,0.05,0.1 • 根据 α 可以确定检验统计量的临界值,并根据统计量的样 本观测值和临界值得出检验结论School of Statistics, Renmin University of China15
1.6 决策:检验统计量 vs. P值• 例:某厂生产袋装麦片重量服从正态分布,每袋平均重量 570g,标准差为8g。由于更换生产线,标准差不会变,但 不知平均装袋重量是否改变,从新生产线抽取30个样品, 得平均重量为573g,能否认为平均质量无显著变化?(α=5%)(1) 提出零假设和备择假设 (2) 选择检验统计量 (3) 检验统计量的观测值H 0 : μ = 570 H1 : μ ≠ 570x − μ0 z= ~ N ( 0,1) σ/ nz obs x − μ 0 573 − 570 = = = 2.05 σ/ n 8 / 3016School of Statistics, Renmin University of China
1.6 决策:检验统计量 vs. P值(4-1) 显著性水平等于0.05, Zobs=2.05 Æ比较Zobs和Za/2 产品 重量μ0=570x原始分布f(x)α/2 1-α α/2统计量的观测 值Zobs=2.05−Ζ a/2 =-1.96 −ΖSchool of Statistics, Renmin University of China0Ζ α/2 =1.96Z N(0,1)17
1.6 决策:检验统计量 vs. P值(4-2) 显著性水平等于0.05, Zobs=2.05 Æp-=0.04036 Æ比较p-和α1/2 p-值α 1/2 p-值-1.96 1.96-2.0502.05Zp值也称为观测到的显著性水平, 是能拒绝H0 的α的最小值, 决策规则: p值
1.6 决策:检验统计量 vs. P值比较:• 统计量检验是事先给出一个显著 性水平为决策依据,无法知道实 际的显著性水平究竟是多少。 • 统计量落在拒绝域不同的地方, 实际的显著性是不同的 • P值是实际算出的显著水平,比 统计量检验提供更多的信息Z 0临界值 统计量1 统计量2αSchool of Statistics, Renmin University of China19
1.7 决策中需注意的问题• 假设检验不能证明原假设正确 • 例:设原假设为H0:μ=10,从该总体中抽出一个随机样本, 得到⎯x=9.8,在α=0.05的水平上,样本提供的证据没有推 翻这一假设。若我们说“接受”原假设,意味着样本提供的 证据已经证明μ=10是正确的。如果我们将原假设改为 H0:μ=10.5,同样,在α=0.05的水平上,样本提供的证据也 没有推翻这一假设,我们又说“接受”原假设。出现矛盾。 • 统计显著不一定有实际意义*–样本量非常大,几乎总能拒绝原假设20School of Statistics, Renmin University of China
内容• 假设检验的基本问题 • 一个总体参数的检验 • 两个总体参数的检验School of Statistics, Renmin University of China21
2.1 总体均值的检验—大样本• 假定条件:–大样本(n≥30)• 使用z检验统计量:–σ 2 已知: σ 2 未知:x − μ0 z= ~ N (0,1) σ n x − μ0 z= ~ N (0,1) s n22–School of Statistics, Renmin University of China
2.1 总体均值的检验—大样本,σ2未知,双侧检验• 例:一罐装饮料用自动生产线,每罐容量255ml,标准差5ml。 为检验每罐容量是否符合要求,质检员在某天生产饮料中随 机抽取40罐进行检验,测得每罐平均容量为255.8ml。取 α=0.05 ,该天生产饮料容量是否符合标准要求?– 提出原假设和备择假设:H0 : μ = 255 H1 : μ ≠ 255x − μ0 z= ~ N (0,1) σ/ n– 选择检验统计量:根据题意: – 检验统计量的观测值:x − μ0 255.8 − 255 = = 1.01 z= σ n 5 4023School of Statistics, Renmin University of China
2.1 总体均值的检验—大样本,σ2未知,双侧检验• 根据z值进行双侧检验:拒绝域 α/2 1-α 置信水平 拒绝域 α/2统计量的观测 值等于1.01-Z a/2=-1.960Z a/2=1.96Z,(t) Z,(t)• 决策:|Z obs|> Z α /2时拒绝原假设,否则不能拒绝原假设 • 不拒绝原假设,不能认为该天生产的饮料不符合标准School of Statistics, Renmin University of China 24
2.1 总体均值的检验—大样本,σ2未知,双侧检验• 根据P值进行双侧检验:双侧检验中p值 = PH 0 (| Z |> Z obs ) 或PH 0 (| t |> t obs )拒绝 1/2 p-值 拒绝 1/2 p-值α /2-1.9601.96Z• 决策: p值
2.1 总体均值的检验—大样本,σ2未知,双侧检验Excel中P值的计算: • 第1步:进入Excel表格界面,直接点击【fx】 • 第2步:在函数分类中点击【统计】,并在函数名菜单下 选择【NORMSDIST】,然后【确定】 • 第3步:将 z 的绝对值1.01录入,得到的函数值为 0.843752355 ,P值=2*(1—0.843752355)=0.312495School of Statistics, Renmin University of China26
2.1 总体均值的检验—大样本,σ2未知,左侧检验• 例:一零件尺寸绝对平均 误差为1.35mm。厂家采用 一种新机床进行加工以期 进一步降低误差。从新机 床某天生产零件中随机抽 取50个进行检验。利用这 些样本数据,检验新机床 加工的零件尺寸的平均误 差与旧机床相比是否有显 著降低? (α=0.01)School of Statistics, Renmin University of China50个零件尺寸的误差数据 (mm) 1.26 1.13 0.98 1.12 1.23 0.99 1.98 1.11 1.70 1.17 1.19 0.96 1.10 1.12 0.74 1.45 1.97 1.54 2.37 1.12 1.31 1.06 1.12 0.95 1.50 1.24 0.91 1.08 1.38 1.23 0.97 1.00 1.03 1.02 0.50 1.01 1.22 1.10 1.60 0.82 1.81 0.94 1.16 1.13 0.59 2.03 1.06 1.64 1.26 0.8627
2.1 总体均值的检验—大样本,σ2未知,左侧检验• H0 :μ ≥1.35 • H1 :μ
2.1 总体均值的检验—大样本,σ2未知,左侧检验Excel中P值的计算: • 第1步:进入Excel表格界面,直接点击【fx】 • 第2步:在函数分类中点【统计】,并在函数名的菜单下 选择【ZTEST】,然后【确定】 • 第3步:在对话框【Array】框中,输入原始数据区域 【X】后输入参数假定值(这里为1.35);在【Sigma】后 输入已知总体标准差(若总未知则可忽略,系统将自动使用样 本标准差代替) • 第4步:用1减去得到的函数值0.995421023 即为P值, P值=1-0.995421023=0.004579School of Statistics, Renmin University of China 29
2.1 总体均值的检验—大样本,σ2未知,左侧检验• P值的图示:αP值P=0.004579临界值0Z计算出的样本统计量=2.6061School of Statistics, Renmin University of China30
2.1 总体均值的检验—小样本• 假定条件: • 总体服从正态分布 • 小样本(n
2.1 总体均值的检验—小样本,σ2未知,双侧检验• 例:一汽车配件平均长度要求为12cm,高或低于该标准均 不合格。汽车生产企业购进配件时,通常经过招标,然后 对中标配件提供商提供的样品进行检验,以决定是否购进。 现对一个配件提供商提供的10个样本进行了检验。假定该 供货商生产的配件长度服从正态分布,在0.05的显著性水 平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度 (cm) 12.2 12.4 10.8 11.3 12.0 12.2 11.8 12.0 11.9 12.3School of Statistics, Renmin University of China32
2.1 总体均值的检验—小样本,σ2未知,双侧检验• H0 :μ =12 • H1 :μ ≠12 • α = 0.05 • df = 10 - 1= 9 • 临界值(c):拒绝 H0 0.025 拒绝 H0 0.025检验统计量:11.89 − 12 t= = −0.70533 0.49317565 10决策:不拒绝H0 结论:没有证据表明该供货商提供 的零件不符合要求-2.26202.262t33-0.7053School of Statistics, Renmin University of China
2.1 总体均值的检验—小样本,σ2未知,双侧检验Excel中P值的计算: • 第1步:进入Excel表格界面,直接点击【fx】 • 第2步:在函数分类中点击【统计】,并在函数名的菜单 下选择【TDIST】,然后【确定】 • 第3步:在出现对话框的【X】栏中输入计算出的t的绝对 值0.7053,在【Deg-freedom】(自由度)栏中输入本例 的自由度9,在【Tails】栏中输入2(表明是双侧检验, 如果是单测检验则在该栏输入1) • 第4步:P值=0.498453School of Statistics, Renmin University of China 34
2.1 总体均值的检验—小样本,σ2未知,双侧检验SPSS进行检验: • 第1步:选择【Analyze】下拉菜单,并选择【Compare Means—One- Samples T Test】选项,进入主对话框 • 第2步:将检验变量(零件长度)选入【Test Variable(s)】;在 【Test Value】框内输入假设值(本题为12) • 第3步:点击【Options】,选择所需的置信水平(隐含值为 95%)。点击【Continue】回到主对话框。点击【OK】School of Statistics, Renmin University of China35
2.1 总体均值的检验—小样本,σ2未知,双侧检验One-Sample Test Test Value = 12 Sig. (2-tailed) .498 95% Confidence Interval of the Difference Mean Lower Upper Difference -.1100 -.463 .243零零零零t -.705df 9School of Statistics, Renmin University of China36
2.1 总体均值的检验—小样本,σ2未知,右侧检验• 例:平均说来,一个有丈夫和两个孩子的家庭主妇每周用 于与家庭活动时间不超过55h。抽取8个家庭主妇每周工作 时间为样本,得到:58,52,64,63,59,62,62,55。 有妇联组织认为每周平均工作时间超过55小时,你的结论 是什么?(假设总体为正态分布)– 提出假设: – 选择检验统计量: – 检验统计量的观测值:H 0 : μ ≤ 55 H1 : μ > 55x − μ0 t= ~ t (n − 1) s/ nSchool of Statistics, Renmin University of China59.375 − 55 tobs = = 2.9416 4.2067 / 837
2.1 总体均值的检验—小样本,σ2未知,右侧检验• 根据t值进行右侧检验:置信水平 拒绝域 1-αH0 H1 μ ≤ μ0 μ>μ0α tα统计量的观测 值等于2.940Z, tt0.05 ( 7 ) = 1.89• 决策:tobs>tα时拒绝零假设,…School of Statistics, Renmin University of China 38
2.1 总体均值的检验—小样本,σ2未知,右侧检验• 根据P值进行右侧检验:右侧检验中 p值= P H0 (t > tobs )拒绝 α p-值0tα2.94tt0.05 ( 7 ) = 1.89• 决策: p值
2.1 总体均值的检验—小结是 总体正态? 否σ2已知?是 否 是n≥30? 否Z=x − μ0σ/ nt=x − μ0 s/ nZ=x − μ0σ/ n增大n; 数学 变换等。 x − μ0t= s/ n实际中总体方差总是未知的,因 而这是应用最多的公式。大样本 时t值可以用z值来近似。School of Statistics, Renmin University of China根据中心极限定理得 到的近似结果。 σ未知时用s来估计。40
2.2 总体比例的检验
•
假定条件
–总体服从二项分布
–
可用正态分布来近似(大样本)
•
检验的z 统计量
z=
p−π0
~
N(0,1)
•例:一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146位女性经常阅读该杂志。分别取显著性水平α=0.05和α=0.01,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?
•Η0:π= 80%检验统计量:
•Η1:π≠80%•α= 0.05z=
0.73−0.80
•n= 200=−2.475
•临界值(c):
决策:拒绝Η0 (p= 0.013328
−1.96
•Η0:π= 80%检验统计量:
•Η1:π≠80%•α= 0.01z=
0.73−0.80
=−2.475
•n= 200•临界值(c):
决策:拒绝Η0 (p= 0.013328 >α= 0.01)结论:没有证据表明”该杂志声称读-2.58
2.58
者群中有80%
为女性”的看法不正确
•假定条件:
•总体近似服从正态分布•检验统计量:
χ2
=
(n−1)s
2
σ
2~χ2
(n−1)
•例:啤酒企业采用自动生产线灌装啤酒,每瓶装填量为640ml,但受不可控因素影响,每瓶装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过4ml。企业质检部门抽取了10瓶啤酒进行检验,得到样本标准差为s=3.8ml。试以0.05的显著性水平检验装填量标准差是否符合要求?
2.3 总体方差的检验
•H0:σ2≤42•H1:σ2> 42•α= 0.10•df = 10 -1 = 9•临界值(s):
统计量:
(10−1)×3.8χ==8.12252
4
2
2
决策:不拒绝Η0 (π=0.52185)
结论:没有证据表明装填量的标准差不符合要求
16.9190
内容
•假设检验的基本问题•一个总体参数的检验•
两个总体参数的检验
•假定条件:
•两个样本是独立的随机样本
•正态总体或非正态总体大样本(n1≥30和n2≥30)•检验统计量:
z=
(1−2)−(μ1−μ2)
•σ2已知:
~N(0,1)
z1−2)−(μ1−μ2)
•σ2
未知:
=
(~N(0,1)
•例:某公司调查男女职员的平均小时工资,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为男职员与女职员的平均小时工资存在显著差异?
统计学
基础第七讲:假设检验甄峰中国人民大学统计学院2015年4
月
学习目标
•了解假设检验的基本思想和原理
•掌握一个总体参数的检验方法
•掌握两个总体参数的检验方法
内容
•假设检验的基本问题
•一个总体参数的检验
•
两个总体参数的检验
1.0 假设检验的地位
•为什么要进行假设检验:通过对样本的观察,发现•例:商家称某产品容量500克,但抽取n个样品,发现都低于500克,是抽样误差,还是总体本身有问题?
•假设检验:事先作出关于总体参数、分布形式、相互关系等的命题(假设),然后通过样本信息来判断该命题是否成立(检验)
•小概率事件在一次试验中几乎不会发生
•如总体假设真实(例如学生上课平均出勤率≥95%),那么不利于或不能支持这一假设的事件A(小概率事件,例如样本出勤率=55% )在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了(样本出勤率=55% ),就有理由怀疑该假设的真实性,拒绝提出的假设。•英国统计学家费希尔把小概率的标准定为0.05
1.2 假设检验的步骤
•根据实际问题提出一对假设(原假设和备择假设)
•构造某个适当的检验统计量,并确定其在原假设成立时的分布
•根据观测的样本计算检验统计量的值
•根据犯第一类错误的损失规定显著性水平α
•根据确定检验统计量的临界值并进而给出拒绝域,或者计算p值等
•结论:根据决策规则得出或原假设的结论注意“不能拒绝原假设”不同于“接受原假设”
1.3 关于‘假设’的基本概念
•什么是假设:对总体参数的具体数值所作的陈述•例:某地人均预期寿命为76岁
某行业的平均工资水平为5000元/月
某产品的合格率为99%
•原假设(零假设):研究者想搜集证据予以反对的,H0•备择假设:研究者想搜集证据予以支持的,H1–特点:原假设和备择假设互斥,即只有一个正确
等号必须出现在H0中
检验以“原假设为真”开始,出现矛盾则H1正确
•常用检验形式:双侧检验,左侧检验和右侧检验双侧检验单侧检验
左侧检验右侧检验
H0μ = μ0μ ≥μ0μ ≤μ0
H1μ ≠μ0μ μ0
原假设和备择假设的设定:
•把不能轻易否定的假设作为原假设
•把现状作为原假设(现状不能轻易否决,有存在的合理性)
•通常把研究者要证明的假设作为备择假设•将所作出的声明作为原假设
——不轻易否定现状!
1.3 关于‘假设’的基本概念• P5例: H0 : μ=500, H1 : μ ≠500 • 例2:某汽车平均每加仑汽油可以行驶24英里。一种新工 艺可提高每加仑汽油的行驶里程。为了检验新的工艺是否 有效: – 要证明μ>24:H0: μ≤24 H1:μ>24School of Statistics, Renmin University of China11
1.4 检验统计量与拒绝域• 检验统计量:根据样本观测结果计算出的对原假设和备择假 设做出决策的某个样本统计量。例如,大样本条件下总体均 x − μ0 类似于标准分数的转化 值的检验统计量为z=σ/ n• 拒绝域:检验统计量取值的集合中,当根据样本得到的检验 统计量的值属于该集合时,拒绝原假设School of Statistics, Renmin University of China12
1.4 检验统计量与拒绝域• 检验统计量的由来:从原始值到标准化值 • 以Η0 : μ =μ0为例,原假设成立下样本均值x 应在μ0附近x原始分布μ0f(x)α/2 1-α α/2a=-1.96School of Statistics, Renmin University of China0b=1.96ZN(0,1) 或t分布13
1.5 两类错误与显著性水平• 第Ⅰ类错误:原假设正确时拒绝原假设,发生概率为α • 第Ⅱ类错误:原假设错误时未拒绝原假设,发生概率为β • 显著性水平:能够容忍的犯第Ⅰ类错误的最大概率(上限值)实际情况 Η0为真 正确 第一类错误(α) 弃真 Η0为假 第二类错误(β) 取伪 正确决策 不拒绝Η0 拒绝Η0School of Statistics, Renmin University of China14
1.5 两类错误与显著性水平• 两类错误不可避免:对于一定样本量 n,要减小其中一种 错误,通常只能通过增加另一种错误的方法做到 • 假设检验中通常首先控制第一类错误的概率不超过某个小 概率水平α,在满足该条件的要求下使犯第二类错误的概 率尽量小 • 显著性水平 α 常取0.01,0.05,0.1 • 根据 α 可以确定检验统计量的临界值,并根据统计量的样 本观测值和临界值得出检验结论School of Statistics, Renmin University of China15
1.6 决策:检验统计量 vs. P值• 例:某厂生产袋装麦片重量服从正态分布,每袋平均重量 570g,标准差为8g。由于更换生产线,标准差不会变,但 不知平均装袋重量是否改变,从新生产线抽取30个样品, 得平均重量为573g,能否认为平均质量无显著变化?(α=5%)(1) 提出零假设和备择假设 (2) 选择检验统计量 (3) 检验统计量的观测值H 0 : μ = 570 H1 : μ ≠ 570x − μ0 z= ~ N ( 0,1) σ/ nz obs x − μ 0 573 − 570 = = = 2.05 σ/ n 8 / 3016School of Statistics, Renmin University of China
1.6 决策:检验统计量 vs. P值(4-1) 显著性水平等于0.05, Zobs=2.05 Æ比较Zobs和Za/2 产品 重量μ0=570x原始分布f(x)α/2 1-α α/2统计量的观测 值Zobs=2.05−Ζ a/2 =-1.96 −ΖSchool of Statistics, Renmin University of China0Ζ α/2 =1.96Z N(0,1)17
1.6 决策:检验统计量 vs. P值(4-2) 显著性水平等于0.05, Zobs=2.05 Æp-=0.04036 Æ比较p-和α1/2 p-值α 1/2 p-值-1.96 1.96-2.0502.05Zp值也称为观测到的显著性水平, 是能拒绝H0 的α的最小值, 决策规则: p值
1.6 决策:检验统计量 vs. P值比较:• 统计量检验是事先给出一个显著 性水平为决策依据,无法知道实 际的显著性水平究竟是多少。 • 统计量落在拒绝域不同的地方, 实际的显著性是不同的 • P值是实际算出的显著水平,比 统计量检验提供更多的信息Z 0临界值 统计量1 统计量2αSchool of Statistics, Renmin University of China19
1.7 决策中需注意的问题• 假设检验不能证明原假设正确 • 例:设原假设为H0:μ=10,从该总体中抽出一个随机样本, 得到⎯x=9.8,在α=0.05的水平上,样本提供的证据没有推 翻这一假设。若我们说“接受”原假设,意味着样本提供的 证据已经证明μ=10是正确的。如果我们将原假设改为 H0:μ=10.5,同样,在α=0.05的水平上,样本提供的证据也 没有推翻这一假设,我们又说“接受”原假设。出现矛盾。 • 统计显著不一定有实际意义*–样本量非常大,几乎总能拒绝原假设20School of Statistics, Renmin University of China
内容• 假设检验的基本问题 • 一个总体参数的检验 • 两个总体参数的检验School of Statistics, Renmin University of China21
2.1 总体均值的检验—大样本• 假定条件:–大样本(n≥30)• 使用z检验统计量:–σ 2 已知: σ 2 未知:x − μ0 z= ~ N (0,1) σ n x − μ0 z= ~ N (0,1) s n22–School of Statistics, Renmin University of China
2.1 总体均值的检验—大样本,σ2未知,双侧检验• 例:一罐装饮料用自动生产线,每罐容量255ml,标准差5ml。 为检验每罐容量是否符合要求,质检员在某天生产饮料中随 机抽取40罐进行检验,测得每罐平均容量为255.8ml。取 α=0.05 ,该天生产饮料容量是否符合标准要求?– 提出原假设和备择假设:H0 : μ = 255 H1 : μ ≠ 255x − μ0 z= ~ N (0,1) σ/ n– 选择检验统计量:根据题意: – 检验统计量的观测值:x − μ0 255.8 − 255 = = 1.01 z= σ n 5 4023School of Statistics, Renmin University of China
2.1 总体均值的检验—大样本,σ2未知,双侧检验• 根据z值进行双侧检验:拒绝域 α/2 1-α 置信水平 拒绝域 α/2统计量的观测 值等于1.01-Z a/2=-1.960Z a/2=1.96Z,(t) Z,(t)• 决策:|Z obs|> Z α /2时拒绝原假设,否则不能拒绝原假设 • 不拒绝原假设,不能认为该天生产的饮料不符合标准School of Statistics, Renmin University of China 24
2.1 总体均值的检验—大样本,σ2未知,双侧检验• 根据P值进行双侧检验:双侧检验中p值 = PH 0 (| Z |> Z obs ) 或PH 0 (| t |> t obs )拒绝 1/2 p-值 拒绝 1/2 p-值α /2-1.9601.96Z• 决策: p值
2.1 总体均值的检验—大样本,σ2未知,双侧检验Excel中P值的计算: • 第1步:进入Excel表格界面,直接点击【fx】 • 第2步:在函数分类中点击【统计】,并在函数名菜单下 选择【NORMSDIST】,然后【确定】 • 第3步:将 z 的绝对值1.01录入,得到的函数值为 0.843752355 ,P值=2*(1—0.843752355)=0.312495School of Statistics, Renmin University of China26
2.1 总体均值的检验—大样本,σ2未知,左侧检验• 例:一零件尺寸绝对平均 误差为1.35mm。厂家采用 一种新机床进行加工以期 进一步降低误差。从新机 床某天生产零件中随机抽 取50个进行检验。利用这 些样本数据,检验新机床 加工的零件尺寸的平均误 差与旧机床相比是否有显 著降低? (α=0.01)School of Statistics, Renmin University of China50个零件尺寸的误差数据 (mm) 1.26 1.13 0.98 1.12 1.23 0.99 1.98 1.11 1.70 1.17 1.19 0.96 1.10 1.12 0.74 1.45 1.97 1.54 2.37 1.12 1.31 1.06 1.12 0.95 1.50 1.24 0.91 1.08 1.38 1.23 0.97 1.00 1.03 1.02 0.50 1.01 1.22 1.10 1.60 0.82 1.81 0.94 1.16 1.13 0.59 2.03 1.06 1.64 1.26 0.8627
2.1 总体均值的检验—大样本,σ2未知,左侧检验• H0 :μ ≥1.35 • H1 :μ
2.1 总体均值的检验—大样本,σ2未知,左侧检验Excel中P值的计算: • 第1步:进入Excel表格界面,直接点击【fx】 • 第2步:在函数分类中点【统计】,并在函数名的菜单下 选择【ZTEST】,然后【确定】 • 第3步:在对话框【Array】框中,输入原始数据区域 【X】后输入参数假定值(这里为1.35);在【Sigma】后 输入已知总体标准差(若总未知则可忽略,系统将自动使用样 本标准差代替) • 第4步:用1减去得到的函数值0.995421023 即为P值, P值=1-0.995421023=0.004579School of Statistics, Renmin University of China 29
2.1 总体均值的检验—大样本,σ2未知,左侧检验• P值的图示:αP值P=0.004579临界值0Z计算出的样本统计量=2.6061School of Statistics, Renmin University of China30
2.1 总体均值的检验—小样本• 假定条件: • 总体服从正态分布 • 小样本(n
2.1 总体均值的检验—小样本,σ2未知,双侧检验• 例:一汽车配件平均长度要求为12cm,高或低于该标准均 不合格。汽车生产企业购进配件时,通常经过招标,然后 对中标配件提供商提供的样品进行检验,以决定是否购进。 现对一个配件提供商提供的10个样本进行了检验。假定该 供货商生产的配件长度服从正态分布,在0.05的显著性水 平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度 (cm) 12.2 12.4 10.8 11.3 12.0 12.2 11.8 12.0 11.9 12.3School of Statistics, Renmin University of China32
2.1 总体均值的检验—小样本,σ2未知,双侧检验• H0 :μ =12 • H1 :μ ≠12 • α = 0.05 • df = 10 - 1= 9 • 临界值(c):拒绝 H0 0.025 拒绝 H0 0.025检验统计量:11.89 − 12 t= = −0.70533 0.49317565 10决策:不拒绝H0 结论:没有证据表明该供货商提供 的零件不符合要求-2.26202.262t33-0.7053School of Statistics, Renmin University of China
2.1 总体均值的检验—小样本,σ2未知,双侧检验Excel中P值的计算: • 第1步:进入Excel表格界面,直接点击【fx】 • 第2步:在函数分类中点击【统计】,并在函数名的菜单 下选择【TDIST】,然后【确定】 • 第3步:在出现对话框的【X】栏中输入计算出的t的绝对 值0.7053,在【Deg-freedom】(自由度)栏中输入本例 的自由度9,在【Tails】栏中输入2(表明是双侧检验, 如果是单测检验则在该栏输入1) • 第4步:P值=0.498453School of Statistics, Renmin University of China 34
2.1 总体均值的检验—小样本,σ2未知,双侧检验SPSS进行检验: • 第1步:选择【Analyze】下拉菜单,并选择【Compare Means—One- Samples T Test】选项,进入主对话框 • 第2步:将检验变量(零件长度)选入【Test Variable(s)】;在 【Test Value】框内输入假设值(本题为12) • 第3步:点击【Options】,选择所需的置信水平(隐含值为 95%)。点击【Continue】回到主对话框。点击【OK】School of Statistics, Renmin University of China35
2.1 总体均值的检验—小样本,σ2未知,双侧检验One-Sample Test Test Value = 12 Sig. (2-tailed) .498 95% Confidence Interval of the Difference Mean Lower Upper Difference -.1100 -.463 .243零零零零t -.705df 9School of Statistics, Renmin University of China36
2.1 总体均值的检验—小样本,σ2未知,右侧检验• 例:平均说来,一个有丈夫和两个孩子的家庭主妇每周用 于与家庭活动时间不超过55h。抽取8个家庭主妇每周工作 时间为样本,得到:58,52,64,63,59,62,62,55。 有妇联组织认为每周平均工作时间超过55小时,你的结论 是什么?(假设总体为正态分布)– 提出假设: – 选择检验统计量: – 检验统计量的观测值:H 0 : μ ≤ 55 H1 : μ > 55x − μ0 t= ~ t (n − 1) s/ nSchool of Statistics, Renmin University of China59.375 − 55 tobs = = 2.9416 4.2067 / 837
2.1 总体均值的检验—小样本,σ2未知,右侧检验• 根据t值进行右侧检验:置信水平 拒绝域 1-αH0 H1 μ ≤ μ0 μ>μ0α tα统计量的观测 值等于2.940Z, tt0.05 ( 7 ) = 1.89• 决策:tobs>tα时拒绝零假设,…School of Statistics, Renmin University of China 38
2.1 总体均值的检验—小样本,σ2未知,右侧检验• 根据P值进行右侧检验:右侧检验中 p值= P H0 (t > tobs )拒绝 α p-值0tα2.94tt0.05 ( 7 ) = 1.89• 决策: p值
2.1 总体均值的检验—小结是 总体正态? 否σ2已知?是 否 是n≥30? 否Z=x − μ0σ/ nt=x − μ0 s/ nZ=x − μ0σ/ n增大n; 数学 变换等。 x − μ0t= s/ n实际中总体方差总是未知的,因 而这是应用最多的公式。大样本 时t值可以用z值来近似。School of Statistics, Renmin University of China根据中心极限定理得 到的近似结果。 σ未知时用s来估计。40
2.2 总体比例的检验
•
假定条件
–总体服从二项分布
–
可用正态分布来近似(大样本)
•
检验的z 统计量
z=
p−π0
~
N(0,1)
•例:一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146位女性经常阅读该杂志。分别取显著性水平α=0.05和α=0.01,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?
•Η0:π= 80%检验统计量:
•Η1:π≠80%•α= 0.05z=
0.73−0.80
•n= 200=−2.475
•临界值(c):
决策:拒绝Η0 (p= 0.013328
−1.96
•Η0:π= 80%检验统计量:
•Η1:π≠80%•α= 0.01z=
0.73−0.80
=−2.475
•n= 200•临界值(c):
决策:拒绝Η0 (p= 0.013328 >α= 0.01)结论:没有证据表明”该杂志声称读-2.58
2.58
者群中有80%
为女性”的看法不正确
•假定条件:
•总体近似服从正态分布•检验统计量:
χ2
=
(n−1)s
2
σ
2~χ2
(n−1)
•例:啤酒企业采用自动生产线灌装啤酒,每瓶装填量为640ml,但受不可控因素影响,每瓶装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过4ml。企业质检部门抽取了10瓶啤酒进行检验,得到样本标准差为s=3.8ml。试以0.05的显著性水平检验装填量标准差是否符合要求?
2.3 总体方差的检验
•H0:σ2≤42•H1:σ2> 42•α= 0.10•df = 10 -1 = 9•临界值(s):
统计量:
(10−1)×3.8χ==8.12252
4
2
2
决策:不拒绝Η0 (π=0.52185)
结论:没有证据表明装填量的标准差不符合要求
16.9190
内容
•假设检验的基本问题•一个总体参数的检验•
两个总体参数的检验
•假定条件:
•两个样本是独立的随机样本
•正态总体或非正态总体大样本(n1≥30和n2≥30)•检验统计量:
z=
(1−2)−(μ1−μ2)
•σ2已知:
~N(0,1)
z1−2)−(μ1−μ2)
•σ2
未知:
=
(~N(0,1)
•例:某公司调查男女职员的平均小时工资,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为男职员与女职员的平均小时工资存在显著差异?