第六章 假设检验
例1从死于汽车碰撞事故的司机中抽取2000名司机的随机样本,根据他们的血液中是否含
有酒精以及他们是否对事故负有责任,将数据整理如下表所示。
在整个总体中,血液中含有酒精和不含酒精的司机之间在对事故负有责任方面有差异
吗?为了回答这一问题:
1) 叙述H 0并计算概值;
2) 计算适当的置信区间(95%) 来说明差异有多大;
3) 从这一数据如何说明“酒精增加了事故的发生率”。
解:设p 1 为含酒精中有责任的概率,p 2无酒精中有责任的概率。
提出假设H 0:血液中含酒精和不含酒精的司机之间对事故富有的责任无差异。即
p 1=p 2 H 1:p 1≠p 2。
依据样本数据:p 1=650/(650+150)=13/16 p 2=700/(700+500)=7/12
构造统计量:P=p 1-p 2 又因为p 1~N(1,
所以p 1-p 2~ N(1-2,p (p (1-p 2) 11-p 1) ),p 2~N(2,2) n 1n 2p (p (1-p 2) p (1-p 1) p (1-p 2) 211-p 1) +2) 记1+2为s n 1n 2n 1n 2
。不包括0 ,p 1-p 2的95%的置信区间为(1-2-z a /2*s,1-2+z a /2*s)=(0.19,0.27)
所以拒绝零假设。可见含酒精的对事故负责任的概率远大于不含酒精的。即酒精增加了事故的而发生率。
(数值计算过程不再列出)
例2、1974年,美国盖洛普公司的一次调查表明,在750名美国男子的样本中,有45%抽烟;在另一个相互独立的750名女子的样本中,36%抽烟,
1) 构造男性总体和女性总体中抽烟比例之差的95%单侧置信区间;
2) 计算没有差异这一原假设的概值;
3) 在错误水平α=0.05下,45%与36%之差在统计上是可以分辨的吗?(或是显著的吗?) 即,能拒绝H 0吗?用两种方式回答,并说明两种答案是一致的:
1) H 0是否没有落入95%的置信区间之内?
2) 对H 0的概值是否小于0.05?
解:设男性抽烟比例为p 1,女性抽烟比例为p 2。
构造统计量:P=p 1-p 2 又因为p 1~N(1,p (p (1-p 2) 11-p 1) ),p 2~N(2,2)
n 1n 2
所以p 1-p 2~ N(1-2,p (p (1-p 2) p (1-p 1) p (1-p 2) 211-p 1) +2)记1+2为s n 1n 2n 1n 2P(P -(1 -2)
45%-36%+1.645*0.02524)=(0,13.15%)
(2)H 0: p 1=p 2 在此条件下P P 45%-36% =1.452 Φ(1.452)=0.927。 ~N(0,1) 。Z==s s s
所以没有差异这一原假设的概率为0.927。
(3) 在错误水平α=0.05下,45%与36%之差在统计上是不可以分辨。即不能拒绝H 0。从以下角度来分析:
1) 因为1-2=9%,落在95%的置信区间。所以不能拒绝原假设H 0。
2) 由(2)可知拒绝H 0出错的概率为0.073,大于0.05,所以不能拒绝原假设。
第六章 假设检验
例1从死于汽车碰撞事故的司机中抽取2000名司机的随机样本,根据他们的血液中是否含
有酒精以及他们是否对事故负有责任,将数据整理如下表所示。
在整个总体中,血液中含有酒精和不含酒精的司机之间在对事故负有责任方面有差异
吗?为了回答这一问题:
1) 叙述H 0并计算概值;
2) 计算适当的置信区间(95%) 来说明差异有多大;
3) 从这一数据如何说明“酒精增加了事故的发生率”。
解:设p 1 为含酒精中有责任的概率,p 2无酒精中有责任的概率。
提出假设H 0:血液中含酒精和不含酒精的司机之间对事故富有的责任无差异。即
p 1=p 2 H 1:p 1≠p 2。
依据样本数据:p 1=650/(650+150)=13/16 p 2=700/(700+500)=7/12
构造统计量:P=p 1-p 2 又因为p 1~N(1,
所以p 1-p 2~ N(1-2,p (p (1-p 2) 11-p 1) ),p 2~N(2,2) n 1n 2p (p (1-p 2) p (1-p 1) p (1-p 2) 211-p 1) +2) 记1+2为s n 1n 2n 1n 2
。不包括0 ,p 1-p 2的95%的置信区间为(1-2-z a /2*s,1-2+z a /2*s)=(0.19,0.27)
所以拒绝零假设。可见含酒精的对事故负责任的概率远大于不含酒精的。即酒精增加了事故的而发生率。
(数值计算过程不再列出)
例2、1974年,美国盖洛普公司的一次调查表明,在750名美国男子的样本中,有45%抽烟;在另一个相互独立的750名女子的样本中,36%抽烟,
1) 构造男性总体和女性总体中抽烟比例之差的95%单侧置信区间;
2) 计算没有差异这一原假设的概值;
3) 在错误水平α=0.05下,45%与36%之差在统计上是可以分辨的吗?(或是显著的吗?) 即,能拒绝H 0吗?用两种方式回答,并说明两种答案是一致的:
1) H 0是否没有落入95%的置信区间之内?
2) 对H 0的概值是否小于0.05?
解:设男性抽烟比例为p 1,女性抽烟比例为p 2。
构造统计量:P=p 1-p 2 又因为p 1~N(1,p (p (1-p 2) 11-p 1) ),p 2~N(2,2)
n 1n 2
所以p 1-p 2~ N(1-2,p (p (1-p 2) p (1-p 1) p (1-p 2) 211-p 1) +2)记1+2为s n 1n 2n 1n 2P(P -(1 -2)
45%-36%+1.645*0.02524)=(0,13.15%)
(2)H 0: p 1=p 2 在此条件下P P 45%-36% =1.452 Φ(1.452)=0.927。 ~N(0,1) 。Z==s s s
所以没有差异这一原假设的概率为0.927。
(3) 在错误水平α=0.05下,45%与36%之差在统计上是不可以分辨。即不能拒绝H 0。从以下角度来分析:
1) 因为1-2=9%,落在95%的置信区间。所以不能拒绝原假设H 0。
2) 由(2)可知拒绝H 0出错的概率为0.073,大于0.05,所以不能拒绝原假设。