用样本估计总体

2.2.2用样本的数字特征估计总体的数字特征

学习目标:掌握众数、中位数、平均数的概念;掌握标准差、方差的概念;

学习重点:求样本的数字特征(三数两差).

学习难点:用样本的数字特征估计总体的数字特征.

思考4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?

学习过程:

问题提出

美国NBA在2006——2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:

甲运动员得分:12,15,20,25,31,30, 36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26, 28,38,39,51,31,39.

思考5:平均数是频率分布直方图的“重心”,从直方图估计总体在各组数据内的平均数分别为多少?

如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征.

思考6:将频率分布直方图中每个小矩形的 面积与小矩形底边中点的横坐标之积相加, 就是样本数据的估值平均数. 由此估计总体的平均数是什么?

知识探究(一):众数、中位数和平均数思考1:以上两组样本数据如何求它们的众数、中位数和平均数?

思考2:在城市居民月均用水量样本 数据的频率分布直方图中, 你认为众数应在哪个小矩形内? 由此估计总体的众数是什么?

思考3:中位数左右两侧的直方图的面积应有什么关系?

思考7:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?

思考8 (1)一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?

.2)样本数据的平均数大于(或小于)中位数说明什么问题?

.3)你怎样理解“我们单位的收入水平比别的单位高”这句话的含义?

.样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数.

平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影.

当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.

知识探究(二):标准差

思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:

甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7

甲、乙两人本次射击的平均成绩分别为多少环?

这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?

知识补充1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散度.方差与标准差

的测量效果是一致的,在实际应用中一般多采用标准差.

2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用

样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.

思考2:

平差异在那里吗?

O

例题分析例1 画出下列四组样本数据的条形图,说明他们的异同点.

(1) 5,5,5,5,5,5,5,5,5;

(2) 4,4,4,5,5,5,6,6,6;(3) 3,3,4,4,5,6,6,7,7;(4) 2,2,2,2,5,8,8,8,8.

思考3:对于样本数据x1,x2,„,xn,设想通过各数据到其平均数的平均距离来反映样本数

据的分散程度,那么这个平均距离如何计算?

思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s表示.假设样

本数据x1,x2,„,xn的平均数为x, 则标准差的计算公式是:

那么标准差的取值范围是什么?

标准差为0的样本数据有何特点?

例2 甲、乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从

他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):甲 :

25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39乙:

25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产零件内径的尺寸看,谁生产的零件质量较高?

s=

xxxx

思考5:对于一个容量为2的样本:x1,x2(x1

22

例3 以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在550分,若某同学

今年高考得了520分,他想报考这所大学还需收集哪些信息? 要点:

(1)查往年录取的新生的平均分数.若平均数小于中位数很多,说明最低录取线较低,可以报考;

(2)查往年录取的新生高考总分的标准差.若标准差较大,说明新生的录取分数较分散,最低录取线可能较低,可以考虑报考.

2.(2009年上海卷理)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是

(A)甲地:总体均值为3,中位数为4 (B)乙地:总体均值为1,总体方差大于0 (C)丙地:中位数为2,众数为3 (D)丁地:总体均值为2,总体方差为3

3.(2009江苏卷)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:

本节小结

则以上两组数据的方差中较小的一个为s.4.(2009辽宁卷理)某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为

1:2:1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取

巩固练习

1.(2009四川卷文)设矩形的长为a,宽为b,其比满足b∶a=

1

0.618,这种矩形2

100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980h,1020h,1032h,则抽取的100件产品的使用寿命的平均值为 .

5.(2009重庆卷文)从一堆苹果中任取5只,称得它们的质量如下(单位:克)125 124 121

123 127则该样本标准差s (克)(用数字作答).

给人以美感,称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620

根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A. 甲批次的总体平均数与标准值更接近 B. 乙批次的总体平均数与标准值更接近 C. 两个批次总体平均数与标准值接近程度相同 D. 两个批次总体平均数与标准值接近程度不能确定

2.2.2用样本的数字特征估计总体的数字特征

学习目标:掌握众数、中位数、平均数的概念;掌握标准差、方差的概念;

学习重点:求样本的数字特征(三数两差).

学习难点:用样本的数字特征估计总体的数字特征.

思考4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?

学习过程:

问题提出

美国NBA在2006——2007年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:

甲运动员得分:12,15,20,25,31,30, 36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26, 28,38,39,51,31,39.

思考5:平均数是频率分布直方图的“重心”,从直方图估计总体在各组数据内的平均数分别为多少?

如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征.

思考6:将频率分布直方图中每个小矩形的 面积与小矩形底边中点的横坐标之积相加, 就是样本数据的估值平均数. 由此估计总体的平均数是什么?

知识探究(一):众数、中位数和平均数思考1:以上两组样本数据如何求它们的众数、中位数和平均数?

思考2:在城市居民月均用水量样本 数据的频率分布直方图中, 你认为众数应在哪个小矩形内? 由此估计总体的众数是什么?

思考3:中位数左右两侧的直方图的面积应有什么关系?

思考7:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?

思考8 (1)一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?

.2)样本数据的平均数大于(或小于)中位数说明什么问题?

.3)你怎样理解“我们单位的收入水平比别的单位高”这句话的含义?

.样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数.

平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影.

当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.

知识探究(二):标准差

思考1:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:

甲:7 8 7 9 5 4 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7

甲、乙两人本次射击的平均成绩分别为多少环?

这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?

知识补充1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散度.方差与标准差

的测量效果是一致的,在实际应用中一般多采用标准差.

2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用

样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.

思考2:

平差异在那里吗?

O

例题分析例1 画出下列四组样本数据的条形图,说明他们的异同点.

(1) 5,5,5,5,5,5,5,5,5;

(2) 4,4,4,5,5,5,6,6,6;(3) 3,3,4,4,5,6,6,7,7;(4) 2,2,2,2,5,8,8,8,8.

思考3:对于样本数据x1,x2,„,xn,设想通过各数据到其平均数的平均距离来反映样本数

据的分散程度,那么这个平均距离如何计算?

思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s表示.假设样

本数据x1,x2,„,xn的平均数为x, 则标准差的计算公式是:

那么标准差的取值范围是什么?

标准差为0的样本数据有何特点?

例2 甲、乙两人同时生产内径为25.40mm的一种零件,为了对两人的生产质量进行评比,从

他们生产的零件中各随机抽取20件,量得其内径尺寸如下(单位:mm):甲 :

25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39乙:

25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48从生产零件内径的尺寸看,谁生产的零件质量较高?

s=

xxxx

思考5:对于一个容量为2的样本:x1,x2(x1

22

例3 以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在550分,若某同学

今年高考得了520分,他想报考这所大学还需收集哪些信息? 要点:

(1)查往年录取的新生的平均分数.若平均数小于中位数很多,说明最低录取线较低,可以报考;

(2)查往年录取的新生高考总分的标准差.若标准差较大,说明新生的录取分数较分散,最低录取线可能较低,可以考虑报考.

2.(2009年上海卷理)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是

(A)甲地:总体均值为3,中位数为4 (B)乙地:总体均值为1,总体方差大于0 (C)丙地:中位数为2,众数为3 (D)丁地:总体均值为2,总体方差为3

3.(2009江苏卷)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:

本节小结

则以上两组数据的方差中较小的一个为s.4.(2009辽宁卷理)某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为

1:2:1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共取

巩固练习

1.(2009四川卷文)设矩形的长为a,宽为b,其比满足b∶a=

1

0.618,这种矩形2

100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980h,1020h,1032h,则抽取的100件产品的使用寿命的平均值为 .

5.(2009重庆卷文)从一堆苹果中任取5只,称得它们的质量如下(单位:克)125 124 121

123 127则该样本标准差s (克)(用数字作答).

给人以美感,称为黄金矩形。黄金矩形常应用于工艺品设计中。下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620

根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A. 甲批次的总体平均数与标准值更接近 B. 乙批次的总体平均数与标准值更接近 C. 两个批次总体平均数与标准值接近程度相同 D. 两个批次总体平均数与标准值接近程度不能确定


相关文章

  • 抽样技术练习题及答案
  • 1. 请列举一些你所了解的以及被接受的抽样调查. 2.抽样调查基础理论及其意义: 3. 抽样调查的特点. 4.样本可能数目及其意义: 5.影响抽样误差的因素: 6.某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 6 ...查看


  • 抽样审计题
  • 三.做题时注意事项 在做题当中区分控制测试和实质性程序应按目的或执行的结果进行区分.有没有按某项制度去做,此时是控制测试,有没有重大错报是实质性程序. 控制测试和实质性程序最大的区别就是要看测试的目的,如果目的是为了测试控制的运行有效性,则 ...查看


  • 3-第7章 统计学 参数估计 练习题
  • 第7章 参数估计 练习题 一.填空题(共10题,每题2分,共计20分) 1.参数估计就是用_______ __去估计_______ __. 2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __. 3.区间估 ...查看


  • 不重复抽样条件下样本方差的修正系数
  • 简单随机抽样下获得的估计值是它们相应的总体值的无偏估计量.简单的情况下,如果我们假定无限的(或至少非常大的)目标总体,我们可以对简单随机抽样下在整个目标总体中测量的特征的平均值和方差作如下估计. 这里 n=样本容量 yi=对样本中第i 个元 ...查看


  • 第二章 参数估计
  • 第二章 参数估计 一.填空题 1.总体X 的分布函数为F (x ; θ) ,其中θ为未知参数,则对θ常用的点估计方法有 , . 2.设总体X 的概率密度为 ⎧e -(x -θ) , x ≥θ f (x ; θ) =⎨ 0, x 而X 1, ...查看


  • 审计风险与抽样
  • 风险评估与风险应对 ●风险评估方法 一.询问 询问被审计单位管理层和内部其他相关人员.询问下列事项: ▲管理层所关注的主要问题 ▲最近的财务状况.经营成果和现金流量 ▲目前发生的重大会计处理问题 ▲发生的其他重要变化 还应当考虑询问采购人员 ...查看


  • 参数估计方法
  • 第七章 参数估计 第一节 基本概念 1.概念网络图 ⎧⎧无偏性⎫⎫ ⎧矩估计⎫⎪⎪⎪⎪ 点估计→估计量的评选标准有效性⎨⎬⎨⎬⎪⎪⎪⎪极大似然估计⎭⎩⎪⎪从样本推断总体⎨⎩一致性⎭⎬ ⎪⎪⎪⎪⎪⎪}区间估计{单正态总体的区间估计⎩⎭ 2.重 ...查看


  • 统计学第七章.第八章
  • 统计学复习笔记 第七章 一. 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量.估计量也是随机变量.如样本均值,样本比例.样本方差等. 根据一个具体的样本计算出来的估计量的数值称为估计值. 2. 简述评价估 ...查看


  • 七 参数估计
  • 第七章 参数估计 参数估计是这样一类问题, 即随机变量(总体) X 的分布类型(或说分布函数) 已知, 但分布形式中含有未知参数, 如何通过X 的样本值来估计未知参数的值或它的取值范围以及该范围包含未知参数真值的可靠程度的问题. 参数估计分 ...查看


  • 参数估计习题参考答案
  • 参数估计习题参考答案 班级: 姓名: 学号: 得分 一.单项选择题: 1.关于样本平均数和总体平均数的说法,下列正确的是 ( B ) (A )前者是一个确定值,后者是随机变量 (B )前者是随机变量,后者是一个确定值 (C )两者都是随机变 ...查看


热门内容