小样本统计

第18课

小样本统计

小样本

当样本容量N 较小时,分布特性的估计量a (均值、 方差、90%百分位值等)通常不是正态分布的。

在这种情况下,估计值

和标准化统计量z 的

(用来得到置信区间和假设检验)可

以用随机模拟进行近似。

为了在随机模拟中产生随机复本,我们需要确定特性a 的值(或者是与它相关的参数)。

对于置信区间估计,我们假设对于假设检验,我们假设随机模拟用大量长度为N 的

(由实际数据计算出的估计值);

(假定的参数值)。 随机样本复本生成

的估计值。通过所有这些估计

值,可以得出期望的估计值和标准化统计量的。

例子——指数分布的均值的小样本双边置信区间

考虑一个取自含有未知参数a 、已知符合指数分布的总体的小样本:

样本均值是a 的无偏估计量:

在大样本情况下,我们由标准化统计量z 得到a 的置信区间。z 的复本i 为:

其中

是由所有复本的估计值

是取

(例如i =

)计算得到的样本均值

和标准差。每个时的数值。 累积分布函数

时用MATLAB 的exprnd 函数计算得到的N=5

是通过函数或作出的复本图得到的。

这个例子中,在数值较小和较大的部分都明显偏离单位正态分布:

在大样本情况下,

用来确定

的值:

a 的小样本双边95%置信区间近似为:

为了进行比较,给出a 的大样本(正态分布)双边95%置信区间为:

就小的样本容量而言,差别是微小的。但a 的小样本和大样本的99%置信区间相比较,差别就较大了。

例子——指数分布的均值的小样本双边假设检验

考虑上面例子,假设:

与上面类似,我们可以利用随机模拟得到这个假设的拒绝域和p 值;不同的是,在这里,函数中取,并按下式由复本得到:

的图和上面例子中的图相同。 在这种情况下,

由观察到的样本的均值得到的检验统计量为:

这样得到的a 的p 值近似为0.004(如图),因此我们拒绝这个假设。

特殊情况:正态分布样本

如果随机样本符合正态分布,则得到某个标准化统计量的小样本的精确CDF 是可能的。

正态分布的小样本双边置信区间

均值

的置信区间:

标准化统计量:

的t 分布。

它有一个自由度为置信区间:

用MATLAB 的 方差

函数估计

的置信区间:

标准化统计量:

它有一个自由度为

置信区间:

分布。

用MATLAB 的函数估计。

正态分布的小样本双边假设检验

均值

的假设检验:

用t 检验统计量

P 值为:

用MATLAB

的 方差

的假设检验

分布检验统计量(

):

函数估计

用MATLAB 的

函数估计

tCDF

分布

版权属于麻省理工学院 2003年

最后修改日期 2003年10月8日

第18课

小样本统计

小样本

当样本容量N 较小时,分布特性的估计量a (均值、 方差、90%百分位值等)通常不是正态分布的。

在这种情况下,估计值

和标准化统计量z 的

(用来得到置信区间和假设检验)可

以用随机模拟进行近似。

为了在随机模拟中产生随机复本,我们需要确定特性a 的值(或者是与它相关的参数)。

对于置信区间估计,我们假设对于假设检验,我们假设随机模拟用大量长度为N 的

(由实际数据计算出的估计值);

(假定的参数值)。 随机样本复本生成

的估计值。通过所有这些估计

值,可以得出期望的估计值和标准化统计量的。

例子——指数分布的均值的小样本双边置信区间

考虑一个取自含有未知参数a 、已知符合指数分布的总体的小样本:

样本均值是a 的无偏估计量:

在大样本情况下,我们由标准化统计量z 得到a 的置信区间。z 的复本i 为:

其中

是由所有复本的估计值

是取

(例如i =

)计算得到的样本均值

和标准差。每个时的数值。 累积分布函数

时用MATLAB 的exprnd 函数计算得到的N=5

是通过函数或作出的复本图得到的。

这个例子中,在数值较小和较大的部分都明显偏离单位正态分布:

在大样本情况下,

用来确定

的值:

a 的小样本双边95%置信区间近似为:

为了进行比较,给出a 的大样本(正态分布)双边95%置信区间为:

就小的样本容量而言,差别是微小的。但a 的小样本和大样本的99%置信区间相比较,差别就较大了。

例子——指数分布的均值的小样本双边假设检验

考虑上面例子,假设:

与上面类似,我们可以利用随机模拟得到这个假设的拒绝域和p 值;不同的是,在这里,函数中取,并按下式由复本得到:

的图和上面例子中的图相同。 在这种情况下,

由观察到的样本的均值得到的检验统计量为:

这样得到的a 的p 值近似为0.004(如图),因此我们拒绝这个假设。

特殊情况:正态分布样本

如果随机样本符合正态分布,则得到某个标准化统计量的小样本的精确CDF 是可能的。

正态分布的小样本双边置信区间

均值

的置信区间:

标准化统计量:

的t 分布。

它有一个自由度为置信区间:

用MATLAB 的 方差

函数估计

的置信区间:

标准化统计量:

它有一个自由度为

置信区间:

分布。

用MATLAB 的函数估计。

正态分布的小样本双边假设检验

均值

的假设检验:

用t 检验统计量

P 值为:

用MATLAB

的 方差

的假设检验

分布检验统计量(

):

函数估计

用MATLAB 的

函数估计

tCDF

分布

版权属于麻省理工学院 2003年

最后修改日期 2003年10月8日


相关文章

  • 教育统计学大纲
  • 高纲1428 江苏省高等教育自学考试大纲 28063 教育统计学 南京师范大学编 江苏省高等教育自学考试委员会办公室 Ⅰ 课程的性质与设置目的 <教育统计学>是研究如何整理.分析在包括教育实验.教育调查等教育研究中所获取的数字资 ...查看


  • 数理统计有关基础知识
  • 第4章 数理统计的基础知识 数理统计与概率论是两个有密切联系的学科, 它们都以随机现象的统计规律为研究对象. 但在研究问题的方法上有很大区别: 概率论 -- 已知随机变量服从某分布, 寻求分布的性质.数字特征.及其应用; 数理统计 -- 通 ...查看


  • 统计学中自由度概念的认识
  • 中国西部科技 2010年10月(下旬)第09卷第30期 总 第227期 统计学中自由度概念的认识 王 玺 (上海电力学院,上海 200090) 摘 要:样本统计量的自由度是统计学中的基本概念.不同的样本统计量有不同的自由度,其差别来自于样本 ...查看


  • 0278 社会统计学
  • 湖北省高等教育自学考试大纲 课程名称:社会统计学 课程代码:0278 第一部分 课程性质与目标 一.课程性质与特点 <社会统计学>是湖北省高等教育自学考试社会工作与管理专业开设的一门专业课程, 侧重介绍调查资料的收集.整理.分析 ...查看


  • 社会统计学_教案
  • <社会统计学>教案 教学目的和要求:通过本课程的学习,使学生熟悉常用的统计方法,并且学会如何将统计分析知识应用于社会调查研究之中,掌握统计方法的灵活运用.本课程偏重统计方法的实际应用,而非其数理基础.在教学过程中,注重对于不同统 ...查看


  • 社会统计学总结
  • 一.算数平均数:某一总体值总体单位平均所得的标志值的水平,是反映集中趋势最常用.最基本的平均指标. 二.中位数:把总体单位某一数量标志的各个数值按大小顺序排列,位于正中处的变量值. 三.平均差:各变量值对其算术平均数(或中位数)离差绝对值的 ...查看


  • 统计学第四版答案(贾俊平)
  • 请举出统计应用的几个例子: 1.用统计识别作者:对于存在争议的论文,通过统计量推出作者 2.用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的 3.挑战者航天飞机失事预测 请举 ...查看


  • 统计学学习心得
  • 1.什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集.整理.显示和分析统计数据的科学.统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统 ...查看


  • 统计学原理复习重点概述
  • 统计学原理复习重点概述 本课程主要包括三部分知识.第一部分统计基础知识第一章和第二章数据收集部分.第二部分描述统计第二章统计数据整理部分(表格与图形法).第三章数据分布特征的描述(静态数据描述法)和动态数据描述法,即第六章时间数列分析和第八 ...查看


热门内容