计算全距.平均差.方差和标准差

计算全距、平均差、方差和标准差

一、全距R(range)

全距是一组数据中的最大值(maximum)与该组数据中最小值(minimum)之差,又称极差。 R=Xmax-Xmin

一般用于研究的预备阶段,用它检查数据的分布范围,以便确定如何进行统计分析 原始数据计算公式 三、四分位差(Quartile)

四分位差是第一个四分位数与第三个四分位数之差计算公式为 Q=Q3-Q1

四、方差与标准差

方差:又称为变异数、均方,是每个数据与该组数据平均数之差乘方后的均值,是表示一组数据离散程度的统计指标。 样本的方差用表示,总体的方差用表示。

标准差是方差的算术平方根。一般样本的标准差用S 表示,总体的标准差用表示。

标准差和方差是描述数据离散程度的最常用的差异量。

分组数据方差与标准差的计算公式

方差与标准差的性质

• 方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。

• 标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性:

总体方差、标准差或者方差、标准才差的合成

• 方差具有可加性的特点。当已知几个小组数据的方差或标准差时,可以计算几个小组联合在一起的总的方差或标准差。

• 需要注意的是,只有在应用同一种观测手段,测量的是同一种特质,

只是样本不同的数据时,才能计算合成方差或标准差。

方差和标准差的优点:

方差与标准差是表示一组数据离散程度的最好指标,其值越大,离散程度越大。

应用方差和标准差表示一组数据的离散程度,须注意必须是同一类数据(即同一种测量工具的测量结果),而且被比较样本的水平比较接近。

优点:

• 反应灵敏。每个数据发生变化,方差与标准差也随之变化 • 有一定计算公式的严密确定 • 容易计算

• 受抽样变动的影响小 • 简单明了

• 方差具有可加性(区分变异源,组间/组内)

五、差异系数(coefficient of variation)

差异系数指标准差与其算术平均数的百分比,它是没有单位的相对数。用CV表示。

何种情况下运用差异系数:

• 两个或两个以上样本所测特质不同,即所使用的观测工具不同,如何比较两者的离散程度?

• 即使使用同一种观测量具,但样本水平相差较大,如何比较其离散程度?

差异系数的作用

• 比较不同单位资料的差异程度

• 比较单位相同而平均数相差较大的两组资料的差异程度 • 可判断特殊差异情况

根据经验,一般CV值常在5%-35%之间。如果CV大于35%时,可怀疑所求得的平均数是否失去了意义;如果CV小于5%时,可怀疑平均数与标准差是否计算有误。

六、标准分数(standard score)

1、概念

标准分数,又称为基分数或Z分数(Z-score),是以标准差为单位,反映一个原始分数在团体中所处位置。具体来说,Z分数表示原始分数在以平均数为中心时的相对位置。

• 标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。

• Z分数可以表明原始分数在团体中的相对位置,因此称为相对位置量数。

2、计算

把原始分数转换成Z分数,就把单位不等距的和缺乏明确参照点的分数转换成以标准差为单位、以平均数为参照点的分数。

线性变换

标准分数带有小数和负值,为了克服标准分数出现的小数、负数和不易为人们所接受等缺点,常常是将其转换成正态标准分数。

例如:早期智力测验中运用智力商数表示智力测查的指标

这种表示智力的方法后来被离差智商取代:

标准分数的性质

• Z分数无实际单位,是以平均数为参照点、以标准差为单位的相对量。 • 一组原始分数得到的Z分数既有正值,也有负值,所有原始分数的Z分数之和为零。

• 一组原始数据中,各个Z分数的标准差为1。

标准分数的应用

• 用于比较几个分属性质不同的观测值在各自数据分布中相对位置的

• 表示标准测验分数。经过标准化的心理和教育测验,常常用标准分数表示测验结果。

标准分数的优点

• 可比性:标准分数以团体的平均数为基准,以标准差为单位,因而具有可比性。

• 可加性:标准分数使不同的原始分数具有相同的参照点,因而具有可加性。

• 明确性:标准分数较原始分数的意义更为明确。

• 合理性:标准分数保证了不同性质的分数在总分数中的权重相同,使分数更合理地反映事实。

七、百分位数与百分位差

把一个次数分布排序后,分为100个单位。百分位数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。 百分位数用Pm表示

百分位差(距)

• 百分位差是指两个百分位数(percentile)之差。 • 常用的百分位距有两种:

P90-P10和P93-P7。

第三节数据的分布形状

一、正态分布

二、偏态系数(skewness SK)

• 当数据较多的出现在均值的一侧时,数据分布左右不对称,此时,数据分布称为偏态分布。

• 描述变量非对称分布的数字特征是偏态系数,也称为偏度。

• 偏态分布有正偏态分布和负偏态分布两种。当N>200以上时,计算的偏态系数才是可靠的。SK>0为正偏态,SK

• 如果偏态系数的绝对值大于1,则说明数据的分布与正态分布有明显

三、峰态系数(kurtosis Ku)

Ku以0.263为判断值,小于为高狭峰,大于为低阔峰

四、偏态系数与峰态系数的计算方法

1、皮尔逊偏态量数法 2、峰度、偏度检验法

计算全距、平均差、方差和标准差

一、全距R(range)

全距是一组数据中的最大值(maximum)与该组数据中最小值(minimum)之差,又称极差。 R=Xmax-Xmin

一般用于研究的预备阶段,用它检查数据的分布范围,以便确定如何进行统计分析 原始数据计算公式 三、四分位差(Quartile)

四分位差是第一个四分位数与第三个四分位数之差计算公式为 Q=Q3-Q1

四、方差与标准差

方差:又称为变异数、均方,是每个数据与该组数据平均数之差乘方后的均值,是表示一组数据离散程度的统计指标。 样本的方差用表示,总体的方差用表示。

标准差是方差的算术平方根。一般样本的标准差用S 表示,总体的标准差用表示。

标准差和方差是描述数据离散程度的最常用的差异量。

分组数据方差与标准差的计算公式

方差与标准差的性质

• 方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。

• 标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性:

总体方差、标准差或者方差、标准才差的合成

• 方差具有可加性的特点。当已知几个小组数据的方差或标准差时,可以计算几个小组联合在一起的总的方差或标准差。

• 需要注意的是,只有在应用同一种观测手段,测量的是同一种特质,

只是样本不同的数据时,才能计算合成方差或标准差。

方差和标准差的优点:

方差与标准差是表示一组数据离散程度的最好指标,其值越大,离散程度越大。

应用方差和标准差表示一组数据的离散程度,须注意必须是同一类数据(即同一种测量工具的测量结果),而且被比较样本的水平比较接近。

优点:

• 反应灵敏。每个数据发生变化,方差与标准差也随之变化 • 有一定计算公式的严密确定 • 容易计算

• 受抽样变动的影响小 • 简单明了

• 方差具有可加性(区分变异源,组间/组内)

五、差异系数(coefficient of variation)

差异系数指标准差与其算术平均数的百分比,它是没有单位的相对数。用CV表示。

何种情况下运用差异系数:

• 两个或两个以上样本所测特质不同,即所使用的观测工具不同,如何比较两者的离散程度?

• 即使使用同一种观测量具,但样本水平相差较大,如何比较其离散程度?

差异系数的作用

• 比较不同单位资料的差异程度

• 比较单位相同而平均数相差较大的两组资料的差异程度 • 可判断特殊差异情况

根据经验,一般CV值常在5%-35%之间。如果CV大于35%时,可怀疑所求得的平均数是否失去了意义;如果CV小于5%时,可怀疑平均数与标准差是否计算有误。

六、标准分数(standard score)

1、概念

标准分数,又称为基分数或Z分数(Z-score),是以标准差为单位,反映一个原始分数在团体中所处位置。具体来说,Z分数表示原始分数在以平均数为中心时的相对位置。

• 标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。

• Z分数可以表明原始分数在团体中的相对位置,因此称为相对位置量数。

2、计算

把原始分数转换成Z分数,就把单位不等距的和缺乏明确参照点的分数转换成以标准差为单位、以平均数为参照点的分数。

线性变换

标准分数带有小数和负值,为了克服标准分数出现的小数、负数和不易为人们所接受等缺点,常常是将其转换成正态标准分数。

例如:早期智力测验中运用智力商数表示智力测查的指标

这种表示智力的方法后来被离差智商取代:

标准分数的性质

• Z分数无实际单位,是以平均数为参照点、以标准差为单位的相对量。 • 一组原始分数得到的Z分数既有正值,也有负值,所有原始分数的Z分数之和为零。

• 一组原始数据中,各个Z分数的标准差为1。

标准分数的应用

• 用于比较几个分属性质不同的观测值在各自数据分布中相对位置的

• 表示标准测验分数。经过标准化的心理和教育测验,常常用标准分数表示测验结果。

标准分数的优点

• 可比性:标准分数以团体的平均数为基准,以标准差为单位,因而具有可比性。

• 可加性:标准分数使不同的原始分数具有相同的参照点,因而具有可加性。

• 明确性:标准分数较原始分数的意义更为明确。

• 合理性:标准分数保证了不同性质的分数在总分数中的权重相同,使分数更合理地反映事实。

七、百分位数与百分位差

把一个次数分布排序后,分为100个单位。百分位数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。 百分位数用Pm表示

百分位差(距)

• 百分位差是指两个百分位数(percentile)之差。 • 常用的百分位距有两种:

P90-P10和P93-P7。

第三节数据的分布形状

一、正态分布

二、偏态系数(skewness SK)

• 当数据较多的出现在均值的一侧时,数据分布左右不对称,此时,数据分布称为偏态分布。

• 描述变量非对称分布的数字特征是偏态系数,也称为偏度。

• 偏态分布有正偏态分布和负偏态分布两种。当N>200以上时,计算的偏态系数才是可靠的。SK>0为正偏态,SK

• 如果偏态系数的绝对值大于1,则说明数据的分布与正态分布有明显

三、峰态系数(kurtosis Ku)

Ku以0.263为判断值,小于为高狭峰,大于为低阔峰

四、偏态系数与峰态系数的计算方法

1、皮尔逊偏态量数法 2、峰度、偏度检验法


相关文章

  • 第五章 离中趋势的量度:变异指标
  • 第五章 离中趋势测量法 平均指标对总体的共性和一般水平作了概括,以此来说明总体标志值分布的集中趋势.但是总体作为统计对象,还有其变异性的一面.变异指标用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映了总体的特 ...查看


  • 教育统计学大纲
  • 高纲1428 江苏省高等教育自学考试大纲 28063 教育统计学 南京师范大学编 江苏省高等教育自学考试委员会办公室 Ⅰ 课程的性质与设置目的 <教育统计学>是研究如何整理.分析在包括教育实验.教育调查等教育研究中所获取的数字资 ...查看


  • 体育统计学 1
  • 体育统计学复习资料 1.体育统计学是统计学的原理和方法在体育中的应用,是统计学的一个分支学科.体育统计学是一门收集.整理和分析体育中的统计数据的方法科学,其目的在于从量的侧面揭示体育现象的特征和规律性. 2.体育统计分析的过程: (1)根据 ...查看


  • 第五章 统计分布的数据特征
  • 第五章 统计分布的数据特征 第一节 平均指标(分布的集中趋势) 一.平均指标的概念和作用:二.算术平均数:三.调和平均数:四.几何平均数:五.众数: 六.中位数:七.各种平均数之间的相互关系. 一. 平均指标的概念和作用 ㈠ 概念:平均指标 ...查看


  • 卫生统计学第二章定量资料的统计描述2
  • 一.题型:A1 题号: 1 本题分数: 2.4 编制组段数为10的频数表,在确定组距时 A. 常取最大值的1/10取整作为组距 B. 常取最小值的1/10取整作为组距 C. 常取极差的1/10取整作为组距 D. 组距等于极差 E. 常取极差 ...查看


  • [教育统计与测量]练习题库及答案
  • 华中师范大学网络教育学院 <教育统计与测量>课程练习题库及答案 本科 一. 名词解释 1. 教育统计:是运用数理统计的原理和方法研究教育现象数量表现和数理关系的科学. 2. 变量:是指可以定量并能取不同数值的事物的特征. 3. ...查看


  • 北大统计学作业答案
  • 北京大学现代远程教育 <统计学>平时作业答案 一.填空题(括号中的页码表示该页或有原题或有相应的知识点) 1.设A.B.C为3个事件,则A.B.C中至少有两个发生的事件可以写成.(p115,掌握例题5.8和5.9) (注:我们使 ...查看


  • 第八章数值变量资料的统计描述
  • 第八章数值变量资料的统计描述 三.习题 A1型题 1 . 描述一组正态或近似正态分布资料的平均水平用() A .算术均数 B .几何均数 C .中位数 D .平均数 E .众数 2 . 血清学滴度资料最常计算()以表示其平均水平. A .均 ...查看


  • 第二章 统计数据的描述
  • 第二章 统计数据的描述 一.填空题: 1. 统计分组有等距分组与两大类. 2. 频率是每组数据出现的 3. 统计分组的关键在于确定和组距. 4. 统计表从形式上看,主要由 表头(总标题) .横行标题.纵栏标题和 数字资料(指标数值) 四部分 ...查看


热门内容