公式一
1. 众数【MODE】
(1) 未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。
(2) 组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。 下限公式: M0=L+
∆1
⨯i ∆1+∆2
式中:M0表示众数;L表示众数的下线;∆1表示众数组次数与上一组次数之差;∆2表示众数组次数与下一组次数之差;i表示众数组的组距。 上限公式:
M0=U-∆2
⨯i ∆1+∆2
式中:U表示众数组的上限。
2.中位数【MEDIAN】
(1)未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。设一组数据按从小到大排序后为X1,X2,…,XN,中位数Me,为则有:
Me=X
(
N+1
2
当N为奇数
⎫1⎧⎪⎪
Me=⎨X⎛N⎫+X⎛N⎫⎬ 当N为偶数
2⎩⎪ +1⎪⎪⎪ ⎝2⎭⎝2⎭⎭
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:
∑f
i=1
N
i
Me=L+
-Sm-1
fm
⨯d
式中:Me表示中位数;L表示中位数所在组的下限;Sm-1表示中位数所在组以下各组的累计次数;fm表示中位数所在组的次数;d表示中位数所在组的组距。
3.均值的计算【AVERAGE】
(1)未经分组均值的计算
xi
x1+x2+…xn∑=i=1 未经分组数据均值的计算公式为: =
nn
n
(2)分组数据均值计算
∑x1f1+x2f+2 +xkfk
=i=k分组数据均值的计算公式为: =
f1+f2+ +fk
4.几何平均数【GEOMEAN】
几何平均数是N个变量值乘积的N次方根,计算公式为:
k
xifi
1i
∑f
i=1
式中:G表示几何平均数;∏表示连乘符号。
5.调和平均数【HARMEAN】
调和平均数是对变量的倒数求平均,然后再取倒数而得到的平均数,它有简单调和平均数与加权调和平均数两种计算形式。 简单调和平均数: H=
n111++…+x1x2xn
=
n1
∑i=1xi
n
n
mi∑m1+m2+…+mn=1
加权调和平均数: H= =in
mnm1m2mi
++…+x1x2xn∑i=1xi式中:H表示调和平均数。
6.极差【Range】
极差也称全距,是一组数据的最大值与最小值之差,即
xi R=max
()
-mxiin
()
式中:R表示极差;maxxi和minxi分别表示一组数据的最大值与最小值。
()
()
7.平均差【Mean Deviation】
平均差是各标志值与其平均数的绝对离差的算术平均。
(1) 根据未分组资料的计算公式: AD∑x-i=1
i
n
n
n
(2) 根据分组资料的计算公式: AD=
∑x-i=1
i
fi
∑f
i=1
n
i
式中:AD表示平均差
8.方差【Variance】和标准差【Standard Deviation】
方差是各变量值与其均值离差平方的平均数。要求掌握方差和标准差的计算方法。
未分组数据方差的计算公式为: σ2=
∑(x-)
i=1
n
2
n
n
分组数据方差的计算公式为: σ2=
∑(x
i=1
i
-i
)
2
i
f
∑f
i=1
n
式中:σ2表示方差。
方差的平方根即为标准差,其相应的计算公式为:
未分组数据:
σ=
分组数据:
σ=
式中:σ表示标准差。
9.离散系数
离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。
其计算公式为: Vσ=式中:Vσ表示离散系数。
σ
10.偏态【SKEW】
偏态是对分布偏斜方向及程度的测度。利用众数、中位数和均值之间的关系就可以判断分布是左偏还是右偏。显然,判别偏态的方向并不困难,但要测度偏斜的程度就需要计算偏态系数了。
n
⎡xi-⎤n
EXCEL中偏态系数的计算公式为: ∑⎢⎥
n-1n-2i=1⎣s⎦
3
11.峰值【KURT】
EXCEL中峰值系数的计算公式为:
42n⎧⎫xnn+13n-1⎛⎫()()⎪⎪i
⎨ ⎪⎬-∑n-1n-2n-3sn-1n-3i=1⎝⎭⎪⎪⎩⎭
式中:s 表示样本标准差。
公式二
1.
均值估计
(1)样本均值的标准差
样本均值的标准差,即为样本均值的标准误差,又称为样本均值的抽样平均误差,它反映的是所有可能样本的均值与总体均值的平均差异程度,反映了所有可能样本的实际抽样误差水平。
样本均值的抽样平均误差计算公式为: 重复抽样方式: σ(
)==不重复抽样方式: σ(
)=
通常情况下,当N很大时,(N-1)几乎等于N,样本均值的抽样平均误差的计算公式也可简化为:
σ(
)=
在公式中,σ是总体标准差。但实际计算时,所研究总体的标准差通常是未知的,在大样本的情况下,通常用样本标准差S代替。
(2)大样本均值的极限误差 ∆=Zα2σ() (3)大样本下总体均值的区间估计
总体均值的置信度为(1-α)的置信区间:
-zα2σ()≤μ≤+zα2σ()
即-zα2(4)总体方差未知,小样本正态总体均值的区间估计
总体均值的置信度为(1-α)的置信区间:
≤μ≤+zα2
-tα2σ()≤μ≤+tα2σ()
≤μ≤+tα2即
-tα2
2.比例估计
(1)样本比例的抽样平均误差
样本比例的抽样平均误差为:
重复抽样下: σ(p)
=
上式中,p应为总体比例,实际计算时通常用样本比例p代替。
不重复抽样下: σ(p)
=(2)样本比例的抽样极限误差
≈∆P=Zασ(p)
(3)总体比率的区间估计
总体比例P的置信度为(1-α)的置信区间为:
p-∆P≤p≤p+∆P
即 p-Zα2σ(p)≤p≤p+Zα2σ(p)
3. 总体均值检验
(1) 单一总体均值检验
①正态总体(总体方差已知)或大样本均值检验
检验统计量Z为:
Z=
②正态总体(总体方差未知)小样本均值检验
检验统计量t为:
t=
(2) 两个总体的均值检验
①两个正态总体均值检验——两个总体方差已知或大样本
Z检验统计量为:
Z=
--μ-μ
大样本下对两个总体均值进行检验时,在总体标准差未知的情况下,可用样本标准差代替总体标准差进行计算,检验统计量不变。
②两个正态总体均值检验(小样本)——两个总体方差未知但相等
T检验统计量为:
--μ-μ Z=
sp=
1n11n22
其中: s=xi-1; s2=xi-2 ∑∑n1-1i=1n2-1i=1
2
1
()
2
()
2
4. 总体比例检验
(1) 单一总体的比例检验
Z检验统计量:
Z=
(2) 两个总体比例的检验
检验的统计量为:
Z=
ˆ=其中:p
ˆ1+n2pˆ2n1p
ˆ为当p1=p2时p1和p2的联合估计值。 ,p
n1+n2
5. 总体方差假设检验
(1) 单一正态总体方差的假设检验
检验统计量为:
n-1)s2( χ=2
2
σ0
其中:s=
2
∑(
i=1
n
xi-)
2
n-1
为σ2的估计量。
(2) 两个正态总体的方差假设检验
2
检验统计量为: F=s12s2
其中: s=
2
1
∑(
i=1
n1
xi-)
2
n1-1
; s=
22
∑(
i=1
n2
xi-)
2
n2-1
。
公式三
1.单因素方差分析
设总体共分为k种处理进行观察,第j种处理试验了容量为nj的样本。 (1) 计算各项离差平方和
在单因素方差分析中,需要计算的离差平方和有3个,它们分别是总离差平方和,误差项离差平方和以及水平项离差平方和。
总离差平方和,用SST(Sum of Squares for Total )代表:
SST=∑∑xij-x
i=1j=1nj
k
()
2
式中:x表示全部样本观测值的总均值。其计算公式为:
x=
x
n
ij
误差离差平方和,用SSE(Sum of Squares for Error)代表:
SSE=∑∑(xij-j)
i=1j=1nj
k
2
式中:j表示第j种水平的样本均值,j=
∑x
i=1
nj
ij
nj
水平项离差平方和。为了后面叙述方便,可以把单因素方差分析中的因素称为A。于是水平项离差平方和可以用SSA(Sum of Squares for Factor A)表示。
SSA的计算公式为: SSA=∑∑j-x
i=1j=1nj
k
()
2
(2) 计算平均平方
用离差平方和除以自由度即可得到平均平方和(Mean Square)。对SST来说,其自由度为(n-1);对SSA来说,其自由度为(r-1),这里r表示水平的个数;对SSE来说,其自由度为(n-r)。与离差平方和一样,SST、SSA、SSE之间的自由度也存在着如下的关系:
n-1=(r-1)+(n-r)
对于SSA,其平均平方MSA(组间均方差)为: MSA=
SSA
r-1SSE
n-r
对于SSE,其平均平方MSE(组内均方差)为: MSE=
MSA
MSE
(3) 检验统计量F F=
2.两因素方差分析
设两个因素A、B分别有k个水平和n个水平,共进行nk次试验。 (1) 计算各项离差平方和
在两因素方差分析中,需要计算的离差平方和有4个,它们分别是总离差平方和,误差项离差平方和以及水平A、B项离差平方和。
总离差平方和,用SST(Sum of Squares for Total)代表: SST=∑∑xij-x
()
2
1nk
式中:x表示全部样本观察值的总均值,其计算公式为: x=∑∑xij
nki=1j=1
水平项离差平方和可以分别用SSA(Sum of Squares for Factor A)和SSB(Sum of Squares for Factor B)表示。
SSA的计算公式为: SSA=∑∑∙j-x
i=1j=1n
k
()
2
1n
式中: ∙j=∑xij
ni=1
SSB的计算公式为: SSB=∑∑i∙-x
i=1j=1
nk
()
2
1k
式中: i∙=∑xi j
kj=1
误差离差平方和,用SSE(Sum of Squares for Error)代表: SSE=∑∑xij-i∙-∙j+x
i=1j=1n
k
()
2
(2) 计算平均平方
用离差平方和除以自由度即可得到平均平方和(Mean Square)。对SST来说,其自由度为(nk-1);对SSA来说,其自由度为(k-1),这里k表示水平A的个数;对SSB来说,其自由度为(n-1),这里n表示水平B的个数;对SSE来说,其自由度为(n-1)(k-1)。这样,把各项离差平方和除以各自的自由度,即得到平均的离差平方和,简称为均方:
MSA=
SSASSBSSE
MSB= MSE= k-1n-1k-1n-1(3) 检验统计量F
F(A)=
MSAMSB
F(B)= MSEMSE
公式四
1.拟合优度的检验统计量:
χ2=∑
i=1k
(fi-fe)
fe
2
式中:fi表示类别i的观察频数;fe表示假设H0为真时,类别i的期望频数;k表示类别总数。 注意:当所有种类的期望频数均大于或等于5时,检验统计量服从自由度为(k-1)的χ2分布。
公式一
1. 众数【MODE】
(1) 未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。
(2) 组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。 下限公式: M0=L+
∆1
⨯i ∆1+∆2
式中:M0表示众数;L表示众数的下线;∆1表示众数组次数与上一组次数之差;∆2表示众数组次数与下一组次数之差;i表示众数组的组距。 上限公式:
M0=U-∆2
⨯i ∆1+∆2
式中:U表示众数组的上限。
2.中位数【MEDIAN】
(1)未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。设一组数据按从小到大排序后为X1,X2,…,XN,中位数Me,为则有:
Me=X
(
N+1
2
当N为奇数
⎫1⎧⎪⎪
Me=⎨X⎛N⎫+X⎛N⎫⎬ 当N为偶数
2⎩⎪ +1⎪⎪⎪ ⎝2⎭⎝2⎭⎭
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:
∑f
i=1
N
i
Me=L+
-Sm-1
fm
⨯d
式中:Me表示中位数;L表示中位数所在组的下限;Sm-1表示中位数所在组以下各组的累计次数;fm表示中位数所在组的次数;d表示中位数所在组的组距。
3.均值的计算【AVERAGE】
(1)未经分组均值的计算
xi
x1+x2+…xn∑=i=1 未经分组数据均值的计算公式为: =
nn
n
(2)分组数据均值计算
∑x1f1+x2f+2 +xkfk
=i=k分组数据均值的计算公式为: =
f1+f2+ +fk
4.几何平均数【GEOMEAN】
几何平均数是N个变量值乘积的N次方根,计算公式为:
k
xifi
1i
∑f
i=1
式中:G表示几何平均数;∏表示连乘符号。
5.调和平均数【HARMEAN】
调和平均数是对变量的倒数求平均,然后再取倒数而得到的平均数,它有简单调和平均数与加权调和平均数两种计算形式。 简单调和平均数: H=
n111++…+x1x2xn
=
n1
∑i=1xi
n
n
mi∑m1+m2+…+mn=1
加权调和平均数: H= =in
mnm1m2mi
++…+x1x2xn∑i=1xi式中:H表示调和平均数。
6.极差【Range】
极差也称全距,是一组数据的最大值与最小值之差,即
xi R=max
()
-mxiin
()
式中:R表示极差;maxxi和minxi分别表示一组数据的最大值与最小值。
()
()
7.平均差【Mean Deviation】
平均差是各标志值与其平均数的绝对离差的算术平均。
(1) 根据未分组资料的计算公式: AD∑x-i=1
i
n
n
n
(2) 根据分组资料的计算公式: AD=
∑x-i=1
i
fi
∑f
i=1
n
i
式中:AD表示平均差
8.方差【Variance】和标准差【Standard Deviation】
方差是各变量值与其均值离差平方的平均数。要求掌握方差和标准差的计算方法。
未分组数据方差的计算公式为: σ2=
∑(x-)
i=1
n
2
n
n
分组数据方差的计算公式为: σ2=
∑(x
i=1
i
-i
)
2
i
f
∑f
i=1
n
式中:σ2表示方差。
方差的平方根即为标准差,其相应的计算公式为:
未分组数据:
σ=
分组数据:
σ=
式中:σ表示标准差。
9.离散系数
离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。
其计算公式为: Vσ=式中:Vσ表示离散系数。
σ
10.偏态【SKEW】
偏态是对分布偏斜方向及程度的测度。利用众数、中位数和均值之间的关系就可以判断分布是左偏还是右偏。显然,判别偏态的方向并不困难,但要测度偏斜的程度就需要计算偏态系数了。
n
⎡xi-⎤n
EXCEL中偏态系数的计算公式为: ∑⎢⎥
n-1n-2i=1⎣s⎦
3
11.峰值【KURT】
EXCEL中峰值系数的计算公式为:
42n⎧⎫xnn+13n-1⎛⎫()()⎪⎪i
⎨ ⎪⎬-∑n-1n-2n-3sn-1n-3i=1⎝⎭⎪⎪⎩⎭
式中:s 表示样本标准差。
公式二
1.
均值估计
(1)样本均值的标准差
样本均值的标准差,即为样本均值的标准误差,又称为样本均值的抽样平均误差,它反映的是所有可能样本的均值与总体均值的平均差异程度,反映了所有可能样本的实际抽样误差水平。
样本均值的抽样平均误差计算公式为: 重复抽样方式: σ(
)==不重复抽样方式: σ(
)=
通常情况下,当N很大时,(N-1)几乎等于N,样本均值的抽样平均误差的计算公式也可简化为:
σ(
)=
在公式中,σ是总体标准差。但实际计算时,所研究总体的标准差通常是未知的,在大样本的情况下,通常用样本标准差S代替。
(2)大样本均值的极限误差 ∆=Zα2σ() (3)大样本下总体均值的区间估计
总体均值的置信度为(1-α)的置信区间:
-zα2σ()≤μ≤+zα2σ()
即-zα2(4)总体方差未知,小样本正态总体均值的区间估计
总体均值的置信度为(1-α)的置信区间:
≤μ≤+zα2
-tα2σ()≤μ≤+tα2σ()
≤μ≤+tα2即
-tα2
2.比例估计
(1)样本比例的抽样平均误差
样本比例的抽样平均误差为:
重复抽样下: σ(p)
=
上式中,p应为总体比例,实际计算时通常用样本比例p代替。
不重复抽样下: σ(p)
=(2)样本比例的抽样极限误差
≈∆P=Zασ(p)
(3)总体比率的区间估计
总体比例P的置信度为(1-α)的置信区间为:
p-∆P≤p≤p+∆P
即 p-Zα2σ(p)≤p≤p+Zα2σ(p)
3. 总体均值检验
(1) 单一总体均值检验
①正态总体(总体方差已知)或大样本均值检验
检验统计量Z为:
Z=
②正态总体(总体方差未知)小样本均值检验
检验统计量t为:
t=
(2) 两个总体的均值检验
①两个正态总体均值检验——两个总体方差已知或大样本
Z检验统计量为:
Z=
--μ-μ
大样本下对两个总体均值进行检验时,在总体标准差未知的情况下,可用样本标准差代替总体标准差进行计算,检验统计量不变。
②两个正态总体均值检验(小样本)——两个总体方差未知但相等
T检验统计量为:
--μ-μ Z=
sp=
1n11n22
其中: s=xi-1; s2=xi-2 ∑∑n1-1i=1n2-1i=1
2
1
()
2
()
2
4. 总体比例检验
(1) 单一总体的比例检验
Z检验统计量:
Z=
(2) 两个总体比例的检验
检验的统计量为:
Z=
ˆ=其中:p
ˆ1+n2pˆ2n1p
ˆ为当p1=p2时p1和p2的联合估计值。 ,p
n1+n2
5. 总体方差假设检验
(1) 单一正态总体方差的假设检验
检验统计量为:
n-1)s2( χ=2
2
σ0
其中:s=
2
∑(
i=1
n
xi-)
2
n-1
为σ2的估计量。
(2) 两个正态总体的方差假设检验
2
检验统计量为: F=s12s2
其中: s=
2
1
∑(
i=1
n1
xi-)
2
n1-1
; s=
22
∑(
i=1
n2
xi-)
2
n2-1
。
公式三
1.单因素方差分析
设总体共分为k种处理进行观察,第j种处理试验了容量为nj的样本。 (1) 计算各项离差平方和
在单因素方差分析中,需要计算的离差平方和有3个,它们分别是总离差平方和,误差项离差平方和以及水平项离差平方和。
总离差平方和,用SST(Sum of Squares for Total )代表:
SST=∑∑xij-x
i=1j=1nj
k
()
2
式中:x表示全部样本观测值的总均值。其计算公式为:
x=
x
n
ij
误差离差平方和,用SSE(Sum of Squares for Error)代表:
SSE=∑∑(xij-j)
i=1j=1nj
k
2
式中:j表示第j种水平的样本均值,j=
∑x
i=1
nj
ij
nj
水平项离差平方和。为了后面叙述方便,可以把单因素方差分析中的因素称为A。于是水平项离差平方和可以用SSA(Sum of Squares for Factor A)表示。
SSA的计算公式为: SSA=∑∑j-x
i=1j=1nj
k
()
2
(2) 计算平均平方
用离差平方和除以自由度即可得到平均平方和(Mean Square)。对SST来说,其自由度为(n-1);对SSA来说,其自由度为(r-1),这里r表示水平的个数;对SSE来说,其自由度为(n-r)。与离差平方和一样,SST、SSA、SSE之间的自由度也存在着如下的关系:
n-1=(r-1)+(n-r)
对于SSA,其平均平方MSA(组间均方差)为: MSA=
SSA
r-1SSE
n-r
对于SSE,其平均平方MSE(组内均方差)为: MSE=
MSA
MSE
(3) 检验统计量F F=
2.两因素方差分析
设两个因素A、B分别有k个水平和n个水平,共进行nk次试验。 (1) 计算各项离差平方和
在两因素方差分析中,需要计算的离差平方和有4个,它们分别是总离差平方和,误差项离差平方和以及水平A、B项离差平方和。
总离差平方和,用SST(Sum of Squares for Total)代表: SST=∑∑xij-x
()
2
1nk
式中:x表示全部样本观察值的总均值,其计算公式为: x=∑∑xij
nki=1j=1
水平项离差平方和可以分别用SSA(Sum of Squares for Factor A)和SSB(Sum of Squares for Factor B)表示。
SSA的计算公式为: SSA=∑∑∙j-x
i=1j=1n
k
()
2
1n
式中: ∙j=∑xij
ni=1
SSB的计算公式为: SSB=∑∑i∙-x
i=1j=1
nk
()
2
1k
式中: i∙=∑xi j
kj=1
误差离差平方和,用SSE(Sum of Squares for Error)代表: SSE=∑∑xij-i∙-∙j+x
i=1j=1n
k
()
2
(2) 计算平均平方
用离差平方和除以自由度即可得到平均平方和(Mean Square)。对SST来说,其自由度为(nk-1);对SSA来说,其自由度为(k-1),这里k表示水平A的个数;对SSB来说,其自由度为(n-1),这里n表示水平B的个数;对SSE来说,其自由度为(n-1)(k-1)。这样,把各项离差平方和除以各自的自由度,即得到平均的离差平方和,简称为均方:
MSA=
SSASSBSSE
MSB= MSE= k-1n-1k-1n-1(3) 检验统计量F
F(A)=
MSAMSB
F(B)= MSEMSE
公式四
1.拟合优度的检验统计量:
χ2=∑
i=1k
(fi-fe)
fe
2
式中:fi表示类别i的观察频数;fe表示假设H0为真时,类别i的期望频数;k表示类别总数。 注意:当所有种类的期望频数均大于或等于5时,检验统计量服从自由度为(k-1)的χ2分布。