统计描述与参数估计和假设检验中的计算公式
1、简单算术平均数
x =
n
(P267)
xf f =∑x 2、加权算术平均数 =
f f
3、简单调和平均数 =
n 1∑x
4、加权调和平均数 =
M ∑x M
5、总体的标准差 ⑴简单式 σ=
2
x -i
N
⑵加权式 σ=
2x i -f
f
i
6、样本标准差 ⑴简单式 s =
⑵加权式 s =
x -n -1
2x -f i
2
f -1
(P269)
在一个统计样本中,其标准差越大,说明它的各个观测值分
布的越分散,它的趋中程度就越差,反之亦然。 7、离散系数(标准差系数)总体的(1) V σ= 样本的(2) V s =
σ
⨯100%
S
⨯100% 离散程度越小,平均数代表程度超高,反之亦然。(P270) 8、标准分数(Z 分数):Z =
x i -,主要用途是判断两个s
不同均值、不同标准差的数据进行对比,以判定它们在各组中的位置。
统计量的标准误差类:
9、样本平均数抽样的抽样误差(标准差)
=μ) σ(
当总体标准差
σ
s
=n n
σ未知时,可用样本标准差S 代替计算。
π1-πn
10、样本比例抽样的抽样误差(标准差)
μσp )= p (
=
p 1-p n
当总体比例方差π(1-π)未知,可用样本比例方差p (1-p )代替
计算。
如果不知道P 值用50%代替计算,或选择接近50%的数计算。
参数估计:就是用样本的统计量去估计总体的参数。有三
种用样本均值估计总体均值;用样本的比例估计总的比例;用样本的方差估计总体的方差。(只学前两种估计) 11、平均值的区间估计:若总体方差未知,可用样本方差代替。
大样本的估计:在n>30的情况下
-Z σ
n n
≤≤+Z σ
n n
-Z α≤≤+Z -Z μ≤≤+Z μαα 也可以写成:1、
2、
-E ≤≤+E
小样本的估计:在n
-t αn
≤≤+t αn
12、比例的区间估计:没有t 分布,全是Z 分布。
P -Z α
p (1-p ) p (1-p )
≤≤+Z α
n n
p -Z αμp ≤P ≤p +Z αμp
也可以写成:1、
2、
p -E p ≤P ≤p +E p
(Z α) 2S 2
13、平均数的样本量的确定:若总体方差未知,可用样本
方差。
n =
(Z α) 2σ2
E 2
=
E 2
14、比例的样本量的确定:若总体比例π未知,可用样本比例P 代替计算。
n =
(Z α) π(1-π)
2
E p
2
=
(Z α) p (1-p )
2
E p
2
假设检验:参数估计是依据样本信息推断未知总体参数,
而假设检验是先对总体参数或分布形式提出某种假设,然后利用样本信息和相关统计量的分布特征去检验这个假定,做出是否拒绝原来假设的结论。 15、平均数的假设检验:
大样本的检验:当n>30的情况下
⑴已知总体标准差
⑵未知总体标准差
σ
-μZ =
,不管n
n
σ,已知样本标准差S ,且n ∠
-μt =
30 ,则: n
16、比例的假设检验:
Z =
p 01-p 0n
p -p 0
=
π01-π0n
p -π0
假设检验有以下三种基本形式: 双侧检验:H 0:μ=μ0(π
=π0),H μ≠μ0 (π≠π0)
1
左侧检验:H 0:μ≥μ0(π 右侧检验:H 0:μ≤μ0(π 17、相关分析中的公式:
A 、相关系数的计算公式:
≥π0),H μ∠μ0 (π∠π0)
1
≤π0),H μ〉μ0 (π〉π0)
1
r =
n ∑x -∑x ⨯n ∑y
2
2
n xy -x y
2
-∑y 2
r ≥0. 8时,可视为高度相关;0. 5≤r 〈0. 8时,可视
为中度相关;
0. 3≤r 〈0. 5时,可视为低度相关;
r 〈0. 3时,可视为不相关,相关程度极弱;
B 、相关系数的检验:当r
H 0:ρ=0(两变量之间不存在线性相关)
H 0:ρ≠0(两变量之间存在线性相关)
t =计算统计量:
r n -2-r
2
C 、一元线性回归方程为:
y =b 0+b 1x
2
^
b 1=
n xy -x y n ∑x -∑x 2
y x b =-b =-b 0
n
1
n
1
D 、估计标准误差 S y
S y =
2
(y i -y i )n -2
=
2y -β0y -β1xy
n -2
反映回归直线代表性的指标。S y 的值越大,说明点离直线越分散,直线的代表性越小;S y 的值越小,说明点离直线越集中,直线的代表性越大;当 S y = 0 时,r =1,说明点都落在直线上,也就是完全相关了。
统计描述与参数估计和假设检验中的计算公式
1、简单算术平均数
x =
n
(P267)
xf f =∑x 2、加权算术平均数 =
f f
3、简单调和平均数 =
n 1∑x
4、加权调和平均数 =
M ∑x M
5、总体的标准差 ⑴简单式 σ=
2
x -i
N
⑵加权式 σ=
2x i -f
f
i
6、样本标准差 ⑴简单式 s =
⑵加权式 s =
x -n -1
2x -f i
2
f -1
(P269)
在一个统计样本中,其标准差越大,说明它的各个观测值分
布的越分散,它的趋中程度就越差,反之亦然。 7、离散系数(标准差系数)总体的(1) V σ= 样本的(2) V s =
σ
⨯100%
S
⨯100% 离散程度越小,平均数代表程度超高,反之亦然。(P270) 8、标准分数(Z 分数):Z =
x i -,主要用途是判断两个s
不同均值、不同标准差的数据进行对比,以判定它们在各组中的位置。
统计量的标准误差类:
9、样本平均数抽样的抽样误差(标准差)
=μ) σ(
当总体标准差
σ
s
=n n
σ未知时,可用样本标准差S 代替计算。
π1-πn
10、样本比例抽样的抽样误差(标准差)
μσp )= p (
=
p 1-p n
当总体比例方差π(1-π)未知,可用样本比例方差p (1-p )代替
计算。
如果不知道P 值用50%代替计算,或选择接近50%的数计算。
参数估计:就是用样本的统计量去估计总体的参数。有三
种用样本均值估计总体均值;用样本的比例估计总的比例;用样本的方差估计总体的方差。(只学前两种估计) 11、平均值的区间估计:若总体方差未知,可用样本方差代替。
大样本的估计:在n>30的情况下
-Z σ
n n
≤≤+Z σ
n n
-Z α≤≤+Z -Z μ≤≤+Z μαα 也可以写成:1、
2、
-E ≤≤+E
小样本的估计:在n
-t αn
≤≤+t αn
12、比例的区间估计:没有t 分布,全是Z 分布。
P -Z α
p (1-p ) p (1-p )
≤≤+Z α
n n
p -Z αμp ≤P ≤p +Z αμp
也可以写成:1、
2、
p -E p ≤P ≤p +E p
(Z α) 2S 2
13、平均数的样本量的确定:若总体方差未知,可用样本
方差。
n =
(Z α) 2σ2
E 2
=
E 2
14、比例的样本量的确定:若总体比例π未知,可用样本比例P 代替计算。
n =
(Z α) π(1-π)
2
E p
2
=
(Z α) p (1-p )
2
E p
2
假设检验:参数估计是依据样本信息推断未知总体参数,
而假设检验是先对总体参数或分布形式提出某种假设,然后利用样本信息和相关统计量的分布特征去检验这个假定,做出是否拒绝原来假设的结论。 15、平均数的假设检验:
大样本的检验:当n>30的情况下
⑴已知总体标准差
⑵未知总体标准差
σ
-μZ =
,不管n
n
σ,已知样本标准差S ,且n ∠
-μt =
30 ,则: n
16、比例的假设检验:
Z =
p 01-p 0n
p -p 0
=
π01-π0n
p -π0
假设检验有以下三种基本形式: 双侧检验:H 0:μ=μ0(π
=π0),H μ≠μ0 (π≠π0)
1
左侧检验:H 0:μ≥μ0(π 右侧检验:H 0:μ≤μ0(π 17、相关分析中的公式:
A 、相关系数的计算公式:
≥π0),H μ∠μ0 (π∠π0)
1
≤π0),H μ〉μ0 (π〉π0)
1
r =
n ∑x -∑x ⨯n ∑y
2
2
n xy -x y
2
-∑y 2
r ≥0. 8时,可视为高度相关;0. 5≤r 〈0. 8时,可视
为中度相关;
0. 3≤r 〈0. 5时,可视为低度相关;
r 〈0. 3时,可视为不相关,相关程度极弱;
B 、相关系数的检验:当r
H 0:ρ=0(两变量之间不存在线性相关)
H 0:ρ≠0(两变量之间存在线性相关)
t =计算统计量:
r n -2-r
2
C 、一元线性回归方程为:
y =b 0+b 1x
2
^
b 1=
n xy -x y n ∑x -∑x 2
y x b =-b =-b 0
n
1
n
1
D 、估计标准误差 S y
S y =
2
(y i -y i )n -2
=
2y -β0y -β1xy
n -2
反映回归直线代表性的指标。S y 的值越大,说明点离直线越分散,直线的代表性越小;S y 的值越小,说明点离直线越集中,直线的代表性越大;当 S y = 0 时,r =1,说明点都落在直线上,也就是完全相关了。