第六章 样本及抽样分布
【内容提要】
一、简单随机样本与统计量
1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。
2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果X 1, X 2,..., X n 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值x 1, x 2,..., x n ,称其为
X 1, X 2,..., X n 的观察值。
注:若X 1, X 2,..., X n 为总体X 的简单随机样本,则X 1, X 2,..., X n 相互独立,且与总体X 同分布。 3. 统计量 设X 1, X 2,..., X n 为总体X 的简单随机样本,T =g (X 1, X 2,..., X n ) 为样本X 1, X 2,..., X n 的实值函数,且不含任何未知参数,则称T =g (X 1, X 2,..., X n ) 为一个统计量,将样本值x 1, x 2,..., x n 代入后算出的函数值t =g (x 1, x 2,..., x n ) 称为该统计量的值。
注:设X 1, X 2,..., X n 为总体X 的简单随机样本,x 1, x 2,..., x n 为相应的样本值,则常用的统计量有:
4. 经验分布函数 设X 1, X 2,..., X n 为总体X 的简单随机样本,x 1, x 2,..., x n 为相应的样本值,将样本值
*
按由小到大的顺序重新编号x 1
*
*
*
⎧0, 若x
⎪m k ⎪m **
=⎨∑i , 若x k ≤x
总体X 的经验分布函数(或样本分布函数) 。
注:设F (x ), F n (x ) 为总体X 的概率分布函数与经验分布函数,则∀x ∈R ,有:
P lim F (x ) -F n (x ) =0=1,即只要n 充分大,则F n (x ) 与F (x ) 只有微小的差别。
n →∞
()
二、抽样分布
1. χ-分布:设X 1, X 2,..., X n 为总体X N (0,1)的简单随机样本,则称χ=∑X k 服从自由度为n
k =1
22
n
2
的χ-分布,记为χ=∑X k χ(n ) 。
k =1
22
n
22
【定理】设随机变量ξ χ2(n ) , η χ2(m ) ,且二者相互独立,则
⎧x n -1e -x , 若x >0⎪
⑴. ξ的密度函数为:f (x ) =⎨2n 2Γ(2) ;
⎪0, 若x ≤0⎩
⑵. χ2-分布的再生性:ξ+η
2
χ2(m +n ) ;
⑶. χ-分布的数字特征:E (ξ) =n , D (ξ) =2n ;
22
⑷. χ2-分布的临界值:P ξχα(n ) =α.(查表)
()()
χ2(n ) -分布的密度函数y =f (x )
2. t -分布:设随机变量X N (0,1), Y 度为n 的t -分布,记为t t (n ) 。 【定理】设随机变量ξ t (n ) ,则
χ2(n ) ,且二者相互独立,
则称随机变量t =
服从自由
⑴. ξ的密度函数为:
f (x ) =
+x 2n ) -(n +1) 2, x ∈(-∞, +∞) ;
⑵. t -分布的极限分布:n →+∞时,ξ
N (0,1),即
lim f (x ) =ϕ(x ) =
n →∞
-x 2, x ∈(-∞, +∞) ; ⑶. t -分布的数字特征:若n >2,则E (ξ) =0, D (ξ) =n (n -2) ; ⑷. t -分布的临界值:P (ξ-t α(n ) )=α.(查表)
虚线:N (0,1)分布的密度函数y =ϕ(x ) 实线:t (n ) -分布的密度函数y =f (x )
3. F -分布:设随机变量X
χ2(m ) , Y χ2(n ) ,且二者相互独立,则称随机变量F =
X m
服从自Y n
由度为(m , n ) 的F -分布,记为F F (m , n ) 。 【定理】设随机变量ξ F (m , n ) ,则
⎧Γ((m +n ) 2)m m n n x 2-1
⋅, 若x >0⎪(m +n ) 2
⑴. ξ的密度函数为:f (x ) =⎨Γ(m 2) Γ(n 2) (mx +n ) ;
⎪0, 若x ≤0⎩
⑵. F -分布的倒数不变性:ξ
-1
F (n , m ) ;
n 2n 2(m +n -2)
⑶. F -分布的数字特征:若n >4,则E (ξ) =; , D (ξ) =
n -2m (n -2) 2(n -4)
⑷. F -分布的临界值:P (ξF α(n , m ) )=α.(查表
)
F (m , n ) -分布的密度函数
y =f (x )
三、正态总体的统计量的分布 1.单个正态总体的情形
设X 1, X 2,..., X n 为正态总体X N (μ, σ2) 的简单随机样本,令
=
111222
X , S =(X -) , χ=∑k ∑k ∑(X k -μ) 2,则 n 1≤k ≤n n -11≤k ≤n n 1≤k ≤n
n χ2⑴
N (0,1); ⑵. 2 χ2(n ) ;
σ⑶. 与S 相互独立,且2.两个正态总体的情形
22
设X 1, X 2,..., X n 1为总体X N (μ1, σ1Y 1, Y 2,..., Y n 2为总体Y N (μ2, σ2) 的简单随机样本,) 的简单
2
(n -1) S 2
σ2
χ2(n -1) ; ⑷
t (n -1) 。
随机样本,且两个样本之间相互独立,令
=
1111∑X k , =∑Y k , S 12=∑(X k -) 2, S 22=∑(Y k -) 2,
n 11≤k ≤n 1n 21≤k ≤n 2n 1-11≤k ≤n 1n 2-11≤k ≤n 2
11222
χ= ∑(X k -μ1) , χ2=∑(Y k -μ2) , S w =
n 11≤k ≤n 1n 21≤k ≤n 221
⑴
χ1212
N (0,1); ⑵. 22 F (n 1, n 2) ;
χ22
S 12122⑶. 22 F (n 1-1, n 2-1) ; ⑷. 若σ12=
σ2 t (n 1+n 2-2) 。
S 22【第六章作业】
一、填空题
1、设X 1, X 2,..., X n ,... 独立同分布,且有有限的期望E (X k ) =μ与方差D (X k ) =σ2>0,则n 充分大
1n 2
时,近似地有=∑X k
N (μ, σn ) ,即 N (0,1),特别当X 1, X 2,..., X n ,... 独立同
n k =1分布于N (μ, σ2) 时,上述结论还是精确成立的。
2、设X 1, X 2,..., X n ,... 独立同分布,且有有限的期望E (X k ) =μ与方差D (X k ) =σ2>0, k =1,2,... ,
1n 21n 222
则Y =∑X k 依概率收敛到(σ+μ) ,即∀ε>0,有lim P (∑X k -(σ2+μ2)
n →∞n k =1n k =1
222
⎤(X +X ) +(X -X ) χ(2),则 3、设X 1, X 2, X 3, X 4是N (0,22) 的简单随机样本,且Y =C ⎡1234⎣⎦
C =。
4、设容量为n =9的样本之观察值为8,7,6,9,8,7,5,9,6,则该样本之观察值的样本均值为=9,样本方差为s 2=81。
1n 2
5、设X 1, X 2,..., X n 是N (μ, σ) 的简单随机样本,则=∑X k N (μ, σ) 。
n k =1
2
二、单项选择题
2
1、设X 1, X 2, X 3是母体N (μ, σ) 的简单随机样本,其中μ已知,σ>0未知,则下列选项中非统计
量的是(C ) :
A .X 1+X 2+X 3; B .max {X 1, X 2, X 3};
22
C .(X 12+X 2+X 3)
2; D .X 1-μ。
2、设X 1, X 2,..., X n 是母体B (1,p ) 的简单随机样本,则下列选项中错误的是(B , D ) : A .当n 充分大时,近似地有 N (p , p (1-p ) n ) ; B .P (=k ) =C n p (1-p )
k
k
n -k
, k =0,1,2,..., n ;
k k C .P (=k n ) =C n p (1-p ) n -k , k =0,1,2,..., n ; k k D .P (X i =k ) =C n p (1-p ) n -k , k =0,1,2,..., n 。
3、设X t (n ) ,则 (A ) :
A .X 2 F (1,n ) ; B .X 2 F (n ,1) ; C .X 2 4、设X 1, X 2,..., X n 是总体N (μ, σ2) 的简单随机样本,令=
22
χ2(n ) ; D .X 2 t (n ) 。
11∑X k , S 12=∑(X k -) 2,n 1≤k ≤n n -11≤k ≤n
1n 1n 1n 2222
而S =∑(X k -) , S 3=∑(X k -μ) , S 4=∑(X k -μ) 2,则服从t (n -1) 的是(C ) :
n k =1n -1k =1n k =1
A
.t =
B
.t = C
.t = D
.t =
X
n m +
5、设X 1, X 2, . , X , n X , n 1. , 2+X , n +
1≤k ≤n
1≤k ≤m
是总体N (0,σ2) 的容量为(n +m ) 的简单随机样本,则统计量
2
V =(m ∑X k 2) (n ∑X n +k ) 服从的分布是(C ) :
A .F (m , n ) ; B .F (n -1, m -1) ; C .F (n , m ) ; D .F (m -1, n -1) 。 三、计算题
1、为了研究某种零件的加工工时定额,随机观察了12人次的加工工时,测得如下数据(分钟) :
9.8,7.8,8.2,10.5,7.5,8.8,10.0,9.4,8.5,9.5,8.4,9.8,试求样本均值、样本方差、样本标准差。 1n 1n 2解:
=∑x k ≈9.02, s =∑(x k -) 2≈0.8359, s =≈0.9143。
n k =1n -1k =1
2、从一批人中随机抽取10人,测得每个人的身高,得到如下数据 (cm ) :
173,170,148,160,168,181,151,168,154,177,求该样本观察值的样本分布函数。
解: 该样本观察值的样本分布函数为:
2
3、在总体N (52.6,3) 中随机抽取一容量为36的样本,求样本均值落在50.8 53.8之间的概率。 解: 由于 N (μ, σ
2
n ) =N (52.6,0.52) ,故
-52.6
≤2.4) =Φ(2.4)+Φ(3.6)-1≈Φ(2.4)≈0.9918。 0.5
P (50.8≤≤53.8) =P (-3.6≤
4、在总体N (20,3)中随机抽取两个容量分别为10,15的独立样本,求两个样本均值只差的绝对值大于
0.3的概率。
解: 由于1 N (μ, σ2n 1) =N (20,0.3),2 N (μ, σ22) =N (20,0.2),且相互独立,故
1-2 N (0,0.5),从而
P (1-2>0.3) =1-P ≤=2Φ-1≈2Φ(0.42)-1
≈2⨯0.6628-1=0.3256。
5、设X 1, X 2,..., X 10是总体N (0,0.32) 的简单随机样本,求P (
1≤k ≤10
∑X k 2>1.44) 。
解: 由于X 1, X 2,..., X 10是总体N (0,0.32) 的简单随机样本,故
1
X k 2 χ2(10),从而 2∑0.31≤k ≤10
P (∑X k 2>1.44) =P (
1≤k ≤10
1
X k 2>16) ≈0.1。 2∑0.31≤k ≤10
6、设X 1, X 2,..., X 10是总体χ2(n ) 的简单随机样本,求E (), D (), E (S 2) 。
解: 由于X 1, X 2,..., X 10是总体χ2(n ) 的简单随机样本,故E (X k ) =n , D (X k ) =2n , 1≤k ≤10,故 E () =
2
110110
E (X ) =n , D () =D (X k ) =0.02n , ∑k 2∑10k =110k =1
1011102222E (∑X k -10) =D (X k ) +(EX k ) ⎤-10⎡D () +() ⎤ E (S ) = ∑⎡⎣⎦⎣⎦10K =110K =1
{}
=(2n +n 2) -(n 2+0.02n ) =1.98n 。
7、在总体N (μ, σ) 中随机抽取一容量为16的简单随机样本(其中μ, σ均未知) ,求P (S 及E (S ), D (S ) 。
解: 由于X 1, X 2,..., X 16是总体N (μ, σ) 的简单随机样本,故15S P (S
2
2
2
2
22
2
2≤2.041)
2 χ2(15),故
0. 99
2
2≤2. 04=1) -1P
σ2
2
2
2
5>
,0 130. ≈6-15) =10.
2
2
2σ4
E (S ) =E (15S ) =⨯15=σ,D (S ) =() D (15S ) =⨯30=。
[1**********]
2
2
2
σ2σ2σ4
第六章 样本及抽样分布
【内容提要】
一、简单随机样本与统计量
1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。
2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果X 1, X 2,..., X n 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值x 1, x 2,..., x n ,称其为
X 1, X 2,..., X n 的观察值。
注:若X 1, X 2,..., X n 为总体X 的简单随机样本,则X 1, X 2,..., X n 相互独立,且与总体X 同分布。 3. 统计量 设X 1, X 2,..., X n 为总体X 的简单随机样本,T =g (X 1, X 2,..., X n ) 为样本X 1, X 2,..., X n 的实值函数,且不含任何未知参数,则称T =g (X 1, X 2,..., X n ) 为一个统计量,将样本值x 1, x 2,..., x n 代入后算出的函数值t =g (x 1, x 2,..., x n ) 称为该统计量的值。
注:设X 1, X 2,..., X n 为总体X 的简单随机样本,x 1, x 2,..., x n 为相应的样本值,则常用的统计量有:
4. 经验分布函数 设X 1, X 2,..., X n 为总体X 的简单随机样本,x 1, x 2,..., x n 为相应的样本值,将样本值
*
按由小到大的顺序重新编号x 1
*
*
*
⎧0, 若x
⎪m k ⎪m **
=⎨∑i , 若x k ≤x
总体X 的经验分布函数(或样本分布函数) 。
注:设F (x ), F n (x ) 为总体X 的概率分布函数与经验分布函数,则∀x ∈R ,有:
P lim F (x ) -F n (x ) =0=1,即只要n 充分大,则F n (x ) 与F (x ) 只有微小的差别。
n →∞
()
二、抽样分布
1. χ-分布:设X 1, X 2,..., X n 为总体X N (0,1)的简单随机样本,则称χ=∑X k 服从自由度为n
k =1
22
n
2
的χ-分布,记为χ=∑X k χ(n ) 。
k =1
22
n
22
【定理】设随机变量ξ χ2(n ) , η χ2(m ) ,且二者相互独立,则
⎧x n -1e -x , 若x >0⎪
⑴. ξ的密度函数为:f (x ) =⎨2n 2Γ(2) ;
⎪0, 若x ≤0⎩
⑵. χ2-分布的再生性:ξ+η
2
χ2(m +n ) ;
⑶. χ-分布的数字特征:E (ξ) =n , D (ξ) =2n ;
22
⑷. χ2-分布的临界值:P ξχα(n ) =α.(查表)
()()
χ2(n ) -分布的密度函数y =f (x )
2. t -分布:设随机变量X N (0,1), Y 度为n 的t -分布,记为t t (n ) 。 【定理】设随机变量ξ t (n ) ,则
χ2(n ) ,且二者相互独立,
则称随机变量t =
服从自由
⑴. ξ的密度函数为:
f (x ) =
+x 2n ) -(n +1) 2, x ∈(-∞, +∞) ;
⑵. t -分布的极限分布:n →+∞时,ξ
N (0,1),即
lim f (x ) =ϕ(x ) =
n →∞
-x 2, x ∈(-∞, +∞) ; ⑶. t -分布的数字特征:若n >2,则E (ξ) =0, D (ξ) =n (n -2) ; ⑷. t -分布的临界值:P (ξ-t α(n ) )=α.(查表)
虚线:N (0,1)分布的密度函数y =ϕ(x ) 实线:t (n ) -分布的密度函数y =f (x )
3. F -分布:设随机变量X
χ2(m ) , Y χ2(n ) ,且二者相互独立,则称随机变量F =
X m
服从自Y n
由度为(m , n ) 的F -分布,记为F F (m , n ) 。 【定理】设随机变量ξ F (m , n ) ,则
⎧Γ((m +n ) 2)m m n n x 2-1
⋅, 若x >0⎪(m +n ) 2
⑴. ξ的密度函数为:f (x ) =⎨Γ(m 2) Γ(n 2) (mx +n ) ;
⎪0, 若x ≤0⎩
⑵. F -分布的倒数不变性:ξ
-1
F (n , m ) ;
n 2n 2(m +n -2)
⑶. F -分布的数字特征:若n >4,则E (ξ) =; , D (ξ) =
n -2m (n -2) 2(n -4)
⑷. F -分布的临界值:P (ξF α(n , m ) )=α.(查表
)
F (m , n ) -分布的密度函数
y =f (x )
三、正态总体的统计量的分布 1.单个正态总体的情形
设X 1, X 2,..., X n 为正态总体X N (μ, σ2) 的简单随机样本,令
=
111222
X , S =(X -) , χ=∑k ∑k ∑(X k -μ) 2,则 n 1≤k ≤n n -11≤k ≤n n 1≤k ≤n
n χ2⑴
N (0,1); ⑵. 2 χ2(n ) ;
σ⑶. 与S 相互独立,且2.两个正态总体的情形
22
设X 1, X 2,..., X n 1为总体X N (μ1, σ1Y 1, Y 2,..., Y n 2为总体Y N (μ2, σ2) 的简单随机样本,) 的简单
2
(n -1) S 2
σ2
χ2(n -1) ; ⑷
t (n -1) 。
随机样本,且两个样本之间相互独立,令
=
1111∑X k , =∑Y k , S 12=∑(X k -) 2, S 22=∑(Y k -) 2,
n 11≤k ≤n 1n 21≤k ≤n 2n 1-11≤k ≤n 1n 2-11≤k ≤n 2
11222
χ= ∑(X k -μ1) , χ2=∑(Y k -μ2) , S w =
n 11≤k ≤n 1n 21≤k ≤n 221
⑴
χ1212
N (0,1); ⑵. 22 F (n 1, n 2) ;
χ22
S 12122⑶. 22 F (n 1-1, n 2-1) ; ⑷. 若σ12=
σ2 t (n 1+n 2-2) 。
S 22【第六章作业】
一、填空题
1、设X 1, X 2,..., X n ,... 独立同分布,且有有限的期望E (X k ) =μ与方差D (X k ) =σ2>0,则n 充分大
1n 2
时,近似地有=∑X k
N (μ, σn ) ,即 N (0,1),特别当X 1, X 2,..., X n ,... 独立同
n k =1分布于N (μ, σ2) 时,上述结论还是精确成立的。
2、设X 1, X 2,..., X n ,... 独立同分布,且有有限的期望E (X k ) =μ与方差D (X k ) =σ2>0, k =1,2,... ,
1n 21n 222
则Y =∑X k 依概率收敛到(σ+μ) ,即∀ε>0,有lim P (∑X k -(σ2+μ2)
n →∞n k =1n k =1
222
⎤(X +X ) +(X -X ) χ(2),则 3、设X 1, X 2, X 3, X 4是N (0,22) 的简单随机样本,且Y =C ⎡1234⎣⎦
C =。
4、设容量为n =9的样本之观察值为8,7,6,9,8,7,5,9,6,则该样本之观察值的样本均值为=9,样本方差为s 2=81。
1n 2
5、设X 1, X 2,..., X n 是N (μ, σ) 的简单随机样本,则=∑X k N (μ, σ) 。
n k =1
2
二、单项选择题
2
1、设X 1, X 2, X 3是母体N (μ, σ) 的简单随机样本,其中μ已知,σ>0未知,则下列选项中非统计
量的是(C ) :
A .X 1+X 2+X 3; B .max {X 1, X 2, X 3};
22
C .(X 12+X 2+X 3)
2; D .X 1-μ。
2、设X 1, X 2,..., X n 是母体B (1,p ) 的简单随机样本,则下列选项中错误的是(B , D ) : A .当n 充分大时,近似地有 N (p , p (1-p ) n ) ; B .P (=k ) =C n p (1-p )
k
k
n -k
, k =0,1,2,..., n ;
k k C .P (=k n ) =C n p (1-p ) n -k , k =0,1,2,..., n ; k k D .P (X i =k ) =C n p (1-p ) n -k , k =0,1,2,..., n 。
3、设X t (n ) ,则 (A ) :
A .X 2 F (1,n ) ; B .X 2 F (n ,1) ; C .X 2 4、设X 1, X 2,..., X n 是总体N (μ, σ2) 的简单随机样本,令=
22
χ2(n ) ; D .X 2 t (n ) 。
11∑X k , S 12=∑(X k -) 2,n 1≤k ≤n n -11≤k ≤n
1n 1n 1n 2222
而S =∑(X k -) , S 3=∑(X k -μ) , S 4=∑(X k -μ) 2,则服从t (n -1) 的是(C ) :
n k =1n -1k =1n k =1
A
.t =
B
.t = C
.t = D
.t =
X
n m +
5、设X 1, X 2, . , X , n X , n 1. , 2+X , n +
1≤k ≤n
1≤k ≤m
是总体N (0,σ2) 的容量为(n +m ) 的简单随机样本,则统计量
2
V =(m ∑X k 2) (n ∑X n +k ) 服从的分布是(C ) :
A .F (m , n ) ; B .F (n -1, m -1) ; C .F (n , m ) ; D .F (m -1, n -1) 。 三、计算题
1、为了研究某种零件的加工工时定额,随机观察了12人次的加工工时,测得如下数据(分钟) :
9.8,7.8,8.2,10.5,7.5,8.8,10.0,9.4,8.5,9.5,8.4,9.8,试求样本均值、样本方差、样本标准差。 1n 1n 2解:
=∑x k ≈9.02, s =∑(x k -) 2≈0.8359, s =≈0.9143。
n k =1n -1k =1
2、从一批人中随机抽取10人,测得每个人的身高,得到如下数据 (cm ) :
173,170,148,160,168,181,151,168,154,177,求该样本观察值的样本分布函数。
解: 该样本观察值的样本分布函数为:
2
3、在总体N (52.6,3) 中随机抽取一容量为36的样本,求样本均值落在50.8 53.8之间的概率。 解: 由于 N (μ, σ
2
n ) =N (52.6,0.52) ,故
-52.6
≤2.4) =Φ(2.4)+Φ(3.6)-1≈Φ(2.4)≈0.9918。 0.5
P (50.8≤≤53.8) =P (-3.6≤
4、在总体N (20,3)中随机抽取两个容量分别为10,15的独立样本,求两个样本均值只差的绝对值大于
0.3的概率。
解: 由于1 N (μ, σ2n 1) =N (20,0.3),2 N (μ, σ22) =N (20,0.2),且相互独立,故
1-2 N (0,0.5),从而
P (1-2>0.3) =1-P ≤=2Φ-1≈2Φ(0.42)-1
≈2⨯0.6628-1=0.3256。
5、设X 1, X 2,..., X 10是总体N (0,0.32) 的简单随机样本,求P (
1≤k ≤10
∑X k 2>1.44) 。
解: 由于X 1, X 2,..., X 10是总体N (0,0.32) 的简单随机样本,故
1
X k 2 χ2(10),从而 2∑0.31≤k ≤10
P (∑X k 2>1.44) =P (
1≤k ≤10
1
X k 2>16) ≈0.1。 2∑0.31≤k ≤10
6、设X 1, X 2,..., X 10是总体χ2(n ) 的简单随机样本,求E (), D (), E (S 2) 。
解: 由于X 1, X 2,..., X 10是总体χ2(n ) 的简单随机样本,故E (X k ) =n , D (X k ) =2n , 1≤k ≤10,故 E () =
2
110110
E (X ) =n , D () =D (X k ) =0.02n , ∑k 2∑10k =110k =1
1011102222E (∑X k -10) =D (X k ) +(EX k ) ⎤-10⎡D () +() ⎤ E (S ) = ∑⎡⎣⎦⎣⎦10K =110K =1
{}
=(2n +n 2) -(n 2+0.02n ) =1.98n 。
7、在总体N (μ, σ) 中随机抽取一容量为16的简单随机样本(其中μ, σ均未知) ,求P (S 及E (S ), D (S ) 。
解: 由于X 1, X 2,..., X 16是总体N (μ, σ) 的简单随机样本,故15S P (S
2
2
2
2
22
2
2≤2.041)
2 χ2(15),故
0. 99
2
2≤2. 04=1) -1P
σ2
2
2
2
5>
,0 130. ≈6-15) =10.
2
2
2σ4
E (S ) =E (15S ) =⨯15=σ,D (S ) =() D (15S ) =⨯30=。
[1**********]
2
2
2
σ2σ2σ4