第1章
P m
(1)排列组合公式
C m
n n
随机事件及其概率
从m 个人中挑出n 个人进行排列的可能数。
m ! (m
n )! m ! n ! (m
n )!
从m 个人中挑出n 个人进行组合的可能数。
:m+n
m 种方法完成,第二种方法可由:m ×n
m 种方法完成,第二个步骤可由
n n
加法原理(两种方法均能完成此事)
(2)加法和乘法原理
种方法来完成,则这件事可由
某件事由两种方法来完成,第一种方法可由乘法原理(两个步骤分别不能完成这件事)某件事由两个步骤来完成,第一个步骤可由种方法来完成,则这件事可由重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题
m+n 种方法来完成。
m ×n 种方法来完成。
(3)一些常见排列(4)随机试验和随机事件
如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。
试验的可能结果称为随机事件。在一个试验下,不管事件有多少个,如下性质:
①每进行一次试验,必须发生且只能发生这一组中的一个事件;②任何事件,都是由这一组中的部分事件组成的。这样一组事件中的每一个事件称为基本事件,用基本事件的全体,称为试验的样本空间,用一个事件就是由
中的部分点(基本事件
的子集。
同理,
来表示。表示。
)组成的集合。通常用大写字母
总可以从其中找出这样一组事件,
它具有
(5)基本事件、样本空间和事件
A ,B ,C ,, 表示事件,它们是
为必然事件,?为不可能事件。
不可能事件(? )的概率为零,而概率为零的事件不一定是不可能事件;
必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。①关系:
如果事件A 的组成部分也是事件
A
B
B 的组成部分,(A 发生必有事件B 发生):
A 与事件B 等价,或称
A 等于B :
如果同时有A
(6)事件的关系与运算
B ,B A ,则称事件
A=B。
A 、B 中至少有一个发生的事件:A B ,或者A +B 。属于A 而不属于B 的部分所构成的事件,称为A 与B 的差,记为A-B ,也可
表示为A-AB 或者A B ,它表示A 发生而B 不发生的事件。
A 、B 同时发生:A B ,或者AB 。A B=?,则表示A 与B 不可能同时发生,
称事件A 与事件B 互不相容或者互斥。基本事件是互不相容的。
-A 称为事件A 的逆事件,或称的事件。互斥未必对立。②运算:
A 的对立事件,记为
A 。它表示A 不发生
结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B) ∪C
分配率:(AB)∪C=(A∪C) ∩(B∪C) (A∪B) ∩C=(AC)∪(BC)
A i
A i
i 1
德摩根率:
设
i 1
A B A B ,A B A B
为样本空间,A 为事件,对每一个事件A 都有一个实数P(A),若满
足下列三个条件:
1° 0≤P(A)≤1,2° P(Ω) =1
(7)概率的公理化定义
P
i 1
3° 对于两两互不相容的事件A 1,A 2,, 有A i
i 1
P (A i )
常称为可列(完全)可加性。则称P(A)为事件A 的概率。1°2° P (
(8)古典概型
1
1
,
2n
,
P (
1
n
) P (
2
) )
1n
m
。
组成的,则有
1
设任一事件A ,它是由
, (
2
P(A)=(
m n
1
) (
2
)
m
) =P (
)
P (
2
)
P (
m
)
A 所包含的基本事件数
基本事件总数
同时样本空
若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,间中的每一个基本事件可以使用一个有界区域来描述,
(9)几何概型
P (A )
(10)加法公式(11)减法公式
概型。对任一事件
L (A ) L (
)
A ,
。
则称此随机试验为几何
。其中L 为几何度量(长度、面积、体积)
P(A+B)=P(A)+P(B)-P(AB)
当P(AB)=0时,P(A+B)=P(A)+P(B) P(A-B)=P(A)-P(AB) 当B
A 时,P(A-B)=P(A)-P(B)
当A=Ω时,P(B )=1- P(B)
定义设A 、B 是两个事件,且P(A)>0,则称件B 发生的条件概率,记为
P (B /A )
P (AB ) P (A )
(12)条件概率
为事件A 发生条件下,事
P (AB ) P (A )
。
条件概率是概率的一种,所有概率的性质都适合于条件概率。例如P(Ω/B)=1乘法公式:P (AB )
(13)乘法公式
A n
P(
B
/A)=1-P(B/A)
P (A ) P (B /A )
2, A 1,A 2,,A n ,若P(A1A A n-1)>0,则有
更一般地,对事件
P (A 1A 2,
1
A n )
P (A 1) P (A 2|A 1) P (A 3|A 1A 2) ,, P (A n |A 1A 2,
) 。
P (A ) P (B ) ,则称事件A 、B 是相互独立的。P (A )
0,则有
①两个事件的独立性
设事件A 、B 满足P (AB ) 若事件A 、B 相互独立,且P (B |A )
P (AB ) P (A )
P (A ) P (B ) P (A )
P (B )
若事件A 、B 相互独立,则可得到A 与B 、A 与B 、A 与B 也都相互独
(14)独立性
立。
必然事件和不可能事件
? 与任何事件都互斥。②多个事件的独立性
设ABC 是三个事件,如果满足两两独立的条件,
P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足
P(ABC)=P(A)P(B)P(C)
那么A 、B 、C 相互独立。对于n 个事件类似。设事件B 1, B 2, 1°B 1, B 2,
(15)全概公式
2°则有
P (A )
n
? 与任何事件都相互独立。
, B n 满足
P (B i )
0(i
1, 2,
, n ) ,
, B n 两两互不相容,B i
A
i 1
,
P (B 2) P (A |B 2) B n 及A 满足
P (Bi ) >0,i
P (B n ) P (A |B n ) 。
P (B 1) P (A |B 1)
设事件B 1,B 2,, ,1°
B 1,B 2,, ,
n
B n 两两互不相容,1,2,, ,n ,
A B i
i 1
2°则
(16)贝叶斯公式
P (B i /A )
,P (A ) 0,
P (B i ) P (A /B i )
n
,i=1,2,,n 。
P (B j ) P (A /B j )
j 1
此公式即为贝叶斯公式。
P (B i ) ,(i
1,2,, ,n ),通常叫先验概率。
P (B i /A ) ,(i
1,2,, ,
n ),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。
(17)伯努利概型
我们作了n 次试验,且满足
每次试验只有两种可能结果,
A 发生或A 不发生;
n 次试验是重复进行的,即
A 发生的概率每次均一样;
A 发生与否与其他次试验
A 发生与
每次试验是独立的,即每次试验否是互不影响的。
这种试验称为伯努利概型,或称为用p 表示每次试验示n 重伯努利试验中
P (k )
n
n 重伯努利试验。
A 发生的概率为1n ) 次的概率,
p
q ,用P n (k ) 表
A 发生的概率,则A 出现k (0
k
k
C
k n
p q
k n
,k
0, 1, 2,
, n 。
第二章
(1)离散型随机变量的分布律
随机变量及其分布
X k (k=1,2,, ) 且取各个值的概率,即事
设离散型随机变量X 的可能取值为件(X=Xk ) 的概率为
P(X=xk )=pk ,k=1,2,, ,则称上式为离散型随机变量式给出:
X P (X
x k )
|x 1, x 2, p 1, p 2,
, x k , , p k ,
。
X 的概率分布或分布律。有时也用分布列的形
显然分布律应满足下列条件:
p k
1
(1)p k
(2)连续型随机变量的分布密度
F (x )
0,k
1, 2,
,(2)
k 1
。
f (x ) ,对任意实数x ,有
设F (x ) 是随机变量X 的分布函数,若存在非负函数
x
f (x ) dx
,
简称概
则称X 为连续型随机变量。f (x ) 称为X 的概率密度函数或密度函数,率密度。
密度函数具有下面4个性质:1° 2°
f (x )
0。
f (x ) dx
x )
P (x
1
X
。
x
dx )
f (x ) dx
P (X
x k )
p k 在离
(3)离散与连续型随机变量的关系
P (X
积分元f (x ) dx 在连续型随机变量理论中所起的作用与
散型随机变量理论中所起的作用相类似。
(4)分布函数
设X 为随机变量,
F (x )
P (X
x )
x 是任意实数,则函数
称为随机变量
P (a
X
X 的分布函数,本质上是一个累积函数。
b )
F (b )
F (a )
可以得到X 落入区间(a , b ]的概率。分布∞,x]内的概率。
函数F (x ) 表示随机变量落入区间(–
分布函数具有如下性质:1°2°3°4°5°
F (x )
1,
x
;x 1
F (
F (x ) 是单调不减的函数,即F (
)
lim
x
x 2时,有
)
x
F (x 1) F (x )
F (x 2) ;1;
F (x ) 0,lim
F (x 0) F (x ) ,即F (x ) 是右连续的;F (x )
F (x
0) 。
P (X x )
对于离散型随机变量,
F (x )
x k x
x
p k ;
对于连续型随机变量,
(5)八大分布
二项分布0-1分布
F (x )
f (x ) dx 。
P(X=1)=p, P(X=0)=q
在n 重贝努里试验中,设事件的次数是随机变量,设为
P (X
k )
P (k )
n
k
A 发生的概率为p 。事件A 发生
, n 。
X ,则X 可能取值为0, 1, 2,
k
n k
C n p q 1, k
,
, n ,
其中
q 1p , 0p 0, 1, 2,
则称随机变量X 服从参数为n ,p 的二项分布。记为
X ~B (n , p ) 。
当n 1时,P (X
k ) p q
k 1k
,k 0. 1,这就是(0-1)分
布,所以(0-1)分布是二项分布的特例。
泊松分布设随机变量X 的分布律为
k
P (X k )
k !
e
,
0,k
0, 1, 2
,
则称随机变量者P(
超几何分布
P (X
k )
X 服从参数为的泊松分布,记为
X ~(
) 或
) 。
np=λ,n →∞)。
0, 1, 2
, l
泊松分布为二项分布的极限分布(
C M
C
k
C
n N
n N
k M
, l
k
min(M , n )
随机变量X 服从参数为n,N,M 的超几何分布,记为
几何分布
P (X
k )
q
k 1
H(n,N,M)。
p , k 1, 2, 3,
,其中p ≥0,q=1-p。
G(p)。
f (x ) 在[a,b]
随机变量X 服从参数为p 的几何分布,记为
均匀分布
设随机变量X 的值只落在[a,b]内,其密度函数上为常数
1b 1
f (x )
b 0,
a a
,即
,
a ≤x ≤b 其他,
则称随机变量分布函数为
X 在[a,b]上服从均匀分布,记为X ~U(a,b) 。
0,
x b
x
x
a a ,
a ≤x ≤b x>b。
F (x ) f (x ) dx
1,
当a ≤x 1
X
x 2)
x 2b
x 1a
。
指数分布
e
f (x )
x
,
x x
0, 0,
0,
0,则称随机变量其中
X 的分布函数为
X 服从参数为的指数分布。
1
F (x )
0,
e
x
,
x
0,
x
记住积分公式:x e
n
x
dx n !
正态分布
设随机变量X 的密度函数为
(x
)
2
2
f (x ) 其中
、
12
e
2
,
x
,
X 服从参数为X ~N (
,
2
0为常数,则称随机变量
、
的正态分布或高斯(
f (x ) 具有如下性质:
Gauss )分布,记为
) 。
1°
f (x ) 的图形是关于
x
对称的;1
为最大值;
2° 当x 若X ~N (1, F (x )
2
时,f (
2
2
)
2
2
(t ) ) x ,则X 的分布函数为2
e dt
。。
参数
0、
1时的正态分布称为标准正态分布,记为
2
X ~N (0, 1) ,其密度函数记为x
1
(x ) e
2
2
分布函数为(x )
1
x
t
,
x
,
2
e
2
dt 。
2
(x ) 是不可求积函数,其函数值,已编制成表可供查用。Φ(-x)=1-Φ(x)且Φ(0)=如果X ~N (
P (x 1
X
, x 2)
2
12
。
~N (0, 1) 。
x 1
) ,则
x 2
X
。
(6)分位数(7)函数分布
下分位表:P (X 上分位表:P (X 离散型
) =) =
;。
已知X 的分布列为
X P (X Y
x 1, x 2, x i ) p 1,
p 2,
y i , , x n , p n ,
g (x i ) 互不相等)如下:
,
g (X ) 的分布列(
Y
g (x 1), g (x 2), , g (x n ),
,
P (Y y i )
p 1, p 2, , p n ,
若有某些g (x i ) 相等,则应将对应的p i 相加作为g (x i ) 的概率。
连续型
先利用X 的概率密度
f X (x)写出Y 的分布函数
F Y (y)=P(g(X)≤
y) ,再利用变上下限积分的求导公式求出f Y (y)。
第三章
(1)联合分布
离散型
二维随机变量及其分布
如果二维随机向量
(X ,Y )的所有可能取值为至多可列为离散型随机量。
(x i , y j )(i , j
1, 2,
) ,
个有序对(x,y ),则称
设且事件{
=(X ,Y )的所有可能取值为=(x i , y j ) }的概率为p ij, , 称
(x i , y j )}
p ij (i , j
P {(X , Y ) 1, 2, )
为=(X ,Y )的分布律或称为X 和Y 的联合分布律。联合分
布有时也用下面的概率分布表来表示:
Y X x 1x 2
y 1p 11p 21
y 2p 12p 22
, , ,
y j p 1j p 2j
, , ,
x i p i1,
p ij
,
这里p ij 具有下面两个性质:(1)p ij ≥0(i,j=1,2,(2)
i
j
, );
p ij
1.
连续型
对于二维随机向量
f (x , y )(
x
,
(X , Y ) ,如果存在非负函数
) ,使对任意一个其邻边
y
分别平行于坐标轴的矩形区域有P {(X , Y ) 则称
D }
D
D ,即D={(X,Y)|a
f (x , y ) dxdy ,
f(x,y)
为
=(X ,Y )的分布
为连续型随机向量;并称
密度或称为X 和Y 的联合分布密度。
分布密度f(x,y)(1)(2)
(2)二维随机变量的本质(3)联合分布函数
设(X ,Y )为二维随机变量,对于任意实数
F (x , y )
P {X
(X
x , Y
y )
(X
x
具有下面两个性质:
f(x,y)≥0; f (x , y ) dxdy
Y
y )
1.
x,y, 二元函数
x , Y
y }
称为二维随机向量(X ,Y )的分布函数,或称为随机变量数。
X 和Y 的联合分布函
分布函数是一个以全平面为其定义域,以事件{(
1
,
2
) |X (
1
) x , Y (
2
)
y }的概率为函数值的一个实值函
数。分布函数(1)0
F(x,y)具有以下的基本性质:
1;
F (x , y )
(2)F (x,y )分别对x 和y 是非减的,即
当x 2>x1时,有F (x 2,y )≥F(x1,y); 当y 2>y1时,有F(x,y2) ≥F(x,y1); (3)F (x,y )分别对x 和y 是右连续的,即
F (x , y )
F (x , y )
0, y ), F (x , y ) F (x ,
)
0, F (
F (x , y
,
) 0); 1.
(4)F (
, ) F (
(5)对于x 1F (x 2,y 2)
(4)离散型与连续型的关系
P (X
x ,Y
x 2,y 1F (x 2,y 1)
y )
P (x
y 2,
F (x 1,y 2)
X
x
F (x 1,y 1)
Y
y
0.
dy )
f (x ,y ) dxdy
dx ,y
(5)边缘分布
离散型X 的边缘分布为
P i
P (X
x i )
j
p ij (i , j 1, 2,
) ;
Y 的边缘分布为P
连续型
j
P (Y
y j )
i
p ij (i , j
1, 2,
) 。
X 的边缘分布密度为f
X
(x ) f (x , y ) dy ;
Y 的边缘分布密度为f Y (y )
(6)条件分布
P (Y
y
j
f (x , y ) dx .
离散型
i 的条件下,Y 取值的条件分布为在已知X=x
|X
x i )
p ij p i
;
在已知Y=yj 的条件下,X 取值的条件分布为P (X
连续型
x i |Y
y j )
p ij p
j
,
在已知Y=y的条件下,X 的条件分布密度为
f (x |y )
f (x , y ) f Y (y )
;
在已知X=x的条件下,Y 的条件分布密度为
f (y |x )
f (x , y ) f X (x )
(7)独立性
一般型离散型
F(X,Y)=FX (x)FY (y)
p ij
p i p
j
有零不独立
连续型
f(x,y)=f
X
(x)f
Y
(y)
直接判断,充要条件:①可分离变量
②正概率密度区间为矩形
二维正态分布
f (x , y )
2
1
2
211
222
1x
2
2(x
11
)(y
2
2
) y
11
2
2(1)
e ,
=0
随机变量的函数
若X 1,X 2, , X m ,X m+1, , X n 相互独立, h,g为连续函数,则:
n )相互独立。h (X 1,X 2, , X m )和g (X m+1, , X
特例:若X 与Y 独立,则:h (X )和g (Y )独立。例如:若X 与Y 独立,则:3X+1和5Y-2独立。
(8)二维均匀分布
设随机向量(X ,Y )的分布密度函数为
1S D
f (x , y )
0,
其他(x , y )
D
其中S D 为区域D 的面积,则称(X ,Y )服从D 上的均匀分布,记为(U (D )。
例如图3.1、图3.2和图3.3。
X ,Y )~
y
1
DO
图3.1
1
1
x
y
1
D 2
O
2 1
x
图3.2
y
d
D 3
c
O a b x
图3.3
(9)二维正态分布
设随机向量(X ,Y )的分布密度函数为
2
2
1
x
2
11
2(x
11
)(y
2
2
) y
2
2
f (x , y )
2
其中布,
,
1
2
11
2
2(1)
e ,
12, 1
0,
2
0, |
|1是5个参数,则称(X ,Y )服从二维正态分
记为(X ,Y )~N (
1
,
22,
1
,
22
, ).
由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即X ~N (
1
,
21
), Y ~N (,
21
22,
2
).
22,
2
但是若X ~N (
(10)函数分布
Z=X+Y
1
), Y ~N () ,(X,Y) 未必是二维正态分布。P (Z
z )
P (X
Y
z )
根据定义计算:
F Z (z )
对于连续型,f Z (z)=
f (x , z x ) dx
两个独立的正态分布的和仍为正态分布(
1
2,
2
122
)。
n 个相互独立的正态分布的线性组合,仍服从正态分布。
C i
i
i
,
2
i
C i
22i
Z=max,min(X 1,X 2,, X n )
若
X 1, X
2
X
n
相互独立,其分布函数分别为
F x n (x ) ,则Z=max,min(X1,X 2,, X n ) 的分布
F x 1(x ) ,F x 2(x )
函数为:
F max (x ) F min (x )
F x 1(x ) 1
[1
F x 2(x ) F x 1(x )]
[1F x n (x ) F x 2(x )]
[1
F x n (x )]
2
分布
设n 个随机变量X 1, X 2, 布,可以证明它们的平方和
, X
n
相互独立,且服从标准正态分
n
W
i 1
X
2i
的分布密度为
n
1
n
1
u
u n 2
2
e
2
u 0,
f (u )
20,
2
u
2
0.
2
我们称随机变量其中
W 服从自由度为n 的
分布,记为W ~(n ) ,
n 2
n
1
x
2
e
x
dx .
所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。
2
分布满足可加性:设
Y i
2
(n i ),
则
k
Z
i 1
Y i ~
2
(n 1n 2n k ).
t 分布设X ,Y 是两个相互独立的随机变量,且
X ~N (0, 1), Y ~
2
(n ),
可以证明函数
T
的概率密度为
n
f (t )
n
我们称随机变量
t 1
(n )
2
X Y /n
12n 2
1
t
2
n 12
(t ).
n
T 服从自由度为n 的t 分布,记为T ~t(n)。
t (n )
2
F 分布
设X ~
(n 1), Y ~(n 2) ,且X 与Y 独立,可以证明
F
X /n 1Y /n 2
的概率密度函数为
n 1
2
f (y )
n 12
我们称随机变量的F 分布,记为
F 1
(n 1, n 2)
n 2
n 1
n 22
n 2
n 12
n 1
1
n 1n 22
y
2
1
n 1n 2
y , y 0
0, y
F 服从第一个自由度为F ~f(n1, n2).
1F
(n 2, n 1)
n 1,第二个自由度为
n 2
第四章
(1)
随机变量的数字特征
离散型
连续型
一维随机变量的数字特征
期望
期望就是平均值
设X 是离散型随机变量,其分布律为
P(
X
x k ) =p k ,
设X 是连续型随机变量,其概率密度为f(x),E (X )
xf (x ) dx
k=1,2,, ,n ,
n
E (X )
k 1
x k p k
(要求绝对收敛)
(要求绝对收敛)
函数的期望
Y=g(X)
n
Y=g(X)
g (x k ) p k
k
1
E (Y )
E (Y ) g (x ) f (x ) dx
方差
D(X)=E[X-E(X)]标准差(X ) 矩
D (X ) ,
①对于正整数阶原点矩,记为
ν=E(X)=
k
k
2
,
D (X )
k
[x k E (X )]p k
2
D (X ) [x E (X )]
2
f (x ) dx
k ,称随机变量v k , 即x i p i ,
i
k
X ①对于正整数k ,称随机变量X 的
X 的k 阶原点
的k 次幂的数学期望为X 的k k 次幂的数学期望为矩,记为v k , 即ν=E(X)=
k
k
x f (x ) dx ,
k
k=1,2, , .
②对于正整数
k ,称随机变量
与E (X )差的k 次幂的数学期望为X 的k 阶中心矩,记为即
k
k=1,2, , .
k ,称随机变量X 与
X
X ②对于正整数
E (X )差的k 次幂的数学期望为,的k 阶中心矩,记为
E (X
E (X ))
k
k
,即
k
k
E (X E (X ))
k
.
.
=
i
(x i
E (X ))
k
=
p i
,
(x E (X ))
k
f (x ) dx ,
k=1,2, , .
k=1,2, , .
切比雪夫不等式设随机变量X 具有数学期望E (X )=μ,方差D (X )=σ,则对于
2
任意正数ε,有下列切比雪夫不等式
2
P (X )
2
切比雪夫不等式给出了在未知X 的分布的情况下,对概率
)
P (X
的一种估计,它在理论上有重要意义。
(2)期望的性质
(3)(4)
(3)方差的性质
(1)(2)(3)(4)(5) D(X
(4)常见分布的期望和方差
0-1分布B (1, p ) 二项分布B (n , p ) 泊松分布P ()
1p
nM N a 2b
(1)(2)
E(C)=C E(CX)=CE(X)
n
n
E(X+Y)=E(X)+E(Y),E (
i 1
C i X i )
i 1
C i E (X i )
E(XY)=E(X) E(Y),充分条件:X 和Y 独立;
充要条件:X 和Y 不相关。
D(C)=0;E(C)=C
D(aX)=aD(X); E(aX)=aE(X) D(aX+b)= aD(X); E(aX+b)=aE(X)+b D(X)=E(X)-E (X)
D(X±Y)=D(X)+D(Y),充分条件:X 和Y 独立;
充要条件:X 和Y 不相关。
±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))]而E(X+Y)=E(X)+E(Y),无条件成立。
期望
方差
p (1
p )
2
22
2
,无条件成立。
p np
np (1p )
几何分布G (p )
1p
2
p
超几何分布H (n , M , N )
nM N
1
M N
N N
n 1
均匀分布U (a , b )
(b a ) 12
1
2
2
指数分布e ()
1
正态分布N (
2
,
2
)
2
分布n 0
n
2n
n n
E (X )
xf
2(x ) dx
t 分布
(5)二维随机变量的数字特征
函数的期望
E (Y )
j 1
(n>2)
期望
E (X )
x i p i
i 1
X
n
y j p
j
E (Y )
yf Y (y ) dy
E [G (X , Y )]=
G (x i , y j ) p ij
i
j
E [G (X , Y )]=
G (x , y ) f (x , y ) dxdy
-
-
方差
D (X )
i
[x i
[x
j
E (X )]p i
E (Y )]
2
2
D (X ) [x E (X )]
2
f X (x ) dx
D (Y )
j
p
j
D (Y ) [y E (Y )]
2
f Y (y ) dy
协方差
对于随机变量X 与Y ,称它们的二阶混合中心矩
或cov(X , Y ) ,即
E (Y ))].
11
为X 与Y 的协方
差或相关矩,记为
E [(X
XY
XY 11
E (X ))(Y
与记号与
。
XY
相对应,X 与Y 的方差D (X )与D (Y )也可分别记为
XX
YY
相关系数对于随机变量X 与Y ,如果D (X )>0, D(Y)>0,则称
XY
D (X ) D (Y )
为X 与Y 的相关系数,记作
|
|≤1,当|
XY
(有时可简记为)。
aY
b )
1
|=1时,称X 与Y 完全相关:P (X
正相关,当负相关,当
1时(a 1时(a
0) ,0) ,
完全相关
而当0时,称X 与Y 不相关。
以下五个命题是等价的:①
XY
0;
②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y).
协方差矩阵
XX
XY
YX
YY
混合矩
对于随机变量X 与Y ,如果有E (X Y ) 存在,则称之为
;k+l阶混合中心矩记为:
E (X ))
k
k l
X 与Y 的
k+l阶混合原点矩,记为
u kl
E [(X
kl
(Y E (Y )) ].
l
(6)协方差的性质(7)独立和不相关
(i)(ii)(iii)(iv)(i )(ii )
cov (X, Y)=cov (Y, X); cov(aX,bY)=ab cov(X,Y); cov(X1+X2, Y)=cov(X
1
,Y)+cov(X2,Y);
cov(X,Y)=E(XY)-E(X)E(Y).
若随机变量X 与Y 相互独立,则若(X ,Y )~N (
1,
2,
21
XY
0;反之不真。),
,
22
,
则X 与Y 相互独立的充要条件是X 和Y 不相关。
第五章大数定律和中心极限定理
(1)大数定律
X
切比雪夫大数定律
设随机变量X 1,X 2,, 相互独立,均具有有限方差,且被同一
ε,有
常数C 所界:D (X i )
lim P
n
1n
i
n
X
1
1
i
n
n
E (X i )
i 1
1.
E (X I )=μ,
特殊情形:若则上式成为lim P
n
X 1,X 2,, 具有相同的数学期望
1n
i
n
X
1
i
1.
A 发生的次数,p 是事件A 在
ε,有
1.
伯努利大数定律
设μ是n 次独立试验中事件
每次试验中发生的概率,则对于任意的正数
lim P
n
p n
伯努利大数定律说明,当试验次数的频率与概率有较大判别的可能性很小,即
lim P
n
n 很大时,事件A 发生
p n
0.
这就以严格的数学形式描述了频率的稳定性。
辛钦大数定律
设X 1,X 2,, ,X n ,, 是相互独立同分布的随机变量序列,且(X n )=μ,则对于任意的正数lim P
n
E
ε有
1n
i
n
X
1
i
1.
X 1,X 2,, 相互独立,服从同一分布,且具有数
k
(2)中心极限定理
2
列维-林德伯格定理)
相
E (X
设随机变量同
k )
的
, D (X
学
2
期
0(k
n
望
1, 2,
和方差:
X N (,
)
) ,则随机变量
n
X
Y n
的分布函数F n (x ) 对任意的实数
n
k
1
k
n
n
x ,有
n
x
12
x
t
2
X
lim F n (x )
n
k
lim P
n
k 1
e
2
dt .
n
此定理也称为独立同分布的中心极限定理。
棣莫弗-拉普拉斯定理
设随机变量
X
n
为具有参数n, p(0
任意实数x, 有
lim P
n
X
n
np p )
x
12
x
t
2
e
2
dt .
np (1时,
k
n
k M
(3)二项定理
若当N
M N
p (n , k 不变) ,则
C M C N
C
n N
C n p (1
k k
p )
n k
(N ).
超几何分布的极限分布为二项分布。
(4)泊松定理
若当n
时, np
0,则
k
C p (1
k n
k
p )
n k
k !
e (n ).
其中k=0,1,2,, ,n ,, 。二项分布的极限分布为泊松分布。
第六章样本及抽样分布
(1)数理统计的基本概念
个体样本总体
在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。
总体中的每一个单元称为样品(或个体)我们把从总体中抽取的部分样品中所含的样品数称为样本容量,总是把样本看成是
x 1, x 2,
。
, x n 称为样本。样本
一般用n 表示。在一般情况下,
n 个相互独立的且与总体有相同分布的随机
变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,x 1, x 2,
, x n 表示n 个随机变量(样本);在具体的一次
, x n 表示n 个具体的数值(样本值)。我们
抽取之后,x 1, x 2, 称之为样本的两重性。
样本函数和统计量
设x 1, x 2,
, x n 为总体的一个样本,称
(x 1, x 2,
为样本函数,其中知参数,则称
, x n )
为一个连续函数。如果中不包含任何未
(x 1, x 2,
, x n )为一个统计量。
常见统计量及其性质
样本均值样本方差
x
1n
i
n
x i .
1
S
2
1n
1
i
n
(x i
1
x ) .
1n
1
i n
2
样本标准差样本k 阶原点矩
M
1
k
n
S
(x i
1
x ) .
2
n
x i , k
i 1
k
1, 2, .
样本k 阶中心矩
M
1
k
n
n
(x i
i 1
x ) , k
k
2, 3, .
2
E (X )
,D (X )
,n
2
E (S )
22
,E (S *)
n
n n X )
2
1
2
,
其中S *
(2)正态总体下的四大分布
正态分布
2
1n
i
(X
1
i
,为二阶中心矩。
设x 1, x 2, 本函数
def
, x n 为来自正态总体
N (,
2
) 的一个样本,则样
u
x /
n
~N (0, 1).
t 分布
设x 1, x 2, 本函数
, x n 为来自正态总体
N (,
2
) 的一个样本,则样
def
t
其中t(n-1)
表示自由度为
x s /
n
~t (n 1),
n-1的t 分布。
2
分布
设x 1, x 2, 本函数
, x n 为来自正态总体
N (,
2
) 的一个样本,则样
def
w
(n 1) S
2
2
~
2
(n 1),
其中
F 分布
2
(n 1) 表示自由度为n-1的
2
分布。
21
设x 1, x 2,
y 1, y 2,
, x n 为来自正态, y n 为来自正态总体
总体N (,
N (
,
22
) 的一个样本,而
) 的一个样本,则样本
函数
def
F
S 1/S 2/
2
22122
~F (n 11, n 2
1),
其中
S 1
2
1n 1
1
i
n 1
(x i
1
x ) ,
2
S 2
2
1n 2
1
n
2
(y i
i 1
y ) ;
2
F (n 1n 2
(3)正态总体下分布的性质
X 与S 独立。
2
1, n 2
1) 表示第一自由度为n 1
1,第二自由度为
1的F 分布。
第七章参数估计
(1)点估计
矩估计
设总体X 的分布中包含有未知数
F (x ;
,
,
,
1
,
2
, ,
m
,则其分布函数可以表成
k
12m
). 它的k 阶原点矩v k
E (X )(k 1, 2,
, m ) 中也
包含了未知参数
x 1, x 2,
1
,
2
, ,
m
,即v k
v k (
1
,
2
, ,
m
) 。又设
, x n 为总体X 的n 个样本值,其样本的
n
k 阶原点矩为
1n
i
x i
1
k
(k 1, 2, , m ).
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有
v 1(
,
,
,
)
1n 1n
i i n
12m
x i ,
1
n
v 2(
1
,
2
, ,
m
) x i ,
1
2
v m (
1
,
2
, ,
m
)
1n
n
x i .
i 1
m
由上面的(
,
,
m 个方程中,解出的
,
m 个未知参数(
1
,
2
, ,
m
) 即为参数
12m
)的矩估计量。
若
为的矩估计,g (x ) 为连续函数,则
g (? ) 为g () 的矩估计。
极大似然估计
当总体f (x ;
1
X 为连续型随机变量时,设其分布密度为,
m
,
2
, ) ,其中
1
,
2
, ,
m
为未知参数。又设
x 1, x ,
2
, x n 为总体的一个样本,称
n
L (
1
,
2
, ,
m
)
i 1
f (x i ;
1
,
2
, ,
m
)
为样本的似然函数,简记为
当总体
P {X
x }
p (x ;
1
L n .
X 为离型随机变量时,设其分布律为,
2
, ,
m
) ,则称
n
L (x 1, x 2, , x n ;
1
,
2
, ,
m
)
i 1
p (x i ;
1
,
2
, ,
m
)
为样本的似然函数。
若似然函数到最大值,则称
L (x 1, x 2,
, x n ;
1
,
2
, ,
m
) 在
1
,
2
, ,
m
处取
1
,
2
, ,
m
分别为
1
,
2
, ,
m
的最大似然估计值,
相应的统计量称为最大似然估计量。
ln L n
i
i
i
0, i 1, 2, , m
若
为的极大似然估计,g (x ) 为单调函数,则
g (? ) 为g () 的极大
似然估计。
(2)估计量的评选标准
为
的无偏估计量。
2
无偏性
设
(x 1, x 2, , x n ) 为未知参数
的估计量。若E ()=,则称
E (X )=E(X ), E(S )=D(X )
有效性
设
1
1
(x 1, x , 2, , x n ) 和D (
)
22
(x 1, x , 2, ) ,则称
, x n ) 是未知参数
的两个无偏估计量。若
1
D (
2
1
比
2
有效。
一致性
设
n
是的一串估计量,如果对于任意的正数
lim P (|
n
n
,都有0,
|)
则称
n
为的一致估计量(或相合估计量)。
若
为的无偏估计,且
D (? )
0(n
), 则
为的一致估计。
只要总体的
(3)区间估计
置信区间和置信度
E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相
应总体的一致估计量。
设总体X 含有一个待估的未知参数发
,
找
出
两
个
(统
计)
。如果我们从样本量
x 1, x , 2,
, x n 出
11
(x 1, x , 2, , x n )
与以
22
(x 1, x , 2, , x n )
12
,使得区间
,即1
,
[
1
,
2
]
1(0
1) 的概率包含这个待估参数
P {
那么称区间[信水平)。
单正态总体的期望和方差的区间估计
设x 1, x , 2,
,
]为
12
}
12
的置信区间,1为该区间的置信度(或置
, x n 为总体X ~N (
和
2
,
2
) 的一个样本,在置信度为
1
下,我们来确定
的置信区间[
1
,
2
]。具体步骤如下:
(i )选择样本函数;(ii )由置信度1(iii
)导出置信区间
,查表找分位数;[
1
,
2
]。
已知方差,估计均值(i )选择样本函数
u (ii)
P
x
~N (0, 1). /
n
查表找分位数
x
1
/
n
.
(iii
x
)导出置信区间
, x
n n
未知方差,估计均值(i )选择样本函数
t
x S /
n ~t (n
1).
(ii)查表找分位数
x S /
n
1
.
P
(iii
x
)导出置信区间
S n , x
S n
方差的区间估计(i )选择样本函数w
(n
1) S
2
2
~
2
(n 1).
(ii )查表找分位数P (iii
(n
1
1) S
2
2
2
1.
)导出
n
2
的置信区间
S ,
n
1
11
S
第八章假设检验
基本思想假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。
为了检验一个假设
0是否成立。我们先假定0是成立的。如果根据这个假H H
定导致了一个不合理的事件发生,那就表明原来的假定相容的。与
H 0是不正确的,我们拒
0,我们称0是H H
绝接受H 0;如果由此没有导出不合理的现象,则不能拒绝接受
H 0相对的假设称为备择假设,用
{K
H 1表示。
R },其概率就是检验水平
这里所说的小概率事件就是事件
α,通
常我们取α=0.05,有时也取0.01或0.10。
基本步骤
假设检验的基本步骤如下:
(i)(ii)(iii)(iv)
提出零假设H 0;选择统计量K ;
对于检验水平α查表找分位数λ;由样本值x 1, x 2,
, x n 计算统计量之值
K ;
0,否则认为) 时否定H
0H
将K 与相容。
两类错误
进行比较,作出判断:当
|K |(或K
第一类错误
当H 0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定
H 0。这时,我们把客观上
记
H 0成立判为
即
H 0为不成立(即否定了真实的假设)
当假”的错误或第一类错误,
0为真}=P{否定H 0|H
,称这种错误为“以真为犯此类错误的概率,
;
此处的α恰好为检验水平。
第二类错误
当H 1为真时,而样本值却落入了相容域,按照我们规定的
0。这时,我们把客观上检验法则,应当接受H
H 0。不成立判
为H 0成立(即接受了不真实的假设)当真”的错误或第二类错误,记即
P{接受H 0|H 1为真}=
两类错误的关系
。
,称这种错误为“以假为犯此类错误的概率,
人们当然希望犯两类错误的概率同时都很小。容量n 一定时,变大。取定
变小,则
变大;相反地,
但是,当变小,则
要想使变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平
α。α大小的选取应根据实际情况而
、而不愿“以真当假”时,则
定。当我们宁可“以假为真”得大些。
应把α取得很小,如0.01,甚至0.001。反之,则应把α取
单正态总体均值和方差的假设检验
条件
H
2
零假设
:
统计量
对应样本函数分布
否定域
|u |u
00
1
2
已知
H
:
U
x
N (0,1)
u u 1
/n
u |t |
t
1
2
H
:
u 1(n
1)
H
2
:
未知
H
:
T
x S /
t (n 1) t
t 1t 1
2
(n 1)
n
t w
(n (n (n
2
H
:
1) 1) 或1)
H
2
:
22
2
w
21
未知
w
H
(n 1) S
20
2
2
(n 1)
w
21
:
220
(n
2
1)
H
:
220
w (n 1)
第1章
P m
(1)排列组合公式
C m
n n
随机事件及其概率
从m 个人中挑出n 个人进行排列的可能数。
m ! (m
n )! m ! n ! (m
n )!
从m 个人中挑出n 个人进行组合的可能数。
:m+n
m 种方法完成,第二种方法可由:m ×n
m 种方法完成,第二个步骤可由
n n
加法原理(两种方法均能完成此事)
(2)加法和乘法原理
种方法来完成,则这件事可由
某件事由两种方法来完成,第一种方法可由乘法原理(两个步骤分别不能完成这件事)某件事由两个步骤来完成,第一个步骤可由种方法来完成,则这件事可由重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题
m+n 种方法来完成。
m ×n 种方法来完成。
(3)一些常见排列(4)随机试验和随机事件
如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。
试验的可能结果称为随机事件。在一个试验下,不管事件有多少个,如下性质:
①每进行一次试验,必须发生且只能发生这一组中的一个事件;②任何事件,都是由这一组中的部分事件组成的。这样一组事件中的每一个事件称为基本事件,用基本事件的全体,称为试验的样本空间,用一个事件就是由
中的部分点(基本事件
的子集。
同理,
来表示。表示。
)组成的集合。通常用大写字母
总可以从其中找出这样一组事件,
它具有
(5)基本事件、样本空间和事件
A ,B ,C ,, 表示事件,它们是
为必然事件,?为不可能事件。
不可能事件(? )的概率为零,而概率为零的事件不一定是不可能事件;
必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。①关系:
如果事件A 的组成部分也是事件
A
B
B 的组成部分,(A 发生必有事件B 发生):
A 与事件B 等价,或称
A 等于B :
如果同时有A
(6)事件的关系与运算
B ,B A ,则称事件
A=B。
A 、B 中至少有一个发生的事件:A B ,或者A +B 。属于A 而不属于B 的部分所构成的事件,称为A 与B 的差,记为A-B ,也可
表示为A-AB 或者A B ,它表示A 发生而B 不发生的事件。
A 、B 同时发生:A B ,或者AB 。A B=?,则表示A 与B 不可能同时发生,
称事件A 与事件B 互不相容或者互斥。基本事件是互不相容的。
-A 称为事件A 的逆事件,或称的事件。互斥未必对立。②运算:
A 的对立事件,记为
A 。它表示A 不发生
结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B) ∪C
分配率:(AB)∪C=(A∪C) ∩(B∪C) (A∪B) ∩C=(AC)∪(BC)
A i
A i
i 1
德摩根率:
设
i 1
A B A B ,A B A B
为样本空间,A 为事件,对每一个事件A 都有一个实数P(A),若满
足下列三个条件:
1° 0≤P(A)≤1,2° P(Ω) =1
(7)概率的公理化定义
P
i 1
3° 对于两两互不相容的事件A 1,A 2,, 有A i
i 1
P (A i )
常称为可列(完全)可加性。则称P(A)为事件A 的概率。1°2° P (
(8)古典概型
1
1
,
2n
,
P (
1
n
) P (
2
) )
1n
m
。
组成的,则有
1
设任一事件A ,它是由
, (
2
P(A)=(
m n
1
) (
2
)
m
) =P (
)
P (
2
)
P (
m
)
A 所包含的基本事件数
基本事件总数
同时样本空
若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,间中的每一个基本事件可以使用一个有界区域来描述,
(9)几何概型
P (A )
(10)加法公式(11)减法公式
概型。对任一事件
L (A ) L (
)
A ,
。
则称此随机试验为几何
。其中L 为几何度量(长度、面积、体积)
P(A+B)=P(A)+P(B)-P(AB)
当P(AB)=0时,P(A+B)=P(A)+P(B) P(A-B)=P(A)-P(AB) 当B
A 时,P(A-B)=P(A)-P(B)
当A=Ω时,P(B )=1- P(B)
定义设A 、B 是两个事件,且P(A)>0,则称件B 发生的条件概率,记为
P (B /A )
P (AB ) P (A )
(12)条件概率
为事件A 发生条件下,事
P (AB ) P (A )
。
条件概率是概率的一种,所有概率的性质都适合于条件概率。例如P(Ω/B)=1乘法公式:P (AB )
(13)乘法公式
A n
P(
B
/A)=1-P(B/A)
P (A ) P (B /A )
2, A 1,A 2,,A n ,若P(A1A A n-1)>0,则有
更一般地,对事件
P (A 1A 2,
1
A n )
P (A 1) P (A 2|A 1) P (A 3|A 1A 2) ,, P (A n |A 1A 2,
) 。
P (A ) P (B ) ,则称事件A 、B 是相互独立的。P (A )
0,则有
①两个事件的独立性
设事件A 、B 满足P (AB ) 若事件A 、B 相互独立,且P (B |A )
P (AB ) P (A )
P (A ) P (B ) P (A )
P (B )
若事件A 、B 相互独立,则可得到A 与B 、A 与B 、A 与B 也都相互独
(14)独立性
立。
必然事件和不可能事件
? 与任何事件都互斥。②多个事件的独立性
设ABC 是三个事件,如果满足两两独立的条件,
P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足
P(ABC)=P(A)P(B)P(C)
那么A 、B 、C 相互独立。对于n 个事件类似。设事件B 1, B 2, 1°B 1, B 2,
(15)全概公式
2°则有
P (A )
n
? 与任何事件都相互独立。
, B n 满足
P (B i )
0(i
1, 2,
, n ) ,
, B n 两两互不相容,B i
A
i 1
,
P (B 2) P (A |B 2) B n 及A 满足
P (Bi ) >0,i
P (B n ) P (A |B n ) 。
P (B 1) P (A |B 1)
设事件B 1,B 2,, ,1°
B 1,B 2,, ,
n
B n 两两互不相容,1,2,, ,n ,
A B i
i 1
2°则
(16)贝叶斯公式
P (B i /A )
,P (A ) 0,
P (B i ) P (A /B i )
n
,i=1,2,,n 。
P (B j ) P (A /B j )
j 1
此公式即为贝叶斯公式。
P (B i ) ,(i
1,2,, ,n ),通常叫先验概率。
P (B i /A ) ,(i
1,2,, ,
n ),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。
(17)伯努利概型
我们作了n 次试验,且满足
每次试验只有两种可能结果,
A 发生或A 不发生;
n 次试验是重复进行的,即
A 发生的概率每次均一样;
A 发生与否与其他次试验
A 发生与
每次试验是独立的,即每次试验否是互不影响的。
这种试验称为伯努利概型,或称为用p 表示每次试验示n 重伯努利试验中
P (k )
n
n 重伯努利试验。
A 发生的概率为1n ) 次的概率,
p
q ,用P n (k ) 表
A 发生的概率,则A 出现k (0
k
k
C
k n
p q
k n
,k
0, 1, 2,
, n 。
第二章
(1)离散型随机变量的分布律
随机变量及其分布
X k (k=1,2,, ) 且取各个值的概率,即事
设离散型随机变量X 的可能取值为件(X=Xk ) 的概率为
P(X=xk )=pk ,k=1,2,, ,则称上式为离散型随机变量式给出:
X P (X
x k )
|x 1, x 2, p 1, p 2,
, x k , , p k ,
。
X 的概率分布或分布律。有时也用分布列的形
显然分布律应满足下列条件:
p k
1
(1)p k
(2)连续型随机变量的分布密度
F (x )
0,k
1, 2,
,(2)
k 1
。
f (x ) ,对任意实数x ,有
设F (x ) 是随机变量X 的分布函数,若存在非负函数
x
f (x ) dx
,
简称概
则称X 为连续型随机变量。f (x ) 称为X 的概率密度函数或密度函数,率密度。
密度函数具有下面4个性质:1° 2°
f (x )
0。
f (x ) dx
x )
P (x
1
X
。
x
dx )
f (x ) dx
P (X
x k )
p k 在离
(3)离散与连续型随机变量的关系
P (X
积分元f (x ) dx 在连续型随机变量理论中所起的作用与
散型随机变量理论中所起的作用相类似。
(4)分布函数
设X 为随机变量,
F (x )
P (X
x )
x 是任意实数,则函数
称为随机变量
P (a
X
X 的分布函数,本质上是一个累积函数。
b )
F (b )
F (a )
可以得到X 落入区间(a , b ]的概率。分布∞,x]内的概率。
函数F (x ) 表示随机变量落入区间(–
分布函数具有如下性质:1°2°3°4°5°
F (x )
1,
x
;x 1
F (
F (x ) 是单调不减的函数,即F (
)
lim
x
x 2时,有
)
x
F (x 1) F (x )
F (x 2) ;1;
F (x ) 0,lim
F (x 0) F (x ) ,即F (x ) 是右连续的;F (x )
F (x
0) 。
P (X x )
对于离散型随机变量,
F (x )
x k x
x
p k ;
对于连续型随机变量,
(5)八大分布
二项分布0-1分布
F (x )
f (x ) dx 。
P(X=1)=p, P(X=0)=q
在n 重贝努里试验中,设事件的次数是随机变量,设为
P (X
k )
P (k )
n
k
A 发生的概率为p 。事件A 发生
, n 。
X ,则X 可能取值为0, 1, 2,
k
n k
C n p q 1, k
,
, n ,
其中
q 1p , 0p 0, 1, 2,
则称随机变量X 服从参数为n ,p 的二项分布。记为
X ~B (n , p ) 。
当n 1时,P (X
k ) p q
k 1k
,k 0. 1,这就是(0-1)分
布,所以(0-1)分布是二项分布的特例。
泊松分布设随机变量X 的分布律为
k
P (X k )
k !
e
,
0,k
0, 1, 2
,
则称随机变量者P(
超几何分布
P (X
k )
X 服从参数为的泊松分布,记为
X ~(
) 或
) 。
np=λ,n →∞)。
0, 1, 2
, l
泊松分布为二项分布的极限分布(
C M
C
k
C
n N
n N
k M
, l
k
min(M , n )
随机变量X 服从参数为n,N,M 的超几何分布,记为
几何分布
P (X
k )
q
k 1
H(n,N,M)。
p , k 1, 2, 3,
,其中p ≥0,q=1-p。
G(p)。
f (x ) 在[a,b]
随机变量X 服从参数为p 的几何分布,记为
均匀分布
设随机变量X 的值只落在[a,b]内,其密度函数上为常数
1b 1
f (x )
b 0,
a a
,即
,
a ≤x ≤b 其他,
则称随机变量分布函数为
X 在[a,b]上服从均匀分布,记为X ~U(a,b) 。
0,
x b
x
x
a a ,
a ≤x ≤b x>b。
F (x ) f (x ) dx
1,
当a ≤x 1
X
x 2)
x 2b
x 1a
。
指数分布
e
f (x )
x
,
x x
0, 0,
0,
0,则称随机变量其中
X 的分布函数为
X 服从参数为的指数分布。
1
F (x )
0,
e
x
,
x
0,
x
记住积分公式:x e
n
x
dx n !
正态分布
设随机变量X 的密度函数为
(x
)
2
2
f (x ) 其中
、
12
e
2
,
x
,
X 服从参数为X ~N (
,
2
0为常数,则称随机变量
、
的正态分布或高斯(
f (x ) 具有如下性质:
Gauss )分布,记为
) 。
1°
f (x ) 的图形是关于
x
对称的;1
为最大值;
2° 当x 若X ~N (1, F (x )
2
时,f (
2
2
)
2
2
(t ) ) x ,则X 的分布函数为2
e dt
。。
参数
0、
1时的正态分布称为标准正态分布,记为
2
X ~N (0, 1) ,其密度函数记为x
1
(x ) e
2
2
分布函数为(x )
1
x
t
,
x
,
2
e
2
dt 。
2
(x ) 是不可求积函数,其函数值,已编制成表可供查用。Φ(-x)=1-Φ(x)且Φ(0)=如果X ~N (
P (x 1
X
, x 2)
2
12
。
~N (0, 1) 。
x 1
) ,则
x 2
X
。
(6)分位数(7)函数分布
下分位表:P (X 上分位表:P (X 离散型
) =) =
;。
已知X 的分布列为
X P (X Y
x 1, x 2, x i ) p 1,
p 2,
y i , , x n , p n ,
g (x i ) 互不相等)如下:
,
g (X ) 的分布列(
Y
g (x 1), g (x 2), , g (x n ),
,
P (Y y i )
p 1, p 2, , p n ,
若有某些g (x i ) 相等,则应将对应的p i 相加作为g (x i ) 的概率。
连续型
先利用X 的概率密度
f X (x)写出Y 的分布函数
F Y (y)=P(g(X)≤
y) ,再利用变上下限积分的求导公式求出f Y (y)。
第三章
(1)联合分布
离散型
二维随机变量及其分布
如果二维随机向量
(X ,Y )的所有可能取值为至多可列为离散型随机量。
(x i , y j )(i , j
1, 2,
) ,
个有序对(x,y ),则称
设且事件{
=(X ,Y )的所有可能取值为=(x i , y j ) }的概率为p ij, , 称
(x i , y j )}
p ij (i , j
P {(X , Y ) 1, 2, )
为=(X ,Y )的分布律或称为X 和Y 的联合分布律。联合分
布有时也用下面的概率分布表来表示:
Y X x 1x 2
y 1p 11p 21
y 2p 12p 22
, , ,
y j p 1j p 2j
, , ,
x i p i1,
p ij
,
这里p ij 具有下面两个性质:(1)p ij ≥0(i,j=1,2,(2)
i
j
, );
p ij
1.
连续型
对于二维随机向量
f (x , y )(
x
,
(X , Y ) ,如果存在非负函数
) ,使对任意一个其邻边
y
分别平行于坐标轴的矩形区域有P {(X , Y ) 则称
D }
D
D ,即D={(X,Y)|a
f (x , y ) dxdy ,
f(x,y)
为
=(X ,Y )的分布
为连续型随机向量;并称
密度或称为X 和Y 的联合分布密度。
分布密度f(x,y)(1)(2)
(2)二维随机变量的本质(3)联合分布函数
设(X ,Y )为二维随机变量,对于任意实数
F (x , y )
P {X
(X
x , Y
y )
(X
x
具有下面两个性质:
f(x,y)≥0; f (x , y ) dxdy
Y
y )
1.
x,y, 二元函数
x , Y
y }
称为二维随机向量(X ,Y )的分布函数,或称为随机变量数。
X 和Y 的联合分布函
分布函数是一个以全平面为其定义域,以事件{(
1
,
2
) |X (
1
) x , Y (
2
)
y }的概率为函数值的一个实值函
数。分布函数(1)0
F(x,y)具有以下的基本性质:
1;
F (x , y )
(2)F (x,y )分别对x 和y 是非减的,即
当x 2>x1时,有F (x 2,y )≥F(x1,y); 当y 2>y1时,有F(x,y2) ≥F(x,y1); (3)F (x,y )分别对x 和y 是右连续的,即
F (x , y )
F (x , y )
0, y ), F (x , y ) F (x ,
)
0, F (
F (x , y
,
) 0); 1.
(4)F (
, ) F (
(5)对于x 1F (x 2,y 2)
(4)离散型与连续型的关系
P (X
x ,Y
x 2,y 1F (x 2,y 1)
y )
P (x
y 2,
F (x 1,y 2)
X
x
F (x 1,y 1)
Y
y
0.
dy )
f (x ,y ) dxdy
dx ,y
(5)边缘分布
离散型X 的边缘分布为
P i
P (X
x i )
j
p ij (i , j 1, 2,
) ;
Y 的边缘分布为P
连续型
j
P (Y
y j )
i
p ij (i , j
1, 2,
) 。
X 的边缘分布密度为f
X
(x ) f (x , y ) dy ;
Y 的边缘分布密度为f Y (y )
(6)条件分布
P (Y
y
j
f (x , y ) dx .
离散型
i 的条件下,Y 取值的条件分布为在已知X=x
|X
x i )
p ij p i
;
在已知Y=yj 的条件下,X 取值的条件分布为P (X
连续型
x i |Y
y j )
p ij p
j
,
在已知Y=y的条件下,X 的条件分布密度为
f (x |y )
f (x , y ) f Y (y )
;
在已知X=x的条件下,Y 的条件分布密度为
f (y |x )
f (x , y ) f X (x )
(7)独立性
一般型离散型
F(X,Y)=FX (x)FY (y)
p ij
p i p
j
有零不独立
连续型
f(x,y)=f
X
(x)f
Y
(y)
直接判断,充要条件:①可分离变量
②正概率密度区间为矩形
二维正态分布
f (x , y )
2
1
2
211
222
1x
2
2(x
11
)(y
2
2
) y
11
2
2(1)
e ,
=0
随机变量的函数
若X 1,X 2, , X m ,X m+1, , X n 相互独立, h,g为连续函数,则:
n )相互独立。h (X 1,X 2, , X m )和g (X m+1, , X
特例:若X 与Y 独立,则:h (X )和g (Y )独立。例如:若X 与Y 独立,则:3X+1和5Y-2独立。
(8)二维均匀分布
设随机向量(X ,Y )的分布密度函数为
1S D
f (x , y )
0,
其他(x , y )
D
其中S D 为区域D 的面积,则称(X ,Y )服从D 上的均匀分布,记为(U (D )。
例如图3.1、图3.2和图3.3。
X ,Y )~
y
1
DO
图3.1
1
1
x
y
1
D 2
O
2 1
x
图3.2
y
d
D 3
c
O a b x
图3.3
(9)二维正态分布
设随机向量(X ,Y )的分布密度函数为
2
2
1
x
2
11
2(x
11
)(y
2
2
) y
2
2
f (x , y )
2
其中布,
,
1
2
11
2
2(1)
e ,
12, 1
0,
2
0, |
|1是5个参数,则称(X ,Y )服从二维正态分
记为(X ,Y )~N (
1
,
22,
1
,
22
, ).
由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即X ~N (
1
,
21
), Y ~N (,
21
22,
2
).
22,
2
但是若X ~N (
(10)函数分布
Z=X+Y
1
), Y ~N () ,(X,Y) 未必是二维正态分布。P (Z
z )
P (X
Y
z )
根据定义计算:
F Z (z )
对于连续型,f Z (z)=
f (x , z x ) dx
两个独立的正态分布的和仍为正态分布(
1
2,
2
122
)。
n 个相互独立的正态分布的线性组合,仍服从正态分布。
C i
i
i
,
2
i
C i
22i
Z=max,min(X 1,X 2,, X n )
若
X 1, X
2
X
n
相互独立,其分布函数分别为
F x n (x ) ,则Z=max,min(X1,X 2,, X n ) 的分布
F x 1(x ) ,F x 2(x )
函数为:
F max (x ) F min (x )
F x 1(x ) 1
[1
F x 2(x ) F x 1(x )]
[1F x n (x ) F x 2(x )]
[1
F x n (x )]
2
分布
设n 个随机变量X 1, X 2, 布,可以证明它们的平方和
, X
n
相互独立,且服从标准正态分
n
W
i 1
X
2i
的分布密度为
n
1
n
1
u
u n 2
2
e
2
u 0,
f (u )
20,
2
u
2
0.
2
我们称随机变量其中
W 服从自由度为n 的
分布,记为W ~(n ) ,
n 2
n
1
x
2
e
x
dx .
所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。
2
分布满足可加性:设
Y i
2
(n i ),
则
k
Z
i 1
Y i ~
2
(n 1n 2n k ).
t 分布设X ,Y 是两个相互独立的随机变量,且
X ~N (0, 1), Y ~
2
(n ),
可以证明函数
T
的概率密度为
n
f (t )
n
我们称随机变量
t 1
(n )
2
X Y /n
12n 2
1
t
2
n 12
(t ).
n
T 服从自由度为n 的t 分布,记为T ~t(n)。
t (n )
2
F 分布
设X ~
(n 1), Y ~(n 2) ,且X 与Y 独立,可以证明
F
X /n 1Y /n 2
的概率密度函数为
n 1
2
f (y )
n 12
我们称随机变量的F 分布,记为
F 1
(n 1, n 2)
n 2
n 1
n 22
n 2
n 12
n 1
1
n 1n 22
y
2
1
n 1n 2
y , y 0
0, y
F 服从第一个自由度为F ~f(n1, n2).
1F
(n 2, n 1)
n 1,第二个自由度为
n 2
第四章
(1)
随机变量的数字特征
离散型
连续型
一维随机变量的数字特征
期望
期望就是平均值
设X 是离散型随机变量,其分布律为
P(
X
x k ) =p k ,
设X 是连续型随机变量,其概率密度为f(x),E (X )
xf (x ) dx
k=1,2,, ,n ,
n
E (X )
k 1
x k p k
(要求绝对收敛)
(要求绝对收敛)
函数的期望
Y=g(X)
n
Y=g(X)
g (x k ) p k
k
1
E (Y )
E (Y ) g (x ) f (x ) dx
方差
D(X)=E[X-E(X)]标准差(X ) 矩
D (X ) ,
①对于正整数阶原点矩,记为
ν=E(X)=
k
k
2
,
D (X )
k
[x k E (X )]p k
2
D (X ) [x E (X )]
2
f (x ) dx
k ,称随机变量v k , 即x i p i ,
i
k
X ①对于正整数k ,称随机变量X 的
X 的k 阶原点
的k 次幂的数学期望为X 的k k 次幂的数学期望为矩,记为v k , 即ν=E(X)=
k
k
x f (x ) dx ,
k
k=1,2, , .
②对于正整数
k ,称随机变量
与E (X )差的k 次幂的数学期望为X 的k 阶中心矩,记为即
k
k=1,2, , .
k ,称随机变量X 与
X
X ②对于正整数
E (X )差的k 次幂的数学期望为,的k 阶中心矩,记为
E (X
E (X ))
k
k
,即
k
k
E (X E (X ))
k
.
.
=
i
(x i
E (X ))
k
=
p i
,
(x E (X ))
k
f (x ) dx ,
k=1,2, , .
k=1,2, , .
切比雪夫不等式设随机变量X 具有数学期望E (X )=μ,方差D (X )=σ,则对于
2
任意正数ε,有下列切比雪夫不等式
2
P (X )
2
切比雪夫不等式给出了在未知X 的分布的情况下,对概率
)
P (X
的一种估计,它在理论上有重要意义。
(2)期望的性质
(3)(4)
(3)方差的性质
(1)(2)(3)(4)(5) D(X
(4)常见分布的期望和方差
0-1分布B (1, p ) 二项分布B (n , p ) 泊松分布P ()
1p
nM N a 2b
(1)(2)
E(C)=C E(CX)=CE(X)
n
n
E(X+Y)=E(X)+E(Y),E (
i 1
C i X i )
i 1
C i E (X i )
E(XY)=E(X) E(Y),充分条件:X 和Y 独立;
充要条件:X 和Y 不相关。
D(C)=0;E(C)=C
D(aX)=aD(X); E(aX)=aE(X) D(aX+b)= aD(X); E(aX+b)=aE(X)+b D(X)=E(X)-E (X)
D(X±Y)=D(X)+D(Y),充分条件:X 和Y 独立;
充要条件:X 和Y 不相关。
±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))]而E(X+Y)=E(X)+E(Y),无条件成立。
期望
方差
p (1
p )
2
22
2
,无条件成立。
p np
np (1p )
几何分布G (p )
1p
2
p
超几何分布H (n , M , N )
nM N
1
M N
N N
n 1
均匀分布U (a , b )
(b a ) 12
1
2
2
指数分布e ()
1
正态分布N (
2
,
2
)
2
分布n 0
n
2n
n n
E (X )
xf
2(x ) dx
t 分布
(5)二维随机变量的数字特征
函数的期望
E (Y )
j 1
(n>2)
期望
E (X )
x i p i
i 1
X
n
y j p
j
E (Y )
yf Y (y ) dy
E [G (X , Y )]=
G (x i , y j ) p ij
i
j
E [G (X , Y )]=
G (x , y ) f (x , y ) dxdy
-
-
方差
D (X )
i
[x i
[x
j
E (X )]p i
E (Y )]
2
2
D (X ) [x E (X )]
2
f X (x ) dx
D (Y )
j
p
j
D (Y ) [y E (Y )]
2
f Y (y ) dy
协方差
对于随机变量X 与Y ,称它们的二阶混合中心矩
或cov(X , Y ) ,即
E (Y ))].
11
为X 与Y 的协方
差或相关矩,记为
E [(X
XY
XY 11
E (X ))(Y
与记号与
。
XY
相对应,X 与Y 的方差D (X )与D (Y )也可分别记为
XX
YY
相关系数对于随机变量X 与Y ,如果D (X )>0, D(Y)>0,则称
XY
D (X ) D (Y )
为X 与Y 的相关系数,记作
|
|≤1,当|
XY
(有时可简记为)。
aY
b )
1
|=1时,称X 与Y 完全相关:P (X
正相关,当负相关,当
1时(a 1时(a
0) ,0) ,
完全相关
而当0时,称X 与Y 不相关。
以下五个命题是等价的:①
XY
0;
②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y).
协方差矩阵
XX
XY
YX
YY
混合矩
对于随机变量X 与Y ,如果有E (X Y ) 存在,则称之为
;k+l阶混合中心矩记为:
E (X ))
k
k l
X 与Y 的
k+l阶混合原点矩,记为
u kl
E [(X
kl
(Y E (Y )) ].
l
(6)协方差的性质(7)独立和不相关
(i)(ii)(iii)(iv)(i )(ii )
cov (X, Y)=cov (Y, X); cov(aX,bY)=ab cov(X,Y); cov(X1+X2, Y)=cov(X
1
,Y)+cov(X2,Y);
cov(X,Y)=E(XY)-E(X)E(Y).
若随机变量X 与Y 相互独立,则若(X ,Y )~N (
1,
2,
21
XY
0;反之不真。),
,
22
,
则X 与Y 相互独立的充要条件是X 和Y 不相关。
第五章大数定律和中心极限定理
(1)大数定律
X
切比雪夫大数定律
设随机变量X 1,X 2,, 相互独立,均具有有限方差,且被同一
ε,有
常数C 所界:D (X i )
lim P
n
1n
i
n
X
1
1
i
n
n
E (X i )
i 1
1.
E (X I )=μ,
特殊情形:若则上式成为lim P
n
X 1,X 2,, 具有相同的数学期望
1n
i
n
X
1
i
1.
A 发生的次数,p 是事件A 在
ε,有
1.
伯努利大数定律
设μ是n 次独立试验中事件
每次试验中发生的概率,则对于任意的正数
lim P
n
p n
伯努利大数定律说明,当试验次数的频率与概率有较大判别的可能性很小,即
lim P
n
n 很大时,事件A 发生
p n
0.
这就以严格的数学形式描述了频率的稳定性。
辛钦大数定律
设X 1,X 2,, ,X n ,, 是相互独立同分布的随机变量序列,且(X n )=μ,则对于任意的正数lim P
n
E
ε有
1n
i
n
X
1
i
1.
X 1,X 2,, 相互独立,服从同一分布,且具有数
k
(2)中心极限定理
2
列维-林德伯格定理)
相
E (X
设随机变量同
k )
的
, D (X
学
2
期
0(k
n
望
1, 2,
和方差:
X N (,
)
) ,则随机变量
n
X
Y n
的分布函数F n (x ) 对任意的实数
n
k
1
k
n
n
x ,有
n
x
12
x
t
2
X
lim F n (x )
n
k
lim P
n
k 1
e
2
dt .
n
此定理也称为独立同分布的中心极限定理。
棣莫弗-拉普拉斯定理
设随机变量
X
n
为具有参数n, p(0
任意实数x, 有
lim P
n
X
n
np p )
x
12
x
t
2
e
2
dt .
np (1时,
k
n
k M
(3)二项定理
若当N
M N
p (n , k 不变) ,则
C M C N
C
n N
C n p (1
k k
p )
n k
(N ).
超几何分布的极限分布为二项分布。
(4)泊松定理
若当n
时, np
0,则
k
C p (1
k n
k
p )
n k
k !
e (n ).
其中k=0,1,2,, ,n ,, 。二项分布的极限分布为泊松分布。
第六章样本及抽样分布
(1)数理统计的基本概念
个体样本总体
在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。
总体中的每一个单元称为样品(或个体)我们把从总体中抽取的部分样品中所含的样品数称为样本容量,总是把样本看成是
x 1, x 2,
。
, x n 称为样本。样本
一般用n 表示。在一般情况下,
n 个相互独立的且与总体有相同分布的随机
变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,x 1, x 2,
, x n 表示n 个随机变量(样本);在具体的一次
, x n 表示n 个具体的数值(样本值)。我们
抽取之后,x 1, x 2, 称之为样本的两重性。
样本函数和统计量
设x 1, x 2,
, x n 为总体的一个样本,称
(x 1, x 2,
为样本函数,其中知参数,则称
, x n )
为一个连续函数。如果中不包含任何未
(x 1, x 2,
, x n )为一个统计量。
常见统计量及其性质
样本均值样本方差
x
1n
i
n
x i .
1
S
2
1n
1
i
n
(x i
1
x ) .
1n
1
i n
2
样本标准差样本k 阶原点矩
M
1
k
n
S
(x i
1
x ) .
2
n
x i , k
i 1
k
1, 2, .
样本k 阶中心矩
M
1
k
n
n
(x i
i 1
x ) , k
k
2, 3, .
2
E (X )
,D (X )
,n
2
E (S )
22
,E (S *)
n
n n X )
2
1
2
,
其中S *
(2)正态总体下的四大分布
正态分布
2
1n
i
(X
1
i
,为二阶中心矩。
设x 1, x 2, 本函数
def
, x n 为来自正态总体
N (,
2
) 的一个样本,则样
u
x /
n
~N (0, 1).
t 分布
设x 1, x 2, 本函数
, x n 为来自正态总体
N (,
2
) 的一个样本,则样
def
t
其中t(n-1)
表示自由度为
x s /
n
~t (n 1),
n-1的t 分布。
2
分布
设x 1, x 2, 本函数
, x n 为来自正态总体
N (,
2
) 的一个样本,则样
def
w
(n 1) S
2
2
~
2
(n 1),
其中
F 分布
2
(n 1) 表示自由度为n-1的
2
分布。
21
设x 1, x 2,
y 1, y 2,
, x n 为来自正态, y n 为来自正态总体
总体N (,
N (
,
22
) 的一个样本,而
) 的一个样本,则样本
函数
def
F
S 1/S 2/
2
22122
~F (n 11, n 2
1),
其中
S 1
2
1n 1
1
i
n 1
(x i
1
x ) ,
2
S 2
2
1n 2
1
n
2
(y i
i 1
y ) ;
2
F (n 1n 2
(3)正态总体下分布的性质
X 与S 独立。
2
1, n 2
1) 表示第一自由度为n 1
1,第二自由度为
1的F 分布。
第七章参数估计
(1)点估计
矩估计
设总体X 的分布中包含有未知数
F (x ;
,
,
,
1
,
2
, ,
m
,则其分布函数可以表成
k
12m
). 它的k 阶原点矩v k
E (X )(k 1, 2,
, m ) 中也
包含了未知参数
x 1, x 2,
1
,
2
, ,
m
,即v k
v k (
1
,
2
, ,
m
) 。又设
, x n 为总体X 的n 个样本值,其样本的
n
k 阶原点矩为
1n
i
x i
1
k
(k 1, 2, , m ).
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有
v 1(
,
,
,
)
1n 1n
i i n
12m
x i ,
1
n
v 2(
1
,
2
, ,
m
) x i ,
1
2
v m (
1
,
2
, ,
m
)
1n
n
x i .
i 1
m
由上面的(
,
,
m 个方程中,解出的
,
m 个未知参数(
1
,
2
, ,
m
) 即为参数
12m
)的矩估计量。
若
为的矩估计,g (x ) 为连续函数,则
g (? ) 为g () 的矩估计。
极大似然估计
当总体f (x ;
1
X 为连续型随机变量时,设其分布密度为,
m
,
2
, ) ,其中
1
,
2
, ,
m
为未知参数。又设
x 1, x ,
2
, x n 为总体的一个样本,称
n
L (
1
,
2
, ,
m
)
i 1
f (x i ;
1
,
2
, ,
m
)
为样本的似然函数,简记为
当总体
P {X
x }
p (x ;
1
L n .
X 为离型随机变量时,设其分布律为,
2
, ,
m
) ,则称
n
L (x 1, x 2, , x n ;
1
,
2
, ,
m
)
i 1
p (x i ;
1
,
2
, ,
m
)
为样本的似然函数。
若似然函数到最大值,则称
L (x 1, x 2,
, x n ;
1
,
2
, ,
m
) 在
1
,
2
, ,
m
处取
1
,
2
, ,
m
分别为
1
,
2
, ,
m
的最大似然估计值,
相应的统计量称为最大似然估计量。
ln L n
i
i
i
0, i 1, 2, , m
若
为的极大似然估计,g (x ) 为单调函数,则
g (? ) 为g () 的极大
似然估计。
(2)估计量的评选标准
为
的无偏估计量。
2
无偏性
设
(x 1, x 2, , x n ) 为未知参数
的估计量。若E ()=,则称
E (X )=E(X ), E(S )=D(X )
有效性
设
1
1
(x 1, x , 2, , x n ) 和D (
)
22
(x 1, x , 2, ) ,则称
, x n ) 是未知参数
的两个无偏估计量。若
1
D (
2
1
比
2
有效。
一致性
设
n
是的一串估计量,如果对于任意的正数
lim P (|
n
n
,都有0,
|)
则称
n
为的一致估计量(或相合估计量)。
若
为的无偏估计,且
D (? )
0(n
), 则
为的一致估计。
只要总体的
(3)区间估计
置信区间和置信度
E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相
应总体的一致估计量。
设总体X 含有一个待估的未知参数发
,
找
出
两
个
(统
计)
。如果我们从样本量
x 1, x , 2,
, x n 出
11
(x 1, x , 2, , x n )
与以
22
(x 1, x , 2, , x n )
12
,使得区间
,即1
,
[
1
,
2
]
1(0
1) 的概率包含这个待估参数
P {
那么称区间[信水平)。
单正态总体的期望和方差的区间估计
设x 1, x , 2,
,
]为
12
}
12
的置信区间,1为该区间的置信度(或置
, x n 为总体X ~N (
和
2
,
2
) 的一个样本,在置信度为
1
下,我们来确定
的置信区间[
1
,
2
]。具体步骤如下:
(i )选择样本函数;(ii )由置信度1(iii
)导出置信区间
,查表找分位数;[
1
,
2
]。
已知方差,估计均值(i )选择样本函数
u (ii)
P
x
~N (0, 1). /
n
查表找分位数
x
1
/
n
.
(iii
x
)导出置信区间
, x
n n
未知方差,估计均值(i )选择样本函数
t
x S /
n ~t (n
1).
(ii)查表找分位数
x S /
n
1
.
P
(iii
x
)导出置信区间
S n , x
S n
方差的区间估计(i )选择样本函数w
(n
1) S
2
2
~
2
(n 1).
(ii )查表找分位数P (iii
(n
1
1) S
2
2
2
1.
)导出
n
2
的置信区间
S ,
n
1
11
S
第八章假设检验
基本思想假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。
为了检验一个假设
0是否成立。我们先假定0是成立的。如果根据这个假H H
定导致了一个不合理的事件发生,那就表明原来的假定相容的。与
H 0是不正确的,我们拒
0,我们称0是H H
绝接受H 0;如果由此没有导出不合理的现象,则不能拒绝接受
H 0相对的假设称为备择假设,用
{K
H 1表示。
R },其概率就是检验水平
这里所说的小概率事件就是事件
α,通
常我们取α=0.05,有时也取0.01或0.10。
基本步骤
假设检验的基本步骤如下:
(i)(ii)(iii)(iv)
提出零假设H 0;选择统计量K ;
对于检验水平α查表找分位数λ;由样本值x 1, x 2,
, x n 计算统计量之值
K ;
0,否则认为) 时否定H
0H
将K 与相容。
两类错误
进行比较,作出判断:当
|K |(或K
第一类错误
当H 0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定
H 0。这时,我们把客观上
记
H 0成立判为
即
H 0为不成立(即否定了真实的假设)
当假”的错误或第一类错误,
0为真}=P{否定H 0|H
,称这种错误为“以真为犯此类错误的概率,
;
此处的α恰好为检验水平。
第二类错误
当H 1为真时,而样本值却落入了相容域,按照我们规定的
0。这时,我们把客观上检验法则,应当接受H
H 0。不成立判
为H 0成立(即接受了不真实的假设)当真”的错误或第二类错误,记即
P{接受H 0|H 1为真}=
两类错误的关系
。
,称这种错误为“以假为犯此类错误的概率,
人们当然希望犯两类错误的概率同时都很小。容量n 一定时,变大。取定
变小,则
变大;相反地,
但是,当变小,则
要想使变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平
α。α大小的选取应根据实际情况而
、而不愿“以真当假”时,则
定。当我们宁可“以假为真”得大些。
应把α取得很小,如0.01,甚至0.001。反之,则应把α取
单正态总体均值和方差的假设检验
条件
H
2
零假设
:
统计量
对应样本函数分布
否定域
|u |u
00
1
2
已知
H
:
U
x
N (0,1)
u u 1
/n
u |t |
t
1
2
H
:
u 1(n
1)
H
2
:
未知
H
:
T
x S /
t (n 1) t
t 1t 1
2
(n 1)
n
t w
(n (n (n
2
H
:
1) 1) 或1)
H
2
:
22
2
w
21
未知
w
H
(n 1) S
20
2
2
(n 1)
w
21
:
220
(n
2
1)
H
:
220
w (n 1)