概率论与数理统计公式整理

第1章

P m

(1)排列组合公式

C m

n n

随机事件及其概率

从m 个人中挑出n 个人进行排列的可能数。

m ! (m

n )! m ! n ! (m

n )!

从m 个人中挑出n 个人进行组合的可能数。

:m+n

m 种方法完成,第二种方法可由:m ×n

m 种方法完成,第二个步骤可由

n n

加法原理(两种方法均能完成此事)

(2)加法和乘法原理

种方法来完成,则这件事可由

某件事由两种方法来完成,第一种方法可由乘法原理(两个步骤分别不能完成这件事)某件事由两个步骤来完成,第一个步骤可由种方法来完成,则这件事可由重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题

m+n 种方法来完成。

m ×n 种方法来完成。

(3)一些常见排列(4)随机试验和随机事件

如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。

试验的可能结果称为随机事件。在一个试验下,不管事件有多少个,如下性质:

①每进行一次试验,必须发生且只能发生这一组中的一个事件;②任何事件,都是由这一组中的部分事件组成的。这样一组事件中的每一个事件称为基本事件,用基本事件的全体,称为试验的样本空间,用一个事件就是由

中的部分点(基本事件

的子集。

同理,

来表示。表示。

)组成的集合。通常用大写字母

总可以从其中找出这样一组事件,

它具有

(5)基本事件、样本空间和事件

A ,B ,C ,, 表示事件,它们是

为必然事件,?为不可能事件。

不可能事件(? )的概率为零,而概率为零的事件不一定是不可能事件;

必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。①关系:

如果事件A 的组成部分也是事件

A

B

B 的组成部分,(A 发生必有事件B 发生):

A 与事件B 等价,或称

A 等于B :

如果同时有A

(6)事件的关系与运算

B ,B A ,则称事件

A=B。

A 、B 中至少有一个发生的事件:A B ,或者A +B 。属于A 而不属于B 的部分所构成的事件,称为A 与B 的差,记为A-B ,也可

表示为A-AB 或者A B ,它表示A 发生而B 不发生的事件。

A 、B 同时发生:A B ,或者AB 。A B=?,则表示A 与B 不可能同时发生,

称事件A 与事件B 互不相容或者互斥。基本事件是互不相容的。

-A 称为事件A 的逆事件,或称的事件。互斥未必对立。②运算:

A 的对立事件,记为

A 。它表示A 不发生

结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B) ∪C

分配率:(AB)∪C=(A∪C) ∩(B∪C) (A∪B) ∩C=(AC)∪(BC)

A i

A i

i 1

德摩根率:

i 1

A B A B ,A B A B

为样本空间,A 为事件,对每一个事件A 都有一个实数P(A),若满

足下列三个条件:

1° 0≤P(A)≤1,2° P(Ω) =1

(7)概率的公理化定义

P

i 1

3° 对于两两互不相容的事件A 1,A 2,, 有A i

i 1

P (A i )

常称为可列(完全)可加性。则称P(A)为事件A 的概率。1°2° P (

(8)古典概型

1

1

,

2n

P (

1

n

) P (

2

) )

1n

m

组成的,则有

1

设任一事件A ,它是由

, (

2

P(A)=(

m n

1

) (

2

)

m

) =P (

)

P (

2

)

P (

m

)

A 所包含的基本事件数

基本事件总数

同时样本空

若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,间中的每一个基本事件可以使用一个有界区域来描述,

(9)几何概型

P (A )

(10)加法公式(11)减法公式

概型。对任一事件

L (A ) L (

)

A ,

则称此随机试验为几何

。其中L 为几何度量(长度、面积、体积)

P(A+B)=P(A)+P(B)-P(AB)

当P(AB)=0时,P(A+B)=P(A)+P(B) P(A-B)=P(A)-P(AB) 当B

A 时,P(A-B)=P(A)-P(B)

当A=Ω时,P(B )=1- P(B)

定义设A 、B 是两个事件,且P(A)>0,则称件B 发生的条件概率,记为

P (B /A )

P (AB ) P (A )

(12)条件概率

为事件A 发生条件下,事

P (AB ) P (A )

条件概率是概率的一种,所有概率的性质都适合于条件概率。例如P(Ω/B)=1乘法公式:P (AB )

(13)乘法公式

A n

P(

B

/A)=1-P(B/A)

P (A ) P (B /A )

2, A 1,A 2,,A n ,若P(A1A A n-1)>0,则有

更一般地,对事件

P (A 1A 2,

1

A n )

P (A 1) P (A 2|A 1) P (A 3|A 1A 2) ,, P (A n |A 1A 2,

) 。

P (A ) P (B ) ,则称事件A 、B 是相互独立的。P (A )

0,则有

①两个事件的独立性

设事件A 、B 满足P (AB ) 若事件A 、B 相互独立,且P (B |A )

P (AB ) P (A )

P (A ) P (B ) P (A )

P (B )

若事件A 、B 相互独立,则可得到A 与B 、A 与B 、A 与B 也都相互独

(14)独立性

立。

必然事件和不可能事件

? 与任何事件都互斥。②多个事件的独立性

设ABC 是三个事件,如果满足两两独立的条件,

P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足

P(ABC)=P(A)P(B)P(C)

那么A 、B 、C 相互独立。对于n 个事件类似。设事件B 1, B 2, 1°B 1, B 2,

(15)全概公式

2°则有

P (A )

n

? 与任何事件都相互独立。

, B n 满足

P (B i )

0(i

1, 2,

, n ) ,

, B n 两两互不相容,B i

A

i 1

P (B 2) P (A |B 2) B n 及A 满足

P (Bi ) >0,i

P (B n ) P (A |B n ) 。

P (B 1) P (A |B 1)

设事件B 1,B 2,, ,1°

B 1,B 2,, ,

n

B n 两两互不相容,1,2,, ,n ,

A B i

i 1

2°则

(16)贝叶斯公式

P (B i /A )

,P (A ) 0,

P (B i ) P (A /B i )

n

,i=1,2,,n 。

P (B j ) P (A /B j )

j 1

此公式即为贝叶斯公式。

P (B i ) ,(i

1,2,, ,n ),通常叫先验概率。

P (B i /A ) ,(i

1,2,, ,

n ),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。

(17)伯努利概型

我们作了n 次试验,且满足

每次试验只有两种可能结果,

A 发生或A 不发生;

n 次试验是重复进行的,即

A 发生的概率每次均一样;

A 发生与否与其他次试验

A 发生与

每次试验是独立的,即每次试验否是互不影响的。

这种试验称为伯努利概型,或称为用p 表示每次试验示n 重伯努利试验中

P (k )

n

n 重伯努利试验。

A 发生的概率为1n ) 次的概率,

p

q ,用P n (k ) 表

A 发生的概率,则A 出现k (0

k

k

C

k n

p q

k n

,k

0, 1, 2,

, n 。

第二章

(1)离散型随机变量的分布律

随机变量及其分布

X k (k=1,2,, ) 且取各个值的概率,即事

设离散型随机变量X 的可能取值为件(X=Xk ) 的概率为

P(X=xk )=pk ,k=1,2,, ,则称上式为离散型随机变量式给出:

X P (X

x k )

|x 1, x 2, p 1, p 2,

, x k , , p k ,

X 的概率分布或分布律。有时也用分布列的形

显然分布律应满足下列条件:

p k

1

(1)p k

(2)连续型随机变量的分布密度

F (x )

0,k

1, 2,

,(2)

k 1

f (x ) ,对任意实数x ,有

设F (x ) 是随机变量X 的分布函数,若存在非负函数

x

f (x ) dx

简称概

则称X 为连续型随机变量。f (x ) 称为X 的概率密度函数或密度函数,率密度。

密度函数具有下面4个性质:1° 2°

f (x )

0。

f (x ) dx

x )

P (x

1

X

x

dx )

f (x ) dx

P (X

x k )

p k 在离

(3)离散与连续型随机变量的关系

P (X

积分元f (x ) dx 在连续型随机变量理论中所起的作用与

散型随机变量理论中所起的作用相类似。

(4)分布函数

设X 为随机变量,

F (x )

P (X

x )

x 是任意实数,则函数

称为随机变量

P (a

X

X 的分布函数,本质上是一个累积函数。

b )

F (b )

F (a )

可以得到X 落入区间(a , b ]的概率。分布∞,x]内的概率。

函数F (x ) 表示随机变量落入区间(–

分布函数具有如下性质:1°2°3°4°5°

F (x )

1,

x

;x 1

F (

F (x ) 是单调不减的函数,即F (

)

lim

x

x 2时,有

)

x

F (x 1) F (x )

F (x 2) ;1;

F (x ) 0,lim

F (x 0) F (x ) ,即F (x ) 是右连续的;F (x )

F (x

0) 。

P (X x )

对于离散型随机变量,

F (x )

x k x

x

p k ;

对于连续型随机变量,

(5)八大分布

二项分布0-1分布

F (x )

f (x ) dx 。

P(X=1)=p, P(X=0)=q

在n 重贝努里试验中,设事件的次数是随机变量,设为

P (X

k )

P (k )

n

k

A 发生的概率为p 。事件A 发生

, n 。

X ,则X 可能取值为0, 1, 2,

k

n k

C n p q 1, k

, n ,

其中

q 1p , 0p 0, 1, 2,

则称随机变量X 服从参数为n ,p 的二项分布。记为

X ~B (n , p ) 。

当n 1时,P (X

k ) p q

k 1k

,k 0. 1,这就是(0-1)分

布,所以(0-1)分布是二项分布的特例。

泊松分布设随机变量X 的分布律为

k

P (X k )

k !

e

0,k

0, 1, 2

则称随机变量者P(

超几何分布

P (X

k )

X 服从参数为的泊松分布,记为

X ~(

) 或

) 。

np=λ,n →∞)。

0, 1, 2

, l

泊松分布为二项分布的极限分布(

C M

C

k

C

n N

n N

k M

, l

k

min(M , n )

随机变量X 服从参数为n,N,M 的超几何分布,记为

几何分布

P (X

k )

q

k 1

H(n,N,M)。

p , k 1, 2, 3,

,其中p ≥0,q=1-p。

G(p)。

f (x ) 在[a,b]

随机变量X 服从参数为p 的几何分布,记为

均匀分布

设随机变量X 的值只落在[a,b]内,其密度函数上为常数

1b 1

f (x )

b 0,

a a

,即

,

a ≤x ≤b 其他,

则称随机变量分布函数为

X 在[a,b]上服从均匀分布,记为X ~U(a,b) 。

0,

x b

x

x

a a ,

a ≤x ≤b x>b。

F (x ) f (x ) dx

1,

当a ≤x 1

X

x 2)

x 2b

x 1a

指数分布

e

f (x )

x

,

x x

0, 0,

0,

0,则称随机变量其中

X 的分布函数为

X 服从参数为的指数分布。

1

F (x )

0,

e

x

,

x

0,

x

记住积分公式:x e

n

x

dx n !

正态分布

设随机变量X 的密度函数为

(x

)

2

2

f (x ) 其中

12

e

2

x

X 服从参数为X ~N (

,

2

0为常数,则称随机变量

的正态分布或高斯(

f (x ) 具有如下性质:

Gauss )分布,记为

) 。

f (x ) 的图形是关于

x

对称的;1

为最大值;

2° 当x 若X ~N (1, F (x )

2

时,f (

2

2

)

2

2

(t ) ) x ,则X 的分布函数为2

e dt

。。

参数

0、

1时的正态分布称为标准正态分布,记为

2

X ~N (0, 1) ,其密度函数记为x

1

(x ) e

2

2

分布函数为(x )

1

x

t

x

2

e

2

dt 。

2

(x ) 是不可求积函数,其函数值,已编制成表可供查用。Φ(-x)=1-Φ(x)且Φ(0)=如果X ~N (

P (x 1

X

, x 2)

2

12

~N (0, 1) 。

x 1

) ,则

x 2

X

(6)分位数(7)函数分布

下分位表:P (X 上分位表:P (X 离散型

) =) =

;。

已知X 的分布列为

X P (X Y

x 1, x 2, x i ) p 1,

p 2,

y i , , x n , p n ,

g (x i ) 互不相等)如下:

g (X ) 的分布列(

Y

g (x 1), g (x 2), , g (x n ),

P (Y y i )

p 1, p 2, , p n ,

若有某些g (x i ) 相等,则应将对应的p i 相加作为g (x i ) 的概率。

连续型

先利用X 的概率密度

f X (x)写出Y 的分布函数

F Y (y)=P(g(X)≤

y) ,再利用变上下限积分的求导公式求出f Y (y)。

第三章

(1)联合分布

离散型

二维随机变量及其分布

如果二维随机向量

(X ,Y )的所有可能取值为至多可列为离散型随机量。

(x i , y j )(i , j

1, 2,

) ,

个有序对(x,y ),则称

设且事件{

=(X ,Y )的所有可能取值为=(x i , y j ) }的概率为p ij, , 称

(x i , y j )}

p ij (i , j

P {(X , Y ) 1, 2, )

为=(X ,Y )的分布律或称为X 和Y 的联合分布律。联合分

布有时也用下面的概率分布表来表示:

Y X x 1x 2

y 1p 11p 21

y 2p 12p 22

, , ,

y j p 1j p 2j

, , ,

x i p i1,

p ij

,

这里p ij 具有下面两个性质:(1)p ij ≥0(i,j=1,2,(2)

i

j

, );

p ij

1.

连续型

对于二维随机向量

f (x , y )(

x

,

(X , Y ) ,如果存在非负函数

) ,使对任意一个其邻边

y

分别平行于坐标轴的矩形区域有P {(X , Y ) 则称

D }

D

D ,即D={(X,Y)|a

f (x , y ) dxdy ,

f(x,y)

=(X ,Y )的分布

为连续型随机向量;并称

密度或称为X 和Y 的联合分布密度。

分布密度f(x,y)(1)(2)

(2)二维随机变量的本质(3)联合分布函数

设(X ,Y )为二维随机变量,对于任意实数

F (x , y )

P {X

(X

x , Y

y )

(X

x

具有下面两个性质:

f(x,y)≥0; f (x , y ) dxdy

Y

y )

1.

x,y, 二元函数

x , Y

y }

称为二维随机向量(X ,Y )的分布函数,或称为随机变量数。

X 和Y 的联合分布函

分布函数是一个以全平面为其定义域,以事件{(

1

,

2

) |X (

1

) x , Y (

2

)

y }的概率为函数值的一个实值函

数。分布函数(1)0

F(x,y)具有以下的基本性质:

1;

F (x , y )

(2)F (x,y )分别对x 和y 是非减的,即

当x 2>x1时,有F (x 2,y )≥F(x1,y); 当y 2>y1时,有F(x,y2) ≥F(x,y1); (3)F (x,y )分别对x 和y 是右连续的,即

F (x , y )

F (x , y )

0, y ), F (x , y ) F (x ,

)

0, F (

F (x , y

,

) 0); 1.

(4)F (

, ) F (

(5)对于x 1F (x 2,y 2)

(4)离散型与连续型的关系

P (X

x ,Y

x 2,y 1F (x 2,y 1)

y )

P (x

y 2,

F (x 1,y 2)

X

x

F (x 1,y 1)

Y

y

0.

dy )

f (x ,y ) dxdy

dx ,y

(5)边缘分布

离散型X 的边缘分布为

P i

P (X

x i )

j

p ij (i , j 1, 2,

) ;

Y 的边缘分布为P

连续型

j

P (Y

y j )

i

p ij (i , j

1, 2,

) 。

X 的边缘分布密度为f

X

(x ) f (x , y ) dy ;

Y 的边缘分布密度为f Y (y )

(6)条件分布

P (Y

y

j

f (x , y ) dx .

离散型

i 的条件下,Y 取值的条件分布为在已知X=x

|X

x i )

p ij p i

在已知Y=yj 的条件下,X 取值的条件分布为P (X

连续型

x i |Y

y j )

p ij p

j

,

在已知Y=y的条件下,X 的条件分布密度为

f (x |y )

f (x , y ) f Y (y )

在已知X=x的条件下,Y 的条件分布密度为

f (y |x )

f (x , y ) f X (x )

(7)独立性

一般型离散型

F(X,Y)=FX (x)FY (y)

p ij

p i p

j

有零不独立

连续型

f(x,y)=f

X

(x)f

Y

(y)

直接判断,充要条件:①可分离变量

②正概率密度区间为矩形

二维正态分布

f (x , y )

2

1

2

211

222

1x

2

2(x

11

)(y

2

2

) y

11

2

2(1)

e ,

=0

随机变量的函数

若X 1,X 2, , X m ,X m+1, , X n 相互独立, h,g为连续函数,则:

n )相互独立。h (X 1,X 2, , X m )和g (X m+1, , X

特例:若X 与Y 独立,则:h (X )和g (Y )独立。例如:若X 与Y 独立,则:3X+1和5Y-2独立。

(8)二维均匀分布

设随机向量(X ,Y )的分布密度函数为

1S D

f (x , y )

0,

其他(x , y )

D

其中S D 为区域D 的面积,则称(X ,Y )服从D 上的均匀分布,记为(U (D )。

例如图3.1、图3.2和图3.3。

X ,Y )~

y

1

DO

图3.1

1

1

x

y

1

D 2

O

2 1

x

图3.2

y

d

D 3

c

O a b x

图3.3

(9)二维正态分布

设随机向量(X ,Y )的分布密度函数为

2

2

1

x

2

11

2(x

11

)(y

2

2

) y

2

2

f (x , y )

2

其中布,

,

1

2

11

2

2(1)

e ,

12, 1

0,

2

0, |

|1是5个参数,则称(X ,Y )服从二维正态分

记为(X ,Y )~N (

1

,

22,

1

,

22

, ).

由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即X ~N (

1

,

21

), Y ~N (,

21

22,

2

).

22,

2

但是若X ~N (

(10)函数分布

Z=X+Y

1

), Y ~N () ,(X,Y) 未必是二维正态分布。P (Z

z )

P (X

Y

z )

根据定义计算:

F Z (z )

对于连续型,f Z (z)=

f (x , z x ) dx

两个独立的正态分布的和仍为正态分布(

1

2,

2

122

)。

n 个相互独立的正态分布的线性组合,仍服从正态分布。

C i

i

i

2

i

C i

22i

Z=max,min(X 1,X 2,, X n )

X 1, X

2

X

n

相互独立,其分布函数分别为

F x n (x ) ,则Z=max,min(X1,X 2,, X n ) 的分布

F x 1(x ) ,F x 2(x )

函数为:

F max (x ) F min (x )

F x 1(x ) 1

[1

F x 2(x ) F x 1(x )]

[1F x n (x ) F x 2(x )]

[1

F x n (x )]

2

分布

设n 个随机变量X 1, X 2, 布,可以证明它们的平方和

, X

n

相互独立,且服从标准正态分

n

W

i 1

X

2i

的分布密度为

n

1

n

1

u

u n 2

2

e

2

u 0,

f (u )

20,

2

u

2

0.

2

我们称随机变量其中

W 服从自由度为n 的

分布,记为W ~(n ) ,

n 2

n

1

x

2

e

x

dx .

所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。

2

分布满足可加性:设

Y i

2

(n i ),

k

Z

i 1

Y i ~

2

(n 1n 2n k ).

t 分布设X ,Y 是两个相互独立的随机变量,且

X ~N (0, 1), Y ~

2

(n ),

可以证明函数

T

的概率密度为

n

f (t )

n

我们称随机变量

t 1

(n )

2

X Y /n

12n 2

1

t

2

n 12

(t ).

n

T 服从自由度为n 的t 分布,记为T ~t(n)。

t (n )

2

F 分布

设X ~

(n 1), Y ~(n 2) ,且X 与Y 独立,可以证明

F

X /n 1Y /n 2

的概率密度函数为

n 1

2

f (y )

n 12

我们称随机变量的F 分布,记为

F 1

(n 1, n 2)

n 2

n 1

n 22

n 2

n 12

n 1

1

n 1n 22

y

2

1

n 1n 2

y , y 0

0, y

F 服从第一个自由度为F ~f(n1, n2).

1F

(n 2, n 1)

n 1,第二个自由度为

n 2

第四章

(1)

随机变量的数字特征

离散型

连续型

一维随机变量的数字特征

期望

期望就是平均值

设X 是离散型随机变量,其分布律为

P(

X

x k ) =p k ,

设X 是连续型随机变量,其概率密度为f(x),E (X )

xf (x ) dx

k=1,2,, ,n ,

n

E (X )

k 1

x k p k

(要求绝对收敛)

(要求绝对收敛)

函数的期望

Y=g(X)

n

Y=g(X)

g (x k ) p k

k

1

E (Y )

E (Y ) g (x ) f (x ) dx

方差

D(X)=E[X-E(X)]标准差(X ) 矩

D (X ) ,

①对于正整数阶原点矩,记为

ν=E(X)=

k

k

2

D (X )

k

[x k E (X )]p k

2

D (X ) [x E (X )]

2

f (x ) dx

k ,称随机变量v k , 即x i p i ,

i

k

X ①对于正整数k ,称随机变量X 的

X 的k 阶原点

的k 次幂的数学期望为X 的k k 次幂的数学期望为矩,记为v k , 即ν=E(X)=

k

k

x f (x ) dx ,

k

k=1,2, , .

②对于正整数

k ,称随机变量

与E (X )差的k 次幂的数学期望为X 的k 阶中心矩,记为即

k

k=1,2, , .

k ,称随机变量X 与

X

X ②对于正整数

E (X )差的k 次幂的数学期望为,的k 阶中心矩,记为

E (X

E (X ))

k

k

,即

k

k

E (X E (X ))

k

.

.

=

i

(x i

E (X ))

k

=

p i

(x E (X ))

k

f (x ) dx ,

k=1,2, , .

k=1,2, , .

切比雪夫不等式设随机变量X 具有数学期望E (X )=μ,方差D (X )=σ,则对于

2

任意正数ε,有下列切比雪夫不等式

2

P (X )

2

切比雪夫不等式给出了在未知X 的分布的情况下,对概率

)

P (X

的一种估计,它在理论上有重要意义。

(2)期望的性质

(3)(4)

(3)方差的性质

(1)(2)(3)(4)(5) D(X

(4)常见分布的期望和方差

0-1分布B (1, p ) 二项分布B (n , p ) 泊松分布P ()

1p

nM N a 2b

(1)(2)

E(C)=C E(CX)=CE(X)

n

n

E(X+Y)=E(X)+E(Y),E (

i 1

C i X i )

i 1

C i E (X i )

E(XY)=E(X) E(Y),充分条件:X 和Y 独立;

充要条件:X 和Y 不相关。

D(C)=0;E(C)=C

D(aX)=aD(X); E(aX)=aE(X) D(aX+b)= aD(X); E(aX+b)=aE(X)+b D(X)=E(X)-E (X)

D(X±Y)=D(X)+D(Y),充分条件:X 和Y 独立;

充要条件:X 和Y 不相关。

±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))]而E(X+Y)=E(X)+E(Y),无条件成立。

期望

方差

p (1

p )

2

22

2

,无条件成立。

p np

np (1p )

几何分布G (p )

1p

2

p

超几何分布H (n , M , N )

nM N

1

M N

N N

n 1

均匀分布U (a , b )

(b a ) 12

1

2

2

指数分布e ()

1

正态分布N (

2

,

2

)

2

分布n 0

n

2n

n n

E (X )

xf

2(x ) dx

t 分布

(5)二维随机变量的数字特征

函数的期望

E (Y )

j 1

(n>2)

期望

E (X )

x i p i

i 1

X

n

y j p

j

E (Y )

yf Y (y ) dy

E [G (X , Y )]=

G (x i , y j ) p ij

i

j

E [G (X , Y )]=

G (x , y ) f (x , y ) dxdy

方差

D (X )

i

[x i

[x

j

E (X )]p i

E (Y )]

2

2

D (X ) [x E (X )]

2

f X (x ) dx

D (Y )

j

p

j

D (Y ) [y E (Y )]

2

f Y (y ) dy

协方差

对于随机变量X 与Y ,称它们的二阶混合中心矩

或cov(X , Y ) ,即

E (Y ))].

11

为X 与Y 的协方

差或相关矩,记为

E [(X

XY

XY 11

E (X ))(Y

与记号与

XY

相对应,X 与Y 的方差D (X )与D (Y )也可分别记为

XX

YY

相关系数对于随机变量X 与Y ,如果D (X )>0, D(Y)>0,则称

XY

D (X ) D (Y )

为X 与Y 的相关系数,记作

|

|≤1,当|

XY

(有时可简记为)。

aY

b )

1

|=1时,称X 与Y 完全相关:P (X

正相关,当负相关,当

1时(a 1时(a

0) ,0) ,

完全相关

而当0时,称X 与Y 不相关。

以下五个命题是等价的:①

XY

0;

②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y).

协方差矩阵

XX

XY

YX

YY

混合矩

对于随机变量X 与Y ,如果有E (X Y ) 存在,则称之为

;k+l阶混合中心矩记为:

E (X ))

k

k l

X 与Y 的

k+l阶混合原点矩,记为

u kl

E [(X

kl

(Y E (Y )) ].

l

(6)协方差的性质(7)独立和不相关

(i)(ii)(iii)(iv)(i )(ii )

cov (X, Y)=cov (Y, X); cov(aX,bY)=ab cov(X,Y); cov(X1+X2, Y)=cov(X

1

,Y)+cov(X2,Y);

cov(X,Y)=E(XY)-E(X)E(Y).

若随机变量X 与Y 相互独立,则若(X ,Y )~N (

1,

2,

21

XY

0;反之不真。),

,

22

,

则X 与Y 相互独立的充要条件是X 和Y 不相关。

第五章大数定律和中心极限定理

(1)大数定律

X

切比雪夫大数定律

设随机变量X 1,X 2,, 相互独立,均具有有限方差,且被同一

ε,有

常数C 所界:D (X i )

lim P

n

1n

i

n

X

1

1

i

n

n

E (X i )

i 1

1.

E (X I )=μ,

特殊情形:若则上式成为lim P

n

X 1,X 2,, 具有相同的数学期望

1n

i

n

X

1

i

1.

A 发生的次数,p 是事件A 在

ε,有

1.

伯努利大数定律

设μ是n 次独立试验中事件

每次试验中发生的概率,则对于任意的正数

lim P

n

p n

伯努利大数定律说明,当试验次数的频率与概率有较大判别的可能性很小,即

lim P

n

n 很大时,事件A 发生

p n

0.

这就以严格的数学形式描述了频率的稳定性。

辛钦大数定律

设X 1,X 2,, ,X n ,, 是相互独立同分布的随机变量序列,且(X n )=μ,则对于任意的正数lim P

n

E

ε有

1n

i

n

X

1

i

1.

X 1,X 2,, 相互独立,服从同一分布,且具有数

k

(2)中心极限定理

2

列维-林德伯格定理)

E (X

设随机变量同

k )

, D (X

2

0(k

n

1, 2,

和方差:

X N (,

)

) ,则随机变量

n

X

Y n

的分布函数F n (x ) 对任意的实数

n

k

1

k

n

n

x ,有

n

x

12

x

t

2

X

lim F n (x )

n

k

lim P

n

k 1

e

2

dt .

n

此定理也称为独立同分布的中心极限定理。

棣莫弗-拉普拉斯定理

设随机变量

X

n

为具有参数n, p(0

任意实数x, 有

lim P

n

X

n

np p )

x

12

x

t

2

e

2

dt .

np (1时,

k

n

k M

(3)二项定理

若当N

M N

p (n , k 不变) ,则

C M C N

C

n N

C n p (1

k k

p )

n k

(N ).

超几何分布的极限分布为二项分布。

(4)泊松定理

若当n

时, np

0,则

k

C p (1

k n

k

p )

n k

k !

e (n ).

其中k=0,1,2,, ,n ,, 。二项分布的极限分布为泊松分布。

第六章样本及抽样分布

(1)数理统计的基本概念

个体样本总体

在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。

总体中的每一个单元称为样品(或个体)我们把从总体中抽取的部分样品中所含的样品数称为样本容量,总是把样本看成是

x 1, x 2,

, x n 称为样本。样本

一般用n 表示。在一般情况下,

n 个相互独立的且与总体有相同分布的随机

变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,x 1, x 2,

, x n 表示n 个随机变量(样本);在具体的一次

, x n 表示n 个具体的数值(样本值)。我们

抽取之后,x 1, x 2, 称之为样本的两重性。

样本函数和统计量

设x 1, x 2,

, x n 为总体的一个样本,称

(x 1, x 2,

为样本函数,其中知参数,则称

, x n )

为一个连续函数。如果中不包含任何未

(x 1, x 2,

, x n )为一个统计量。

常见统计量及其性质

样本均值样本方差

x

1n

i

n

x i .

1

S

2

1n

1

i

n

(x i

1

x ) .

1n

1

i n

2

样本标准差样本k 阶原点矩

M

1

k

n

S

(x i

1

x ) .

2

n

x i , k

i 1

k

1, 2, .

样本k 阶中心矩

M

1

k

n

n

(x i

i 1

x ) , k

k

2, 3, .

2

E (X )

,D (X )

,n

2

E (S )

22

,E (S *)

n

n n X )

2

1

2

,

其中S *

(2)正态总体下的四大分布

正态分布

2

1n

i

(X

1

i

,为二阶中心矩。

设x 1, x 2, 本函数

def

, x n 为来自正态总体

N (,

2

) 的一个样本,则样

u

x /

n

~N (0, 1).

t 分布

设x 1, x 2, 本函数

, x n 为来自正态总体

N (,

2

) 的一个样本,则样

def

t

其中t(n-1)

表示自由度为

x s /

n

~t (n 1),

n-1的t 分布。

2

分布

设x 1, x 2, 本函数

, x n 为来自正态总体

N (,

2

) 的一个样本,则样

def

w

(n 1) S

2

2

~

2

(n 1),

其中

F 分布

2

(n 1) 表示自由度为n-1的

2

分布。

21

设x 1, x 2,

y 1, y 2,

, x n 为来自正态, y n 为来自正态总体

总体N (,

N (

,

22

) 的一个样本,而

) 的一个样本,则样本

函数

def

F

S 1/S 2/

2

22122

~F (n 11, n 2

1),

其中

S 1

2

1n 1

1

i

n 1

(x i

1

x ) ,

2

S 2

2

1n 2

1

n

2

(y i

i 1

y ) ;

2

F (n 1n 2

(3)正态总体下分布的性质

X 与S 独立。

2

1, n 2

1) 表示第一自由度为n 1

1,第二自由度为

1的F 分布。

第七章参数估计

(1)点估计

矩估计

设总体X 的分布中包含有未知数

F (x ;

,

,

,

1

,

2

, ,

m

,则其分布函数可以表成

k

12m

). 它的k 阶原点矩v k

E (X )(k 1, 2,

, m ) 中也

包含了未知参数

x 1, x 2,

1

,

2

, ,

m

,即v k

v k (

1

,

2

, ,

m

) 。又设

, x n 为总体X 的n 个样本值,其样本的

n

k 阶原点矩为

1n

i

x i

1

k

(k 1, 2, , m ).

这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有

v 1(

,

,

,

)

1n 1n

i i n

12m

x i ,

1

n

v 2(

1

,

2

, ,

m

) x i ,

1

2

v m (

1

,

2

, ,

m

)

1n

n

x i .

i 1

m

由上面的(

,

,

m 个方程中,解出的

,

m 个未知参数(

1

,

2

, ,

m

) 即为参数

12m

)的矩估计量。

为的矩估计,g (x ) 为连续函数,则

g (? ) 为g () 的矩估计。

极大似然估计

当总体f (x ;

1

X 为连续型随机变量时,设其分布密度为,

m

,

2

, ) ,其中

1

,

2

, ,

m

为未知参数。又设

x 1, x ,

2

, x n 为总体的一个样本,称

n

L (

1

,

2

, ,

m

)

i 1

f (x i ;

1

,

2

, ,

m

)

为样本的似然函数,简记为

当总体

P {X

x }

p (x ;

1

L n .

X 为离型随机变量时,设其分布律为,

2

, ,

m

) ,则称

n

L (x 1, x 2, , x n ;

1

,

2

, ,

m

)

i 1

p (x i ;

1

,

2

, ,

m

)

为样本的似然函数。

若似然函数到最大值,则称

L (x 1, x 2,

, x n ;

1

,

2

, ,

m

) 在

1

,

2

, ,

m

处取

1

,

2

, ,

m

分别为

1

,

2

, ,

m

的最大似然估计值,

相应的统计量称为最大似然估计量。

ln L n

i

i

i

0, i 1, 2, , m

为的极大似然估计,g (x ) 为单调函数,则

g (? ) 为g () 的极大

似然估计。

(2)估计量的评选标准

的无偏估计量。

2

无偏性

(x 1, x 2, , x n ) 为未知参数

的估计量。若E ()=,则称

E (X )=E(X ), E(S )=D(X )

有效性

1

1

(x 1, x , 2, , x n ) 和D (

)

22

(x 1, x , 2, ) ,则称

, x n ) 是未知参数

的两个无偏估计量。若

1

D (

2

1

2

有效。

一致性

n

是的一串估计量,如果对于任意的正数

lim P (|

n

n

,都有0,

|)

则称

n

为的一致估计量(或相合估计量)。

为的无偏估计,且

D (? )

0(n

), 则

为的一致估计。

只要总体的

(3)区间估计

置信区间和置信度

E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相

应总体的一致估计量。

设总体X 含有一个待估的未知参数发

(统

计)

。如果我们从样本量

x 1, x , 2,

, x n 出

11

(x 1, x , 2, , x n )

与以

22

(x 1, x , 2, , x n )

12

,使得区间

,即1

,

[

1

,

2

]

1(0

1) 的概率包含这个待估参数

P {

那么称区间[信水平)。

单正态总体的期望和方差的区间估计

设x 1, x , 2,

,

]为

12

}

12

的置信区间,1为该区间的置信度(或置

, x n 为总体X ~N (

2

,

2

) 的一个样本,在置信度为

1

下,我们来确定

的置信区间[

1

,

2

]。具体步骤如下:

(i )选择样本函数;(ii )由置信度1(iii

)导出置信区间

,查表找分位数;[

1

,

2

]。

已知方差,估计均值(i )选择样本函数

u (ii)

P

x

~N (0, 1). /

n

查表找分位数

x

1

/

n

.

(iii

x

)导出置信区间

, x

n n

未知方差,估计均值(i )选择样本函数

t

x S /

n ~t (n

1).

(ii)查表找分位数

x S /

n

1

.

P

(iii

x

)导出置信区间

S n , x

S n

方差的区间估计(i )选择样本函数w

(n

1) S

2

2

~

2

(n 1).

(ii )查表找分位数P (iii

(n

1

1) S

2

2

2

1.

)导出

n

2

的置信区间

S ,

n

1

11

S

第八章假设检验

基本思想假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。

为了检验一个假设

0是否成立。我们先假定0是成立的。如果根据这个假H H

定导致了一个不合理的事件发生,那就表明原来的假定相容的。与

H 0是不正确的,我们拒

0,我们称0是H H

绝接受H 0;如果由此没有导出不合理的现象,则不能拒绝接受

H 0相对的假设称为备择假设,用

{K

H 1表示。

R },其概率就是检验水平

这里所说的小概率事件就是事件

α,通

常我们取α=0.05,有时也取0.01或0.10。

基本步骤

假设检验的基本步骤如下:

(i)(ii)(iii)(iv)

提出零假设H 0;选择统计量K ;

对于检验水平α查表找分位数λ;由样本值x 1, x 2,

, x n 计算统计量之值

K ;

0,否则认为) 时否定H

0H

将K 与相容。

两类错误

进行比较,作出判断:当

|K |(或K

第一类错误

当H 0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定

H 0。这时,我们把客观上

H 0成立判为

H 0为不成立(即否定了真实的假设)

当假”的错误或第一类错误,

0为真}=P{否定H 0|H

,称这种错误为“以真为犯此类错误的概率,

此处的α恰好为检验水平。

第二类错误

当H 1为真时,而样本值却落入了相容域,按照我们规定的

0。这时,我们把客观上检验法则,应当接受H

H 0。不成立判

为H 0成立(即接受了不真实的假设)当真”的错误或第二类错误,记即

P{接受H 0|H 1为真}=

两类错误的关系

,称这种错误为“以假为犯此类错误的概率,

人们当然希望犯两类错误的概率同时都很小。容量n 一定时,变大。取定

变小,则

变大;相反地,

但是,当变小,则

要想使变小,则必须增加样本容量。

在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平

α。α大小的选取应根据实际情况而

、而不愿“以真当假”时,则

定。当我们宁可“以假为真”得大些。

应把α取得很小,如0.01,甚至0.001。反之,则应把α取

单正态总体均值和方差的假设检验

条件

H

2

零假设

:

统计量

对应样本函数分布

否定域

|u |u

00

1

2

已知

H

:

U

x

N (0,1)

u u 1

/n

u |t |

t

1

2

H

:

u 1(n

1)

H

2

:

未知

H

:

T

x S /

t (n 1) t

t 1t 1

2

(n 1)

n

t w

(n (n (n

2

H

:

1) 1) 或1)

H

2

:

22

2

w

21

未知

w

H

(n 1) S

20

2

2

(n 1)

w

21

:

220

(n

2

1)

H

:

220

w (n 1)

第1章

P m

(1)排列组合公式

C m

n n

随机事件及其概率

从m 个人中挑出n 个人进行排列的可能数。

m ! (m

n )! m ! n ! (m

n )!

从m 个人中挑出n 个人进行组合的可能数。

:m+n

m 种方法完成,第二种方法可由:m ×n

m 种方法完成,第二个步骤可由

n n

加法原理(两种方法均能完成此事)

(2)加法和乘法原理

种方法来完成,则这件事可由

某件事由两种方法来完成,第一种方法可由乘法原理(两个步骤分别不能完成这件事)某件事由两个步骤来完成,第一个步骤可由种方法来完成,则这件事可由重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题

m+n 种方法来完成。

m ×n 种方法来完成。

(3)一些常见排列(4)随机试验和随机事件

如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。

试验的可能结果称为随机事件。在一个试验下,不管事件有多少个,如下性质:

①每进行一次试验,必须发生且只能发生这一组中的一个事件;②任何事件,都是由这一组中的部分事件组成的。这样一组事件中的每一个事件称为基本事件,用基本事件的全体,称为试验的样本空间,用一个事件就是由

中的部分点(基本事件

的子集。

同理,

来表示。表示。

)组成的集合。通常用大写字母

总可以从其中找出这样一组事件,

它具有

(5)基本事件、样本空间和事件

A ,B ,C ,, 表示事件,它们是

为必然事件,?为不可能事件。

不可能事件(? )的概率为零,而概率为零的事件不一定是不可能事件;

必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。①关系:

如果事件A 的组成部分也是事件

A

B

B 的组成部分,(A 发生必有事件B 发生):

A 与事件B 等价,或称

A 等于B :

如果同时有A

(6)事件的关系与运算

B ,B A ,则称事件

A=B。

A 、B 中至少有一个发生的事件:A B ,或者A +B 。属于A 而不属于B 的部分所构成的事件,称为A 与B 的差,记为A-B ,也可

表示为A-AB 或者A B ,它表示A 发生而B 不发生的事件。

A 、B 同时发生:A B ,或者AB 。A B=?,则表示A 与B 不可能同时发生,

称事件A 与事件B 互不相容或者互斥。基本事件是互不相容的。

-A 称为事件A 的逆事件,或称的事件。互斥未必对立。②运算:

A 的对立事件,记为

A 。它表示A 不发生

结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B) ∪C

分配率:(AB)∪C=(A∪C) ∩(B∪C) (A∪B) ∩C=(AC)∪(BC)

A i

A i

i 1

德摩根率:

i 1

A B A B ,A B A B

为样本空间,A 为事件,对每一个事件A 都有一个实数P(A),若满

足下列三个条件:

1° 0≤P(A)≤1,2° P(Ω) =1

(7)概率的公理化定义

P

i 1

3° 对于两两互不相容的事件A 1,A 2,, 有A i

i 1

P (A i )

常称为可列(完全)可加性。则称P(A)为事件A 的概率。1°2° P (

(8)古典概型

1

1

,

2n

P (

1

n

) P (

2

) )

1n

m

组成的,则有

1

设任一事件A ,它是由

, (

2

P(A)=(

m n

1

) (

2

)

m

) =P (

)

P (

2

)

P (

m

)

A 所包含的基本事件数

基本事件总数

同时样本空

若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,间中的每一个基本事件可以使用一个有界区域来描述,

(9)几何概型

P (A )

(10)加法公式(11)减法公式

概型。对任一事件

L (A ) L (

)

A ,

则称此随机试验为几何

。其中L 为几何度量(长度、面积、体积)

P(A+B)=P(A)+P(B)-P(AB)

当P(AB)=0时,P(A+B)=P(A)+P(B) P(A-B)=P(A)-P(AB) 当B

A 时,P(A-B)=P(A)-P(B)

当A=Ω时,P(B )=1- P(B)

定义设A 、B 是两个事件,且P(A)>0,则称件B 发生的条件概率,记为

P (B /A )

P (AB ) P (A )

(12)条件概率

为事件A 发生条件下,事

P (AB ) P (A )

条件概率是概率的一种,所有概率的性质都适合于条件概率。例如P(Ω/B)=1乘法公式:P (AB )

(13)乘法公式

A n

P(

B

/A)=1-P(B/A)

P (A ) P (B /A )

2, A 1,A 2,,A n ,若P(A1A A n-1)>0,则有

更一般地,对事件

P (A 1A 2,

1

A n )

P (A 1) P (A 2|A 1) P (A 3|A 1A 2) ,, P (A n |A 1A 2,

) 。

P (A ) P (B ) ,则称事件A 、B 是相互独立的。P (A )

0,则有

①两个事件的独立性

设事件A 、B 满足P (AB ) 若事件A 、B 相互独立,且P (B |A )

P (AB ) P (A )

P (A ) P (B ) P (A )

P (B )

若事件A 、B 相互独立,则可得到A 与B 、A 与B 、A 与B 也都相互独

(14)独立性

立。

必然事件和不可能事件

? 与任何事件都互斥。②多个事件的独立性

设ABC 是三个事件,如果满足两两独立的条件,

P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足

P(ABC)=P(A)P(B)P(C)

那么A 、B 、C 相互独立。对于n 个事件类似。设事件B 1, B 2, 1°B 1, B 2,

(15)全概公式

2°则有

P (A )

n

? 与任何事件都相互独立。

, B n 满足

P (B i )

0(i

1, 2,

, n ) ,

, B n 两两互不相容,B i

A

i 1

P (B 2) P (A |B 2) B n 及A 满足

P (Bi ) >0,i

P (B n ) P (A |B n ) 。

P (B 1) P (A |B 1)

设事件B 1,B 2,, ,1°

B 1,B 2,, ,

n

B n 两两互不相容,1,2,, ,n ,

A B i

i 1

2°则

(16)贝叶斯公式

P (B i /A )

,P (A ) 0,

P (B i ) P (A /B i )

n

,i=1,2,,n 。

P (B j ) P (A /B j )

j 1

此公式即为贝叶斯公式。

P (B i ) ,(i

1,2,, ,n ),通常叫先验概率。

P (B i /A ) ,(i

1,2,, ,

n ),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。

(17)伯努利概型

我们作了n 次试验,且满足

每次试验只有两种可能结果,

A 发生或A 不发生;

n 次试验是重复进行的,即

A 发生的概率每次均一样;

A 发生与否与其他次试验

A 发生与

每次试验是独立的,即每次试验否是互不影响的。

这种试验称为伯努利概型,或称为用p 表示每次试验示n 重伯努利试验中

P (k )

n

n 重伯努利试验。

A 发生的概率为1n ) 次的概率,

p

q ,用P n (k ) 表

A 发生的概率,则A 出现k (0

k

k

C

k n

p q

k n

,k

0, 1, 2,

, n 。

第二章

(1)离散型随机变量的分布律

随机变量及其分布

X k (k=1,2,, ) 且取各个值的概率,即事

设离散型随机变量X 的可能取值为件(X=Xk ) 的概率为

P(X=xk )=pk ,k=1,2,, ,则称上式为离散型随机变量式给出:

X P (X

x k )

|x 1, x 2, p 1, p 2,

, x k , , p k ,

X 的概率分布或分布律。有时也用分布列的形

显然分布律应满足下列条件:

p k

1

(1)p k

(2)连续型随机变量的分布密度

F (x )

0,k

1, 2,

,(2)

k 1

f (x ) ,对任意实数x ,有

设F (x ) 是随机变量X 的分布函数,若存在非负函数

x

f (x ) dx

简称概

则称X 为连续型随机变量。f (x ) 称为X 的概率密度函数或密度函数,率密度。

密度函数具有下面4个性质:1° 2°

f (x )

0。

f (x ) dx

x )

P (x

1

X

x

dx )

f (x ) dx

P (X

x k )

p k 在离

(3)离散与连续型随机变量的关系

P (X

积分元f (x ) dx 在连续型随机变量理论中所起的作用与

散型随机变量理论中所起的作用相类似。

(4)分布函数

设X 为随机变量,

F (x )

P (X

x )

x 是任意实数,则函数

称为随机变量

P (a

X

X 的分布函数,本质上是一个累积函数。

b )

F (b )

F (a )

可以得到X 落入区间(a , b ]的概率。分布∞,x]内的概率。

函数F (x ) 表示随机变量落入区间(–

分布函数具有如下性质:1°2°3°4°5°

F (x )

1,

x

;x 1

F (

F (x ) 是单调不减的函数,即F (

)

lim

x

x 2时,有

)

x

F (x 1) F (x )

F (x 2) ;1;

F (x ) 0,lim

F (x 0) F (x ) ,即F (x ) 是右连续的;F (x )

F (x

0) 。

P (X x )

对于离散型随机变量,

F (x )

x k x

x

p k ;

对于连续型随机变量,

(5)八大分布

二项分布0-1分布

F (x )

f (x ) dx 。

P(X=1)=p, P(X=0)=q

在n 重贝努里试验中,设事件的次数是随机变量,设为

P (X

k )

P (k )

n

k

A 发生的概率为p 。事件A 发生

, n 。

X ,则X 可能取值为0, 1, 2,

k

n k

C n p q 1, k

, n ,

其中

q 1p , 0p 0, 1, 2,

则称随机变量X 服从参数为n ,p 的二项分布。记为

X ~B (n , p ) 。

当n 1时,P (X

k ) p q

k 1k

,k 0. 1,这就是(0-1)分

布,所以(0-1)分布是二项分布的特例。

泊松分布设随机变量X 的分布律为

k

P (X k )

k !

e

0,k

0, 1, 2

则称随机变量者P(

超几何分布

P (X

k )

X 服从参数为的泊松分布,记为

X ~(

) 或

) 。

np=λ,n →∞)。

0, 1, 2

, l

泊松分布为二项分布的极限分布(

C M

C

k

C

n N

n N

k M

, l

k

min(M , n )

随机变量X 服从参数为n,N,M 的超几何分布,记为

几何分布

P (X

k )

q

k 1

H(n,N,M)。

p , k 1, 2, 3,

,其中p ≥0,q=1-p。

G(p)。

f (x ) 在[a,b]

随机变量X 服从参数为p 的几何分布,记为

均匀分布

设随机变量X 的值只落在[a,b]内,其密度函数上为常数

1b 1

f (x )

b 0,

a a

,即

,

a ≤x ≤b 其他,

则称随机变量分布函数为

X 在[a,b]上服从均匀分布,记为X ~U(a,b) 。

0,

x b

x

x

a a ,

a ≤x ≤b x>b。

F (x ) f (x ) dx

1,

当a ≤x 1

X

x 2)

x 2b

x 1a

指数分布

e

f (x )

x

,

x x

0, 0,

0,

0,则称随机变量其中

X 的分布函数为

X 服从参数为的指数分布。

1

F (x )

0,

e

x

,

x

0,

x

记住积分公式:x e

n

x

dx n !

正态分布

设随机变量X 的密度函数为

(x

)

2

2

f (x ) 其中

12

e

2

x

X 服从参数为X ~N (

,

2

0为常数,则称随机变量

的正态分布或高斯(

f (x ) 具有如下性质:

Gauss )分布,记为

) 。

f (x ) 的图形是关于

x

对称的;1

为最大值;

2° 当x 若X ~N (1, F (x )

2

时,f (

2

2

)

2

2

(t ) ) x ,则X 的分布函数为2

e dt

。。

参数

0、

1时的正态分布称为标准正态分布,记为

2

X ~N (0, 1) ,其密度函数记为x

1

(x ) e

2

2

分布函数为(x )

1

x

t

x

2

e

2

dt 。

2

(x ) 是不可求积函数,其函数值,已编制成表可供查用。Φ(-x)=1-Φ(x)且Φ(0)=如果X ~N (

P (x 1

X

, x 2)

2

12

~N (0, 1) 。

x 1

) ,则

x 2

X

(6)分位数(7)函数分布

下分位表:P (X 上分位表:P (X 离散型

) =) =

;。

已知X 的分布列为

X P (X Y

x 1, x 2, x i ) p 1,

p 2,

y i , , x n , p n ,

g (x i ) 互不相等)如下:

g (X ) 的分布列(

Y

g (x 1), g (x 2), , g (x n ),

P (Y y i )

p 1, p 2, , p n ,

若有某些g (x i ) 相等,则应将对应的p i 相加作为g (x i ) 的概率。

连续型

先利用X 的概率密度

f X (x)写出Y 的分布函数

F Y (y)=P(g(X)≤

y) ,再利用变上下限积分的求导公式求出f Y (y)。

第三章

(1)联合分布

离散型

二维随机变量及其分布

如果二维随机向量

(X ,Y )的所有可能取值为至多可列为离散型随机量。

(x i , y j )(i , j

1, 2,

) ,

个有序对(x,y ),则称

设且事件{

=(X ,Y )的所有可能取值为=(x i , y j ) }的概率为p ij, , 称

(x i , y j )}

p ij (i , j

P {(X , Y ) 1, 2, )

为=(X ,Y )的分布律或称为X 和Y 的联合分布律。联合分

布有时也用下面的概率分布表来表示:

Y X x 1x 2

y 1p 11p 21

y 2p 12p 22

, , ,

y j p 1j p 2j

, , ,

x i p i1,

p ij

,

这里p ij 具有下面两个性质:(1)p ij ≥0(i,j=1,2,(2)

i

j

, );

p ij

1.

连续型

对于二维随机向量

f (x , y )(

x

,

(X , Y ) ,如果存在非负函数

) ,使对任意一个其邻边

y

分别平行于坐标轴的矩形区域有P {(X , Y ) 则称

D }

D

D ,即D={(X,Y)|a

f (x , y ) dxdy ,

f(x,y)

=(X ,Y )的分布

为连续型随机向量;并称

密度或称为X 和Y 的联合分布密度。

分布密度f(x,y)(1)(2)

(2)二维随机变量的本质(3)联合分布函数

设(X ,Y )为二维随机变量,对于任意实数

F (x , y )

P {X

(X

x , Y

y )

(X

x

具有下面两个性质:

f(x,y)≥0; f (x , y ) dxdy

Y

y )

1.

x,y, 二元函数

x , Y

y }

称为二维随机向量(X ,Y )的分布函数,或称为随机变量数。

X 和Y 的联合分布函

分布函数是一个以全平面为其定义域,以事件{(

1

,

2

) |X (

1

) x , Y (

2

)

y }的概率为函数值的一个实值函

数。分布函数(1)0

F(x,y)具有以下的基本性质:

1;

F (x , y )

(2)F (x,y )分别对x 和y 是非减的,即

当x 2>x1时,有F (x 2,y )≥F(x1,y); 当y 2>y1时,有F(x,y2) ≥F(x,y1); (3)F (x,y )分别对x 和y 是右连续的,即

F (x , y )

F (x , y )

0, y ), F (x , y ) F (x ,

)

0, F (

F (x , y

,

) 0); 1.

(4)F (

, ) F (

(5)对于x 1F (x 2,y 2)

(4)离散型与连续型的关系

P (X

x ,Y

x 2,y 1F (x 2,y 1)

y )

P (x

y 2,

F (x 1,y 2)

X

x

F (x 1,y 1)

Y

y

0.

dy )

f (x ,y ) dxdy

dx ,y

(5)边缘分布

离散型X 的边缘分布为

P i

P (X

x i )

j

p ij (i , j 1, 2,

) ;

Y 的边缘分布为P

连续型

j

P (Y

y j )

i

p ij (i , j

1, 2,

) 。

X 的边缘分布密度为f

X

(x ) f (x , y ) dy ;

Y 的边缘分布密度为f Y (y )

(6)条件分布

P (Y

y

j

f (x , y ) dx .

离散型

i 的条件下,Y 取值的条件分布为在已知X=x

|X

x i )

p ij p i

在已知Y=yj 的条件下,X 取值的条件分布为P (X

连续型

x i |Y

y j )

p ij p

j

,

在已知Y=y的条件下,X 的条件分布密度为

f (x |y )

f (x , y ) f Y (y )

在已知X=x的条件下,Y 的条件分布密度为

f (y |x )

f (x , y ) f X (x )

(7)独立性

一般型离散型

F(X,Y)=FX (x)FY (y)

p ij

p i p

j

有零不独立

连续型

f(x,y)=f

X

(x)f

Y

(y)

直接判断,充要条件:①可分离变量

②正概率密度区间为矩形

二维正态分布

f (x , y )

2

1

2

211

222

1x

2

2(x

11

)(y

2

2

) y

11

2

2(1)

e ,

=0

随机变量的函数

若X 1,X 2, , X m ,X m+1, , X n 相互独立, h,g为连续函数,则:

n )相互独立。h (X 1,X 2, , X m )和g (X m+1, , X

特例:若X 与Y 独立,则:h (X )和g (Y )独立。例如:若X 与Y 独立,则:3X+1和5Y-2独立。

(8)二维均匀分布

设随机向量(X ,Y )的分布密度函数为

1S D

f (x , y )

0,

其他(x , y )

D

其中S D 为区域D 的面积,则称(X ,Y )服从D 上的均匀分布,记为(U (D )。

例如图3.1、图3.2和图3.3。

X ,Y )~

y

1

DO

图3.1

1

1

x

y

1

D 2

O

2 1

x

图3.2

y

d

D 3

c

O a b x

图3.3

(9)二维正态分布

设随机向量(X ,Y )的分布密度函数为

2

2

1

x

2

11

2(x

11

)(y

2

2

) y

2

2

f (x , y )

2

其中布,

,

1

2

11

2

2(1)

e ,

12, 1

0,

2

0, |

|1是5个参数,则称(X ,Y )服从二维正态分

记为(X ,Y )~N (

1

,

22,

1

,

22

, ).

由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即X ~N (

1

,

21

), Y ~N (,

21

22,

2

).

22,

2

但是若X ~N (

(10)函数分布

Z=X+Y

1

), Y ~N () ,(X,Y) 未必是二维正态分布。P (Z

z )

P (X

Y

z )

根据定义计算:

F Z (z )

对于连续型,f Z (z)=

f (x , z x ) dx

两个独立的正态分布的和仍为正态分布(

1

2,

2

122

)。

n 个相互独立的正态分布的线性组合,仍服从正态分布。

C i

i

i

2

i

C i

22i

Z=max,min(X 1,X 2,, X n )

X 1, X

2

X

n

相互独立,其分布函数分别为

F x n (x ) ,则Z=max,min(X1,X 2,, X n ) 的分布

F x 1(x ) ,F x 2(x )

函数为:

F max (x ) F min (x )

F x 1(x ) 1

[1

F x 2(x ) F x 1(x )]

[1F x n (x ) F x 2(x )]

[1

F x n (x )]

2

分布

设n 个随机变量X 1, X 2, 布,可以证明它们的平方和

, X

n

相互独立,且服从标准正态分

n

W

i 1

X

2i

的分布密度为

n

1

n

1

u

u n 2

2

e

2

u 0,

f (u )

20,

2

u

2

0.

2

我们称随机变量其中

W 服从自由度为n 的

分布,记为W ~(n ) ,

n 2

n

1

x

2

e

x

dx .

所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。

2

分布满足可加性:设

Y i

2

(n i ),

k

Z

i 1

Y i ~

2

(n 1n 2n k ).

t 分布设X ,Y 是两个相互独立的随机变量,且

X ~N (0, 1), Y ~

2

(n ),

可以证明函数

T

的概率密度为

n

f (t )

n

我们称随机变量

t 1

(n )

2

X Y /n

12n 2

1

t

2

n 12

(t ).

n

T 服从自由度为n 的t 分布,记为T ~t(n)。

t (n )

2

F 分布

设X ~

(n 1), Y ~(n 2) ,且X 与Y 独立,可以证明

F

X /n 1Y /n 2

的概率密度函数为

n 1

2

f (y )

n 12

我们称随机变量的F 分布,记为

F 1

(n 1, n 2)

n 2

n 1

n 22

n 2

n 12

n 1

1

n 1n 22

y

2

1

n 1n 2

y , y 0

0, y

F 服从第一个自由度为F ~f(n1, n2).

1F

(n 2, n 1)

n 1,第二个自由度为

n 2

第四章

(1)

随机变量的数字特征

离散型

连续型

一维随机变量的数字特征

期望

期望就是平均值

设X 是离散型随机变量,其分布律为

P(

X

x k ) =p k ,

设X 是连续型随机变量,其概率密度为f(x),E (X )

xf (x ) dx

k=1,2,, ,n ,

n

E (X )

k 1

x k p k

(要求绝对收敛)

(要求绝对收敛)

函数的期望

Y=g(X)

n

Y=g(X)

g (x k ) p k

k

1

E (Y )

E (Y ) g (x ) f (x ) dx

方差

D(X)=E[X-E(X)]标准差(X ) 矩

D (X ) ,

①对于正整数阶原点矩,记为

ν=E(X)=

k

k

2

D (X )

k

[x k E (X )]p k

2

D (X ) [x E (X )]

2

f (x ) dx

k ,称随机变量v k , 即x i p i ,

i

k

X ①对于正整数k ,称随机变量X 的

X 的k 阶原点

的k 次幂的数学期望为X 的k k 次幂的数学期望为矩,记为v k , 即ν=E(X)=

k

k

x f (x ) dx ,

k

k=1,2, , .

②对于正整数

k ,称随机变量

与E (X )差的k 次幂的数学期望为X 的k 阶中心矩,记为即

k

k=1,2, , .

k ,称随机变量X 与

X

X ②对于正整数

E (X )差的k 次幂的数学期望为,的k 阶中心矩,记为

E (X

E (X ))

k

k

,即

k

k

E (X E (X ))

k

.

.

=

i

(x i

E (X ))

k

=

p i

(x E (X ))

k

f (x ) dx ,

k=1,2, , .

k=1,2, , .

切比雪夫不等式设随机变量X 具有数学期望E (X )=μ,方差D (X )=σ,则对于

2

任意正数ε,有下列切比雪夫不等式

2

P (X )

2

切比雪夫不等式给出了在未知X 的分布的情况下,对概率

)

P (X

的一种估计,它在理论上有重要意义。

(2)期望的性质

(3)(4)

(3)方差的性质

(1)(2)(3)(4)(5) D(X

(4)常见分布的期望和方差

0-1分布B (1, p ) 二项分布B (n , p ) 泊松分布P ()

1p

nM N a 2b

(1)(2)

E(C)=C E(CX)=CE(X)

n

n

E(X+Y)=E(X)+E(Y),E (

i 1

C i X i )

i 1

C i E (X i )

E(XY)=E(X) E(Y),充分条件:X 和Y 独立;

充要条件:X 和Y 不相关。

D(C)=0;E(C)=C

D(aX)=aD(X); E(aX)=aE(X) D(aX+b)= aD(X); E(aX+b)=aE(X)+b D(X)=E(X)-E (X)

D(X±Y)=D(X)+D(Y),充分条件:X 和Y 独立;

充要条件:X 和Y 不相关。

±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))]而E(X+Y)=E(X)+E(Y),无条件成立。

期望

方差

p (1

p )

2

22

2

,无条件成立。

p np

np (1p )

几何分布G (p )

1p

2

p

超几何分布H (n , M , N )

nM N

1

M N

N N

n 1

均匀分布U (a , b )

(b a ) 12

1

2

2

指数分布e ()

1

正态分布N (

2

,

2

)

2

分布n 0

n

2n

n n

E (X )

xf

2(x ) dx

t 分布

(5)二维随机变量的数字特征

函数的期望

E (Y )

j 1

(n>2)

期望

E (X )

x i p i

i 1

X

n

y j p

j

E (Y )

yf Y (y ) dy

E [G (X , Y )]=

G (x i , y j ) p ij

i

j

E [G (X , Y )]=

G (x , y ) f (x , y ) dxdy

方差

D (X )

i

[x i

[x

j

E (X )]p i

E (Y )]

2

2

D (X ) [x E (X )]

2

f X (x ) dx

D (Y )

j

p

j

D (Y ) [y E (Y )]

2

f Y (y ) dy

协方差

对于随机变量X 与Y ,称它们的二阶混合中心矩

或cov(X , Y ) ,即

E (Y ))].

11

为X 与Y 的协方

差或相关矩,记为

E [(X

XY

XY 11

E (X ))(Y

与记号与

XY

相对应,X 与Y 的方差D (X )与D (Y )也可分别记为

XX

YY

相关系数对于随机变量X 与Y ,如果D (X )>0, D(Y)>0,则称

XY

D (X ) D (Y )

为X 与Y 的相关系数,记作

|

|≤1,当|

XY

(有时可简记为)。

aY

b )

1

|=1时,称X 与Y 完全相关:P (X

正相关,当负相关,当

1时(a 1时(a

0) ,0) ,

完全相关

而当0时,称X 与Y 不相关。

以下五个命题是等价的:①

XY

0;

②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y).

协方差矩阵

XX

XY

YX

YY

混合矩

对于随机变量X 与Y ,如果有E (X Y ) 存在,则称之为

;k+l阶混合中心矩记为:

E (X ))

k

k l

X 与Y 的

k+l阶混合原点矩,记为

u kl

E [(X

kl

(Y E (Y )) ].

l

(6)协方差的性质(7)独立和不相关

(i)(ii)(iii)(iv)(i )(ii )

cov (X, Y)=cov (Y, X); cov(aX,bY)=ab cov(X,Y); cov(X1+X2, Y)=cov(X

1

,Y)+cov(X2,Y);

cov(X,Y)=E(XY)-E(X)E(Y).

若随机变量X 与Y 相互独立,则若(X ,Y )~N (

1,

2,

21

XY

0;反之不真。),

,

22

,

则X 与Y 相互独立的充要条件是X 和Y 不相关。

第五章大数定律和中心极限定理

(1)大数定律

X

切比雪夫大数定律

设随机变量X 1,X 2,, 相互独立,均具有有限方差,且被同一

ε,有

常数C 所界:D (X i )

lim P

n

1n

i

n

X

1

1

i

n

n

E (X i )

i 1

1.

E (X I )=μ,

特殊情形:若则上式成为lim P

n

X 1,X 2,, 具有相同的数学期望

1n

i

n

X

1

i

1.

A 发生的次数,p 是事件A 在

ε,有

1.

伯努利大数定律

设μ是n 次独立试验中事件

每次试验中发生的概率,则对于任意的正数

lim P

n

p n

伯努利大数定律说明,当试验次数的频率与概率有较大判别的可能性很小,即

lim P

n

n 很大时,事件A 发生

p n

0.

这就以严格的数学形式描述了频率的稳定性。

辛钦大数定律

设X 1,X 2,, ,X n ,, 是相互独立同分布的随机变量序列,且(X n )=μ,则对于任意的正数lim P

n

E

ε有

1n

i

n

X

1

i

1.

X 1,X 2,, 相互独立,服从同一分布,且具有数

k

(2)中心极限定理

2

列维-林德伯格定理)

E (X

设随机变量同

k )

, D (X

2

0(k

n

1, 2,

和方差:

X N (,

)

) ,则随机变量

n

X

Y n

的分布函数F n (x ) 对任意的实数

n

k

1

k

n

n

x ,有

n

x

12

x

t

2

X

lim F n (x )

n

k

lim P

n

k 1

e

2

dt .

n

此定理也称为独立同分布的中心极限定理。

棣莫弗-拉普拉斯定理

设随机变量

X

n

为具有参数n, p(0

任意实数x, 有

lim P

n

X

n

np p )

x

12

x

t

2

e

2

dt .

np (1时,

k

n

k M

(3)二项定理

若当N

M N

p (n , k 不变) ,则

C M C N

C

n N

C n p (1

k k

p )

n k

(N ).

超几何分布的极限分布为二项分布。

(4)泊松定理

若当n

时, np

0,则

k

C p (1

k n

k

p )

n k

k !

e (n ).

其中k=0,1,2,, ,n ,, 。二项分布的极限分布为泊松分布。

第六章样本及抽样分布

(1)数理统计的基本概念

个体样本总体

在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。

总体中的每一个单元称为样品(或个体)我们把从总体中抽取的部分样品中所含的样品数称为样本容量,总是把样本看成是

x 1, x 2,

, x n 称为样本。样本

一般用n 表示。在一般情况下,

n 个相互独立的且与总体有相同分布的随机

变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,x 1, x 2,

, x n 表示n 个随机变量(样本);在具体的一次

, x n 表示n 个具体的数值(样本值)。我们

抽取之后,x 1, x 2, 称之为样本的两重性。

样本函数和统计量

设x 1, x 2,

, x n 为总体的一个样本,称

(x 1, x 2,

为样本函数,其中知参数,则称

, x n )

为一个连续函数。如果中不包含任何未

(x 1, x 2,

, x n )为一个统计量。

常见统计量及其性质

样本均值样本方差

x

1n

i

n

x i .

1

S

2

1n

1

i

n

(x i

1

x ) .

1n

1

i n

2

样本标准差样本k 阶原点矩

M

1

k

n

S

(x i

1

x ) .

2

n

x i , k

i 1

k

1, 2, .

样本k 阶中心矩

M

1

k

n

n

(x i

i 1

x ) , k

k

2, 3, .

2

E (X )

,D (X )

,n

2

E (S )

22

,E (S *)

n

n n X )

2

1

2

,

其中S *

(2)正态总体下的四大分布

正态分布

2

1n

i

(X

1

i

,为二阶中心矩。

设x 1, x 2, 本函数

def

, x n 为来自正态总体

N (,

2

) 的一个样本,则样

u

x /

n

~N (0, 1).

t 分布

设x 1, x 2, 本函数

, x n 为来自正态总体

N (,

2

) 的一个样本,则样

def

t

其中t(n-1)

表示自由度为

x s /

n

~t (n 1),

n-1的t 分布。

2

分布

设x 1, x 2, 本函数

, x n 为来自正态总体

N (,

2

) 的一个样本,则样

def

w

(n 1) S

2

2

~

2

(n 1),

其中

F 分布

2

(n 1) 表示自由度为n-1的

2

分布。

21

设x 1, x 2,

y 1, y 2,

, x n 为来自正态, y n 为来自正态总体

总体N (,

N (

,

22

) 的一个样本,而

) 的一个样本,则样本

函数

def

F

S 1/S 2/

2

22122

~F (n 11, n 2

1),

其中

S 1

2

1n 1

1

i

n 1

(x i

1

x ) ,

2

S 2

2

1n 2

1

n

2

(y i

i 1

y ) ;

2

F (n 1n 2

(3)正态总体下分布的性质

X 与S 独立。

2

1, n 2

1) 表示第一自由度为n 1

1,第二自由度为

1的F 分布。

第七章参数估计

(1)点估计

矩估计

设总体X 的分布中包含有未知数

F (x ;

,

,

,

1

,

2

, ,

m

,则其分布函数可以表成

k

12m

). 它的k 阶原点矩v k

E (X )(k 1, 2,

, m ) 中也

包含了未知参数

x 1, x 2,

1

,

2

, ,

m

,即v k

v k (

1

,

2

, ,

m

) 。又设

, x n 为总体X 的n 个样本值,其样本的

n

k 阶原点矩为

1n

i

x i

1

k

(k 1, 2, , m ).

这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有

v 1(

,

,

,

)

1n 1n

i i n

12m

x i ,

1

n

v 2(

1

,

2

, ,

m

) x i ,

1

2

v m (

1

,

2

, ,

m

)

1n

n

x i .

i 1

m

由上面的(

,

,

m 个方程中,解出的

,

m 个未知参数(

1

,

2

, ,

m

) 即为参数

12m

)的矩估计量。

为的矩估计,g (x ) 为连续函数,则

g (? ) 为g () 的矩估计。

极大似然估计

当总体f (x ;

1

X 为连续型随机变量时,设其分布密度为,

m

,

2

, ) ,其中

1

,

2

, ,

m

为未知参数。又设

x 1, x ,

2

, x n 为总体的一个样本,称

n

L (

1

,

2

, ,

m

)

i 1

f (x i ;

1

,

2

, ,

m

)

为样本的似然函数,简记为

当总体

P {X

x }

p (x ;

1

L n .

X 为离型随机变量时,设其分布律为,

2

, ,

m

) ,则称

n

L (x 1, x 2, , x n ;

1

,

2

, ,

m

)

i 1

p (x i ;

1

,

2

, ,

m

)

为样本的似然函数。

若似然函数到最大值,则称

L (x 1, x 2,

, x n ;

1

,

2

, ,

m

) 在

1

,

2

, ,

m

处取

1

,

2

, ,

m

分别为

1

,

2

, ,

m

的最大似然估计值,

相应的统计量称为最大似然估计量。

ln L n

i

i

i

0, i 1, 2, , m

为的极大似然估计,g (x ) 为单调函数,则

g (? ) 为g () 的极大

似然估计。

(2)估计量的评选标准

的无偏估计量。

2

无偏性

(x 1, x 2, , x n ) 为未知参数

的估计量。若E ()=,则称

E (X )=E(X ), E(S )=D(X )

有效性

1

1

(x 1, x , 2, , x n ) 和D (

)

22

(x 1, x , 2, ) ,则称

, x n ) 是未知参数

的两个无偏估计量。若

1

D (

2

1

2

有效。

一致性

n

是的一串估计量,如果对于任意的正数

lim P (|

n

n

,都有0,

|)

则称

n

为的一致估计量(或相合估计量)。

为的无偏估计,且

D (? )

0(n

), 则

为的一致估计。

只要总体的

(3)区间估计

置信区间和置信度

E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相

应总体的一致估计量。

设总体X 含有一个待估的未知参数发

(统

计)

。如果我们从样本量

x 1, x , 2,

, x n 出

11

(x 1, x , 2, , x n )

与以

22

(x 1, x , 2, , x n )

12

,使得区间

,即1

,

[

1

,

2

]

1(0

1) 的概率包含这个待估参数

P {

那么称区间[信水平)。

单正态总体的期望和方差的区间估计

设x 1, x , 2,

,

]为

12

}

12

的置信区间,1为该区间的置信度(或置

, x n 为总体X ~N (

2

,

2

) 的一个样本,在置信度为

1

下,我们来确定

的置信区间[

1

,

2

]。具体步骤如下:

(i )选择样本函数;(ii )由置信度1(iii

)导出置信区间

,查表找分位数;[

1

,

2

]。

已知方差,估计均值(i )选择样本函数

u (ii)

P

x

~N (0, 1). /

n

查表找分位数

x

1

/

n

.

(iii

x

)导出置信区间

, x

n n

未知方差,估计均值(i )选择样本函数

t

x S /

n ~t (n

1).

(ii)查表找分位数

x S /

n

1

.

P

(iii

x

)导出置信区间

S n , x

S n

方差的区间估计(i )选择样本函数w

(n

1) S

2

2

~

2

(n 1).

(ii )查表找分位数P (iii

(n

1

1) S

2

2

2

1.

)导出

n

2

的置信区间

S ,

n

1

11

S

第八章假设检验

基本思想假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。

为了检验一个假设

0是否成立。我们先假定0是成立的。如果根据这个假H H

定导致了一个不合理的事件发生,那就表明原来的假定相容的。与

H 0是不正确的,我们拒

0,我们称0是H H

绝接受H 0;如果由此没有导出不合理的现象,则不能拒绝接受

H 0相对的假设称为备择假设,用

{K

H 1表示。

R },其概率就是检验水平

这里所说的小概率事件就是事件

α,通

常我们取α=0.05,有时也取0.01或0.10。

基本步骤

假设检验的基本步骤如下:

(i)(ii)(iii)(iv)

提出零假设H 0;选择统计量K ;

对于检验水平α查表找分位数λ;由样本值x 1, x 2,

, x n 计算统计量之值

K ;

0,否则认为) 时否定H

0H

将K 与相容。

两类错误

进行比较,作出判断:当

|K |(或K

第一类错误

当H 0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定

H 0。这时,我们把客观上

H 0成立判为

H 0为不成立(即否定了真实的假设)

当假”的错误或第一类错误,

0为真}=P{否定H 0|H

,称这种错误为“以真为犯此类错误的概率,

此处的α恰好为检验水平。

第二类错误

当H 1为真时,而样本值却落入了相容域,按照我们规定的

0。这时,我们把客观上检验法则,应当接受H

H 0。不成立判

为H 0成立(即接受了不真实的假设)当真”的错误或第二类错误,记即

P{接受H 0|H 1为真}=

两类错误的关系

,称这种错误为“以假为犯此类错误的概率,

人们当然希望犯两类错误的概率同时都很小。容量n 一定时,变大。取定

变小,则

变大;相反地,

但是,当变小,则

要想使变小,则必须增加样本容量。

在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平

α。α大小的选取应根据实际情况而

、而不愿“以真当假”时,则

定。当我们宁可“以假为真”得大些。

应把α取得很小,如0.01,甚至0.001。反之,则应把α取

单正态总体均值和方差的假设检验

条件

H

2

零假设

:

统计量

对应样本函数分布

否定域

|u |u

00

1

2

已知

H

:

U

x

N (0,1)

u u 1

/n

u |t |

t

1

2

H

:

u 1(n

1)

H

2

:

未知

H

:

T

x S /

t (n 1) t

t 1t 1

2

(n 1)

n

t w

(n (n (n

2

H

:

1) 1) 或1)

H

2

:

22

2

w

21

未知

w

H

(n 1) S

20

2

2

(n 1)

w

21

:

220

(n

2

1)

H

:

220

w (n 1)


相关文章

  • 概率论与数理统计重要公式
  • 概率论与数理统计重要公式:假设检验 2016年考研数学复习,公式是首要掌握的基础和关键.下面凯程老师整理了概率论与数理统计部分的重要公式,希望考生收藏背诵,并在复习中灵活的掌握和运用,提升解题能力. 基本思想 假设检验的统计思想是,概率很小 ...查看


  • 0278 社会统计学
  • 湖北省高等教育自学考试大纲 课程名称:社会统计学 课程代码:0278 第一部分 课程性质与目标 一.课程性质与特点 <社会统计学>是湖北省高等教育自学考试社会工作与管理专业开设的一门专业课程, 侧重介绍调查资料的收集.整理.分析 ...查看


  • 统计学心得
  • 班级:市场营销(二)班 学号:09602223 姓名: 齐灵元 统计学实习心得 花几天时间,整体复习了一遍统计学,准确的来说是从第一页开始较为仔细的阅读了一遍<统计学>这本教科书.随后统计为我打开了另一扇窗,让我得以从不同的视角 ...查看


  • 考研数学概率公式整理 1
  • 概率公式整理 1.随机事件及其概率 P (A 1A 2 A n ) =P (A 1) P (A 2A 1) P (A n A 1A 2 A n -1) (P (A 1A 2 A n -1) >0) 全概率公式 A ⋃Ω=Ω 吸收律:A ...查看


  • 初中数学统计初步与概率初步
  • 统计初步与概率初步 平均数 平均数的概念 (1)平均数:一般地,如果有n 个数x 1, x 2, , x n , 那么,x 个数的平均数,x 读作"x 拔". (2)加权平均数:如果n 个数中,=1(x 1+x 2+ + ...查看


  • 数据的收集.整理与描述_知识点
  • 七年级下第十章 数据的收集.整理与描述 知识点 一.知识框架 做统计调查时,通常先采用问卷调查的方法:收集数据,为此要设计: 调查问卷, 为了更清楚地了解数据所蕴含的规律,经常用表格整理数据:为了更直观地看出表中的信息,还可以用统计图来: ...查看


  • 统计学原理复习重点概述
  • 统计学原理复习重点概述 本课程主要包括三部分知识.第一部分统计基础知识第一章和第二章数据收集部分.第二部分描述统计第二章统计数据整理部分(表格与图形法).第三章数据分布特征的描述(静态数据描述法)和动态数据描述法,即第六章时间数列分析和第八 ...查看


  • 假设检验在产品质量检验中的应用
  • <数理统计>课程设计 题目 指导教师 日期:2012-6-27 假设检验在产品质量检验中的应用 摘要:生产的目的是提供满足人们需要的产品,任何一种产品具有满足人们的目中需 要,才会被顾客接受,这种接受与满足的程度就是质量问题.随 ...查看


  • 体育统计学 1
  • 体育统计学复习资料 1.体育统计学是统计学的原理和方法在体育中的应用,是统计学的一个分支学科.体育统计学是一门收集.整理和分析体育中的统计数据的方法科学,其目的在于从量的侧面揭示体育现象的特征和规律性. 2.体育统计分析的过程: (1)根据 ...查看


热门内容