概率论与数理统计笔记

第一章 概率论的基本概念

1 随机试验

1. 对随机现象的观察、记录、试验统称为随机试验.

2. 随机试验E 的所有结果构成的集合称为E 的样本空间,记为

S ={e }, 称S 中的元素e 为基本事件或样本点.

3. 可以在相同的条件下进行相同的实验;每次实验的可能结果不止一个,并且能事先明确试验的所有可能结果;进行一次试验之前不能确定哪一个结果会实现.

2. 样本空间、随机事件

1. 对于随机试验,尽管在每次试验之前不能预知试验结果,但试验的所有可能结果组成的集合是已知的. 我们将随机试验E 的所有可能结果组成的集合称为E 的样本空间,记为S 样本空间的元素,即E 的每个结果称为样本点.

2. 一般我们称S 的子集A 为E 的随机事件A ,当且仅当A 所包含的一个样本点发生称事件A 发生. 如果将S 亦视作事件,则每次试验S 总是发生,故又称S 为必然事件。为方便起见,记φ为不可能事件,φ不包含任何样本点.

3. 若A ⊂B ,则称事件B 包含事件A ,这指的是事件A 发生必导致事件的发生。若A ⊂B 且B ⊂A ,即A =B ,则称事件A 与事件B 相等.

4. 和事件A B ={x x ∈A 或x ∈A }:A 与B 至少有一发生.

5. 当AB =φ时,称事件A 与B 不相容的,或互斥的. 这指事件A 与事件B 不能同时发生. 基本事件是两两互不相容的.

A =S A =S A 的逆事件记为,{, 若{, 则称A , B 互逆,互斥. =∅AB =∅

6. 当且仅当A , B 同时发生时,事件A B 发生. A B 也记作AB .

当且仅当A , B 同时发生时,事件A B 发生, A B 也记作AB .

7. 事件 A 的对立事件:设 A 表示事件 “A 出现”, 则“事件 A 不出现”称为事件 A 的对立事件或逆事件.

事件间的运算规律:设A , B , C 为事件, 则有

(1)交换律:A B =B A , AB =BA

(2)结合律:(A B ) C =A (B C ), (AB ) C =A (BC )

(3)分配律:(A B ) C =(A C ) (B C ) =AC BC

(4)de Morgan 律:A B =A B , A B =A B

3. 频率和概率

1. 记f n (A )=n n

其中n A -A 发生的次数(频数);n -总试验次数. 称f n (A ) 为A 在这n 次试验中发生的频率.

(A ) 反映了事件A 发生的频繁程度. 频率 f n

2. 频率的性质:

。 1 0≤f n (A ) ≤1

2。 f n (S ) =1

k k

3. 当重复试验次数n 逐渐增大时,频率 逐渐稳定f n (A ) 呈现出稳定性,

于某个常数. 这种“频率稳定性”即通常所说的统计规律性. 我们让试

f n (A ) 以它来表征事件A 发生可能性的大验重复大量次数,计算频率

f n (A ) 随n 的增大渐趋稳定,记稳定值为p . 小是合适的. f n (A ) 的稳定

值p 定义为A 的概率,记为P (A ) =p .

4. 概率定义:设E 是随机试验,S 是它的样本空间. 对于E 的每一个事件A 赋予一个实数,记为P (A ) ,称为事件A 的概率.

满足下列条件:

(1) 非负性:对于每一个事件A , 有P (A ) ≥0;

(2) 规范性:对于必然事件S , 有P (S ) =1;

(3) 可列可加性:设A 1, A 2, 是两两相互不相容的事件,即对于

i ≠j ,A i A j =φ,i , j =1,2 ,则有

P (A )=P (A 1)+P (A 2)+ ; 1 A 2

5. 概率定义推得的重要性质.

(1)P (φ) =0

(2)有限可加性 若A 1A 2A 3A n 是两两互不相容的事件 则有

P (A 1 A 2 A n )=P (A 1) +P (A 2)+ P (A n )

(3)对于任一事件P (A ) ≤1

(4)对于任一事件A 有 P (A ) =1-P (A )

(5) P (A B ) =P (A ) +P (B ) -P (AB )

4.等可能概型(古典概型)

1. 当试验的样本空间只含有有限个元素,并且试验中每个基本事件发生的可能性相同,具有这样特点的试验是大量存在的,则称这种试验为等可能概型. 它在概率论发展初期曾是主要的研究对象,所以也称为等可能概型.

2. P (A )=∑P e i j j =1k ({})k A 包含的基本事件数==即是等可能概型中n S 中基本事件的总数

事件A 的概率的计算公式.

5. 条件概率

P (AB ) 1. 条件概率定义:设A , B 是两个事件, 且P (A ) >0,称P (B A ) = P (A )

为在A 事件发生条件下B 事件发生的条件概率.

2. 符合条件概率的三个条件,即:

(1)非负性 对于每一事件B , 有 P (B A )≥0

(2)规范性 对于必然事件S ,有 P (S A )=1

(3)可列可加性 设B 1B 2 是两两互不相容的事件,则有⎛∞⎫∞

P B i A ⎪=∑P (B i A ) ⎝i =1⎭i =1

3. 乘法定理:设P (A )>0,则有 P (AB )=P (B A )P (A )

n ≥2,推广: 一般设 A 1A 2 A n 为n 个事件,且P (A A A 12 1n -)>0有

P (A 1A 2 A n ) =P (A n A 1A 2 A n -1) P (A n -1A 1A 2 A n -2) ⨯P (A 2A 1) P (A 1) .

4. 全概率公式:设试验E 的样本空间为S

,A 为E 的事件,

B 1, B 2,...., B n 为S 的一个划分,且P (B i ) >0(i =1,2,..., n ) ,则

P (A )=P (A B 1)P (B 1)+P (A B 2)P (B 2)+ +P (A B n )P (B n )

5. 贝叶斯公式:设试验E 的样本空间为S ,A 为E 的事件, B 1, B 2,...., B n 为S 的一个划分,且P (B i ) >0(i =1,2,..., n ) ,则

P (B i A )=P (A B i )P (B i )

∑P (A B )P (B )j j

j =1n

6. 独立性

1. 定义:设A , B 是两事件,如果满足等式P (AB ) =P (A ) P (B ) ,则称事件A , B 相互独立,简称A , B 独立.

若P (A ) >0, P (B ) >0, 则A , B 相互独立与A , B 互不相容不能同时成立.

2. 定理一:设A , B 是两事件,且P (A )>0,若A , B 相互独立,则P (B A )=P (B ). 反之亦然.

3. 定理二:若事件A 与B 相互独立则A 与B ,A 与B ,A 与B 也相互独立.

4. 推广定义:设A , B , C 是三个事件,如果满足等式P (AB ) =P (A ) P (B ) , P (BC ) =P (B ) P (C ) ,P (AC ) =P (A ) P (C ) , P (ABC ) =P (A ) P (B ) P (C ) 则称事件A , B , C 相互独立.

5. A , B 相互独立⇔, B 相互独立⇔A , ⇔, 当P (AB )=P (A )⋅P (B )时 P ()=P (A -AB )=P (A )-P (AB )=P (A )⎡⎣1-P (B )⎤⎦=P (A )P ()

第二章 随机变量及其分布

1. 随机变量

1. 定义:设随机试验的样本空间S ={e }, X =X {e }是定义在样本空间S 上的实值单值函数,称X =X {e }为随机变量.

常见的两类随机变量{离散型

连续型.

2. 本书中一般以大写字母如X , Y , Z , W ,... 表示随机变量,而以小写字母x , y , z , w ,... 表示实数.

2. 离散型随机变量及其分布律

1. 定义:有些随机变量,它全部可能取到的不相同的值是有限个或可列无限多个,这种随机变量称为离散型随机变量.

2. 定义:取值可数的随机变量为离散量.

一般地,设离散型随机变量X 所有可能取的值为x (k =1,2, ⋅⋅⋅⋅) k

x 取各个可能值的概率论,即事件的概率为P {X =x k }=p k , k =1,2, ⋅⋅⋅称为离散型随机变量X 的分布律。p k 满足如下两个条件:

(1)p k ≥0 (2)∑p k =1

k =1∞

3. (0-1)分布

设随机变量X 只可能取0与1两个值, 它的分布律是

P {X =k }=p k q 1-k , k =0, 1(0

(0-1)分布的分布律也可写成

4. 设试验只有两个可能结果:A 及, 则称E 为伯努利试验.设P (A ) =p (0

k k n -k P {X =k }=C n p q ,k =0,1,2, ,n

k k n -k C n p q 刚好是二项式(p +q ) n 的展开式中出现P k 的那一项,故称随机变量X 服从参数n , p 的二项分布,记为X ~B (n , p ) . 特别,当n =1时二项分布化为P {X =k }=p k q 1-k , k =0,1,这就是(0-1)分布.

5. 泊松分布

设随机变量X 所有可能取值为0,1,2„..而取各个值的概率为

P {X = k } = k = 0, 1, 2 , , 其中λ>0是常数, λk e -λ

k !

X 服从参数为 λ 的泊松分布, 记为 X ~ P ( λ ) . 则称

3. 随机变量的分布函数

1. 分布函数的定义

设X 是一个连续随机变量,称F (x ) =p (X ≤x )(-∞

由定义,对任意实数 x 1

2. 分布函数性质

(1)0≤F (x ) ≤1, x ∈(-∞, ∞)

(2)F (x 1) ≤F (x 2),(x 1

(3)F (-∞) =lim F (x ) =0, F (∞) =lim F (x ) =1x →-∞x →∞ (4)lim +=F (x 0),(-∞

即任一分布函数处处右连续.

3. 公式

(1)P {a

(2) P {X >a }=1-F (a ).

4. 连续型随机变量及其概率密度

1. 如果对于随机变量X 的分布函数F (x ),存在非负函数f (x ) ,使对任意实数x 有F (x )=⎰f (t )dt ,则称X 为连续型随机变量,其中-∞x

函数f (x ) 称为X 的概率密度函数简称概率密度。在实际应用中遇到的基本上是离散型或连续型随机变量.

2. 概率密度f (x ) 性质:

(1)f (x ) ≥0

(2)⎰f (x )dx =1 -∞∞

(3)对于任意实数x 1, x 2,(x 1≤x 2),

P {x 1

(4)若f (x ) 在点x 处连续则有 F '(x )=f (x )

3. 均匀分布:设连续型随机变量X 具有概率密度

⎧1, a

⎪⎩0, 其他

. X U (a , b ). 易知f (x ) ≥0, 且⎰f (x ) dx =1-∞∞

4指数分布:设连续型随机变量X 具有概率密度

⎧1-x /θ⎪e , x >0f (x )=⎨θ,其中θ>0为常数,则称X 服从参数为θ的指⎪⎩0, 其他

数分布. 易知f (x ) ≥0, 且⎰f (x ) dx =1. -∞∞

5 正态分布:设连续型随机变量X 具有概率密度f (

x )=2x -μ)(-2σ2, -∞

5. 随机变量的函数分布

定理:设随机变量X 具有概率密度f X (x ),-∞0(或恒有g ' (x )

第三章 多维随机变量及其分布

1. 二维随机变量

1. 设随机试验E 的样本空间为:S ={e }, X (e )、Y (e ) 为定义在S 上的随机变量,由它们构成一个随机向量 (X 、Y ) , 叫二维随机向量或二维随机变量.

2. 定义:设二维随机变量(X 、Y ) ,对任意实数x 、y , 二元函数

, 称为(X 、Y ) 的(联合) 概率分布函数. F (X , Y ) =P , Y ≤}y {X ≤x

二维随机变量分布函数的性质:

(1)即对任意固定的y ,当x 2>x 1F (x , y )是变量x 和y 的不减函数,时F (x 2, y )≥F (x 1, y ); 对于任意固定的x ,当y 2>y 1时F (x , y 2)≥F (x , y 1).

(2)0≤F (x , y )≤1,且对于任意固定的y ,F (-∞, y )=0,对于任意固定的x , F (x , -∞)=0, F (-∞, -∞)=0, F (∞, ∞)=1.

(3) F (x , y )=F (x +0, y ),即Fxy F (x , y )=F (x , y +0),(, )关于x 右连续,关于y 也右连续.

(4) 对于任意(x 1, y 1),(x 2, y 2),x 2>x 1,y 2>y 1,下述不等式成立: F (x 2, y 2)-F (x 2, y 1)+F (x 1, y 1)-F (x 1, y 2)≥0. 如果二维随机变量(X , Y ) 全部可能取到的不相同的值是有限对或可列无限多对,则称(X , Y ) 是离散型的随机变量.

3. 对于二维随机变量(X , Y )的分布函数F (x , y ). 如果存在非负的函数f (x , y )使对于任意(X 、Y ) 有F (x , y )=⎰y

-∞-∞⎰x f (μ, υ)d μd υ,

则称(X , Y )是连续型的二维随机变量,函数f (x , y )称为二维随机变量(X , Y )的概率密度,或称为随机变量X 和Y 的联合概率密度. 概率密度f (x , y )具有以下性质:

(1)f (x , y ) ≥0

(2) ⎰∞

-∞-∞⎰∞f (x , y ) dxdy =F (∞, ∞) =1

(3) 设G 是xOy 平面上的区域,点(X 、Y ) 落在G 内的概率为

P {(X , Y ) ∈G }=⎰⎰f (x , y ) dxdy

G

∂2F (x , y )

=f (x , y ) (4) 若f (x , y )在点(X 、Y ) 连续 则有

∂x ∂y

4. 两个常用的分布

(1)均匀分布:定义设D 为闭区域面积为A ,若随机变量(X 、Y ) 的(联合) 密度为: f (x

, y ) =⎨

⎧1/A

⎩0

(x , y ) ∈D 其它

则称: (X 、Y ) 服从D 上的均匀分布.

(2)二维正态分布:若二维随机变量 (X 、Y ) 的概率密度为: f (x , y ) =

⎪ exp ⎧

-∞

-1⎡(x -μ1) 2(x -μ1)(y -μ2) (y -μ2) 2⎤⎫⎪

-2ρ+⎨⎥⎬2⎢22

2(1-ρ) σσσσ⎪⎣1122⎦⎪⎩⎭

则称: (X 、Y ) 服从参数为μ1、μ2、σ1、σ2、ρ的二维正态分布. 其中σ1>0,σ2>0,|ρ|≤1是常数. 记为:(X 、Y ) ~N (μ1、μ2、σ12、σ22、ρ) .

2. 边缘分布

1. 二维随机变量(X , Y )作为一个整体,具有分布函数F (x , y ),而X 和Y 都是随机变量,也有也有分布函数,将他们分别记为F X (x ),

F Y (y ),依次称为二维随机变量(X , Y )关于X 和Y 的边缘分布函数。边缘分布函数可以由(X , Y )的分布函数F (x , y )所确定,事实上F X (x )=F (∞, x ) .

2. X 是一个连续型随机变量,则其概率密度f X (x )=⎰-∞f (x , y )dy 和

f Y (y )=⎰f (x , y )dx 分别称f X (x ),f Y (y )为(X , Y )关于X 和关于Y 的边

-∞∞

缘概率密度函数.

3. 离散型随机变量的边缘概率分布: ⎰-∞[⎰-∞f (x , y ) dy ]dx

x +∞

3. 条件分布

1. 定义:设(X , Y )使二维离散型随机变量,对于固定的j ,若有

P {Y =y j }>0,则称

P X =x i =y j =

{}

P {X =x i , Y =y j }P Y =y j =

p ij p ·j

, i =1,2, ,为在Y =y j 条件

下随机变量X 的条件分布律。同样,对于固定的i ,若P {X =x 则称P {Y =y j X =x i }=

i

}>0

P {X =x i , Y =y j }P X =x i =

p ij p i

, j =1,2, ,为在X =x i

条件下随机变量Y 的条件分布律.

2. 定义:设二维随机变量(X , Y )的概率密度为f (x , y ),(X , Y )关于

f (x , y )

Y 的边缘概率密度为f Y (y ). 对于固定的y ,f Y (y )>0, 则称

f Y y 为在Y =y 的条件下X 的条件概率密度,记为f X (x y )=称⎰f X (x y )dx =⎰

-∞x

x

f (x , y )

. f Y y -∞

f (x , y )

dx 为在Y =y 的条件下,X 的条件分布f Y y 函数,记为P {X ≤x Y =y }或F X (x y )即

F X (x y )=P {X ≤x Y =y }=⎰

x -∞

f (x , y )

, f Y y y f (x , y )f (x , y )

. 类似的,可以定义f Y X (y x )=和F Y X (y x )=⎰-∞f X x f X x 3. 离散型随机变量的条件分布

设(X,Y )是二维离散型随机变量,对于固定的j ,若P {Y =j }>0, 则称P {X =x i Y =y j }=

P {X =x i , Y =y j }P Y =y j =p ij p j

, i =1,2,... 为在Y =y j 条件下随机

变量X 的条件分布律.

4. 连续型随机变量的条件分布

给定y , 设对于任意固定的正数ε, P {y -ε0, 且

若对于任意实数x , 极限

lim +P {X ≤x y -ε

ε→0

ε→0

P {X ≤x , y -ε

写成P {X ≤x Y =y }或记为F X (X Y ) 。

f (x , y )

f Y X (y x ) =.

f X (x )

4. 相互独立的随机变量

1. 定义:设F (x , y ) , F x (x ) , F y (y ) 分别为二维随机变量(X , Y ) 的(联合) 分布函数和边缘分布函数,若对于所有x , y 有: F (x , y ) = 即:P {X ≤x , Y ≤y }=P {X ≤x } P {Y ≤y },则称X 与Y F x (x ) ·F y (y ) ,相互独立.

2. 定理 a. X , Y 相互独立 ⇔ f (x , y ) =f x (x ) f y (y )

b. 离散型随机变量X , Y 相互独立充要条件是对于任意x , y 有:

P {X =x , Y =y }=P {X =x } P {Y =y }.

5. 两个随机变量函数的分布

1. Z =X +Y 的分布

设(X , Y )的概率密度为f (x , y ),则Z =X +Y 分布函数为

F z (z )=P {Z ≤z }=

x +y ≤z

⎰⎰f (x , y )dxdy , 由概率密度的定义,即得到Z 的

∞-∞

概率密度为f z (z )=⎰写成f z (z )=⎰

f (z -y , y )dy , 由(X , Y )的对称性,f z (z )又可

-∞

. 特别,当X 和Y 相互独立是,设边缘概f (x , z -x )dx

率密度为f X (x ),f Y (y ),则上面两个公式可以化为

f z (z )=⎰f X (z -y )f Y (y )dy ,f z (z )=⎰f X (x )f Y (z -x )dx , 这两个公

-∞

-∞

式称为卷积公式,记为f X *f Y 即

f X *f Y =⎰f X (z -y )f Y (y )dy =⎰f X (x )f Y (z -x )dx

-∞

-∞

∞∞

更一般地,有限个相互独立得正态随机变量的线性组合仍然服从正态分布.

2. M =max (X , Y )及N =min (X , Y )的分布

设(X , Y )是两个相互独立的随机变量,他们的分布函数分别为

F x (x ) , F y (y ) ,现在来求M =max (X , Y )及N =min (X , Y )的分布函

数。P {M ≤z z 又由于X 和Y 相互独立,得到}=P {X ≤, z Y ≤}

M =max (X , Y ) 的分布函数为

F max (z )=P {M ≤z }=P {X ≤z , Y ≤z }=P {X ≤z }P {Y ≤z }

即有F max (z )=F X (z )F Y (z ) 类似的,可得到N =min (X , Y )的分布函数为

F min (z )=P {N ≤z }=1-P {N >z }=1-P {X >z , Y >z }=1-P {X >z }⋅P {Y >z } 即F min (z )=1-⎡⎣1-F X (z )⎤⎦⎡⎣1-F Y (z )⎤⎦.

第四章 随机变量的数字特征

1. 数学期望

k =1,2 1. 定义:设离散型随机变量X 的分布律为P {X =x k }=p k ,若级数∑x k p k 绝对收敛,则称级数∑x k p k 的和为随机变量X 的数

k =1

k =1

学期望,记为E (X ) =∑x k p k .

k =1

2. 设连续型随机变量X 的概率密度为f (x ) , 若积分⎰xf (x ) dx 的

-∞

值为随机变量X 的数学期望, 即E (X ) =⎰xf (x ) dx .

-∞

数学期望简称期望,又称均值.

3. 定理:设Y 是随机变量X 的函数: Y =g (X ) (g 是连续函数).

k =1,2 1) 若X 是离散型随机变量,它的分布律为P {X =x k }=p k ,若级数∑g (x k ) p k 绝对收敛,则有E (Y ) =E [g (X ) ]=∑g (x k ) p k .

k =1

k =1

2) 若X 是连续型随机变量,它的概率密度为f (x ) 若

-∞

g (x ) f (x ) dx 绝对收敛则有E (Y ) =E [g (X ) ]= ⎰g (x ) f (x ) dx .

-∞

4. 数学期望的重要性质:

(1) 设C 是常数,则有 E (C )=C

(2)设X 是一个随机变量,C 是常数,则有 E (CX )=CE (X ) (3) 设X , Y 是两个随机变量,则有 E (X +Y )=E (X )+E (Y ). 这一性质可以推广到任意有限个随机变量之和的情况.

(4) 设X , Y 是相互独立的随机变量,则有E (XY )=E (X )E (Y );

这一性质可以推广到任意有限个相互独立的随机变量之积的情况.

5. 几个重要随机变量的期望 (1)0-1分布的数学期望:E (X ) =p (2)二项分布b =(n , p ) :E (X ) =np

X ~P {X =k }=

(3) 泊松分布:

λk

k !

e -λ, k =0,1,2,...

E (X ) =∑k

k =0

λ

k

k !

e -λ=λe -λ∑

k =1

λ

k -1

(k -1)!

⎧1⎪

(4) 均匀分布X ~U (a , b ) . X ~f (x ) =⎨b -a ,a

⎪⎩0,其他

E (X )=⎰xf (x ) dx =⎰

-∞

x a +b =

a b -a 2

b

(5) 指数分布:E (X )=⎰xf (x ) dx =⎰x dx =-θe

θ

-∞

1

-

x

-

x

θ

θ

=θ 0

(6)正态分布N (μ, σ2) : E (X ) =μ

2. 方差

1. 定义:设X 是一个随机变量,若E ⎡⎣X -E (X )⎤⎦

E ⎡⎣X -E (X )⎤⎦

{

2

}存在,则称

{

2

}

为X 的方差,记为D (X )或Var (X )即

D (X )=Var (X )=E ⎡⎣X -E (X )⎤⎦ .在应用上引入

,记为

{

2

}

σ(X ) 称为标准差或均方差.

2. 离散型随机变量:D (X ) =∑[x k -E (X ) ]p k , 其中

k =1∞

2

P {X =x k }=p k , k =1 , . 2

连续型随机变量:D (X ) =⎰的概率密度.

-∞

[x k -E (X ) ]f (x ) dx 其中f (x ) 是X

2

2

随机变量X 的方差可按D (X )=E (X 2)-⎡⎣E (X )⎤⎦计算. 3. 方差的重要性质

(1)设C 是常数,则有D (X )=0

(2)设X 是一个随机变量,C 是常数,则有D (CX )=C 2D (X ) (3) 设X , Y 是两个随机变量,则有

D (X +Y )=D (X )+D (Y )+2E

{(X -E (X ))(Y -E (Y ))}

若X , Y 相互独立,则有 D (X +Y )=D (X )+D (Y )这一性质可以推广到任意有限个相互独立的随机变量之和的情况

(4) D (X )=0的充要条件是X 以概率1取常数C ,P {X =C }=1 4. 几个重要随机变量的方差

(1)X ~b (n , p ):D (X ) =np (1-p ) (2) 泊松分布: D (X ) =λ

(b -a ) 2(3) 均匀分布U (a , b ) : D (X ) =

12

(4) 指数分布: D (X ) =θ2 (5) 正态分布N (μ, σ2) : D (X ) =σ2

3. 协方差及相关系数

1 定义:E ⎡⎣X -E (X )⎤⎦⎡⎣Y -E (Y )⎤⎦称为随机变量X 与Y 的协方差,记为C o (v , )X , Y 即Cov (X , Y )=E ⎡⎣X -E (X )⎤⎦⎡⎣Y -E (Y )⎤⎦

{}

{}

ρXY =

Cov X , Y 称为随机变量X 与Y 的相关系数.

2. 协方差性质

1) Cov (X , Y ) =Cov (Y , X ) 2) Cov (X , Y ) =D (X ), Cov (X , c ) =0 3) Cov (aX , bY ) =abCov (X , Y ), a , b 是常数 4) Cov (X +Y , Z ) =Cov (X , Z ) +Cov (Y , Z ) 5) 若X , Y 相互独立,则Cov (X , Y ) =0 6) D (X ±Y , Z ) =D (X ) +D (Y ) +2Cov (X , Y ) 3. 定 理: (1)ρXY ≤1

(2)ρXY =1的充要条件是,存在常数a , b 使P {Y =a +bX }=1 (3)当ρXY =0时,称X 和Y 不相关

(4)当X 和Y 相互独立时由Cov (X , Y )=0,知ρXY =0即X,Y 不相关,反之,若X , Y 不相关,X , Y 却不一定相互独立.

4. 矩、协方差矩阵

1.定义:设X 和Y 是随机变量,若E (X k ) ,k =1,2 存在,称它为

k

⎤X 的k 阶矩。若E ⎡X -E (X ) 存在,称它为X 的k 阶⎣⎦, k =2,3

{}

l

中心矩。若 E (X k Y l ), k , l =1,2 存在,称它为X 和Y 的k +1阶混合

k , l =1,2 存在,矩. 若 E [X -E (X ) ][Y -E (Y ) ],称它为X 和Y 的

k +1阶混合中心矩.

{

k

}

2. 设n 维随机变量(X 1, X 2,... X n ) 的二阶混合中心距

⎤c ij =Cov (X i , X j ) =E ⎡⎣X i -E (X i )⎤⎦⎡⎣X j -E (X j )⎦, i , j =1,2,..., n 都存⎛a 11 a 1n ⎫

⎪为维随机变量在,则称矩阵 (X 1, X 2,... X n ) 的协方差矩 ⎪n

a a ⎪

nn ⎭⎝n 1阵.

3. n 维正态变量的性质:

1) n 维随机变量(X 1, X 2, , X n ) 的每一个分量X i , i =1, 2, , n 都是正态变量; 反之, 若X 1, X 2, , X n 都是正态变量, 且相互独立, 则(X 1, X 2, , X n ) 是n 维正态变量. 2) n 维随机变量(X 1, X 2, , X n ) 服从n 维正态分布的充要条件是X 1, X 2, , X n 的任意的线性组合l 1X 1+l 2X 2+ +l n X n 服从一维正态分布(其中l 1, l 2, , l n 不全为零).

{}

3) 若(X 1, X 2, , X n ) 服从n 维正态分布, 设Y 1, , Y k 是X j (j =1,2, , n ) 的线性函数, 则(Y 1, Y 2, , Y k ) 也服从多维正态分布.

4)设(X 1, , X n ) 服从n 维正态分布, 则“ X 1, X 2, , X n 相互独立” 与“ X 1, X 2, , X n 两两不相关” 是等价的.

第五章 大数定律和中心极限定理

1. 大数定律

1. 定理(契比雪夫不等式):设随机变量X 具有数学期望E(X)=μ, 方差D(X)=σ2.

σ2

则对于任意ε>0, 都有:P {X -E (X ) ≥ε}≤2

ε

σ2

定理的等价形式为:P {X -E (X )

ε

2. 定义:设随机变量序列X 1, X 2, X 3, , 若存在某常数μ,使得∀ε>0,

均有:lim P {X n -μ≥ε}=0, 则称随机变量序列{X n }依概率收敛于常数μ,

3. 定理(契比雪夫不等式的特殊情形):设随机变量序列X 1, X 2, , X n ,

2

相互独立,且具有相同的数学期望μ和相同的方差σ,作前n 个随机

X 则∀ε>0,变量的算术平均:Y =n k n ∑k =1

⎧n ⎫ 有:lim P {Y n -μ

⎩k =1⎭

4. 定理(贝努里大数定理)

设事件A 在每次试验中发生的概率为p ,记n A 为n 次独立重复试验

⎧n A ⎫

中A 发生的次数, 则∀ε>0, 有:lim P ⎨-p

n →+∞ ⎩⎭

n

2. 中心极限定理

1. 定理 (独立同分布的中心极限定理)

设随机变量X 1, X 2, , X n , 相互独立同分布,E (X i )=μ, D (

X i )=σ2, i =1,2,

则前n 个变量的和的标准化变量为:Y n =

∑X

n

i

-n μ

x ∈R , 有:

⎛n ⎫

X -n μ2∑i ⎪x - lim P (

Y ≤x )=lim P ≤x ⎪=⎰dt . n n →+∞n →+∞

⎪⎪

概率论与数理统计读书笔记

此定理表明,当n 充分大时,Y n 近似服从N (

0,1).

n

i =12即:X (近似)~N (n μ, n σ), ∑i

从而,P (a

2. 定理 (德莫佛--拉普拉斯定理) 设n A 为n 次贝努里试验中A 发生的次数,P (A )=p (0

⎛⎫b -t 2 则对任何区间[

a , b ],有:lim P a

n

21

第一章 概率论的基本概念

1 随机试验

1. 对随机现象的观察、记录、试验统称为随机试验.

2. 随机试验E 的所有结果构成的集合称为E 的样本空间,记为

S ={e }, 称S 中的元素e 为基本事件或样本点.

3. 可以在相同的条件下进行相同的实验;每次实验的可能结果不止一个,并且能事先明确试验的所有可能结果;进行一次试验之前不能确定哪一个结果会实现.

2. 样本空间、随机事件

1. 对于随机试验,尽管在每次试验之前不能预知试验结果,但试验的所有可能结果组成的集合是已知的. 我们将随机试验E 的所有可能结果组成的集合称为E 的样本空间,记为S 样本空间的元素,即E 的每个结果称为样本点.

2. 一般我们称S 的子集A 为E 的随机事件A ,当且仅当A 所包含的一个样本点发生称事件A 发生. 如果将S 亦视作事件,则每次试验S 总是发生,故又称S 为必然事件。为方便起见,记φ为不可能事件,φ不包含任何样本点.

3. 若A ⊂B ,则称事件B 包含事件A ,这指的是事件A 发生必导致事件的发生。若A ⊂B 且B ⊂A ,即A =B ,则称事件A 与事件B 相等.

4. 和事件A B ={x x ∈A 或x ∈A }:A 与B 至少有一发生.

5. 当AB =φ时,称事件A 与B 不相容的,或互斥的. 这指事件A 与事件B 不能同时发生. 基本事件是两两互不相容的.

A =S A =S A 的逆事件记为,{, 若{, 则称A , B 互逆,互斥. =∅AB =∅

6. 当且仅当A , B 同时发生时,事件A B 发生. A B 也记作AB .

当且仅当A , B 同时发生时,事件A B 发生, A B 也记作AB .

7. 事件 A 的对立事件:设 A 表示事件 “A 出现”, 则“事件 A 不出现”称为事件 A 的对立事件或逆事件.

事件间的运算规律:设A , B , C 为事件, 则有

(1)交换律:A B =B A , AB =BA

(2)结合律:(A B ) C =A (B C ), (AB ) C =A (BC )

(3)分配律:(A B ) C =(A C ) (B C ) =AC BC

(4)de Morgan 律:A B =A B , A B =A B

3. 频率和概率

1. 记f n (A )=n n

其中n A -A 发生的次数(频数);n -总试验次数. 称f n (A ) 为A 在这n 次试验中发生的频率.

(A ) 反映了事件A 发生的频繁程度. 频率 f n

2. 频率的性质:

。 1 0≤f n (A ) ≤1

2。 f n (S ) =1

k k

3. 当重复试验次数n 逐渐增大时,频率 逐渐稳定f n (A ) 呈现出稳定性,

于某个常数. 这种“频率稳定性”即通常所说的统计规律性. 我们让试

f n (A ) 以它来表征事件A 发生可能性的大验重复大量次数,计算频率

f n (A ) 随n 的增大渐趋稳定,记稳定值为p . 小是合适的. f n (A ) 的稳定

值p 定义为A 的概率,记为P (A ) =p .

4. 概率定义:设E 是随机试验,S 是它的样本空间. 对于E 的每一个事件A 赋予一个实数,记为P (A ) ,称为事件A 的概率.

满足下列条件:

(1) 非负性:对于每一个事件A , 有P (A ) ≥0;

(2) 规范性:对于必然事件S , 有P (S ) =1;

(3) 可列可加性:设A 1, A 2, 是两两相互不相容的事件,即对于

i ≠j ,A i A j =φ,i , j =1,2 ,则有

P (A )=P (A 1)+P (A 2)+ ; 1 A 2

5. 概率定义推得的重要性质.

(1)P (φ) =0

(2)有限可加性 若A 1A 2A 3A n 是两两互不相容的事件 则有

P (A 1 A 2 A n )=P (A 1) +P (A 2)+ P (A n )

(3)对于任一事件P (A ) ≤1

(4)对于任一事件A 有 P (A ) =1-P (A )

(5) P (A B ) =P (A ) +P (B ) -P (AB )

4.等可能概型(古典概型)

1. 当试验的样本空间只含有有限个元素,并且试验中每个基本事件发生的可能性相同,具有这样特点的试验是大量存在的,则称这种试验为等可能概型. 它在概率论发展初期曾是主要的研究对象,所以也称为等可能概型.

2. P (A )=∑P e i j j =1k ({})k A 包含的基本事件数==即是等可能概型中n S 中基本事件的总数

事件A 的概率的计算公式.

5. 条件概率

P (AB ) 1. 条件概率定义:设A , B 是两个事件, 且P (A ) >0,称P (B A ) = P (A )

为在A 事件发生条件下B 事件发生的条件概率.

2. 符合条件概率的三个条件,即:

(1)非负性 对于每一事件B , 有 P (B A )≥0

(2)规范性 对于必然事件S ,有 P (S A )=1

(3)可列可加性 设B 1B 2 是两两互不相容的事件,则有⎛∞⎫∞

P B i A ⎪=∑P (B i A ) ⎝i =1⎭i =1

3. 乘法定理:设P (A )>0,则有 P (AB )=P (B A )P (A )

n ≥2,推广: 一般设 A 1A 2 A n 为n 个事件,且P (A A A 12 1n -)>0有

P (A 1A 2 A n ) =P (A n A 1A 2 A n -1) P (A n -1A 1A 2 A n -2) ⨯P (A 2A 1) P (A 1) .

4. 全概率公式:设试验E 的样本空间为S

,A 为E 的事件,

B 1, B 2,...., B n 为S 的一个划分,且P (B i ) >0(i =1,2,..., n ) ,则

P (A )=P (A B 1)P (B 1)+P (A B 2)P (B 2)+ +P (A B n )P (B n )

5. 贝叶斯公式:设试验E 的样本空间为S ,A 为E 的事件, B 1, B 2,...., B n 为S 的一个划分,且P (B i ) >0(i =1,2,..., n ) ,则

P (B i A )=P (A B i )P (B i )

∑P (A B )P (B )j j

j =1n

6. 独立性

1. 定义:设A , B 是两事件,如果满足等式P (AB ) =P (A ) P (B ) ,则称事件A , B 相互独立,简称A , B 独立.

若P (A ) >0, P (B ) >0, 则A , B 相互独立与A , B 互不相容不能同时成立.

2. 定理一:设A , B 是两事件,且P (A )>0,若A , B 相互独立,则P (B A )=P (B ). 反之亦然.

3. 定理二:若事件A 与B 相互独立则A 与B ,A 与B ,A 与B 也相互独立.

4. 推广定义:设A , B , C 是三个事件,如果满足等式P (AB ) =P (A ) P (B ) , P (BC ) =P (B ) P (C ) ,P (AC ) =P (A ) P (C ) , P (ABC ) =P (A ) P (B ) P (C ) 则称事件A , B , C 相互独立.

5. A , B 相互独立⇔, B 相互独立⇔A , ⇔, 当P (AB )=P (A )⋅P (B )时 P ()=P (A -AB )=P (A )-P (AB )=P (A )⎡⎣1-P (B )⎤⎦=P (A )P ()

第二章 随机变量及其分布

1. 随机变量

1. 定义:设随机试验的样本空间S ={e }, X =X {e }是定义在样本空间S 上的实值单值函数,称X =X {e }为随机变量.

常见的两类随机变量{离散型

连续型.

2. 本书中一般以大写字母如X , Y , Z , W ,... 表示随机变量,而以小写字母x , y , z , w ,... 表示实数.

2. 离散型随机变量及其分布律

1. 定义:有些随机变量,它全部可能取到的不相同的值是有限个或可列无限多个,这种随机变量称为离散型随机变量.

2. 定义:取值可数的随机变量为离散量.

一般地,设离散型随机变量X 所有可能取的值为x (k =1,2, ⋅⋅⋅⋅) k

x 取各个可能值的概率论,即事件的概率为P {X =x k }=p k , k =1,2, ⋅⋅⋅称为离散型随机变量X 的分布律。p k 满足如下两个条件:

(1)p k ≥0 (2)∑p k =1

k =1∞

3. (0-1)分布

设随机变量X 只可能取0与1两个值, 它的分布律是

P {X =k }=p k q 1-k , k =0, 1(0

(0-1)分布的分布律也可写成

4. 设试验只有两个可能结果:A 及, 则称E 为伯努利试验.设P (A ) =p (0

k k n -k P {X =k }=C n p q ,k =0,1,2, ,n

k k n -k C n p q 刚好是二项式(p +q ) n 的展开式中出现P k 的那一项,故称随机变量X 服从参数n , p 的二项分布,记为X ~B (n , p ) . 特别,当n =1时二项分布化为P {X =k }=p k q 1-k , k =0,1,这就是(0-1)分布.

5. 泊松分布

设随机变量X 所有可能取值为0,1,2„..而取各个值的概率为

P {X = k } = k = 0, 1, 2 , , 其中λ>0是常数, λk e -λ

k !

X 服从参数为 λ 的泊松分布, 记为 X ~ P ( λ ) . 则称

3. 随机变量的分布函数

1. 分布函数的定义

设X 是一个连续随机变量,称F (x ) =p (X ≤x )(-∞

由定义,对任意实数 x 1

2. 分布函数性质

(1)0≤F (x ) ≤1, x ∈(-∞, ∞)

(2)F (x 1) ≤F (x 2),(x 1

(3)F (-∞) =lim F (x ) =0, F (∞) =lim F (x ) =1x →-∞x →∞ (4)lim +=F (x 0),(-∞

即任一分布函数处处右连续.

3. 公式

(1)P {a

(2) P {X >a }=1-F (a ).

4. 连续型随机变量及其概率密度

1. 如果对于随机变量X 的分布函数F (x ),存在非负函数f (x ) ,使对任意实数x 有F (x )=⎰f (t )dt ,则称X 为连续型随机变量,其中-∞x

函数f (x ) 称为X 的概率密度函数简称概率密度。在实际应用中遇到的基本上是离散型或连续型随机变量.

2. 概率密度f (x ) 性质:

(1)f (x ) ≥0

(2)⎰f (x )dx =1 -∞∞

(3)对于任意实数x 1, x 2,(x 1≤x 2),

P {x 1

(4)若f (x ) 在点x 处连续则有 F '(x )=f (x )

3. 均匀分布:设连续型随机变量X 具有概率密度

⎧1, a

⎪⎩0, 其他

. X U (a , b ). 易知f (x ) ≥0, 且⎰f (x ) dx =1-∞∞

4指数分布:设连续型随机变量X 具有概率密度

⎧1-x /θ⎪e , x >0f (x )=⎨θ,其中θ>0为常数,则称X 服从参数为θ的指⎪⎩0, 其他

数分布. 易知f (x ) ≥0, 且⎰f (x ) dx =1. -∞∞

5 正态分布:设连续型随机变量X 具有概率密度f (

x )=2x -μ)(-2σ2, -∞

5. 随机变量的函数分布

定理:设随机变量X 具有概率密度f X (x ),-∞0(或恒有g ' (x )

第三章 多维随机变量及其分布

1. 二维随机变量

1. 设随机试验E 的样本空间为:S ={e }, X (e )、Y (e ) 为定义在S 上的随机变量,由它们构成一个随机向量 (X 、Y ) , 叫二维随机向量或二维随机变量.

2. 定义:设二维随机变量(X 、Y ) ,对任意实数x 、y , 二元函数

, 称为(X 、Y ) 的(联合) 概率分布函数. F (X , Y ) =P , Y ≤}y {X ≤x

二维随机变量分布函数的性质:

(1)即对任意固定的y ,当x 2>x 1F (x , y )是变量x 和y 的不减函数,时F (x 2, y )≥F (x 1, y ); 对于任意固定的x ,当y 2>y 1时F (x , y 2)≥F (x , y 1).

(2)0≤F (x , y )≤1,且对于任意固定的y ,F (-∞, y )=0,对于任意固定的x , F (x , -∞)=0, F (-∞, -∞)=0, F (∞, ∞)=1.

(3) F (x , y )=F (x +0, y ),即Fxy F (x , y )=F (x , y +0),(, )关于x 右连续,关于y 也右连续.

(4) 对于任意(x 1, y 1),(x 2, y 2),x 2>x 1,y 2>y 1,下述不等式成立: F (x 2, y 2)-F (x 2, y 1)+F (x 1, y 1)-F (x 1, y 2)≥0. 如果二维随机变量(X , Y ) 全部可能取到的不相同的值是有限对或可列无限多对,则称(X , Y ) 是离散型的随机变量.

3. 对于二维随机变量(X , Y )的分布函数F (x , y ). 如果存在非负的函数f (x , y )使对于任意(X 、Y ) 有F (x , y )=⎰y

-∞-∞⎰x f (μ, υ)d μd υ,

则称(X , Y )是连续型的二维随机变量,函数f (x , y )称为二维随机变量(X , Y )的概率密度,或称为随机变量X 和Y 的联合概率密度. 概率密度f (x , y )具有以下性质:

(1)f (x , y ) ≥0

(2) ⎰∞

-∞-∞⎰∞f (x , y ) dxdy =F (∞, ∞) =1

(3) 设G 是xOy 平面上的区域,点(X 、Y ) 落在G 内的概率为

P {(X , Y ) ∈G }=⎰⎰f (x , y ) dxdy

G

∂2F (x , y )

=f (x , y ) (4) 若f (x , y )在点(X 、Y ) 连续 则有

∂x ∂y

4. 两个常用的分布

(1)均匀分布:定义设D 为闭区域面积为A ,若随机变量(X 、Y ) 的(联合) 密度为: f (x

, y ) =⎨

⎧1/A

⎩0

(x , y ) ∈D 其它

则称: (X 、Y ) 服从D 上的均匀分布.

(2)二维正态分布:若二维随机变量 (X 、Y ) 的概率密度为: f (x , y ) =

⎪ exp ⎧

-∞

-1⎡(x -μ1) 2(x -μ1)(y -μ2) (y -μ2) 2⎤⎫⎪

-2ρ+⎨⎥⎬2⎢22

2(1-ρ) σσσσ⎪⎣1122⎦⎪⎩⎭

则称: (X 、Y ) 服从参数为μ1、μ2、σ1、σ2、ρ的二维正态分布. 其中σ1>0,σ2>0,|ρ|≤1是常数. 记为:(X 、Y ) ~N (μ1、μ2、σ12、σ22、ρ) .

2. 边缘分布

1. 二维随机变量(X , Y )作为一个整体,具有分布函数F (x , y ),而X 和Y 都是随机变量,也有也有分布函数,将他们分别记为F X (x ),

F Y (y ),依次称为二维随机变量(X , Y )关于X 和Y 的边缘分布函数。边缘分布函数可以由(X , Y )的分布函数F (x , y )所确定,事实上F X (x )=F (∞, x ) .

2. X 是一个连续型随机变量,则其概率密度f X (x )=⎰-∞f (x , y )dy 和

f Y (y )=⎰f (x , y )dx 分别称f X (x ),f Y (y )为(X , Y )关于X 和关于Y 的边

-∞∞

缘概率密度函数.

3. 离散型随机变量的边缘概率分布: ⎰-∞[⎰-∞f (x , y ) dy ]dx

x +∞

3. 条件分布

1. 定义:设(X , Y )使二维离散型随机变量,对于固定的j ,若有

P {Y =y j }>0,则称

P X =x i =y j =

{}

P {X =x i , Y =y j }P Y =y j =

p ij p ·j

, i =1,2, ,为在Y =y j 条件

下随机变量X 的条件分布律。同样,对于固定的i ,若P {X =x 则称P {Y =y j X =x i }=

i

}>0

P {X =x i , Y =y j }P X =x i =

p ij p i

, j =1,2, ,为在X =x i

条件下随机变量Y 的条件分布律.

2. 定义:设二维随机变量(X , Y )的概率密度为f (x , y ),(X , Y )关于

f (x , y )

Y 的边缘概率密度为f Y (y ). 对于固定的y ,f Y (y )>0, 则称

f Y y 为在Y =y 的条件下X 的条件概率密度,记为f X (x y )=称⎰f X (x y )dx =⎰

-∞x

x

f (x , y )

. f Y y -∞

f (x , y )

dx 为在Y =y 的条件下,X 的条件分布f Y y 函数,记为P {X ≤x Y =y }或F X (x y )即

F X (x y )=P {X ≤x Y =y }=⎰

x -∞

f (x , y )

, f Y y y f (x , y )f (x , y )

. 类似的,可以定义f Y X (y x )=和F Y X (y x )=⎰-∞f X x f X x 3. 离散型随机变量的条件分布

设(X,Y )是二维离散型随机变量,对于固定的j ,若P {Y =j }>0, 则称P {X =x i Y =y j }=

P {X =x i , Y =y j }P Y =y j =p ij p j

, i =1,2,... 为在Y =y j 条件下随机

变量X 的条件分布律.

4. 连续型随机变量的条件分布

给定y , 设对于任意固定的正数ε, P {y -ε0, 且

若对于任意实数x , 极限

lim +P {X ≤x y -ε

ε→0

ε→0

P {X ≤x , y -ε

写成P {X ≤x Y =y }或记为F X (X Y ) 。

f (x , y )

f Y X (y x ) =.

f X (x )

4. 相互独立的随机变量

1. 定义:设F (x , y ) , F x (x ) , F y (y ) 分别为二维随机变量(X , Y ) 的(联合) 分布函数和边缘分布函数,若对于所有x , y 有: F (x , y ) = 即:P {X ≤x , Y ≤y }=P {X ≤x } P {Y ≤y },则称X 与Y F x (x ) ·F y (y ) ,相互独立.

2. 定理 a. X , Y 相互独立 ⇔ f (x , y ) =f x (x ) f y (y )

b. 离散型随机变量X , Y 相互独立充要条件是对于任意x , y 有:

P {X =x , Y =y }=P {X =x } P {Y =y }.

5. 两个随机变量函数的分布

1. Z =X +Y 的分布

设(X , Y )的概率密度为f (x , y ),则Z =X +Y 分布函数为

F z (z )=P {Z ≤z }=

x +y ≤z

⎰⎰f (x , y )dxdy , 由概率密度的定义,即得到Z 的

∞-∞

概率密度为f z (z )=⎰写成f z (z )=⎰

f (z -y , y )dy , 由(X , Y )的对称性,f z (z )又可

-∞

. 特别,当X 和Y 相互独立是,设边缘概f (x , z -x )dx

率密度为f X (x ),f Y (y ),则上面两个公式可以化为

f z (z )=⎰f X (z -y )f Y (y )dy ,f z (z )=⎰f X (x )f Y (z -x )dx , 这两个公

-∞

-∞

式称为卷积公式,记为f X *f Y 即

f X *f Y =⎰f X (z -y )f Y (y )dy =⎰f X (x )f Y (z -x )dx

-∞

-∞

∞∞

更一般地,有限个相互独立得正态随机变量的线性组合仍然服从正态分布.

2. M =max (X , Y )及N =min (X , Y )的分布

设(X , Y )是两个相互独立的随机变量,他们的分布函数分别为

F x (x ) , F y (y ) ,现在来求M =max (X , Y )及N =min (X , Y )的分布函

数。P {M ≤z z 又由于X 和Y 相互独立,得到}=P {X ≤, z Y ≤}

M =max (X , Y ) 的分布函数为

F max (z )=P {M ≤z }=P {X ≤z , Y ≤z }=P {X ≤z }P {Y ≤z }

即有F max (z )=F X (z )F Y (z ) 类似的,可得到N =min (X , Y )的分布函数为

F min (z )=P {N ≤z }=1-P {N >z }=1-P {X >z , Y >z }=1-P {X >z }⋅P {Y >z } 即F min (z )=1-⎡⎣1-F X (z )⎤⎦⎡⎣1-F Y (z )⎤⎦.

第四章 随机变量的数字特征

1. 数学期望

k =1,2 1. 定义:设离散型随机变量X 的分布律为P {X =x k }=p k ,若级数∑x k p k 绝对收敛,则称级数∑x k p k 的和为随机变量X 的数

k =1

k =1

学期望,记为E (X ) =∑x k p k .

k =1

2. 设连续型随机变量X 的概率密度为f (x ) , 若积分⎰xf (x ) dx 的

-∞

值为随机变量X 的数学期望, 即E (X ) =⎰xf (x ) dx .

-∞

数学期望简称期望,又称均值.

3. 定理:设Y 是随机变量X 的函数: Y =g (X ) (g 是连续函数).

k =1,2 1) 若X 是离散型随机变量,它的分布律为P {X =x k }=p k ,若级数∑g (x k ) p k 绝对收敛,则有E (Y ) =E [g (X ) ]=∑g (x k ) p k .

k =1

k =1

2) 若X 是连续型随机变量,它的概率密度为f (x ) 若

-∞

g (x ) f (x ) dx 绝对收敛则有E (Y ) =E [g (X ) ]= ⎰g (x ) f (x ) dx .

-∞

4. 数学期望的重要性质:

(1) 设C 是常数,则有 E (C )=C

(2)设X 是一个随机变量,C 是常数,则有 E (CX )=CE (X ) (3) 设X , Y 是两个随机变量,则有 E (X +Y )=E (X )+E (Y ). 这一性质可以推广到任意有限个随机变量之和的情况.

(4) 设X , Y 是相互独立的随机变量,则有E (XY )=E (X )E (Y );

这一性质可以推广到任意有限个相互独立的随机变量之积的情况.

5. 几个重要随机变量的期望 (1)0-1分布的数学期望:E (X ) =p (2)二项分布b =(n , p ) :E (X ) =np

X ~P {X =k }=

(3) 泊松分布:

λk

k !

e -λ, k =0,1,2,...

E (X ) =∑k

k =0

λ

k

k !

e -λ=λe -λ∑

k =1

λ

k -1

(k -1)!

⎧1⎪

(4) 均匀分布X ~U (a , b ) . X ~f (x ) =⎨b -a ,a

⎪⎩0,其他

E (X )=⎰xf (x ) dx =⎰

-∞

x a +b =

a b -a 2

b

(5) 指数分布:E (X )=⎰xf (x ) dx =⎰x dx =-θe

θ

-∞

1

-

x

-

x

θ

θ

=θ 0

(6)正态分布N (μ, σ2) : E (X ) =μ

2. 方差

1. 定义:设X 是一个随机变量,若E ⎡⎣X -E (X )⎤⎦

E ⎡⎣X -E (X )⎤⎦

{

2

}存在,则称

{

2

}

为X 的方差,记为D (X )或Var (X )即

D (X )=Var (X )=E ⎡⎣X -E (X )⎤⎦ .在应用上引入

,记为

{

2

}

σ(X ) 称为标准差或均方差.

2. 离散型随机变量:D (X ) =∑[x k -E (X ) ]p k , 其中

k =1∞

2

P {X =x k }=p k , k =1 , . 2

连续型随机变量:D (X ) =⎰的概率密度.

-∞

[x k -E (X ) ]f (x ) dx 其中f (x ) 是X

2

2

随机变量X 的方差可按D (X )=E (X 2)-⎡⎣E (X )⎤⎦计算. 3. 方差的重要性质

(1)设C 是常数,则有D (X )=0

(2)设X 是一个随机变量,C 是常数,则有D (CX )=C 2D (X ) (3) 设X , Y 是两个随机变量,则有

D (X +Y )=D (X )+D (Y )+2E

{(X -E (X ))(Y -E (Y ))}

若X , Y 相互独立,则有 D (X +Y )=D (X )+D (Y )这一性质可以推广到任意有限个相互独立的随机变量之和的情况

(4) D (X )=0的充要条件是X 以概率1取常数C ,P {X =C }=1 4. 几个重要随机变量的方差

(1)X ~b (n , p ):D (X ) =np (1-p ) (2) 泊松分布: D (X ) =λ

(b -a ) 2(3) 均匀分布U (a , b ) : D (X ) =

12

(4) 指数分布: D (X ) =θ2 (5) 正态分布N (μ, σ2) : D (X ) =σ2

3. 协方差及相关系数

1 定义:E ⎡⎣X -E (X )⎤⎦⎡⎣Y -E (Y )⎤⎦称为随机变量X 与Y 的协方差,记为C o (v , )X , Y 即Cov (X , Y )=E ⎡⎣X -E (X )⎤⎦⎡⎣Y -E (Y )⎤⎦

{}

{}

ρXY =

Cov X , Y 称为随机变量X 与Y 的相关系数.

2. 协方差性质

1) Cov (X , Y ) =Cov (Y , X ) 2) Cov (X , Y ) =D (X ), Cov (X , c ) =0 3) Cov (aX , bY ) =abCov (X , Y ), a , b 是常数 4) Cov (X +Y , Z ) =Cov (X , Z ) +Cov (Y , Z ) 5) 若X , Y 相互独立,则Cov (X , Y ) =0 6) D (X ±Y , Z ) =D (X ) +D (Y ) +2Cov (X , Y ) 3. 定 理: (1)ρXY ≤1

(2)ρXY =1的充要条件是,存在常数a , b 使P {Y =a +bX }=1 (3)当ρXY =0时,称X 和Y 不相关

(4)当X 和Y 相互独立时由Cov (X , Y )=0,知ρXY =0即X,Y 不相关,反之,若X , Y 不相关,X , Y 却不一定相互独立.

4. 矩、协方差矩阵

1.定义:设X 和Y 是随机变量,若E (X k ) ,k =1,2 存在,称它为

k

⎤X 的k 阶矩。若E ⎡X -E (X ) 存在,称它为X 的k 阶⎣⎦, k =2,3

{}

l

中心矩。若 E (X k Y l ), k , l =1,2 存在,称它为X 和Y 的k +1阶混合

k , l =1,2 存在,矩. 若 E [X -E (X ) ][Y -E (Y ) ],称它为X 和Y 的

k +1阶混合中心矩.

{

k

}

2. 设n 维随机变量(X 1, X 2,... X n ) 的二阶混合中心距

⎤c ij =Cov (X i , X j ) =E ⎡⎣X i -E (X i )⎤⎦⎡⎣X j -E (X j )⎦, i , j =1,2,..., n 都存⎛a 11 a 1n ⎫

⎪为维随机变量在,则称矩阵 (X 1, X 2,... X n ) 的协方差矩 ⎪n

a a ⎪

nn ⎭⎝n 1阵.

3. n 维正态变量的性质:

1) n 维随机变量(X 1, X 2, , X n ) 的每一个分量X i , i =1, 2, , n 都是正态变量; 反之, 若X 1, X 2, , X n 都是正态变量, 且相互独立, 则(X 1, X 2, , X n ) 是n 维正态变量. 2) n 维随机变量(X 1, X 2, , X n ) 服从n 维正态分布的充要条件是X 1, X 2, , X n 的任意的线性组合l 1X 1+l 2X 2+ +l n X n 服从一维正态分布(其中l 1, l 2, , l n 不全为零).

{}

3) 若(X 1, X 2, , X n ) 服从n 维正态分布, 设Y 1, , Y k 是X j (j =1,2, , n ) 的线性函数, 则(Y 1, Y 2, , Y k ) 也服从多维正态分布.

4)设(X 1, , X n ) 服从n 维正态分布, 则“ X 1, X 2, , X n 相互独立” 与“ X 1, X 2, , X n 两两不相关” 是等价的.

第五章 大数定律和中心极限定理

1. 大数定律

1. 定理(契比雪夫不等式):设随机变量X 具有数学期望E(X)=μ, 方差D(X)=σ2.

σ2

则对于任意ε>0, 都有:P {X -E (X ) ≥ε}≤2

ε

σ2

定理的等价形式为:P {X -E (X )

ε

2. 定义:设随机变量序列X 1, X 2, X 3, , 若存在某常数μ,使得∀ε>0,

均有:lim P {X n -μ≥ε}=0, 则称随机变量序列{X n }依概率收敛于常数μ,

3. 定理(契比雪夫不等式的特殊情形):设随机变量序列X 1, X 2, , X n ,

2

相互独立,且具有相同的数学期望μ和相同的方差σ,作前n 个随机

X 则∀ε>0,变量的算术平均:Y =n k n ∑k =1

⎧n ⎫ 有:lim P {Y n -μ

⎩k =1⎭

4. 定理(贝努里大数定理)

设事件A 在每次试验中发生的概率为p ,记n A 为n 次独立重复试验

⎧n A ⎫

中A 发生的次数, 则∀ε>0, 有:lim P ⎨-p

n →+∞ ⎩⎭

n

2. 中心极限定理

1. 定理 (独立同分布的中心极限定理)

设随机变量X 1, X 2, , X n , 相互独立同分布,E (X i )=μ, D (

X i )=σ2, i =1,2,

则前n 个变量的和的标准化变量为:Y n =

∑X

n

i

-n μ

x ∈R , 有:

⎛n ⎫

X -n μ2∑i ⎪x - lim P (

Y ≤x )=lim P ≤x ⎪=⎰dt . n n →+∞n →+∞

⎪⎪

概率论与数理统计读书笔记

此定理表明,当n 充分大时,Y n 近似服从N (

0,1).

n

i =12即:X (近似)~N (n μ, n σ), ∑i

从而,P (a

2. 定理 (德莫佛--拉普拉斯定理) 设n A 为n 次贝努里试验中A 发生的次数,P (A )=p (0

⎛⎫b -t 2 则对任何区间[

a , b ],有:lim P a

n

21


相关文章

  • 人民大学统计学经济社会统计学考研参考书
  • 2017年人民大学统计学经济社会统计学考研参考书 统计学:经济社会统计学 风险管理与精算学: <概率论>,李贤平,高等教育出版社 <数理统计基础>,陆璇,清华大学出版社 <概率论与数理统计>,茆诗松.周纪 ...查看


  • 考研计划书
  • 第一阶段(3月下半月-5月上半月)最晚不能晚到5月底:60天左右,期中 英语和数学是紧急重要的任务. 数学: 每天4-6个小时,有基础的可以不看教材,直接看二李的全书(每天4小时):没有基础的配合教材(每天2小时)看第一遍二李的全书(4小时 ...查看


  • 概率统计大纲
  • <概率论与数理统计>课程教学大纲 一.课程与任课教师基本信息 课程名称:概率论与数理统计 总学时/学分:54/3 46/8 授课时间:1-14周 任课教师姓名:余晋昌,张忠志,刘群锋,吕益群,刘学杰,简润强,葛浩,李伯忍,魏平 ...查看


  • 医学统计学笔记12
  • 医学统计学笔记 统计学:是收集.分析.解释与阐述数据资料的一门科学.通过收集.分类.分析来处理数据变化的科学与艺术,获得可信结果. 医学统计学:将概率论和数理统计的原理和方法应用于医疗卫生实践和医学科研,研究其数据的搜集.整理与分析的一门科 ...查看


  • 统计学笔记|数理统计知识点概要(5)
  • 假设检验收尾 分布拟合检验 单个分布的 拟合检验法 分布族的 拟合检验法 偏度,峰度检验法 假设检验问题的p值法 方差分析引入 单因素实验的方差分析(上) 基本概念 平方和的分解 小结 分布拟合检验 这又是另一个话题了,我们在之前做假设检验 ...查看


  • 医学统计学_总结_重点_笔记_复习资料
  • 第一章 2选1 总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合.可分为有限总体和无限总体.总体中的所有单位都能够标识者为有限总体,反之为无限总体. 总体population根据 ...查看


  • 浅析用马尔科夫链预测大学生电脑市场占有率
  • 浅析用马尔科夫链预测大学生电脑市场占有率 摘要: 本文通过对马尔可夫过程理论中用于分析随机过程方法的研究,提出了将转移概率矩阵法应用于企业产品的市场占有率分析当中,认为该理论的无后效性和稳定性特点能够帮助企业在纵向和横向资讯不够充分的情况下 ...查看


  • 葵花宝典之心理统计学笔记
  • 心理统计学葵花宝典 + 心得 参考文献:<现代心理与教育统计学><心理与行为科学统计>..<心理统计>(Richard P.Runyon).<心理统计学习指南> <心理学专业基础> ...查看


  • 考研学习计划
  • 英语计划 一.考研英语基本概况 英语(一) 考试内容 试题分三部分,共52题,包括英语知识运用.阅读理解和写作. 第一部分 英语知识运用 该部分不仅考查考生对不同语境中规范的语言要素(包括词汇.表达方式和结构)的掌握程度,而且还考查考生对语 ...查看


热门内容