概率与统计
知识点一:常见的概率类型与概率计算公式; 类型一:古典概型;
1、 古典概型的基本特点:
(1) 基本事件数有限多个;
(2) 每个基本事件之间互斥且等可能; 2、 概率计算公式:
A事件发生的概率P(A)
A事件所包含的基本事件数
;
总的基本事件数
类型二:几何概型;
1、 几何概型的基本特点:
(1) 基本事件数有无限多个;
(2) 每个基本事件之间互斥且等可能; 2、 概率计算公式:
A事件发生的概率P(A)
构成A事件的区域长度(或面积或体积或角度)
;
总的区域长度(或面积或体积或角度)
注意:
(1) 究竟是长度比还是面积比还是体积比,关键是看表达该概率问题需要几个变量,如
果需要一个变量,则应该是长度比或者角度比;若需要两个变量则应该是面积比;当然如果是必须要三个变量则必为体积比;
(2) 如果是用一个变量,到底是角度问题还是长度问题,关键是看谁是变化的主体,哪
一个是等可能的; 例如:等腰ABC中,角C=
2
,则: 3
(1) 若点M是线段AB上一点,求使得AMAC的概率; (2) 若射线CA绕着点C向射线CB旋转,且射线CA与线段AB始终相交且交点是M,求
使得AMAC的概率;
解析:第一问中明确M为AB上动点,即点M是在AB上均匀分布,所以这一问应该是长度
之比,所求概率:P1; 3而第二问中真正变化的主体是射线的转动,所以角度的变化是均匀的,所以这一问应该是角度之比的问题,所以所求的概率:P2=
755
=; 1208
知识点二:常见的概率计算性质; 类型一:事件间的关系与运算; A+B(和事件):表示A、B两个事件至少有一个发生; AB(积事件):表示A、B两个事件同时发生;
A(对立事件):表示事件A的对立事件;
类型二:复杂事件的概率计算公式; 1、 和事件的概率:
P(AB)=P(A)P(B)P(AB)
(1)特别的,若A与B为互斥事件,则:
P(AB)=P(A)P(B)
(2)对立事件的概率公式:
P(A)1P(A)
2、 积事件的概率:
(1)若事件A1、A2、、An相互独立,则:
P(A1A2An)P(A1)P(A2)P(An)
(2)n次独立重复的贝努利实验中,某事件A在每一次实验中发生的概率都为p,则在n次试验中事件A发生k次的概率:
kknk
P(A)knCnp(1p)
类型三:条件概率;
1、 条件概率的定义:我们把在事件A发生的条件下事件B发生的概率记为:P(B|A);
且P(B|A)
P(AB)
P(A)
2、 三个常见公式:
(1) 乘法公式:P(AB)P(A)P(B|A)
(2) 全概率公式:设A1,A2,A3,
n
,An是一组互斥的事件且Ak,则对于任何
k1
n
一个事件B都有:P(B)
P(A
k1
k
B)P(Ai)P(B|Ai)
k1
n
n
(3) 贝叶斯公式:设A1,A2,A3,
,An是一组互斥的事件且Ak
k1
则对于任何一个事件B都有:P(Aj|B)
P(Aj)P(B|Aj)
P(A)P(B|A)
i
i
k1
n
知识点三:求解一般概率问题的步骤;
第一步:确定事件的性质:等可能事件、互斥事件、相互独立事件、n次独立重复实验等; 第二步:确定事件的运算:和事件、积事件、条件概率等;
第三步:运用相应公式,算出结果;
知识点三:常见的统计学数字特征量及其计算; 特征量一:平均数(数学期望) 计算公式一:x
1
(x1x2x3n
n
i
i
xn);
计算公式二:Ex
xP(xx);
k1
计算公式三:(若随机变量x是连续型随机变量,且函数f(x)是它的密度函数)
Ex
xf(x)dx
特征量二:中位数
将所有的数从大到小排或者从小到大排,若共有奇数个数,则正中间的那个数叫做这一列数的中位数;若共有偶数个数,那么正中间那两个数的平均数叫做这一列数的中位数。
特征量三:众数
将所有数中出现次数最多且次数超过1次的数叫做这一列数的众数。一列数的众数可以有多个,也可以没有。
特征量四:方差
方差反映一组数或者一个统计变量的稳定程度,方差越小数值越稳定,方差越大则数值波动越大。
1n
计算公式一:Dx[(xkx)2];
nk1
1n
计算公式二:Dx[P(xxk)(xkEx)2];
nk1
计算公式三:DxEx2(Ex)2; 注:期望和方差的性质: 性质1:E(c)c;
性质2:E(axb)aExb; 性质3:E(x1x2
xn)Ex1Ex2Exn;
性质4:若x,y相互独立,则:E(xy)(Ex)(Ey); 性质5:D(x)E(xE(x))E(x)(E(x));
2
2
2
性质6:D(c)0;
性质7:D(axb)a2D(x);
性质8:若x,y为两个随机变量则:D(xy)D(x)D(y)2[(xE(x))(yE(y))]; 性质9:若x1,x2,
,xn是相互独立的随机变量,则: D(x1x2
xn)D(x1)D(x2)
D(xn);
知识点四:简单的统计学知识;
问题一:统计学中的简单的抽样方法; 方法一:简单随机抽样; 1、 基本原理:根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,
采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。 2、 具体做法:①随机数字法 ; ② 抽签法; 3、 优缺点分析:
优点:基本原理比较简单;
当总体容量不大时比较方便; 抽样误差的计算较方便;
缺点:对所有观察单位编号,当数量大时,有难度; 方法二:系统抽样;
1、 基本原理:先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号
观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本; 2、 优缺点分析:
优点:抽样方法简便,特别是容量比较大的时候;
易得到一个按比例分配的样本,抽样误差较小; 缺点:仍需对每个观察单位编号;
当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性;
方法三:分层抽样;
1、 基本原理:先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单
位,合起来组成样本。 2、 具体做法:
第一步:计算每一层个体数与总体容量的比值;
第二步:用样本容量分别乘以每一层的比值,得出每层应抽取的个体数; 第三步:用简单随机抽样的方法产生样本; 3、 优缺点分析:
优点:在一定程度上控制了抽样误差,尤其是最优分配法;
缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大; 总结:以上三种抽样方法的共同特征是每个个体被抽中的可能性相同;
知识点五:常用的几个统计学图表;
图表一:频率分布直方图与频率分布折线图; 1、 说明几个基本概念:
(1) 频数:符合某一条件的个体个数;
(2) 频率:频率=
频数
;(在必要情况下,可以近视的看作概率;所有组的频率之和总数
是1;)
2、 认识频率分布直方图:
(1) 横标是分组的情况;
(2) 纵标不是频率,而是频率/组距;小方框的面积才是频率;所有的面积和为1; 3、 画频率分布直方图:
第一步:求极差;
第二步:分组,确定组距; 第三步:列频率分布表; 第四步:作图; 4、 画频率分布折线图:
将频率分布直方图中每个方框的顶边的中点用直线连起来形成的折线图; 5、 利用频率分布直方图估计样本的统计学数字特征量:
(1) 中位数:取图中方框面积和达到
1
时的横坐标; 2
(2) 众数:取最高的那个方框的中点横坐标; (3) 平均数:E(x)
x
k1n
n
k
其中xk表示第k组的中点横坐标,P(xxk)P(xxk);
表示第k组的频率;
(4) 方差:D(x)
[x
k1
k
E(x)]2;
图表二:茎叶图;
定义:若数据为整数,一般用中间的数表示个位数以上的部分,两边的数表示个位数字;若数据是小数,一般用中间的数表示整数部分,两边的数表示小数部分形成的图表;
知识点六:变量间的相互关系与统计案例; 1、相关关系的分类:
从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关。 2、线性相关:
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线。 3.最小二乘法求回归方程:
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据: ^^^
(x1,y1),(x2,y2),„,(xn,yn),其回归方程为y=bx+a,
其中,b是回归方程的斜率,a是在y轴上的截距. 4.样本相关系数:
r=
(1)当r>0时,表明两个变量正相关;
,用它来衡量两个变量间的线性相关关系.
(2)当r<0时,表明两个变量负相关;
(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系. 6.独立性检验:
(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.
(2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
n(adbc) (其中n=a+b+c+d为样本容量),可利用独立性检验K
(ab)(ac)(cd)(bd)
2
判断表来判断“x与y的关系”.这种利用随机变量K来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 附表:
2
注意:
(1)K越大相关性越强,反之越弱;
(2)附表中P(K≥k)是两个统计学变量无关的概率;
知识点七:常见的概率分布及期望、方差; 类型一:离散型随机变量的概率分布; 1、 两点分布(贝努利分布或0、1分布):
2
2
(1) 特点:随机变量x只能取两个值0、1;分布列如下:
(2) 期望:E(x)q;
方差:D(x)qq2=pq;
2、 二项分布:
(1) 特点:在n次独立重复的贝努利实验中,每次实验中A事件发生的概率都是p;
每次试验只有两个结果A或A;随机变量x表示n次试验中A事件发生的次数; 即:P(xk)
C
k
knk
p(1p);则称随机变量x服从二项分布;记为: n
xB(n,p);
(2) 期望:E(x)np;(有两种不同的证明方法,这里就省略了。)
方差:D(x)np(1p)npq;
3、 几何分布:
(1) 特点:在独立重复的贝努利实验中,每次实验中A事件发生的概率都是p,不发
生的概率为(1p);随机变量x表示A事件首次出现时试验的次数;则称随机变量x服从几何分布,记为:x
(2) 期望:E(x)
G(p);
1
(k)1(p)(Pxp;
pk1,期望公式可以利用等比数列求和
和极限的思想证明。) 方差:D(x)
4、 超几何分布:
(1) 特点:一般的共有N个个体,A类个体有M个,从中任取n个,随机变量x表示
取到的A类个体的个数,则称x服从超几何分布,记为:x
knk
CMCNM
P(xk);(k0,1,2,3,n
CN
1pp;
H(n,M,N);
,min{M,n});
Mn
E(x)(2) 期望:N;
方差:D(x)
MnM(M1)n(n1)Mn2
(); NN(N1)N
(高中阶段我们只研究正态分布) 类型二:连续型随机变量的概率分布;正态分布:
1、 密度函数的概念:在频率分布折线图中,当样本容量取得足够大,组距取得足够小的时
候频率分布折线图会变成一条光滑的曲线,我们就把这样的曲线叫做连续性随机变量的密度曲线;把他的解析式叫做密度函数;
显然,如果连续型随机变量x的密度函数是f(x),则:
P(axb)f(x)dx;
aa
b
f(x)dx1;
P(xa)f(x)dx;P(xa)
a
f(x)dx;
2、正态分布的定义:如果连续型随机变量x的密度函数是:f(x)随机变量x服从正态分布,记为:x3、正态分布曲线的特点:
(1)整条曲线都在x轴的上方,即f(x)0对xR恒成立;
(x)22;则称
N(,2);
(2)x是他的对称轴,当x,时,函数f(x)单调递增;当x[,)时,函数f(x)单调递减;在x时取得最大值;
(3)正态分布曲线的两个主要参数,的几何学意义:
参数决定对称轴的位置,也决定整条曲线的位置,所以也称为位置参数;参数 决定数据的离散程度,也就决定了曲线的高矮胖瘦;具体规律是:越大,数据越离散,曲线越矮越胖;越小,数据越集中,曲线越高越瘦;于是我们习惯于把参数称为形
状参数;
4、 正态分布的期望与方差:若x
N(,2)
期望:E(x); 方差:D(x)2; 5、 正态分布的3原则:
(1)P(x)0.6826; (2)P(2x2)0.9544; (3)P(3x3)0.9974; 6、标准正态分布:若x7、正态分布x 若x
N(0,1),则称随机变量x服从标准正态分布;
N(,2)与标准正态分布之间的转化关系:
xu
N(,2),则
N(0,1);
概率与统计
知识点一:常见的概率类型与概率计算公式; 类型一:古典概型;
1、 古典概型的基本特点:
(1) 基本事件数有限多个;
(2) 每个基本事件之间互斥且等可能; 2、 概率计算公式:
A事件发生的概率P(A)
A事件所包含的基本事件数
;
总的基本事件数
类型二:几何概型;
1、 几何概型的基本特点:
(1) 基本事件数有无限多个;
(2) 每个基本事件之间互斥且等可能; 2、 概率计算公式:
A事件发生的概率P(A)
构成A事件的区域长度(或面积或体积或角度)
;
总的区域长度(或面积或体积或角度)
注意:
(1) 究竟是长度比还是面积比还是体积比,关键是看表达该概率问题需要几个变量,如
果需要一个变量,则应该是长度比或者角度比;若需要两个变量则应该是面积比;当然如果是必须要三个变量则必为体积比;
(2) 如果是用一个变量,到底是角度问题还是长度问题,关键是看谁是变化的主体,哪
一个是等可能的; 例如:等腰ABC中,角C=
2
,则: 3
(1) 若点M是线段AB上一点,求使得AMAC的概率; (2) 若射线CA绕着点C向射线CB旋转,且射线CA与线段AB始终相交且交点是M,求
使得AMAC的概率;
解析:第一问中明确M为AB上动点,即点M是在AB上均匀分布,所以这一问应该是长度
之比,所求概率:P1; 3而第二问中真正变化的主体是射线的转动,所以角度的变化是均匀的,所以这一问应该是角度之比的问题,所以所求的概率:P2=
755
=; 1208
知识点二:常见的概率计算性质; 类型一:事件间的关系与运算; A+B(和事件):表示A、B两个事件至少有一个发生; AB(积事件):表示A、B两个事件同时发生;
A(对立事件):表示事件A的对立事件;
类型二:复杂事件的概率计算公式; 1、 和事件的概率:
P(AB)=P(A)P(B)P(AB)
(1)特别的,若A与B为互斥事件,则:
P(AB)=P(A)P(B)
(2)对立事件的概率公式:
P(A)1P(A)
2、 积事件的概率:
(1)若事件A1、A2、、An相互独立,则:
P(A1A2An)P(A1)P(A2)P(An)
(2)n次独立重复的贝努利实验中,某事件A在每一次实验中发生的概率都为p,则在n次试验中事件A发生k次的概率:
kknk
P(A)knCnp(1p)
类型三:条件概率;
1、 条件概率的定义:我们把在事件A发生的条件下事件B发生的概率记为:P(B|A);
且P(B|A)
P(AB)
P(A)
2、 三个常见公式:
(1) 乘法公式:P(AB)P(A)P(B|A)
(2) 全概率公式:设A1,A2,A3,
n
,An是一组互斥的事件且Ak,则对于任何
k1
n
一个事件B都有:P(B)
P(A
k1
k
B)P(Ai)P(B|Ai)
k1
n
n
(3) 贝叶斯公式:设A1,A2,A3,
,An是一组互斥的事件且Ak
k1
则对于任何一个事件B都有:P(Aj|B)
P(Aj)P(B|Aj)
P(A)P(B|A)
i
i
k1
n
知识点三:求解一般概率问题的步骤;
第一步:确定事件的性质:等可能事件、互斥事件、相互独立事件、n次独立重复实验等; 第二步:确定事件的运算:和事件、积事件、条件概率等;
第三步:运用相应公式,算出结果;
知识点三:常见的统计学数字特征量及其计算; 特征量一:平均数(数学期望) 计算公式一:x
1
(x1x2x3n
n
i
i
xn);
计算公式二:Ex
xP(xx);
k1
计算公式三:(若随机变量x是连续型随机变量,且函数f(x)是它的密度函数)
Ex
xf(x)dx
特征量二:中位数
将所有的数从大到小排或者从小到大排,若共有奇数个数,则正中间的那个数叫做这一列数的中位数;若共有偶数个数,那么正中间那两个数的平均数叫做这一列数的中位数。
特征量三:众数
将所有数中出现次数最多且次数超过1次的数叫做这一列数的众数。一列数的众数可以有多个,也可以没有。
特征量四:方差
方差反映一组数或者一个统计变量的稳定程度,方差越小数值越稳定,方差越大则数值波动越大。
1n
计算公式一:Dx[(xkx)2];
nk1
1n
计算公式二:Dx[P(xxk)(xkEx)2];
nk1
计算公式三:DxEx2(Ex)2; 注:期望和方差的性质: 性质1:E(c)c;
性质2:E(axb)aExb; 性质3:E(x1x2
xn)Ex1Ex2Exn;
性质4:若x,y相互独立,则:E(xy)(Ex)(Ey); 性质5:D(x)E(xE(x))E(x)(E(x));
2
2
2
性质6:D(c)0;
性质7:D(axb)a2D(x);
性质8:若x,y为两个随机变量则:D(xy)D(x)D(y)2[(xE(x))(yE(y))]; 性质9:若x1,x2,
,xn是相互独立的随机变量,则: D(x1x2
xn)D(x1)D(x2)
D(xn);
知识点四:简单的统计学知识;
问题一:统计学中的简单的抽样方法; 方法一:简单随机抽样; 1、 基本原理:根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,
采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。 2、 具体做法:①随机数字法 ; ② 抽签法; 3、 优缺点分析:
优点:基本原理比较简单;
当总体容量不大时比较方便; 抽样误差的计算较方便;
缺点:对所有观察单位编号,当数量大时,有难度; 方法二:系统抽样;
1、 基本原理:先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号
观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本; 2、 优缺点分析:
优点:抽样方法简便,特别是容量比较大的时候;
易得到一个按比例分配的样本,抽样误差较小; 缺点:仍需对每个观察单位编号;
当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性;
方法三:分层抽样;
1、 基本原理:先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单
位,合起来组成样本。 2、 具体做法:
第一步:计算每一层个体数与总体容量的比值;
第二步:用样本容量分别乘以每一层的比值,得出每层应抽取的个体数; 第三步:用简单随机抽样的方法产生样本; 3、 优缺点分析:
优点:在一定程度上控制了抽样误差,尤其是最优分配法;
缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大; 总结:以上三种抽样方法的共同特征是每个个体被抽中的可能性相同;
知识点五:常用的几个统计学图表;
图表一:频率分布直方图与频率分布折线图; 1、 说明几个基本概念:
(1) 频数:符合某一条件的个体个数;
(2) 频率:频率=
频数
;(在必要情况下,可以近视的看作概率;所有组的频率之和总数
是1;)
2、 认识频率分布直方图:
(1) 横标是分组的情况;
(2) 纵标不是频率,而是频率/组距;小方框的面积才是频率;所有的面积和为1; 3、 画频率分布直方图:
第一步:求极差;
第二步:分组,确定组距; 第三步:列频率分布表; 第四步:作图; 4、 画频率分布折线图:
将频率分布直方图中每个方框的顶边的中点用直线连起来形成的折线图; 5、 利用频率分布直方图估计样本的统计学数字特征量:
(1) 中位数:取图中方框面积和达到
1
时的横坐标; 2
(2) 众数:取最高的那个方框的中点横坐标; (3) 平均数:E(x)
x
k1n
n
k
其中xk表示第k组的中点横坐标,P(xxk)P(xxk);
表示第k组的频率;
(4) 方差:D(x)
[x
k1
k
E(x)]2;
图表二:茎叶图;
定义:若数据为整数,一般用中间的数表示个位数以上的部分,两边的数表示个位数字;若数据是小数,一般用中间的数表示整数部分,两边的数表示小数部分形成的图表;
知识点六:变量间的相互关系与统计案例; 1、相关关系的分类:
从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关。 2、线性相关:
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线。 3.最小二乘法求回归方程:
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据: ^^^
(x1,y1),(x2,y2),„,(xn,yn),其回归方程为y=bx+a,
其中,b是回归方程的斜率,a是在y轴上的截距. 4.样本相关系数:
r=
(1)当r>0时,表明两个变量正相关;
,用它来衡量两个变量间的线性相关关系.
(2)当r<0时,表明两个变量负相关;
(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系. 6.独立性检验:
(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.
(2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
n(adbc) (其中n=a+b+c+d为样本容量),可利用独立性检验K
(ab)(ac)(cd)(bd)
2
判断表来判断“x与y的关系”.这种利用随机变量K来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 附表:
2
注意:
(1)K越大相关性越强,反之越弱;
(2)附表中P(K≥k)是两个统计学变量无关的概率;
知识点七:常见的概率分布及期望、方差; 类型一:离散型随机变量的概率分布; 1、 两点分布(贝努利分布或0、1分布):
2
2
(1) 特点:随机变量x只能取两个值0、1;分布列如下:
(2) 期望:E(x)q;
方差:D(x)qq2=pq;
2、 二项分布:
(1) 特点:在n次独立重复的贝努利实验中,每次实验中A事件发生的概率都是p;
每次试验只有两个结果A或A;随机变量x表示n次试验中A事件发生的次数; 即:P(xk)
C
k
knk
p(1p);则称随机变量x服从二项分布;记为: n
xB(n,p);
(2) 期望:E(x)np;(有两种不同的证明方法,这里就省略了。)
方差:D(x)np(1p)npq;
3、 几何分布:
(1) 特点:在独立重复的贝努利实验中,每次实验中A事件发生的概率都是p,不发
生的概率为(1p);随机变量x表示A事件首次出现时试验的次数;则称随机变量x服从几何分布,记为:x
(2) 期望:E(x)
G(p);
1
(k)1(p)(Pxp;
pk1,期望公式可以利用等比数列求和
和极限的思想证明。) 方差:D(x)
4、 超几何分布:
(1) 特点:一般的共有N个个体,A类个体有M个,从中任取n个,随机变量x表示
取到的A类个体的个数,则称x服从超几何分布,记为:x
knk
CMCNM
P(xk);(k0,1,2,3,n
CN
1pp;
H(n,M,N);
,min{M,n});
Mn
E(x)(2) 期望:N;
方差:D(x)
MnM(M1)n(n1)Mn2
(); NN(N1)N
(高中阶段我们只研究正态分布) 类型二:连续型随机变量的概率分布;正态分布:
1、 密度函数的概念:在频率分布折线图中,当样本容量取得足够大,组距取得足够小的时
候频率分布折线图会变成一条光滑的曲线,我们就把这样的曲线叫做连续性随机变量的密度曲线;把他的解析式叫做密度函数;
显然,如果连续型随机变量x的密度函数是f(x),则:
P(axb)f(x)dx;
aa
b
f(x)dx1;
P(xa)f(x)dx;P(xa)
a
f(x)dx;
2、正态分布的定义:如果连续型随机变量x的密度函数是:f(x)随机变量x服从正态分布,记为:x3、正态分布曲线的特点:
(1)整条曲线都在x轴的上方,即f(x)0对xR恒成立;
(x)22;则称
N(,2);
(2)x是他的对称轴,当x,时,函数f(x)单调递增;当x[,)时,函数f(x)单调递减;在x时取得最大值;
(3)正态分布曲线的两个主要参数,的几何学意义:
参数决定对称轴的位置,也决定整条曲线的位置,所以也称为位置参数;参数 决定数据的离散程度,也就决定了曲线的高矮胖瘦;具体规律是:越大,数据越离散,曲线越矮越胖;越小,数据越集中,曲线越高越瘦;于是我们习惯于把参数称为形
状参数;
4、 正态分布的期望与方差:若x
N(,2)
期望:E(x); 方差:D(x)2; 5、 正态分布的3原则:
(1)P(x)0.6826; (2)P(2x2)0.9544; (3)P(3x3)0.9974; 6、标准正态分布:若x7、正态分布x 若x
N(0,1),则称随机变量x服从标准正态分布;
N(,2)与标准正态分布之间的转化关系:
xu
N(,2),则
N(0,1);