一、统计表的结构与注意事项
基本要求:简明扼要,重点突出,内容安排合理,主次分明,条理清楚,数据准确、可靠。
基本结构 :一般由标题、标目、线条、数字、备注5个部分组成。
(1)标题:高度概括表的中心内容,列在表的上端中央;
(2)标目:有单位的标目要注明单位,横标目在表左侧,“主语”,纵标目在表上端,“谓语”;
(3)线条:三线格形式(顶线、底线及隔开纵标目与数字的横线),禁用斜线和竖线;
(4)数字:使用阿拉伯数字,位数对齐,小数点位数一致,不要留空项,
无数字用“—”表示,缺失数字用“”表示,数值为0者记为“0”;
(5)备注:不列入表内,用“*”标出,写在统计表下方。
二、二项分布
应用条件
(1)每次试验结果只能是两个互斥的结果之一,属于二项分类资料;
(2)每次试验中,某事件发生的概率不变,均为π;
(3)各次试验相互独立,即任何一个事件的是否出现不影响其他事件出现的概率。
特征——图形特征
以x为横坐标,P(x)为纵坐标,可绘出二项分布图形。二项分布的形状取决于π与n的大小。
高峰在u=nπ 处或附近;当π≈0.5时,分布是对称的;
当π≠0.5时,分布是偏的,且对于同一n,π离0.5越远,对称性越差。
对于同一π,随着π的增大,分布趋于对称。
当n足够大,只要π 或1-π不太小,[特别是当np且n(1-p)均大于5],二项分布趋于对称。
三、Poisson分布
特征——图形
以X为横坐标,Poisson分布的概率P(X)为纵坐标,可绘出Poisson分布的图形。
Poisson分布的形状取决于λ的大小,λ值愈小分布愈偏,随着λ的增大,分布愈趋于对称,
当λ =20时,分布接近正态分布,当λ=50时,可认为Poisson分布呈正态分布N(λ,λ)。
特征——均数与方差相等,λ=u=σ2,
特征——可加性
四、正态分布特征
(1)曲线在x轴的上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值(最高点),f(x)取最大值;
(4)正态分布的X取值范围理论上没有边界,X离μ越远,f(X)值越接近0,但不会等于0;
(5)正态分布有两个参数:均数μ是位置参数,决定正态曲线的中心位置,
σ是形状参数,决定正态曲线的陡峭或扁平程度,σ越大曲线越扁平,σ越小曲线越陡峭;
(6)正态分布曲线下的面积分布有一定的规律:X轴与正态曲线所夹面积恒等于1 ,对称区域面积相等。
五、t分布
性质
(1)t 分布曲线是一簇曲线。当自由度不同时,曲线的形状不同。
(2)当ν→∞时, t 分布趋近于标准正态分布;ν较小时, t 分布与标准正态分布差异较大。
(3)分布的高峰位置比u分布低,尾部高。
用途
总体均数的区间估计;⒉样本均数与总体均数的比较;两样本均数的比较。
适用条件
当样本含量较小时,要求样本取自正态分布总体;
做两样本均数比较时,还要求两总体方差相等。
六、假设检验的注意事项
(1)保证组间的可比性:严密的实验设计,样本从同质总体中随机抽取;
(2)根据研究目的、设计和资料类型选用恰当的检验方法;
(3)正确理解差别有无统计学意义和实际意义的区别;
(4)结论不能绝对化:当P接近检验水准时,下结论要慎重
(5)单侧和双侧检验
选用单侧检验的条件是在研究开始之前,表明不会出现0(或0)的情况。
若没有这方面的依据,一般选用双侧检验。
(6)u检验和t检验理论上要求样本来自正态分布总体,还要注意方差齐性。
七、t检验
:;。>σ方差分析
;。>σ方差分析
>σ方差分析
八、方差分析
基本思想
根据实验设计的类型及研究目的,将全部观察值之间所表现出来的总变异,分解为两个或多个部分。
除随机误差/实验误差作用外,其余每个部分的变异均可由某个因素的作用加以解释。
通过比较不同变异来源的均方(MS),借助F分布做出统计推断,从而推断研究因素对试验结果有无影响。 应用条件 独立 正态性 方差齐性
各样本是相互独立的随机样本,且来自正态分布的总体;相互比较的各样本的总体方差相等,即具有方差齐性。 优点 不受比较组数的限制,可比较多组均数;可同时分析多个因素的作用;可分析因素间的交互作用。 完全随机设计与随机区组设计的区别
完全随机设计
将全部试验对象按随机化的方法分配到各个处理组中;
各组样本含量可以相等也可以不等;
单因素方差分析,只有一个研究因素;
总变异分解为组间变异(处理间变异)和组内变异(误差)。
随机区组设计
将受试对象按性质相同或相近者组成区组,每个区组的对象随机分配到各个处理组中;
各处理组样本含量相等;
两因素方差分析,指主要的研究因素和区组因素;
总变异分解为处理间(因素)变异、区组间(配伍组)变异及误差三部分;
中
九、卡方检验的基本思想
在假设H0(两或多样本频率分布相等)成立的条件下,用两或多样本的联合计算的频率分布作为总体分布的近似, 以此计算出各组别的理论频数,如果H0成立,当观察个数较大时,样本观察频数与理论频数应该相差不大, χ2值即表示观察值与理论值之间的偏离程度。根据χ2分布可确定在H0成立的情况下获得当前统计量的概率P。 如果P值很小,说明H0成立可能性小,应拒绝H0,表示比较资料之间有显穿差异;
否则就不拒绝H0,尚不能认为校样所代表的实际情况和理论假如有差别。
十、直线相关与回归
区别:
(1)直线相关的两个变量都需服从正态分布,而直线回归中Y必须服从正态分布,X不一定;
(2)相关表示相互关系(双向),回归表示数量依存关系(单向)。
联系
一、统计表的结构与注意事项
基本要求:简明扼要,重点突出,内容安排合理,主次分明,条理清楚,数据准确、可靠。
基本结构 :一般由标题、标目、线条、数字、备注5个部分组成。
(1)标题:高度概括表的中心内容,列在表的上端中央;
(2)标目:有单位的标目要注明单位,横标目在表左侧,“主语”,纵标目在表上端,“谓语”;
(3)线条:三线格形式(顶线、底线及隔开纵标目与数字的横线),禁用斜线和竖线;
(4)数字:使用阿拉伯数字,位数对齐,小数点位数一致,不要留空项,
无数字用“—”表示,缺失数字用“”表示,数值为0者记为“0”;
(5)备注:不列入表内,用“*”标出,写在统计表下方。
二、二项分布
应用条件
(1)每次试验结果只能是两个互斥的结果之一,属于二项分类资料;
(2)每次试验中,某事件发生的概率不变,均为π;
(3)各次试验相互独立,即任何一个事件的是否出现不影响其他事件出现的概率。
特征——图形特征
以x为横坐标,P(x)为纵坐标,可绘出二项分布图形。二项分布的形状取决于π与n的大小。
高峰在u=nπ 处或附近;当π≈0.5时,分布是对称的;
当π≠0.5时,分布是偏的,且对于同一n,π离0.5越远,对称性越差。
对于同一π,随着π的增大,分布趋于对称。
当n足够大,只要π 或1-π不太小,[特别是当np且n(1-p)均大于5],二项分布趋于对称。
三、Poisson分布
特征——图形
以X为横坐标,Poisson分布的概率P(X)为纵坐标,可绘出Poisson分布的图形。
Poisson分布的形状取决于λ的大小,λ值愈小分布愈偏,随着λ的增大,分布愈趋于对称,
当λ =20时,分布接近正态分布,当λ=50时,可认为Poisson分布呈正态分布N(λ,λ)。
特征——均数与方差相等,λ=u=σ2,
特征——可加性
四、正态分布特征
(1)曲线在x轴的上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值(最高点),f(x)取最大值;
(4)正态分布的X取值范围理论上没有边界,X离μ越远,f(X)值越接近0,但不会等于0;
(5)正态分布有两个参数:均数μ是位置参数,决定正态曲线的中心位置,
σ是形状参数,决定正态曲线的陡峭或扁平程度,σ越大曲线越扁平,σ越小曲线越陡峭;
(6)正态分布曲线下的面积分布有一定的规律:X轴与正态曲线所夹面积恒等于1 ,对称区域面积相等。
五、t分布
性质
(1)t 分布曲线是一簇曲线。当自由度不同时,曲线的形状不同。
(2)当ν→∞时, t 分布趋近于标准正态分布;ν较小时, t 分布与标准正态分布差异较大。
(3)分布的高峰位置比u分布低,尾部高。
用途
总体均数的区间估计;⒉样本均数与总体均数的比较;两样本均数的比较。
适用条件
当样本含量较小时,要求样本取自正态分布总体;
做两样本均数比较时,还要求两总体方差相等。
六、假设检验的注意事项
(1)保证组间的可比性:严密的实验设计,样本从同质总体中随机抽取;
(2)根据研究目的、设计和资料类型选用恰当的检验方法;
(3)正确理解差别有无统计学意义和实际意义的区别;
(4)结论不能绝对化:当P接近检验水准时,下结论要慎重
(5)单侧和双侧检验
选用单侧检验的条件是在研究开始之前,表明不会出现0(或0)的情况。
若没有这方面的依据,一般选用双侧检验。
(6)u检验和t检验理论上要求样本来自正态分布总体,还要注意方差齐性。
七、t检验
:;。>σ方差分析
;。>σ方差分析
>σ方差分析
八、方差分析
基本思想
根据实验设计的类型及研究目的,将全部观察值之间所表现出来的总变异,分解为两个或多个部分。
除随机误差/实验误差作用外,其余每个部分的变异均可由某个因素的作用加以解释。
通过比较不同变异来源的均方(MS),借助F分布做出统计推断,从而推断研究因素对试验结果有无影响。 应用条件 独立 正态性 方差齐性
各样本是相互独立的随机样本,且来自正态分布的总体;相互比较的各样本的总体方差相等,即具有方差齐性。 优点 不受比较组数的限制,可比较多组均数;可同时分析多个因素的作用;可分析因素间的交互作用。 完全随机设计与随机区组设计的区别
完全随机设计
将全部试验对象按随机化的方法分配到各个处理组中;
各组样本含量可以相等也可以不等;
单因素方差分析,只有一个研究因素;
总变异分解为组间变异(处理间变异)和组内变异(误差)。
随机区组设计
将受试对象按性质相同或相近者组成区组,每个区组的对象随机分配到各个处理组中;
各处理组样本含量相等;
两因素方差分析,指主要的研究因素和区组因素;
总变异分解为处理间(因素)变异、区组间(配伍组)变异及误差三部分;
中
九、卡方检验的基本思想
在假设H0(两或多样本频率分布相等)成立的条件下,用两或多样本的联合计算的频率分布作为总体分布的近似, 以此计算出各组别的理论频数,如果H0成立,当观察个数较大时,样本观察频数与理论频数应该相差不大, χ2值即表示观察值与理论值之间的偏离程度。根据χ2分布可确定在H0成立的情况下获得当前统计量的概率P。 如果P值很小,说明H0成立可能性小,应拒绝H0,表示比较资料之间有显穿差异;
否则就不拒绝H0,尚不能认为校样所代表的实际情况和理论假如有差别。
十、直线相关与回归
区别:
(1)直线相关的两个变量都需服从正态分布,而直线回归中Y必须服从正态分布,X不一定;
(2)相关表示相互关系(双向),回归表示数量依存关系(单向)。
联系