卫生统计学重点

一、统计表的结构与注意事项

基本要求：简明扼要，重点突出，内容安排合理，主次分明，条理清楚，数据准确、可靠。

基本结构：一般由标题、标目、线条、数字、备注5个部分组成。

（1）标题：高度概括表的中心内容，列在表的上端中央；

（2）标目：有单位的标目要注明单位，横标目在表左侧，“主语”，纵标目在表上端，“谓语”；

（3）线条：三线格形式（顶线、底线及隔开纵标目与数字的横线），禁用斜线和竖线；

（4）数字：使用阿拉伯数字，位数对齐，小数点位数一致，不要留空项，

无数字用“—”表示，缺失数字用“”表示，数值为0者记为“0”；

（5）备注：不列入表内，用“*”标出，写在统计表下方。

二、二项分布

应用条件

（1）每次试验结果只能是两个互斥的结果之一，属于二项分类资料；

（2）每次试验中，某事件发生的概率不变，均为π；

（3）各次试验相互独立，即任何一个事件的是否出现不影响其他事件出现的概率。

特征——图形特征

以x为横坐标，P(x)为纵坐标，可绘出二项分布图形。二项分布的形状取决于π与n的大小。

高峰在u=nπ 处或附近；当π≈0.5时，分布是对称的；

当π≠0.5时，分布是偏的，且对于同一n，π离0.5越远，对称性越差。

对于同一π，随着π的增大，分布趋于对称。

当n足够大，只要π 或1-π不太小，[特别是当np且n(1-p)均大于5]，二项分布趋于对称。

三、Poisson分布

特征——图形

以X为横坐标，Poisson分布的概率P(X)为纵坐标，可绘出Poisson分布的图形。

Poisson分布的形状取决于λ的大小，λ值愈小分布愈偏，随着λ的增大，分布愈趋于对称，

当λ ＝20时，分布接近正态分布，当λ＝50时，可认为Poisson分布呈正态分布N(λ,λ)。

特征——均数与方差相等，λ=u=σ2，

特征——可加性

四、正态分布特征

（1）曲线在x轴的上方，与x轴不相交；

（2）曲线是单峰的,它关于直线x=μ对称；

（3）曲线在x=μ处达到峰值(最高点)，f(x)取最大值；

（4）正态分布的X取值范围理论上没有边界，X离μ越远，f(X)值越接近0，但不会等于0；

（5）正态分布有两个参数：均数μ是位置参数，决定正态曲线的中心位置，

σ是形状参数，决定正态曲线的陡峭或扁平程度，σ越大曲线越扁平，σ越小曲线越陡峭；

（6）正态分布曲线下的面积分布有一定的规律：X轴与正态曲线所夹面积恒等于1 ，对称区域面积相等。

五、t分布

性质

（1）t 分布曲线是一簇曲线。当自由度不同时，曲线的形状不同。

（2）当ν→∞时， t 分布趋近于标准正态分布；ν较小时， t 分布与标准正态分布差异较大。

（3）分布的高峰位置比u分布低，尾部高。

用途

总体均数的区间估计；⒉样本均数与总体均数的比较；两样本均数的比较。

适用条件

当样本含量较小时，要求样本取自正态分布总体；

做两样本均数比较时，还要求两总体方差相等。

六、假设检验的注意事项

（1）保证组间的可比性：严密的实验设计，样本从同质总体中随机抽取；

（2）根据研究目的、设计和资料类型选用恰当的检验方法；

（3）正确理解差别有无统计学意义和实际意义的区别；

（4）结论不能绝对化：当P接近检验水准时，下结论要慎重

（5）单侧和双侧检验

选用单侧检验的条件是在研究开始之前，表明不会出现0（或0）的情况。

若没有这方面的依据，一般选用双侧检验。

（6）u检验和t检验理论上要求样本来自正态分布总体，还要注意方差齐性。

七、t检验

：；。>σ方差分析

；。>σ方差分析

>σ方差分析

八、方差分析

基本思想

根据实验设计的类型及研究目的，将全部观察值之间所表现出来的总变异，分解为两个或多个部分。

除随机误差/实验误差作用外，其余每个部分的变异均可由某个因素的作用加以解释。

通过比较不同变异来源的均方(MS)，借助F分布做出统计推断，从而推断研究因素对试验结果有无影响。应用条件独立正态性方差齐性

各样本是相互独立的随机样本，且来自正态分布的总体；相互比较的各样本的总体方差相等，即具有方差齐性。优点不受比较组数的限制，可比较多组均数；可同时分析多个因素的作用；可分析因素间的交互作用。完全随机设计与随机区组设计的区别

完全随机设计

将全部试验对象按随机化的方法分配到各个处理组中；

各组样本含量可以相等也可以不等；

单因素方差分析，只有一个研究因素；

总变异分解为组间变异（处理间变异）和组内变异（误差）。

随机区组设计

将受试对象按性质相同或相近者组成区组，每个区组的对象随机分配到各个处理组中；

各处理组样本含量相等；

两因素方差分析，指主要的研究因素和区组因素；

总变异分解为处理间（因素）变异、区组间（配伍组）变异及误差三部分；

中

九、卡方检验的基本思想

在假设H0（两或多样本频率分布相等）成立的条件下，用两或多样本的联合计算的频率分布作为总体分布的近似，以此计算出各组别的理论频数，如果H0成立，当观察个数较大时，样本观察频数与理论频数应该相差不大， χ2值即表示观察值与理论值之间的偏离程度。根据χ2分布可确定在H0成立的情况下获得当前统计量的概率P。如果P值很小，说明H0成立可能性小，应拒绝H0，表示比较资料之间有显穿差异；

否则就不拒绝H0，尚不能认为校样所代表的实际情况和理论假如有差别。

十、直线相关与回归

区别：

（1）直线相关的两个变量都需服从正态分布，而直线回归中Y必须服从正态分布，X不一定；

（2）相关表示相互关系（双向），回归表示数量依存关系（单向）。

联系