生物统计上机操作第四讲 卡方检验 二项分布检验

研究生《生物统计学》课程 上机内容

第四讲:独立性检验与二项分布检验

独立性检验(χ2 检验)与二项分布检验:是针对离散型数据的检验,在生物科学研究中,除了分析计量资料外,还常常需要对质量性状和质量反应的次数资料进行分析,其变异情况只能用分类计数的方法加以表示,属于计数资料。

本次主要练习:

⑴ 卡方检验(独立性检验):[Analyze]=>[Decriptive Statistics](描述性统计)=>[Crosstabs](交叉列联表过程)

⑵ 二项分布检验:[Analyze]=>[Nonparametric Tests] (非参数检验)=>[Binominal](二项分布)

一、独立性检验

(一)2×2列联表独立性检验

案例:下表给出不同给药方式与给药效果, 问口服与注射两种给药方式的效果差异是否显著?

SPSS 操作:

(1) 建立数据文件:在Variable View 中定义三个变量(方式、效果、计数),其中“方式”、

“效果”的变量类型定义为字符串(string )型,“计数”定义为数值(Numeric )型;在Data View中输入数据;

(2) 用Weight Cases 对频数变量“计数”进行加权: [Data]=>[Weight Cases],弹出对话框,

选中“Weight cases by”,将“计数”导入“Frequency Variable”框中,

(3) 卡方分析:

1) [Analyze]=>[Decriptive Statistics] =>[Crosstabs],弹出对话框,将“方式”

导入[Row(s)]中,将“效果”导入[Column(s)]中;

2) 点击[Statistics],弹出对话框,选中[Chi-square](卡方检验),continue 返

回;

3) 点击[Cells],弹出对话框,选中Counts 下的[Expected](显示理论值),continue

返回;

4) OK ,运行结果输出到output 窗口。

(4) 结果分析:在output 中输出三个表

1)

2) Case Processing Summary:检查数据缺失情况; Crosstabulation :列联表,显示观测值(及理论值、比例、观测值与理论值的差

值等)

3) Chi-Square Test:卡方检验结果:

Pearson Chi-Square:常用卡方检验计算的卡方值(样本数n ≥40且所有理论数T ≥5) Continuity Correction:连续性矫正卡方值(df=1或n ≥40但有5>T≥1 )

Likelihood Ratio:对数似然比法计算的卡方值(类似Pearson Chi-Square)

Fisher ’s Exact Test:确切概率法计算的卡方值(n

(二)r×c 列联表独立性检验

案例:用A 、B 、C 三种方法治疗仔猪白痢病,试验结果如下表,试检验不同的治疗方法是否与治疗效果有关。

SPSS 操作:

(1) 建立数据文件:在Variable View 中定义三个变量(治疗方法、治疗效果、计数),均

定义为数值(Numeric )型。对“治疗方法”的value 进行定义(“1”为“A ”、“2”为“B ”、“3”为“C ”)、对“治疗效果”的value 进行定义(“1”为“治愈”、“2”为“好转”、“3”为“死亡”),将三个变量的小数位数设为0;在Data View 中输入数据;

(注:也可象上例一样,将“治疗方法”和“治疗效果”设为string 型,在data view 中直接输入字符串。)

(2) 用Weight Cases 对频数变量“计数”进行加权: [Data]=>[Weight Cases],弹出对话框,

选中“Weight cases by”,将“计数”导入“Frequency Variable”框中,

(3) 卡方分析:

1) [Analyze]=>[Decriptive Statistics](描述性统计)=>[Crosstabs],弹出对话

框,将“治疗方法”导入[Row(s)]中,将“治疗效果”导入[Column(s)]中;

2) 点击[Statistics],弹出对话框,选中[Chi-square](卡方检验),continue 返

回;

3) 点击[Cells],弹出对话框,选中Counts 下的[Expected](显示理论值),continue

返回;

4) OK ,运行结果输出到output 窗口。

(4) 结果分析:在output 中输出三个表

1)

2) Case Processing Summary:检查数据缺失情况; Crosstabulation :列联表,显示观测值(及理论值、比例、观测值与理论值的差

值等)

3) Chi-Square Test:卡方检验,因为df=(r-1)(c-1)=4≠1,所以在表中不再出

现Continuity Correction(连续性矫正卡方值)

自行练习:

1、某校对学生的课外活动内容进行调查,结果整理成下表

二、二项分布检验:用于对给定样本数据检验其总体是否服从概率为指定数值的二项分布。

[Analyze]=>[Nonparametric Tests] (非参数检验)=>[Binominal](二项分布)

数据存放有两种方式:

一种是定义一个变量存放所有的样本值,重复的样本值作为不同的个案包论,如下面的

案例“二项分布检验 硬币.sav ”;

另一种是定义两个变量,一个存放不同的样本值,另一个存放该样本值的相应频数,但

这是应将频数变量指定为加权变量,如下面的案例“二项分布检验 蜜蜂.sav ”

1、案例:某人做抛掷硬币实验,检验硬币正面出现的概率是否为1/2。抛掷60次,出现正面记为1,出现反面记为0,记录结果如下表,检验硬币正反面出现的次数是否服从于概率为0.5的二项分布?

(数据文件:二项分布检验 硬币.sav )

SPSS 操作:

(1) 建立数据文件,定义变量“硬币结果”;

(2) [Analyze]=>[Nonparametric Tests] =>[Binominal],弹出“Binomial Test”对话框,将变

量“硬币结果”移至“Test Variables List”(检验变量列表) ;在“Test Proportion”(检验比例)文本框中输入“0.5”(默认为0.5,输入范围0.001~0.999);

(3) 单击[Option],在弹出对话框中选择“Descriptive ”,Continue 返回;

(4) OK ,结果输出到Output 。

(5) 结果分析:输出两个表:

1)

2) Descriptive Statistics:二项分布检验的描述性统计量 Binomial Test:二项分布检验的结果,Group1表示“正面”,Group2表示“反面”,

最后一列为计算得到的概率(双尾检验)

案例:蜜蜂某种病用一般疗法治愈率为75%,现尝试采用一种新疗法治疗,试验结果为治疗30只,治愈27只,试检验新疗法是否提高了疗效。(数据文件:二项分布检验 蜜蜂.sav )

SPSS 操作:

(1)建立数据文件,定义变量“治疗效果”、“结果”,在“治疗效果”中用“1”表示“治愈”,用“2”表示“未治愈”;输入数据;

(2)用Weight Cases对频数变量“结果”进行加权: [Data]=>[Weight Cases],弹出对话框,选中“Weight cases by”,将“结果”导入“Frequency Variable”框中,

(3)[Analyze]=>[Nonparametric Tests] =>[Binominal],弹出“Binomial Test”对话框,将变量“治疗效果”移至“Test Variables List”(检验变量列表) ;在“Test Proportion”(检验比例)文本框中输入“0.75”;在Define Dichotomy(定义二分法)中选中“Get from data”(变量的取值只有两个有效值时选择该项,本例中“治疗效果”只有“1”和“2”两个取值);

(4)单击[Option],在弹出对话框中选择“Descriptive ”,Continue 返回;

(5)OK ,结果输出到Output 。

(6)结果分析:输出Binomial Test结果最后一列为单尾检验(1-tailed )

自行练习:

1、有一批蔬菜种子的平均发芽率 p =0.85,现随机抽取500 粒,用种衣剂进行处理,结果有445粒发芽,试检验种衣剂对种子发芽有无效果。

研究生《生物统计学》课程 上机内容

第四讲:独立性检验与二项分布检验

独立性检验(χ2 检验)与二项分布检验:是针对离散型数据的检验,在生物科学研究中,除了分析计量资料外,还常常需要对质量性状和质量反应的次数资料进行分析,其变异情况只能用分类计数的方法加以表示,属于计数资料。

本次主要练习:

⑴ 卡方检验(独立性检验):[Analyze]=>[Decriptive Statistics](描述性统计)=>[Crosstabs](交叉列联表过程)

⑵ 二项分布检验:[Analyze]=>[Nonparametric Tests] (非参数检验)=>[Binominal](二项分布)

一、独立性检验

(一)2×2列联表独立性检验

案例:下表给出不同给药方式与给药效果, 问口服与注射两种给药方式的效果差异是否显著?

SPSS 操作:

(1) 建立数据文件:在Variable View 中定义三个变量(方式、效果、计数),其中“方式”、

“效果”的变量类型定义为字符串(string )型,“计数”定义为数值(Numeric )型;在Data View中输入数据;

(2) 用Weight Cases 对频数变量“计数”进行加权: [Data]=>[Weight Cases],弹出对话框,

选中“Weight cases by”,将“计数”导入“Frequency Variable”框中,

(3) 卡方分析:

1) [Analyze]=>[Decriptive Statistics] =>[Crosstabs],弹出对话框,将“方式”

导入[Row(s)]中,将“效果”导入[Column(s)]中;

2) 点击[Statistics],弹出对话框,选中[Chi-square](卡方检验),continue 返

回;

3) 点击[Cells],弹出对话框,选中Counts 下的[Expected](显示理论值),continue

返回;

4) OK ,运行结果输出到output 窗口。

(4) 结果分析:在output 中输出三个表

1)

2) Case Processing Summary:检查数据缺失情况; Crosstabulation :列联表,显示观测值(及理论值、比例、观测值与理论值的差

值等)

3) Chi-Square Test:卡方检验结果:

Pearson Chi-Square:常用卡方检验计算的卡方值(样本数n ≥40且所有理论数T ≥5) Continuity Correction:连续性矫正卡方值(df=1或n ≥40但有5>T≥1 )

Likelihood Ratio:对数似然比法计算的卡方值(类似Pearson Chi-Square)

Fisher ’s Exact Test:确切概率法计算的卡方值(n

(二)r×c 列联表独立性检验

案例:用A 、B 、C 三种方法治疗仔猪白痢病,试验结果如下表,试检验不同的治疗方法是否与治疗效果有关。

SPSS 操作:

(1) 建立数据文件:在Variable View 中定义三个变量(治疗方法、治疗效果、计数),均

定义为数值(Numeric )型。对“治疗方法”的value 进行定义(“1”为“A ”、“2”为“B ”、“3”为“C ”)、对“治疗效果”的value 进行定义(“1”为“治愈”、“2”为“好转”、“3”为“死亡”),将三个变量的小数位数设为0;在Data View 中输入数据;

(注:也可象上例一样,将“治疗方法”和“治疗效果”设为string 型,在data view 中直接输入字符串。)

(2) 用Weight Cases 对频数变量“计数”进行加权: [Data]=>[Weight Cases],弹出对话框,

选中“Weight cases by”,将“计数”导入“Frequency Variable”框中,

(3) 卡方分析:

1) [Analyze]=>[Decriptive Statistics](描述性统计)=>[Crosstabs],弹出对话

框,将“治疗方法”导入[Row(s)]中,将“治疗效果”导入[Column(s)]中;

2) 点击[Statistics],弹出对话框,选中[Chi-square](卡方检验),continue 返

回;

3) 点击[Cells],弹出对话框,选中Counts 下的[Expected](显示理论值),continue

返回;

4) OK ,运行结果输出到output 窗口。

(4) 结果分析:在output 中输出三个表

1)

2) Case Processing Summary:检查数据缺失情况; Crosstabulation :列联表,显示观测值(及理论值、比例、观测值与理论值的差

值等)

3) Chi-Square Test:卡方检验,因为df=(r-1)(c-1)=4≠1,所以在表中不再出

现Continuity Correction(连续性矫正卡方值)

自行练习:

1、某校对学生的课外活动内容进行调查,结果整理成下表

二、二项分布检验:用于对给定样本数据检验其总体是否服从概率为指定数值的二项分布。

[Analyze]=>[Nonparametric Tests] (非参数检验)=>[Binominal](二项分布)

数据存放有两种方式:

一种是定义一个变量存放所有的样本值,重复的样本值作为不同的个案包论,如下面的

案例“二项分布检验 硬币.sav ”;

另一种是定义两个变量,一个存放不同的样本值,另一个存放该样本值的相应频数,但

这是应将频数变量指定为加权变量,如下面的案例“二项分布检验 蜜蜂.sav ”

1、案例:某人做抛掷硬币实验,检验硬币正面出现的概率是否为1/2。抛掷60次,出现正面记为1,出现反面记为0,记录结果如下表,检验硬币正反面出现的次数是否服从于概率为0.5的二项分布?

(数据文件:二项分布检验 硬币.sav )

SPSS 操作:

(1) 建立数据文件,定义变量“硬币结果”;

(2) [Analyze]=>[Nonparametric Tests] =>[Binominal],弹出“Binomial Test”对话框,将变

量“硬币结果”移至“Test Variables List”(检验变量列表) ;在“Test Proportion”(检验比例)文本框中输入“0.5”(默认为0.5,输入范围0.001~0.999);

(3) 单击[Option],在弹出对话框中选择“Descriptive ”,Continue 返回;

(4) OK ,结果输出到Output 。

(5) 结果分析:输出两个表:

1)

2) Descriptive Statistics:二项分布检验的描述性统计量 Binomial Test:二项分布检验的结果,Group1表示“正面”,Group2表示“反面”,

最后一列为计算得到的概率(双尾检验)

案例:蜜蜂某种病用一般疗法治愈率为75%,现尝试采用一种新疗法治疗,试验结果为治疗30只,治愈27只,试检验新疗法是否提高了疗效。(数据文件:二项分布检验 蜜蜂.sav )

SPSS 操作:

(1)建立数据文件,定义变量“治疗效果”、“结果”,在“治疗效果”中用“1”表示“治愈”,用“2”表示“未治愈”;输入数据;

(2)用Weight Cases对频数变量“结果”进行加权: [Data]=>[Weight Cases],弹出对话框,选中“Weight cases by”,将“结果”导入“Frequency Variable”框中,

(3)[Analyze]=>[Nonparametric Tests] =>[Binominal],弹出“Binomial Test”对话框,将变量“治疗效果”移至“Test Variables List”(检验变量列表) ;在“Test Proportion”(检验比例)文本框中输入“0.75”;在Define Dichotomy(定义二分法)中选中“Get from data”(变量的取值只有两个有效值时选择该项,本例中“治疗效果”只有“1”和“2”两个取值);

(4)单击[Option],在弹出对话框中选择“Descriptive ”,Continue 返回;

(5)OK ,结果输出到Output 。

(6)结果分析:输出Binomial Test结果最后一列为单尾检验(1-tailed )

自行练习:

1、有一批蔬菜种子的平均发芽率 p =0.85,现随机抽取500 粒,用种衣剂进行处理,结果有445粒发芽,试检验种衣剂对种子发芽有无效果。


相关文章

  • [生物统计学]上机内容(SPSS)
  • <生物统计学>上机实验 -- SPSS for Windows 统计软件操作与应用 陈 光 升 编 绵阳师范学院生命科学与技术学院 实验一 数据的管理及基本统计分析 一.数据格式化: 用户可根据具体资料的属性对数据进行格式化.主 ...查看


  • 统计学实验指导书(2016)
  • 统计学实验指导书 唐爱莉 郭彩云 岳志春 鲍 琳 主编 河北工程大学 前 言 当今,统计在经济活动和日常生活中正发挥着越来越大的作用:同时随着计算机的普及,统计分析方法在各个领域得到迅速推广.统计分析常用的软件有SAS .SPSS 和Exc ...查看


  • 美国一流统计学专业课程设置现状研究
  • 美国一流统计学专业课程设置现状研究 美国一流统计学专业课程设置现状研究 王炯琦 (国防科学技术大学 摘 要 * 吴翊周海银 长沙410073) 理学院数学与系统科学系,湖南 专业课程设置对于完善学生的知识结构.构建扎实的专业基础具有十分重要 ...查看


  • 应用统计学课程教学大纲
  • <应用统计学>课程教学大纲 第一部分 大纲说明 一.课程的性质和任务 <应用统计学>是高职高专院校经济类及管理类专业必修课的核心课程,是其它专业的选修课.在市场经济条件下,为了使学生掌握各种调查.各类数据的分析以及对 ...查看


  • 研究生医学统计学上机试题
  • 医学科研中的统计学方法上机试题 时间:2014-12-15 共4题,共100分 1.某医院病理科研究人体两肾的重量, 20例男性尸解时的左.右肾的称重记录见下表,问左.右肾重量有无不同? 表1:20例男性尸解时左.右肾的称重记录 编号 1 ...查看


  • 空间分析实验总结
  • 一.实验概述........................................................................................................ 2 二.实验专题. ...查看


  • 诺禾致源有参转录组分析流程
  • 一.建库测序流程 从RNA 样品到最终数据获得,样品检测.建库.测序每一个环节都会对数据质量和数量产生影响,而数据质量又会直接影响后续信息分析的结果.为了从源头上 保证测序数据的准确性.可靠性,诺禾致源对样品检测.建库.测序每一个生产步骤都 ...查看


  • 上机操作2完全随机试验设计的SPSS分析
  • 上机操作2 完全随机试验设计的SPSS分析 习题3 不同种源的白榆在土壤肥力不一致的4块试验地上进行试验,每块试验地划分5个小区,每小区播种一个种源,苗木生长4个月后,测每小区苗木平均高,测定结果见表8.15.问不同种源的白榆苗高生长差异是 ...查看


  • 生物统计学实验
  • 渤海大学学生实验报告 课程名称: 生物统计学实验 任课教师: 何余堂 实验室名称: 计算机室 房间号: 理工Ⅱ--205 实验时间: 2012-6-14 一.实验目的 1.掌握Excel 数据输入.输出与编辑方法: 2.掌握Excel 用于 ...查看


热门内容