研究生《生物统计学》课程 上机内容
第四讲:独立性检验与二项分布检验
独立性检验(χ2 检验)与二项分布检验:是针对离散型数据的检验,在生物科学研究中,除了分析计量资料外,还常常需要对质量性状和质量反应的次数资料进行分析,其变异情况只能用分类计数的方法加以表示,属于计数资料。
本次主要练习:
⑴ 卡方检验(独立性检验):[Analyze]=>[Decriptive Statistics](描述性统计)=>[Crosstabs](交叉列联表过程)
⑵ 二项分布检验:[Analyze]=>[Nonparametric Tests] (非参数检验)=>[Binominal](二项分布)
一、独立性检验
(一)2×2列联表独立性检验
案例:下表给出不同给药方式与给药效果, 问口服与注射两种给药方式的效果差异是否显著?
SPSS 操作:
(1) 建立数据文件:在Variable View 中定义三个变量(方式、效果、计数),其中“方式”、
“效果”的变量类型定义为字符串(string )型,“计数”定义为数值(Numeric )型;在Data View中输入数据;
(2) 用Weight Cases 对频数变量“计数”进行加权: [Data]=>[Weight Cases],弹出对话框,
选中“Weight cases by”,将“计数”导入“Frequency Variable”框中,
(3) 卡方分析:
1) [Analyze]=>[Decriptive Statistics] =>[Crosstabs],弹出对话框,将“方式”
导入[Row(s)]中,将“效果”导入[Column(s)]中;
2) 点击[Statistics],弹出对话框,选中[Chi-square](卡方检验),continue 返
回;
3) 点击[Cells],弹出对话框,选中Counts 下的[Expected](显示理论值),continue
返回;
4) OK ,运行结果输出到output 窗口。
(4) 结果分析:在output 中输出三个表
1)
2) Case Processing Summary:检查数据缺失情况; Crosstabulation :列联表,显示观测值(及理论值、比例、观测值与理论值的差
值等)
3) Chi-Square Test:卡方检验结果:
Pearson Chi-Square:常用卡方检验计算的卡方值(样本数n ≥40且所有理论数T ≥5) Continuity Correction:连续性矫正卡方值(df=1或n ≥40但有5>T≥1 )
Likelihood Ratio:对数似然比法计算的卡方值(类似Pearson Chi-Square)
Fisher ’s Exact Test:确切概率法计算的卡方值(n
(二)r×c 列联表独立性检验
案例:用A 、B 、C 三种方法治疗仔猪白痢病,试验结果如下表,试检验不同的治疗方法是否与治疗效果有关。
SPSS 操作:
(1) 建立数据文件:在Variable View 中定义三个变量(治疗方法、治疗效果、计数),均
定义为数值(Numeric )型。对“治疗方法”的value 进行定义(“1”为“A ”、“2”为“B ”、“3”为“C ”)、对“治疗效果”的value 进行定义(“1”为“治愈”、“2”为“好转”、“3”为“死亡”),将三个变量的小数位数设为0;在Data View 中输入数据;
(注:也可象上例一样,将“治疗方法”和“治疗效果”设为string 型,在data view 中直接输入字符串。)
(2) 用Weight Cases 对频数变量“计数”进行加权: [Data]=>[Weight Cases],弹出对话框,
选中“Weight cases by”,将“计数”导入“Frequency Variable”框中,
(3) 卡方分析:
1) [Analyze]=>[Decriptive Statistics](描述性统计)=>[Crosstabs],弹出对话
框,将“治疗方法”导入[Row(s)]中,将“治疗效果”导入[Column(s)]中;
2) 点击[Statistics],弹出对话框,选中[Chi-square](卡方检验),continue 返
回;
3) 点击[Cells],弹出对话框,选中Counts 下的[Expected](显示理论值),continue
返回;
4) OK ,运行结果输出到output 窗口。
(4) 结果分析:在output 中输出三个表
1)
2) Case Processing Summary:检查数据缺失情况; Crosstabulation :列联表,显示观测值(及理论值、比例、观测值与理论值的差
值等)
3) Chi-Square Test:卡方检验,因为df=(r-1)(c-1)=4≠1,所以在表中不再出
现Continuity Correction(连续性矫正卡方值)
自行练习:
1、某校对学生的课外活动内容进行调查,结果整理成下表
二、二项分布检验:用于对给定样本数据检验其总体是否服从概率为指定数值的二项分布。
[Analyze]=>[Nonparametric Tests] (非参数检验)=>[Binominal](二项分布)
数据存放有两种方式:
一种是定义一个变量存放所有的样本值,重复的样本值作为不同的个案包论,如下面的
案例“二项分布检验 硬币.sav ”;
另一种是定义两个变量,一个存放不同的样本值,另一个存放该样本值的相应频数,但
这是应将频数变量指定为加权变量,如下面的案例“二项分布检验 蜜蜂.sav ”
1、案例:某人做抛掷硬币实验,检验硬币正面出现的概率是否为1/2。抛掷60次,出现正面记为1,出现反面记为0,记录结果如下表,检验硬币正反面出现的次数是否服从于概率为0.5的二项分布?
(数据文件:二项分布检验 硬币.sav )
SPSS 操作:
(1) 建立数据文件,定义变量“硬币结果”;
(2) [Analyze]=>[Nonparametric Tests] =>[Binominal],弹出“Binomial Test”对话框,将变
量“硬币结果”移至“Test Variables List”(检验变量列表) ;在“Test Proportion”(检验比例)文本框中输入“0.5”(默认为0.5,输入范围0.001~0.999);
(3) 单击[Option],在弹出对话框中选择“Descriptive ”,Continue 返回;
(4) OK ,结果输出到Output 。
(5) 结果分析:输出两个表:
1)
2) Descriptive Statistics:二项分布检验的描述性统计量 Binomial Test:二项分布检验的结果,Group1表示“正面”,Group2表示“反面”,
最后一列为计算得到的概率(双尾检验)
案例:蜜蜂某种病用一般疗法治愈率为75%,现尝试采用一种新疗法治疗,试验结果为治疗30只,治愈27只,试检验新疗法是否提高了疗效。(数据文件:二项分布检验 蜜蜂.sav )
SPSS 操作:
(1)建立数据文件,定义变量“治疗效果”、“结果”,在“治疗效果”中用“1”表示“治愈”,用“2”表示“未治愈”;输入数据;
(2)用Weight Cases对频数变量“结果”进行加权: [Data]=>[Weight Cases],弹出对话框,选中“Weight cases by”,将“结果”导入“Frequency Variable”框中,
(3)[Analyze]=>[Nonparametric Tests] =>[Binominal],弹出“Binomial Test”对话框,将变量“治疗效果”移至“Test Variables List”(检验变量列表) ;在“Test Proportion”(检验比例)文本框中输入“0.75”;在Define Dichotomy(定义二分法)中选中“Get from data”(变量的取值只有两个有效值时选择该项,本例中“治疗效果”只有“1”和“2”两个取值);
(4)单击[Option],在弹出对话框中选择“Descriptive ”,Continue 返回;
(5)OK ,结果输出到Output 。
(6)结果分析:输出Binomial Test结果最后一列为单尾检验(1-tailed )
自行练习:
1、有一批蔬菜种子的平均发芽率 p =0.85,现随机抽取500 粒,用种衣剂进行处理,结果有445粒发芽,试检验种衣剂对种子发芽有无效果。
研究生《生物统计学》课程 上机内容
第四讲:独立性检验与二项分布检验
独立性检验(χ2 检验)与二项分布检验:是针对离散型数据的检验,在生物科学研究中,除了分析计量资料外,还常常需要对质量性状和质量反应的次数资料进行分析,其变异情况只能用分类计数的方法加以表示,属于计数资料。
本次主要练习:
⑴ 卡方检验(独立性检验):[Analyze]=>[Decriptive Statistics](描述性统计)=>[Crosstabs](交叉列联表过程)
⑵ 二项分布检验:[Analyze]=>[Nonparametric Tests] (非参数检验)=>[Binominal](二项分布)
一、独立性检验
(一)2×2列联表独立性检验
案例:下表给出不同给药方式与给药效果, 问口服与注射两种给药方式的效果差异是否显著?
SPSS 操作:
(1) 建立数据文件:在Variable View 中定义三个变量(方式、效果、计数),其中“方式”、
“效果”的变量类型定义为字符串(string )型,“计数”定义为数值(Numeric )型;在Data View中输入数据;
(2) 用Weight Cases 对频数变量“计数”进行加权: [Data]=>[Weight Cases],弹出对话框,
选中“Weight cases by”,将“计数”导入“Frequency Variable”框中,
(3) 卡方分析:
1) [Analyze]=>[Decriptive Statistics] =>[Crosstabs],弹出对话框,将“方式”
导入[Row(s)]中,将“效果”导入[Column(s)]中;
2) 点击[Statistics],弹出对话框,选中[Chi-square](卡方检验),continue 返
回;
3) 点击[Cells],弹出对话框,选中Counts 下的[Expected](显示理论值),continue
返回;
4) OK ,运行结果输出到output 窗口。
(4) 结果分析:在output 中输出三个表
1)
2) Case Processing Summary:检查数据缺失情况; Crosstabulation :列联表,显示观测值(及理论值、比例、观测值与理论值的差
值等)
3) Chi-Square Test:卡方检验结果:
Pearson Chi-Square:常用卡方检验计算的卡方值(样本数n ≥40且所有理论数T ≥5) Continuity Correction:连续性矫正卡方值(df=1或n ≥40但有5>T≥1 )
Likelihood Ratio:对数似然比法计算的卡方值(类似Pearson Chi-Square)
Fisher ’s Exact Test:确切概率法计算的卡方值(n
(二)r×c 列联表独立性检验
案例:用A 、B 、C 三种方法治疗仔猪白痢病,试验结果如下表,试检验不同的治疗方法是否与治疗效果有关。
SPSS 操作:
(1) 建立数据文件:在Variable View 中定义三个变量(治疗方法、治疗效果、计数),均
定义为数值(Numeric )型。对“治疗方法”的value 进行定义(“1”为“A ”、“2”为“B ”、“3”为“C ”)、对“治疗效果”的value 进行定义(“1”为“治愈”、“2”为“好转”、“3”为“死亡”),将三个变量的小数位数设为0;在Data View 中输入数据;
(注:也可象上例一样,将“治疗方法”和“治疗效果”设为string 型,在data view 中直接输入字符串。)
(2) 用Weight Cases 对频数变量“计数”进行加权: [Data]=>[Weight Cases],弹出对话框,
选中“Weight cases by”,将“计数”导入“Frequency Variable”框中,
(3) 卡方分析:
1) [Analyze]=>[Decriptive Statistics](描述性统计)=>[Crosstabs],弹出对话
框,将“治疗方法”导入[Row(s)]中,将“治疗效果”导入[Column(s)]中;
2) 点击[Statistics],弹出对话框,选中[Chi-square](卡方检验),continue 返
回;
3) 点击[Cells],弹出对话框,选中Counts 下的[Expected](显示理论值),continue
返回;
4) OK ,运行结果输出到output 窗口。
(4) 结果分析:在output 中输出三个表
1)
2) Case Processing Summary:检查数据缺失情况; Crosstabulation :列联表,显示观测值(及理论值、比例、观测值与理论值的差
值等)
3) Chi-Square Test:卡方检验,因为df=(r-1)(c-1)=4≠1,所以在表中不再出
现Continuity Correction(连续性矫正卡方值)
自行练习:
1、某校对学生的课外活动内容进行调查,结果整理成下表
二、二项分布检验:用于对给定样本数据检验其总体是否服从概率为指定数值的二项分布。
[Analyze]=>[Nonparametric Tests] (非参数检验)=>[Binominal](二项分布)
数据存放有两种方式:
一种是定义一个变量存放所有的样本值,重复的样本值作为不同的个案包论,如下面的
案例“二项分布检验 硬币.sav ”;
另一种是定义两个变量,一个存放不同的样本值,另一个存放该样本值的相应频数,但
这是应将频数变量指定为加权变量,如下面的案例“二项分布检验 蜜蜂.sav ”
1、案例:某人做抛掷硬币实验,检验硬币正面出现的概率是否为1/2。抛掷60次,出现正面记为1,出现反面记为0,记录结果如下表,检验硬币正反面出现的次数是否服从于概率为0.5的二项分布?
(数据文件:二项分布检验 硬币.sav )
SPSS 操作:
(1) 建立数据文件,定义变量“硬币结果”;
(2) [Analyze]=>[Nonparametric Tests] =>[Binominal],弹出“Binomial Test”对话框,将变
量“硬币结果”移至“Test Variables List”(检验变量列表) ;在“Test Proportion”(检验比例)文本框中输入“0.5”(默认为0.5,输入范围0.001~0.999);
(3) 单击[Option],在弹出对话框中选择“Descriptive ”,Continue 返回;
(4) OK ,结果输出到Output 。
(5) 结果分析:输出两个表:
1)
2) Descriptive Statistics:二项分布检验的描述性统计量 Binomial Test:二项分布检验的结果,Group1表示“正面”,Group2表示“反面”,
最后一列为计算得到的概率(双尾检验)
案例:蜜蜂某种病用一般疗法治愈率为75%,现尝试采用一种新疗法治疗,试验结果为治疗30只,治愈27只,试检验新疗法是否提高了疗效。(数据文件:二项分布检验 蜜蜂.sav )
SPSS 操作:
(1)建立数据文件,定义变量“治疗效果”、“结果”,在“治疗效果”中用“1”表示“治愈”,用“2”表示“未治愈”;输入数据;
(2)用Weight Cases对频数变量“结果”进行加权: [Data]=>[Weight Cases],弹出对话框,选中“Weight cases by”,将“结果”导入“Frequency Variable”框中,
(3)[Analyze]=>[Nonparametric Tests] =>[Binominal],弹出“Binomial Test”对话框,将变量“治疗效果”移至“Test Variables List”(检验变量列表) ;在“Test Proportion”(检验比例)文本框中输入“0.75”;在Define Dichotomy(定义二分法)中选中“Get from data”(变量的取值只有两个有效值时选择该项,本例中“治疗效果”只有“1”和“2”两个取值);
(4)单击[Option],在弹出对话框中选择“Descriptive ”,Continue 返回;
(5)OK ,结果输出到Output 。
(6)结果分析:输出Binomial Test结果最后一列为单尾检验(1-tailed )
自行练习:
1、有一批蔬菜种子的平均发芽率 p =0.85,现随机抽取500 粒,用种衣剂进行处理,结果有445粒发芽,试检验种衣剂对种子发芽有无效果。