中国科学院武汉教育基地
2006—2007学年第二学期期末考试试卷
课程名称:生物统计学
考试时间:2007年4月29日上午8:30-10:00。
一、选择题(每小题只选择一个最确切的答案,2分×10=20分) 1、对于一个连续型变量,其平均数之间有如下 A 、算术平均数
2、一个小样本量(n
A 、
(X -)
n -1
2
B 、
∑(X -) 2
n -1
C 、
∑(X -) 2
n
D 、
(X -)
n
2
3、若ξ~χ2(l ) 、η~χ2(k ) ,且ξ、η相互独立,则ξ + η服从 A 、t 分布 B 、F 分布 C 、χ2分布 D 、二项分布
4.某资料的观察值呈正态分布,则下面的叙述哪一个不正确 A. 图形左右不一定对称 B. 均数决定图形在X 轴上的位置 C. 曲线下面积为1 D. 标准差决定曲线的形状 5、泊松(Poisson )分布是
A 、χ2分布 B 、正态分布 C 、二项分布 D 、t 分布 6、在下列试验设计方法中,
A. 正交设计 B. 随机区组设计 C. 析因设计 D. 重复测量设计 7、如果变量X 和Y 之间的相关系数为-1,说明两个变量之间 A 、不存在相关关系 B 、相关程度很低 C 、相关程度很高 D 、完全负相关
8、随机抽取几十名7岁儿童,在他们上小学一年级时进行入学和学年期末两次推理能力的测试,现在要比较学生的推理能力在入学后的一年里是否有所提高,应该用
A 、Paired-Sample T Test,1-tailed B 、Indepent Two-Sample T Test,1-tailed C 、Paired-Sample T Test,2-tailed D 、Indepent Two-Sample T Test,2-tailed
9、某地区五月份的降水量y 与四月份的平均气温X1,平均气压X2有关,假设此关系是线性的,气象站统计了连续12年的资料,数据如下,
年 序 降水量 气 温 气 压
1 24 10 30
2 29 10 40
3 25 25 22
4 26 12 26
5 31 16 29
6 33 24 20
7 25 13 27
8 40 24 33
9 27 15 25
10 31 20 18
11 33 18 31
12 28 14 34
要确定五月份的降水量与4月份的气温和气压的关系,则用 统计方法? A 、一元线性回归 B 、多元线性回归 C 、一元线性相关 D 、多元线性相关 10、为了研究不同记忆条件下的记忆效果,取4名被试,每个被试均分别接受4种不同条件(A 、B 、C 、D )下的记忆实验,实验顺序随机决定,所得结果如下, 被试者 A B C D 1 14 19 28 19 2 35 24 30 28 3 31 35 40 36 4 27 22 24 27
这里所测得的记忆能力得分的分布不明,请问用下列 法比较不同记忆条件下的记忆效果?
A 、One-way ANOVA
B 、K-Independent-Samples test,Kruskal-Wallis 秩和检验 C 、K-Related-Samples test,Friedman 秩和检验 D 、K-Related-Samples test,Kendall 协同系数检验
二、填空题(1分×20=20分)
1、在对计量资料进行统计描述时,对于正态分布的资料,平均指标常常用变异指标用 ;对于偏态分布的资料,平均指标常常用 ,变异指标用 。
2、已知 ~N (70, 72) ,则ξ的标准差为,变异系数为。 3、在一次家禽流行病过程中,某养鸡场1000只鸡已有300头死于流行病。如果从该鸡场购买5只鸡,有2只鸡存活的概率为 。
4、将45尾幼虾等分为5份,称取每份虾的总重量,其标准差为81 mg ,则这45尾幼虾单尾重量的标准差为 。
5、某男子身高为161 cm,该地区男子的平均身高为173 cm,方差为36 cm2,则该男子身高在其所在地区的标准得分为 。
6、统计推断主要包括
7、 变量X 和变量Y 线性相关,其相关系数为-0.8,则X 对Y 的决定系数为
8、建立多元回归方程过程中,筛选对因变量作用显著的自变量的方法主要有
9、在判别分析中,常用的判别方法有 10、在生存分析中截尾数据是指从
三、判断题(1分×10=10分)
(在下面有关统计学的陈述后面的括号内,你认为正确的打“√”,错误的划“×”) 1、总体的统计指标称为统计量。 ( ) 2、若x ~N(μ, σ2) ,则~N(μ, σ2/n)。 ( ) 3、对一个分为两组的正态资料的两均数进行比较时,方差分析与t 检验是等价的。
( )
4、在方差分析过程中,对多组均数进行比较时,最小显著差异(LSD )检验适用于多个均数两两之间的全面比较。 ( ) 5、交叉设计是考虑交互作用的实验设计。 ( ) 6、在总体分布未知时,非参数统计的效率比参数检验方法高。 ( ) 7、协方差分析是将方差分析与相关分析结合在一起的统计方法。 ( ) 8、在直线相关分析中,r 值不仅反映两变量间关系的密切程度,同时也反应它们相关
的方向。 ( ) 9、对变量的聚类和对样品聚类在数学上是对称的,没有什么不同。 ( ) 10、在对多变量数据进行降维时,变量越相关,降维效果就越好。 ( )
四、简答题:(5分×2=10分)
1、某水产研究所为了比较四种不同饲料对鱼的增重效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果见表4-1。
表4-1 饲喂不同饲料的鱼的增重(单位:10g )
饲料
A 1 A 2 A 3 A 4
31.9 24.8 22.1 27.0
27.9 25.7 23.6 30.8
鱼的增重(x ij )
31.8 28.4 26.8 27.9 27.3 24.9 29.0 24.5
35.9
26.2 25.8 28.5
1)如果对本例进行方差分析,需要具备哪些条件?
2)如果本例数据满足方差分析的条件,请简述主要的几个步骤(不需要进行具体的计算)。
2、在一个三因素析因实验设计中,A 因素有3个水平,B 因素有2个水平,C 因素有3个水平,每个水平组合重复3次试验。
1)一共需要做多少次试验?
2)如果需要分析本试验中所有因素间的交互作用,则有多少个三阶交互作用,用多少个二阶交互作用,有多少个主效应?
3)如果最后的统计分析模型只需要保留有统计学意义的效应,则按什么顺序去除无统计学意义的交互作用或效应?
五、计算题(5分×2=10分)
1、在进行方差分析时,当有4个均数需要作全面两两比较时,共有多少次比较?设每次检验所用I 类错误的概率水准为0.05,在样本彼此独立的情况下,累积I 类错误的概率为多少?
2、有4个样品,每个样品由3个指标反应,其数据矩阵记为X 。 1)试完成下面绝对距离矩阵的计算。
数据矩阵
绝对距离矩阵
8 5 3 - - - 5 8 2 0 - -
D = X =
13 2 7 0 - 6 15 3 0 2)如果对样品进行聚类,则最先将哪两个样品聚为一类?
六、分析题(10分×3 = 30分)
1、甲乙两个班每班40位学生某次数学考试的部分成绩见表6-1,利用SPSS 软件对两个班成绩的正态检验(Explore )结果见表6-2,对两个班成绩均数的参数检验(Independent Samples Test)输出结果见表6-3,对中位数的非参数检验(Mann-Whitney 秩和检验)的结果见表6-4。
表6-1两个班的数学成绩(Score )
Class 1 2
学生编号
1 65 64
2 69 64
3 62 55
4 70 60
5 70 68
6 80 52
7 66 78
8 55 57
9 44 68
10 62 59
11 69 57
12 58 61
13 80 63
14 70 66
15 65 71
16 43 69
17 37 58
18 51 74
... ... ...
40 31 68
表6-2 SPSS output: Tests of Normality
Score
class
1 2
Kolmogorov-Smirnov a
Statistic
0.107 0.138
df 40 40
Sig. 0.200* 0.054
Statistic
0.980 0.966
Shapiro-Wilk
df 40 40
Sig. 0.703 0.260
* This is a lower bound of the true significance. a Lilliefors Significance Correction.
表6-3 SPSS output: Independent Samples Test
Levene's Test for Equality
of Variances
F Sig. 15.599
0.000
T-test for Equality of Means t
df
Sig.(2-tailed)
0.035 0.036
Score Equal variances assumed
Equal variances not assumed
-2.149 78.000 -2.149 59.775
表6-4 SPSS output: Mann-Whitney Test
Mann-Whitney U Wilcoxon W Z
Asymp. Sig. (2-tailed)
请回答下列问题:
1)两班的数学成绩是否为正态资料?为什么? 2)两班的数学成绩方差是否相等?为什么?
3)根据t 测验的结果,两个班的成绩是否明显不同?为什么? 4)根据非参数检验的结果,两个班的成绩是否明显不同? 5)在总体分布形式已知时,非参数检验有什么缺点?
2、某医师希望研究3种治疗方案对尿路感染的疗效,数据见表6-5。研究者想知道3种方案(treat = 1,传统疗法;treat = 2,新疗法;treat = 3,服用安慰剂)以及有无并发症(bingfa = 1,有并发症;bingfa = 0,无并发症)对病人的疗效(result = 1,治愈;result = 2,未愈)有无区别。
表6-5 3种治疗方案对尿路感染的疗效
bingfa 1 1 1 0 0 0 1 1 1 0 0 0
treat 1 2 3 1 2 3 1 2 3 1 2 3
result 1 1 1 1 1 1 0 0 0 0 0 0
count 78 101 68 40 54 34 28 11 46 5 5 6
score 598 1418 -1.944 0.052
为了比较3种治疗方案两两之间疗效是否存在差异,将治疗方案设置为哑变量,且第三个水平(treat = 3)设为参照。
用SPSS 对本例资料进行二分类变量logistic 回归分析的部分结果如表6-6: 表6-6 SPSS output: Logistic Regression
Block 1: Method = Enter
Variables in the Equation
Step 1 a
bingfa treat treat(1) treat(2) Constant
B
S.E.
Wald 10.288 24.622 4.902 24.401 22.551
df 1 2 1 1 1
Sig. 0.001 0.000 0.027 0.000 0.000
Exp(B) 0.3823 1.7945 4.7625 4.1305
-0.9616 0.2998
0.5847 0.2641 1.5608 0.316 1.4184 0.2987
a. Variable(s) entered on step 1: bingfa, treat.
1)试判断有无并发症以及不同的治疗方案对尿路感染的疗效是否有不同?为什么?
2)传统疗法组和新疗法组的尿路感染治愈率分别是服用安慰剂组的几倍? 3)如果需要比较新疗法组与传统疗法组的疗效,则哑变量应该怎样设置?
3. 欲比较某药三种不同浓度(dose1 = 10 nmol,dose2 = 30 nmol,dose3 = 90 nmol)诱发小白鼠皮肤发生癌变(trans = 1,癌变;trans = 0,未致癌)的时间,每种浓度均处理了30只老鼠,试验结果见表6-7。
表6-7 某药三种不同浓度对小白鼠皮肤的致癌作用
dose time trans count dose time trans count dose time 1 1 1 1 1 1 1 1 1 1 1 1 1 1
32 40 42 44 46 48 60 60 62 64 66 72 76 76
1 1 1 1 1 1 1 0 1 0 1 0 1 0
1 2 1 1 1 1 2 1 1 1 1 1 8 8
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
22 26 32 33 35 36 38 40 42 43 44 44 45 46 48 48 49
1 0 1 0 0 1 1 1 1 0 1 0 1 1 1 0 0
1 1 1 1 1 1 2 2 1 2 5 1 2 3 1 3 2
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
1 22 23 28 29 32 34 36 38 40 42 44 44 45 48 48 49
trans count 1 1 0 1 1 1 0 1 1 1 1 1 0 1 1 0 0
1 1 1 1 1 4 1 1 4 3 1 2 1 1 1 1 5
1)变量count 为各时间点小白鼠出现癌变或未癌变的例数。欲用SPSS 软件对本例资料进行生存分析,先需要对数据进行怎样的处理?
2)欲用Kaplan-Meier 过程比较不同浓度处理小白鼠的致癌时间是否相同,试将各变量名填入下图右边的对应框中。
Kaplan-Meier 过程的部分结果如表6-8,表6-9:
表6-8 SPSS output: Kaplan-Meier Means and Medians for Survival Time Mean Median
dose 1
2 3
Estimate 66.074 43.416 38.862
Std. 95% Confidence Interval Std. 95% Confidence Interval
Estimate
Error Error Lower Upper Lower Upper 2.715 60.752 71.395 76.000 2.876 - - 1.103 41.253 45.579 45.000 1.000 1.886 35.166 42.558 40.000 1.475 - -
a Estimation is limited to the largest survival time if it is censored.
表6-9 SPSS output: Pairwise Comparisons
Log Rank
(Mantel-Cox)
dose 1 2 3
1
Chi-Square
Sig.
2
Chi-Square 15.026
Sig. 0.000
3
Chi-Square 19.013 1.374
Sig. 0.000 0.241
-
15.026 19.013
-
0.000 0.000
-
1.374
-
0.241
- -
3)请问该药物的3种不同浓度对小白鼠的半数致癌时间分别是多少? 4)设本次试验所得到的半数致癌时间是对其总体的无偏估计,则药物浓度为30 nmol 时,小白鼠半数致癌时间的95%的置信限为多少?
5)3种不同浓度处理小白鼠后的健康曲线(生存曲线)之间,哪些有显著性差异,哪些没有显著性差异?
6) 药物以第2种浓度和第3种浓度处理小白鼠后,其半数致癌时间是否相等?为什么?
中国科学院武汉教育基地
2006—2007学年第二学期期末考试试卷
课程名称:生物统计学
考试时间:2007年4月29日上午8:30-10:00。
一、选择题(每小题只选择一个最确切的答案,2分×10=20分) 1、对于一个连续型变量,其平均数之间有如下 A 、算术平均数
2、一个小样本量(n
A 、
(X -)
n -1
2
B 、
∑(X -) 2
n -1
C 、
∑(X -) 2
n
D 、
(X -)
n
2
3、若ξ~χ2(l ) 、η~χ2(k ) ,且ξ、η相互独立,则ξ + η服从 A 、t 分布 B 、F 分布 C 、χ2分布 D 、二项分布
4.某资料的观察值呈正态分布,则下面的叙述哪一个不正确 A. 图形左右不一定对称 B. 均数决定图形在X 轴上的位置 C. 曲线下面积为1 D. 标准差决定曲线的形状 5、泊松(Poisson )分布是
A 、χ2分布 B 、正态分布 C 、二项分布 D 、t 分布 6、在下列试验设计方法中,
A. 正交设计 B. 随机区组设计 C. 析因设计 D. 重复测量设计 7、如果变量X 和Y 之间的相关系数为-1,说明两个变量之间 A 、不存在相关关系 B 、相关程度很低 C 、相关程度很高 D 、完全负相关
8、随机抽取几十名7岁儿童,在他们上小学一年级时进行入学和学年期末两次推理能力的测试,现在要比较学生的推理能力在入学后的一年里是否有所提高,应该用
A 、Paired-Sample T Test,1-tailed B 、Indepent Two-Sample T Test,1-tailed C 、Paired-Sample T Test,2-tailed D 、Indepent Two-Sample T Test,2-tailed
9、某地区五月份的降水量y 与四月份的平均气温X1,平均气压X2有关,假设此关系是线性的,气象站统计了连续12年的资料,数据如下,
年 序 降水量 气 温 气 压
1 24 10 30
2 29 10 40
3 25 25 22
4 26 12 26
5 31 16 29
6 33 24 20
7 25 13 27
8 40 24 33
9 27 15 25
10 31 20 18
11 33 18 31
12 28 14 34
要确定五月份的降水量与4月份的气温和气压的关系,则用 统计方法? A 、一元线性回归 B 、多元线性回归 C 、一元线性相关 D 、多元线性相关 10、为了研究不同记忆条件下的记忆效果,取4名被试,每个被试均分别接受4种不同条件(A 、B 、C 、D )下的记忆实验,实验顺序随机决定,所得结果如下, 被试者 A B C D 1 14 19 28 19 2 35 24 30 28 3 31 35 40 36 4 27 22 24 27
这里所测得的记忆能力得分的分布不明,请问用下列 法比较不同记忆条件下的记忆效果?
A 、One-way ANOVA
B 、K-Independent-Samples test,Kruskal-Wallis 秩和检验 C 、K-Related-Samples test,Friedman 秩和检验 D 、K-Related-Samples test,Kendall 协同系数检验
二、填空题(1分×20=20分)
1、在对计量资料进行统计描述时,对于正态分布的资料,平均指标常常用变异指标用 ;对于偏态分布的资料,平均指标常常用 ,变异指标用 。
2、已知 ~N (70, 72) ,则ξ的标准差为,变异系数为。 3、在一次家禽流行病过程中,某养鸡场1000只鸡已有300头死于流行病。如果从该鸡场购买5只鸡,有2只鸡存活的概率为 。
4、将45尾幼虾等分为5份,称取每份虾的总重量,其标准差为81 mg ,则这45尾幼虾单尾重量的标准差为 。
5、某男子身高为161 cm,该地区男子的平均身高为173 cm,方差为36 cm2,则该男子身高在其所在地区的标准得分为 。
6、统计推断主要包括
7、 变量X 和变量Y 线性相关,其相关系数为-0.8,则X 对Y 的决定系数为
8、建立多元回归方程过程中,筛选对因变量作用显著的自变量的方法主要有
9、在判别分析中,常用的判别方法有 10、在生存分析中截尾数据是指从
三、判断题(1分×10=10分)
(在下面有关统计学的陈述后面的括号内,你认为正确的打“√”,错误的划“×”) 1、总体的统计指标称为统计量。 ( ) 2、若x ~N(μ, σ2) ,则~N(μ, σ2/n)。 ( ) 3、对一个分为两组的正态资料的两均数进行比较时,方差分析与t 检验是等价的。
( )
4、在方差分析过程中,对多组均数进行比较时,最小显著差异(LSD )检验适用于多个均数两两之间的全面比较。 ( ) 5、交叉设计是考虑交互作用的实验设计。 ( ) 6、在总体分布未知时,非参数统计的效率比参数检验方法高。 ( ) 7、协方差分析是将方差分析与相关分析结合在一起的统计方法。 ( ) 8、在直线相关分析中,r 值不仅反映两变量间关系的密切程度,同时也反应它们相关
的方向。 ( ) 9、对变量的聚类和对样品聚类在数学上是对称的,没有什么不同。 ( ) 10、在对多变量数据进行降维时,变量越相关,降维效果就越好。 ( )
四、简答题:(5分×2=10分)
1、某水产研究所为了比较四种不同饲料对鱼的增重效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果见表4-1。
表4-1 饲喂不同饲料的鱼的增重(单位:10g )
饲料
A 1 A 2 A 3 A 4
31.9 24.8 22.1 27.0
27.9 25.7 23.6 30.8
鱼的增重(x ij )
31.8 28.4 26.8 27.9 27.3 24.9 29.0 24.5
35.9
26.2 25.8 28.5
1)如果对本例进行方差分析,需要具备哪些条件?
2)如果本例数据满足方差分析的条件,请简述主要的几个步骤(不需要进行具体的计算)。
2、在一个三因素析因实验设计中,A 因素有3个水平,B 因素有2个水平,C 因素有3个水平,每个水平组合重复3次试验。
1)一共需要做多少次试验?
2)如果需要分析本试验中所有因素间的交互作用,则有多少个三阶交互作用,用多少个二阶交互作用,有多少个主效应?
3)如果最后的统计分析模型只需要保留有统计学意义的效应,则按什么顺序去除无统计学意义的交互作用或效应?
五、计算题(5分×2=10分)
1、在进行方差分析时,当有4个均数需要作全面两两比较时,共有多少次比较?设每次检验所用I 类错误的概率水准为0.05,在样本彼此独立的情况下,累积I 类错误的概率为多少?
2、有4个样品,每个样品由3个指标反应,其数据矩阵记为X 。 1)试完成下面绝对距离矩阵的计算。
数据矩阵
绝对距离矩阵
8 5 3 - - - 5 8 2 0 - -
D = X =
13 2 7 0 - 6 15 3 0 2)如果对样品进行聚类,则最先将哪两个样品聚为一类?
六、分析题(10分×3 = 30分)
1、甲乙两个班每班40位学生某次数学考试的部分成绩见表6-1,利用SPSS 软件对两个班成绩的正态检验(Explore )结果见表6-2,对两个班成绩均数的参数检验(Independent Samples Test)输出结果见表6-3,对中位数的非参数检验(Mann-Whitney 秩和检验)的结果见表6-4。
表6-1两个班的数学成绩(Score )
Class 1 2
学生编号
1 65 64
2 69 64
3 62 55
4 70 60
5 70 68
6 80 52
7 66 78
8 55 57
9 44 68
10 62 59
11 69 57
12 58 61
13 80 63
14 70 66
15 65 71
16 43 69
17 37 58
18 51 74
... ... ...
40 31 68
表6-2 SPSS output: Tests of Normality
Score
class
1 2
Kolmogorov-Smirnov a
Statistic
0.107 0.138
df 40 40
Sig. 0.200* 0.054
Statistic
0.980 0.966
Shapiro-Wilk
df 40 40
Sig. 0.703 0.260
* This is a lower bound of the true significance. a Lilliefors Significance Correction.
表6-3 SPSS output: Independent Samples Test
Levene's Test for Equality
of Variances
F Sig. 15.599
0.000
T-test for Equality of Means t
df
Sig.(2-tailed)
0.035 0.036
Score Equal variances assumed
Equal variances not assumed
-2.149 78.000 -2.149 59.775
表6-4 SPSS output: Mann-Whitney Test
Mann-Whitney U Wilcoxon W Z
Asymp. Sig. (2-tailed)
请回答下列问题:
1)两班的数学成绩是否为正态资料?为什么? 2)两班的数学成绩方差是否相等?为什么?
3)根据t 测验的结果,两个班的成绩是否明显不同?为什么? 4)根据非参数检验的结果,两个班的成绩是否明显不同? 5)在总体分布形式已知时,非参数检验有什么缺点?
2、某医师希望研究3种治疗方案对尿路感染的疗效,数据见表6-5。研究者想知道3种方案(treat = 1,传统疗法;treat = 2,新疗法;treat = 3,服用安慰剂)以及有无并发症(bingfa = 1,有并发症;bingfa = 0,无并发症)对病人的疗效(result = 1,治愈;result = 2,未愈)有无区别。
表6-5 3种治疗方案对尿路感染的疗效
bingfa 1 1 1 0 0 0 1 1 1 0 0 0
treat 1 2 3 1 2 3 1 2 3 1 2 3
result 1 1 1 1 1 1 0 0 0 0 0 0
count 78 101 68 40 54 34 28 11 46 5 5 6
score 598 1418 -1.944 0.052
为了比较3种治疗方案两两之间疗效是否存在差异,将治疗方案设置为哑变量,且第三个水平(treat = 3)设为参照。
用SPSS 对本例资料进行二分类变量logistic 回归分析的部分结果如表6-6: 表6-6 SPSS output: Logistic Regression
Block 1: Method = Enter
Variables in the Equation
Step 1 a
bingfa treat treat(1) treat(2) Constant
B
S.E.
Wald 10.288 24.622 4.902 24.401 22.551
df 1 2 1 1 1
Sig. 0.001 0.000 0.027 0.000 0.000
Exp(B) 0.3823 1.7945 4.7625 4.1305
-0.9616 0.2998
0.5847 0.2641 1.5608 0.316 1.4184 0.2987
a. Variable(s) entered on step 1: bingfa, treat.
1)试判断有无并发症以及不同的治疗方案对尿路感染的疗效是否有不同?为什么?
2)传统疗法组和新疗法组的尿路感染治愈率分别是服用安慰剂组的几倍? 3)如果需要比较新疗法组与传统疗法组的疗效,则哑变量应该怎样设置?
3. 欲比较某药三种不同浓度(dose1 = 10 nmol,dose2 = 30 nmol,dose3 = 90 nmol)诱发小白鼠皮肤发生癌变(trans = 1,癌变;trans = 0,未致癌)的时间,每种浓度均处理了30只老鼠,试验结果见表6-7。
表6-7 某药三种不同浓度对小白鼠皮肤的致癌作用
dose time trans count dose time trans count dose time 1 1 1 1 1 1 1 1 1 1 1 1 1 1
32 40 42 44 46 48 60 60 62 64 66 72 76 76
1 1 1 1 1 1 1 0 1 0 1 0 1 0
1 2 1 1 1 1 2 1 1 1 1 1 8 8
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
22 26 32 33 35 36 38 40 42 43 44 44 45 46 48 48 49
1 0 1 0 0 1 1 1 1 0 1 0 1 1 1 0 0
1 1 1 1 1 1 2 2 1 2 5 1 2 3 1 3 2
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
1 22 23 28 29 32 34 36 38 40 42 44 44 45 48 48 49
trans count 1 1 0 1 1 1 0 1 1 1 1 1 0 1 1 0 0
1 1 1 1 1 4 1 1 4 3 1 2 1 1 1 1 5
1)变量count 为各时间点小白鼠出现癌变或未癌变的例数。欲用SPSS 软件对本例资料进行生存分析,先需要对数据进行怎样的处理?
2)欲用Kaplan-Meier 过程比较不同浓度处理小白鼠的致癌时间是否相同,试将各变量名填入下图右边的对应框中。
Kaplan-Meier 过程的部分结果如表6-8,表6-9:
表6-8 SPSS output: Kaplan-Meier Means and Medians for Survival Time Mean Median
dose 1
2 3
Estimate 66.074 43.416 38.862
Std. 95% Confidence Interval Std. 95% Confidence Interval
Estimate
Error Error Lower Upper Lower Upper 2.715 60.752 71.395 76.000 2.876 - - 1.103 41.253 45.579 45.000 1.000 1.886 35.166 42.558 40.000 1.475 - -
a Estimation is limited to the largest survival time if it is censored.
表6-9 SPSS output: Pairwise Comparisons
Log Rank
(Mantel-Cox)
dose 1 2 3
1
Chi-Square
Sig.
2
Chi-Square 15.026
Sig. 0.000
3
Chi-Square 19.013 1.374
Sig. 0.000 0.241
-
15.026 19.013
-
0.000 0.000
-
1.374
-
0.241
- -
3)请问该药物的3种不同浓度对小白鼠的半数致癌时间分别是多少? 4)设本次试验所得到的半数致癌时间是对其总体的无偏估计,则药物浓度为30 nmol 时,小白鼠半数致癌时间的95%的置信限为多少?
5)3种不同浓度处理小白鼠后的健康曲线(生存曲线)之间,哪些有显著性差异,哪些没有显著性差异?
6) 药物以第2种浓度和第3种浓度处理小白鼠后,其半数致癌时间是否相等?为什么?