2001级预防医学专业《卫生统计学》试卷
2004年5月31日
专业 学号 姓名 得分
一、 单项选择题(每题2分,共40分)
1. 标准正态分布的中位数为__A______
A. 0 B. 1 C. 0.5 D. 与标准差有关
2. 2检验能分析D
A. 两样本率差异有无统计学意义 B. 多个样本率差异有无统计学意义 C. 两有序分类变量的关联性 D. 以上都对
3. 医学试验设计的基本原则是D
A. 对照 B. 随机 C. 重复 D. 以上均正确
4. 以下关于二项分布的说法,错误的是___D_____
A. 二项分布要求随机试验仅有两个互相对立的结果,每次试验间是互相独立的;
B. 二项分布要求各次随机试验的阳性率是恒定不变的;
C. 从一个装有10个白球和10个黑球的口袋中随机摸球,每次摸出一球,记录其颜色后放回袋中,重复10次,作为一次试验。若以摸出白球作为阳性,则每次试验的阳性率服从二项分布;
D. 虽然二项分布要求各次随机试验的阳性率是不变的,但在样本含量比较大,且阳性率和阴性率均不太小时,也可以近似利用二项分布的原理来解决阳性率有微弱改变时的有关问题。如从一个装有5000个白球和5000个黑球的口袋中随机摸球,每次摸出一球,记录其颜色后不放回袋中,重复10次,作为一次试验。可以近似利用二项分布的有关原理来解决这样的问题。
5. 关于正态分布,以下说法正确的是__B______ A.仅仅标准正态分布其曲线下面积才为1;
B.在横轴上,从负无限大到1.96所对应的曲线下面积为0.975;
C.从服从正态分布的总体中抽样,不管其样本含量有多大,其样本均数均服从正态分布;
D.以上都不对。
6. 各观察值同时加上(或减去)同一不为0的常数后。 A. 均数改变, 标准差不变 B. 均数不变, 标准差改变 C. 两者均不变 D. 两者均改变
7. 要研究鼻咽癌患者、眼病患者和正常人血型的构成比是否有不同,采用三组构成比比较的卡方检验,构建一个3行4列的R*C表后,其卡方值的自由度为___B_____
A.8 B.6 C.4 D.跟样本含量有关
8. 样本均数与总体均数比较的t检验,按照α=0.05的水准拒绝H0,此时若推断有错,则错误的概率为__A______
A.0.05 B.0.10 C.0.95 D.0.90
9. 下列分布中___C_____的均数等于方差。
A.标准正态分布 B.二项分布 C.Poisson分布 D.F分布
10. 根据以往经验,新生儿染色体异常率为0.01,在某地随机抽查400名新生儿,至少有4人异常的概率为_C______
A. P(1)+P(2)+P(3)+P(4) B. P(0)+P(1)+P(2)+P(3)+P(4) C. 1-P(0)-P(1)-P(2)-P(3) D. 1-P(0)-P(1)-P(2)-P(3)-P(4)
11. 三组样本均数的比较,先进行单因素方差分析,P
B.第一组和第三组来自于两个不同的总体,但尚无法判断第二组究竟来自于哪个总体 C. 第二组来自的总体位于第一组和第三组所来自的总体之间 D. 该两两比较为模糊结论,说明计算中发生了错误。
12. 下面关于直线相关与回归的说法,正确的是C A. 回归系数越大,说明相关性越强 B. 相关系数为0,说明两个变量间无关
C. 两组资料,第一组相关系数小于第二组,说明第二组的相关程度强于第一组 D. 相关系数越大,说明在样本含量一定时,越有可能在对相关关系是否存在的假设检验中拒绝H0。
13. A. B. C. D.
下面关于假设检验的说法,正确地是D 在P值大于检验水准时,我们可以接受H0
在两个率比较的卡方检验中,P值越小,说明两个总体率差得越大。 若发现双侧检验不能拒绝H0,可以进行单侧检验提高检验效能 以上说法都不对
14. 对两个方差分析中,组间变异主要反映的是__A______ A. 处理因素的作用 B. 抽样误差 C. 测量误差 D.随机误差,包括个体差异和测量误差
15. 关于样本含量的影响,以下说法正确的是D A. 随着样本含量的增加,标准差逐渐变小 B. 随着样本含量的增加,标准误逐渐变大
C. 随着样本含量的增加,参考值范围越来越稳定 D. 随着样本含量的增加,可信区间越来越稳定
16. R*C表周边合计不变时,实际频数若有改变,理论频数__C_____ A.增加 B. 减少 C. 不变 D.不知道
17. 计算某地某时期某病的病死率,应注意D
A.分母是该时期该地平均人口数 B.分子是该时期该地所有死亡数 C.分子是该时期该地该疾病病人的死亡数 D. 分子是该时期该地该疾病病人的因该病的死亡数
18. X1~Poisson(μ1),X2~Poisson(μ2),则_____C___ A. X1-X2~Poisson(μ1-μ2) B. X1+X2~Poisson(μ1+μ2) C. A与B均对 D. A与B均不对
19. 比较身高与体重两组数据变异大小宜采用A A. 变异系数 B. 方差 C. 标准差 D. 四分位间距
20. 正态分布曲线下,横轴上,从μ-1.96σ到μ+2.58σ的面积为___92.5%_____
A. 95% B. 49.5% C. 99% D. 97%
二、 分析计算题(共40分)
1. (10分) 用克矽平雾化吸入治疗矽肺患者7人,疗前疗后分别测得血清粘蛋白,结果如下(单位mg/L)。
患者 1 2 3 4 5 6 7 疗前 65 73 73 30 73 56 73 疗后 34 36 37 26 43 37 50
. ttest x1=x2
Paired t test
------------------------------------------------------------------------------ Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- x1 | 7 63.28571 6.058109 16.02825 48.46206 78.10937 x2 | 7 37.57143 2.81879 7.457818 30.6741 44.46876 ---------+-------------------------------------------------------------------- diff | 7 25.71429 4.3737 11.57172 15.01223 36.41634 ------------------------------------------------------------------------------ Ho: mean(x1 - x2) = mean(diff) = 0
Ha: mean(diff) 0 t = 5.8793 t = 5.8793 t = 5.8793 P |t| = 0.0011 P > t = 0.0005
(1) 该研究属于什么设计? 配对设计
(2) 该资料中,疗前、疗后的血清粘蛋白均数分别是多少?标准差为多少? 疗前:均数68.28571,标准差16.02825 疗后: 37.57143 7.457818
(3) 疗前、疗后的血清粘蛋白平均相差多少?差值的标准差为多少?差值均数的95%可信区间是多少?
差值均数:25.71429,标准差11.57172,可信区间15.01223 36.41634 mg/l
(3) 能否认为治疗会引起患者血清粘蛋白的改变?(列出详细步骤,并下结论) H0:治疗不会引起血清蛋白的改变 H1:治疗会引起血清蛋白的改变 α=0.05
配对t检验t=5.8793 P= 0.0011
有统计学差异,拒绝H0,接受H1认为治疗会引起血清蛋白的改变
2. (10分) 要比较四种强心剂的毒性。将稀释过的药物注入麻醉的豚鼠体内,记录导致豚鼠死亡时药物的剂量。每种药物各进行了10次试验,事先已经采取了有关的措施以保证每只豚鼠试验时环境和测量方法尽量相同。实验结果如下:
药物
1 2 3 4
样本含量
10 10 10 10
豚鼠死亡时药物的剂量
29,28,23,26,26,19,25,29,26,28 17,25,24,19,28,21,20,25,19,24 17,16,21,22,23,18,20,17,25,21 18,20,25,24,16,20,20,17,19,17
(1) 该实验属于什么设计? 完全随机设计
(2) 完成方差分析表。
SS df MS F P 变异来源
组间 249.88 0.0002 组内 350.90 9.74 总变异 15.40
(3) 根据方差分析的结果,写出假设检验的详细过程,并下结论。 H0:四种强心剂的毒性相同 H1:四种强心剂的毒性不同 α=0.05
采用单因素方差分析 P=0.0002
P
3 (10分)10名79岁正常老年人的收缩压和舒张压的测定值如下(单位mmHg),
患者编号 舒张压(X) 收缩压(Yl)
1 2 3 4 5 6 7 8 9 10 76 76 80 81 84 84 89 91 87 78 114 120 136 138 141 143 163 160 143 125
散点图如下
170160收缩压(Y)
[***********]
75
80
85舒张压(X)
90
95
Stata的输出结果如下。
. corr y x
| y x -------------+------------------ y | 1.0000
x | 0.9578 1.0000
. reg y x
Source | SS df MS Number of obs = 10 -------------+------------------------------ F( 1, 8) = 88.83 Model | 2055.02393 1 2055.02393 Prob > F = 0.0000 Residual | 185.07607 8 23.1345087 R-squared = 0.9174 -------------+------------------------------ Adj R-squared = 0.9071 Total | 2240.1 9 248.9 Root MSE = 4.8098
------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | 2.853407 .3027509 *** **** 2.155262 3.551552 _cons | -97.39144 25.05344 -3.89 0.005 -155.1648 -39.61811 ------------------------------------------------------------------------------
(1) X与Y间是否存在直线相关关系?(写出假设检验的详细步骤,并下结论)
H0:X与Y间不存在直线相关关系 H1:X与Y间存在直线相关关系 α=0.05 r=0.9578 t= 9.4249585
P
P
(2) 写出回归方程。该方程的假设检验结果如何? Y=2.8534x-97.19344 该方程有统计学意义
(3) X=85mmHg时,Y的估计是多少?表示什么意思? 145.344mmHg
表示当舒张压为85mmHg时,估计收缩压平均值为145.344mmHg
(4) 该回归方程的剩余标准差为多少?说明什么含义? 4.8098,表示扣除x的影响后,y的变异。
(5) 回归系数的t检验的自由度是多少? 8
(6) 在建立回归方程之后,有人要用它来预测一位舒张压为105mmHg的高血压病人的收缩压,就他的做法提出你的观点。 不可,只可内推,不可外延。
4 (4分)某牧区观察慢性布鲁氏病患者植物血凝素(PHA)皮肤试验反应,问活动型与稳定型布鲁氏病患者PHA阳性反应率有无差别 (写出详细步骤)。
分型 活动型 稳定型
阳性 1 3
阴性 14 7
合计 15 10
提示:四格表周边合计不变的情况下,不同组合的确切概率如下。
0.0166 0.1423 0.3735 0.3597 0.1079
H0:活动型与稳定型布鲁氏病患者PHA阳性反应率无差别 H1:活动型与稳定型布鲁氏病患者PHA阳性反应率有差别 α=0.05
用确切概率法
P=0.0166+0.1079>0.05 P>0.05,不拒绝H0,认为活动型与稳定型布鲁氏病患者PHA阳性反应率无差别
5. (6分) 某医生欲研究WBC倍增现象是否会影响白血病的生存时间(单位:月),分别随访了出现和未出现白细胞倍增的白血病患者各8例,资料如下:
有白细胞倍增(g=1)
2.00 3.00 4.00 5.00 5.50 6.00 6.50 10.00
秩次 1 2 4 5.5 7 8 9 12
无白细胞倍增(g=2)
3.50 5.00 7.00 8.00 12.00 15.00 17.00 >20
秩次 3 5.5 10 11 13 14 15 16
(1) 对该资料进行编秩,以便进行统计分析。 (2) 两组的理论秩和分别为多少? 48.5 87.5
(3) 根据Stata的输出结果,作出统计推断(写出假设检验的过程,并下结论)
. ranksum y,by(g)
Two-sample Wilcoxon rank-sum (Mann-Whitney) test g | obs rank sum expected -------------+--------------------------------- 1 | 8 48.5 68 2 | 8 87.5 68 -------------+--------------------------------- combined | 16 136 136
unadjusted variance 90.67 adjustment for ties -0.13 ---------- adjusted variance 90.53
Ho: y(g==1) = y(g==2) z = -2.049 Prob > |z| = 0.0404
H0: 两组无差别 H1:两组有差别 α=0.05
z = -2.049
Prob > |z| = 0.0404 P
P
三、 简答题(每题5分,共20分)
1 描述数值变量资料(计量资料)的集中程度有哪些指标,有何适用条件? 答:均数,应用甚广,最适用于单峰对称分布,特别是正态分布;几何均数,适用于等比
资料,对数正态分布的资料;中位数及百份位数,适用于任何分布的资料,尤其适用于偏态分布的资料,或分布不明或分布末端无确定值。
2 简述假设检验中第一类错误和第二类错误的含义及其相互关系。
答:拒绝了实际上成立的H0,这类错误称为第一类错误,其概率的大小用α表示,α可取单尾或双尾,架设检验是研究者可根据不同的研究目的来确定α的大小。
接受了实际上不成立的H0,这类错误称为第二类错误,其概率的大小用β来表示,β只取单尾,β值的大小在进行架设检验时一般并不知道,须在已知两总体的差值,检验水准α以及样本含量的情况下,才能算出。
1-β成为检验效能,其意义是党两总体确有差异,按规定的检验水准α所能发现该差异的能力。α越小β越大,反之α越大β越小,同时控制两类错误的方法只有增加样本含量。
3 以两样本均数的t检验为例,简述假设检验的基本思想。
两样本均数不同,可能是由于抽样误差,也有可能是由于两样本分别来自两个不同的总体,先建立假设两样本来自同一总体,计算在该假设前提之下,获得手头样本的概率,(用统计量t值),通过对该概率进行界定做出结论一般于0.05进行比较,允许犯假阳性错误的概率为0.05。
4 某地1岁婴儿平均血红蛋白的95%可信区间为116.2~130.1(g/L),表示什么
意义?该地1岁正常婴儿的血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?
答:某地1岁婴儿平均血红蛋白的95%可信区间为116.2~130.1(g/L)是指每100个样本所算得的95%可信区间,平均有95个可信区间包含了1岁婴儿平均血红蛋白总体均数。
1岁正常婴儿的血红蛋白95%的参考值范围为111.2~135.1(g/L)的含义是95%的正常婴儿的血红蛋白在111.2~135.1(g/L)范围内。
2001级预防医学专业《卫生统计学》试卷
2004年5月31日
专业 学号 姓名 得分
一、 单项选择题(每题2分,共40分)
1. 标准正态分布的中位数为__A______
A. 0 B. 1 C. 0.5 D. 与标准差有关
2. 2检验能分析D
A. 两样本率差异有无统计学意义 B. 多个样本率差异有无统计学意义 C. 两有序分类变量的关联性 D. 以上都对
3. 医学试验设计的基本原则是D
A. 对照 B. 随机 C. 重复 D. 以上均正确
4. 以下关于二项分布的说法,错误的是___D_____
A. 二项分布要求随机试验仅有两个互相对立的结果,每次试验间是互相独立的;
B. 二项分布要求各次随机试验的阳性率是恒定不变的;
C. 从一个装有10个白球和10个黑球的口袋中随机摸球,每次摸出一球,记录其颜色后放回袋中,重复10次,作为一次试验。若以摸出白球作为阳性,则每次试验的阳性率服从二项分布;
D. 虽然二项分布要求各次随机试验的阳性率是不变的,但在样本含量比较大,且阳性率和阴性率均不太小时,也可以近似利用二项分布的原理来解决阳性率有微弱改变时的有关问题。如从一个装有5000个白球和5000个黑球的口袋中随机摸球,每次摸出一球,记录其颜色后不放回袋中,重复10次,作为一次试验。可以近似利用二项分布的有关原理来解决这样的问题。
5. 关于正态分布,以下说法正确的是__B______ A.仅仅标准正态分布其曲线下面积才为1;
B.在横轴上,从负无限大到1.96所对应的曲线下面积为0.975;
C.从服从正态分布的总体中抽样,不管其样本含量有多大,其样本均数均服从正态分布;
D.以上都不对。
6. 各观察值同时加上(或减去)同一不为0的常数后。 A. 均数改变, 标准差不变 B. 均数不变, 标准差改变 C. 两者均不变 D. 两者均改变
7. 要研究鼻咽癌患者、眼病患者和正常人血型的构成比是否有不同,采用三组构成比比较的卡方检验,构建一个3行4列的R*C表后,其卡方值的自由度为___B_____
A.8 B.6 C.4 D.跟样本含量有关
8. 样本均数与总体均数比较的t检验,按照α=0.05的水准拒绝H0,此时若推断有错,则错误的概率为__A______
A.0.05 B.0.10 C.0.95 D.0.90
9. 下列分布中___C_____的均数等于方差。
A.标准正态分布 B.二项分布 C.Poisson分布 D.F分布
10. 根据以往经验,新生儿染色体异常率为0.01,在某地随机抽查400名新生儿,至少有4人异常的概率为_C______
A. P(1)+P(2)+P(3)+P(4) B. P(0)+P(1)+P(2)+P(3)+P(4) C. 1-P(0)-P(1)-P(2)-P(3) D. 1-P(0)-P(1)-P(2)-P(3)-P(4)
11. 三组样本均数的比较,先进行单因素方差分析,P
B.第一组和第三组来自于两个不同的总体,但尚无法判断第二组究竟来自于哪个总体 C. 第二组来自的总体位于第一组和第三组所来自的总体之间 D. 该两两比较为模糊结论,说明计算中发生了错误。
12. 下面关于直线相关与回归的说法,正确的是C A. 回归系数越大,说明相关性越强 B. 相关系数为0,说明两个变量间无关
C. 两组资料,第一组相关系数小于第二组,说明第二组的相关程度强于第一组 D. 相关系数越大,说明在样本含量一定时,越有可能在对相关关系是否存在的假设检验中拒绝H0。
13. A. B. C. D.
下面关于假设检验的说法,正确地是D 在P值大于检验水准时,我们可以接受H0
在两个率比较的卡方检验中,P值越小,说明两个总体率差得越大。 若发现双侧检验不能拒绝H0,可以进行单侧检验提高检验效能 以上说法都不对
14. 对两个方差分析中,组间变异主要反映的是__A______ A. 处理因素的作用 B. 抽样误差 C. 测量误差 D.随机误差,包括个体差异和测量误差
15. 关于样本含量的影响,以下说法正确的是D A. 随着样本含量的增加,标准差逐渐变小 B. 随着样本含量的增加,标准误逐渐变大
C. 随着样本含量的增加,参考值范围越来越稳定 D. 随着样本含量的增加,可信区间越来越稳定
16. R*C表周边合计不变时,实际频数若有改变,理论频数__C_____ A.增加 B. 减少 C. 不变 D.不知道
17. 计算某地某时期某病的病死率,应注意D
A.分母是该时期该地平均人口数 B.分子是该时期该地所有死亡数 C.分子是该时期该地该疾病病人的死亡数 D. 分子是该时期该地该疾病病人的因该病的死亡数
18. X1~Poisson(μ1),X2~Poisson(μ2),则_____C___ A. X1-X2~Poisson(μ1-μ2) B. X1+X2~Poisson(μ1+μ2) C. A与B均对 D. A与B均不对
19. 比较身高与体重两组数据变异大小宜采用A A. 变异系数 B. 方差 C. 标准差 D. 四分位间距
20. 正态分布曲线下,横轴上,从μ-1.96σ到μ+2.58σ的面积为___92.5%_____
A. 95% B. 49.5% C. 99% D. 97%
二、 分析计算题(共40分)
1. (10分) 用克矽平雾化吸入治疗矽肺患者7人,疗前疗后分别测得血清粘蛋白,结果如下(单位mg/L)。
患者 1 2 3 4 5 6 7 疗前 65 73 73 30 73 56 73 疗后 34 36 37 26 43 37 50
. ttest x1=x2
Paired t test
------------------------------------------------------------------------------ Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- x1 | 7 63.28571 6.058109 16.02825 48.46206 78.10937 x2 | 7 37.57143 2.81879 7.457818 30.6741 44.46876 ---------+-------------------------------------------------------------------- diff | 7 25.71429 4.3737 11.57172 15.01223 36.41634 ------------------------------------------------------------------------------ Ho: mean(x1 - x2) = mean(diff) = 0
Ha: mean(diff) 0 t = 5.8793 t = 5.8793 t = 5.8793 P |t| = 0.0011 P > t = 0.0005
(1) 该研究属于什么设计? 配对设计
(2) 该资料中,疗前、疗后的血清粘蛋白均数分别是多少?标准差为多少? 疗前:均数68.28571,标准差16.02825 疗后: 37.57143 7.457818
(3) 疗前、疗后的血清粘蛋白平均相差多少?差值的标准差为多少?差值均数的95%可信区间是多少?
差值均数:25.71429,标准差11.57172,可信区间15.01223 36.41634 mg/l
(3) 能否认为治疗会引起患者血清粘蛋白的改变?(列出详细步骤,并下结论) H0:治疗不会引起血清蛋白的改变 H1:治疗会引起血清蛋白的改变 α=0.05
配对t检验t=5.8793 P= 0.0011
有统计学差异,拒绝H0,接受H1认为治疗会引起血清蛋白的改变
2. (10分) 要比较四种强心剂的毒性。将稀释过的药物注入麻醉的豚鼠体内,记录导致豚鼠死亡时药物的剂量。每种药物各进行了10次试验,事先已经采取了有关的措施以保证每只豚鼠试验时环境和测量方法尽量相同。实验结果如下:
药物
1 2 3 4
样本含量
10 10 10 10
豚鼠死亡时药物的剂量
29,28,23,26,26,19,25,29,26,28 17,25,24,19,28,21,20,25,19,24 17,16,21,22,23,18,20,17,25,21 18,20,25,24,16,20,20,17,19,17
(1) 该实验属于什么设计? 完全随机设计
(2) 完成方差分析表。
SS df MS F P 变异来源
组间 249.88 0.0002 组内 350.90 9.74 总变异 15.40
(3) 根据方差分析的结果,写出假设检验的详细过程,并下结论。 H0:四种强心剂的毒性相同 H1:四种强心剂的毒性不同 α=0.05
采用单因素方差分析 P=0.0002
P
3 (10分)10名79岁正常老年人的收缩压和舒张压的测定值如下(单位mmHg),
患者编号 舒张压(X) 收缩压(Yl)
1 2 3 4 5 6 7 8 9 10 76 76 80 81 84 84 89 91 87 78 114 120 136 138 141 143 163 160 143 125
散点图如下
170160收缩压(Y)
[***********]
75
80
85舒张压(X)
90
95
Stata的输出结果如下。
. corr y x
| y x -------------+------------------ y | 1.0000
x | 0.9578 1.0000
. reg y x
Source | SS df MS Number of obs = 10 -------------+------------------------------ F( 1, 8) = 88.83 Model | 2055.02393 1 2055.02393 Prob > F = 0.0000 Residual | 185.07607 8 23.1345087 R-squared = 0.9174 -------------+------------------------------ Adj R-squared = 0.9071 Total | 2240.1 9 248.9 Root MSE = 4.8098
------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | 2.853407 .3027509 *** **** 2.155262 3.551552 _cons | -97.39144 25.05344 -3.89 0.005 -155.1648 -39.61811 ------------------------------------------------------------------------------
(1) X与Y间是否存在直线相关关系?(写出假设检验的详细步骤,并下结论)
H0:X与Y间不存在直线相关关系 H1:X与Y间存在直线相关关系 α=0.05 r=0.9578 t= 9.4249585
P
P
(2) 写出回归方程。该方程的假设检验结果如何? Y=2.8534x-97.19344 该方程有统计学意义
(3) X=85mmHg时,Y的估计是多少?表示什么意思? 145.344mmHg
表示当舒张压为85mmHg时,估计收缩压平均值为145.344mmHg
(4) 该回归方程的剩余标准差为多少?说明什么含义? 4.8098,表示扣除x的影响后,y的变异。
(5) 回归系数的t检验的自由度是多少? 8
(6) 在建立回归方程之后,有人要用它来预测一位舒张压为105mmHg的高血压病人的收缩压,就他的做法提出你的观点。 不可,只可内推,不可外延。
4 (4分)某牧区观察慢性布鲁氏病患者植物血凝素(PHA)皮肤试验反应,问活动型与稳定型布鲁氏病患者PHA阳性反应率有无差别 (写出详细步骤)。
分型 活动型 稳定型
阳性 1 3
阴性 14 7
合计 15 10
提示:四格表周边合计不变的情况下,不同组合的确切概率如下。
0.0166 0.1423 0.3735 0.3597 0.1079
H0:活动型与稳定型布鲁氏病患者PHA阳性反应率无差别 H1:活动型与稳定型布鲁氏病患者PHA阳性反应率有差别 α=0.05
用确切概率法
P=0.0166+0.1079>0.05 P>0.05,不拒绝H0,认为活动型与稳定型布鲁氏病患者PHA阳性反应率无差别
5. (6分) 某医生欲研究WBC倍增现象是否会影响白血病的生存时间(单位:月),分别随访了出现和未出现白细胞倍增的白血病患者各8例,资料如下:
有白细胞倍增(g=1)
2.00 3.00 4.00 5.00 5.50 6.00 6.50 10.00
秩次 1 2 4 5.5 7 8 9 12
无白细胞倍增(g=2)
3.50 5.00 7.00 8.00 12.00 15.00 17.00 >20
秩次 3 5.5 10 11 13 14 15 16
(1) 对该资料进行编秩,以便进行统计分析。 (2) 两组的理论秩和分别为多少? 48.5 87.5
(3) 根据Stata的输出结果,作出统计推断(写出假设检验的过程,并下结论)
. ranksum y,by(g)
Two-sample Wilcoxon rank-sum (Mann-Whitney) test g | obs rank sum expected -------------+--------------------------------- 1 | 8 48.5 68 2 | 8 87.5 68 -------------+--------------------------------- combined | 16 136 136
unadjusted variance 90.67 adjustment for ties -0.13 ---------- adjusted variance 90.53
Ho: y(g==1) = y(g==2) z = -2.049 Prob > |z| = 0.0404
H0: 两组无差别 H1:两组有差别 α=0.05
z = -2.049
Prob > |z| = 0.0404 P
P
三、 简答题(每题5分,共20分)
1 描述数值变量资料(计量资料)的集中程度有哪些指标,有何适用条件? 答:均数,应用甚广,最适用于单峰对称分布,特别是正态分布;几何均数,适用于等比
资料,对数正态分布的资料;中位数及百份位数,适用于任何分布的资料,尤其适用于偏态分布的资料,或分布不明或分布末端无确定值。
2 简述假设检验中第一类错误和第二类错误的含义及其相互关系。
答:拒绝了实际上成立的H0,这类错误称为第一类错误,其概率的大小用α表示,α可取单尾或双尾,架设检验是研究者可根据不同的研究目的来确定α的大小。
接受了实际上不成立的H0,这类错误称为第二类错误,其概率的大小用β来表示,β只取单尾,β值的大小在进行架设检验时一般并不知道,须在已知两总体的差值,检验水准α以及样本含量的情况下,才能算出。
1-β成为检验效能,其意义是党两总体确有差异,按规定的检验水准α所能发现该差异的能力。α越小β越大,反之α越大β越小,同时控制两类错误的方法只有增加样本含量。
3 以两样本均数的t检验为例,简述假设检验的基本思想。
两样本均数不同,可能是由于抽样误差,也有可能是由于两样本分别来自两个不同的总体,先建立假设两样本来自同一总体,计算在该假设前提之下,获得手头样本的概率,(用统计量t值),通过对该概率进行界定做出结论一般于0.05进行比较,允许犯假阳性错误的概率为0.05。
4 某地1岁婴儿平均血红蛋白的95%可信区间为116.2~130.1(g/L),表示什么
意义?该地1岁正常婴儿的血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?
答:某地1岁婴儿平均血红蛋白的95%可信区间为116.2~130.1(g/L)是指每100个样本所算得的95%可信区间,平均有95个可信区间包含了1岁婴儿平均血红蛋白总体均数。
1岁正常婴儿的血红蛋白95%的参考值范围为111.2~135.1(g/L)的含义是95%的正常婴儿的血红蛋白在111.2~135.1(g/L)范围内。