机械系工业工程11级《工程统计学》试卷
姓名: 马素伟 学号: [1**********]5 专业:工业工程112班
一、简答题(20分)
1、(10分)简述假设检验的基本原理及P-value 的意义。
解:假设检验的基本思想是概率性质反证法,它的理论根据是小概率事件原理。在假设检验中,接受H 0或拒绝H 0并不代表原假设H 0一定是正确的或错误的,而只是根据样本所提供的信息以一定的概率认为原假设是正确的或错误的。
P-value 的意义:P 值就是拒绝原假设所需的最低显著性水平。如果P 值小于给定的显著性水平 ,则拒绝原假设;否则,接受原假设。或更直观的来说,如果P 值很小,则拒绝原假设;如果P 值很大,则接受原假设。
2、(10分)应用矩估计法的基本原理以及步骤。
解: 原理:矩估计由皮尔逊于1894年提出,基本原理是用样本的k 阶矩来估计总体X 的k 阶矩,还可以用样本矩的函数去替换相应的总体矩的函数。
步骤:先找出总体矩与参数之间的关系;用样本矩替换总体矩,得到关于估计量的方程; 解方程组得到k 个参数的据估计量。
二、计算与分析题(80分)
1、(15分)随机产生一组数据,要求其个数为60个,并且该数据服从标准正态分布。
(1) 绘制出数据的直方图,Box 图,给出各描述性统计量(至少包括均值、方差、中位数、峰度、
偏斜、四分位数等等);
(2) 给出样本均值的95%置信区间、样本中位数的95%置信区间; 解
0.83301 -0.09430 0.495241 -1.74421 -3.40165 1.02059 -1.25638 2.41384 1.04256 0.29187 -1.9450 -0.10166 0.164092 -0.89598 -0.11886 1.16907 1.20360 0.52885 0.59652 0.04767 1.00631 0.77246 -0.394619 -1.50075 -0.23955 0.34661 -0.37906 -0.41947 1.25400 0.80832 -0.05240 -0.85853 -0.175860 -0.68263 0.92446 -1.23045 0.30684 -0.64336 0.63365 -0.80998 -0.40328 -0.05520 -0.825615 0.41974 -0.45409 -1.35617 1.69816 -0.20505 -0.31908 -2.70239 -0.24344 -2.05124 -0.736034 0.91173 -0.69944 0.81932 -0.69232 -0.63098 -0.69784 0.62711
描述性统计: C11
均值标 上四分
变量 均值 准误 标准差 最小值 下四分位数 中位数 位数 最大值 偏度 C11 -0.154 0.136 1.055 -3.402 -0.699 -0.190 0.632 2.414 -0.48
变量 峰度 C11 0.95
单样本 Z: C11
mu = 0 与 ≠ 0 的检验 假定标准差 = 1
均值标
变量 N 均值 标准差 准误 95% 置信区间 Z P C11 60 -0.154 1.055 0.129 (-0.407, 0.099) -1.20 0.232
2、(20分)机器包装食盐,每袋净质量X (单位:克)服从正态分布,规定每袋净质量为500克,标准差不能超过10克。某天开工后,为检验机器工作是否正常,从包装好的食盐中随机抽取9袋,测得其净质量为,497,507,510,475,484,488,524,491,515,在给定显著性水平0.05的情况下,检验这天包装机工
作是否正常。
22
解 检验包装机工作是否正常,就是要检验是否均值为μ0=500,方差小于σ0=10。利用minitab
软件可得
单方差检验和置信区间: C2
方法
原假设 西格玛 = 10 备择假设 西格玛不 = 10
卡方方法仅适用于正态分布。 Bonett 方法适用于任何连续分布。 统计量
变量 N 标准差 方差 C2 9 16.0 257
(1)设H 0:μ=500; H 1:μ≠500 由于σ未知,选统计量
2
t =
-μ0S
n
~t (n -1)
对显著性水平α=0. 05,α/2=0.025 df =9-1=8
由样本值计算得=499,
t =
499-500
≈0. 187
216. 0决策:
∵t 值落入接受域,∴在 =0.05的显著性水平上接受H0 结论:
有证据表明这天自动包装机工作正常
(2)设H 0:σ
2
=102; H 1:σ2>102
由于μ未知,选统计量
χ=
2
(n -1) S 2
σ02
~χ2(n -1)
对显著性水平α=0. 05,查表得χα(n -1) =χ0. 05(8) =15. 5,
χ2=
22
8⨯2572
=20. 56>15. 5=χα(n -1) 100
拒绝H 0,接受H 1,认为标准差大于10。
综上,尽管包装机没有系统误差,但是工作不够稳定,因此这天包装机工作不正常。
3、(15分)有甲乙两车床生产同一型号的滚珠,根据已有经验可以认为,这两台车床生产的滚珠直径都服从正态分布,问题是要比较两台车床生产的滚珠直径的方差。现在从这两台车床生产的产品中分别抽取8个和9个,经计算得到,甲的样本均值是15.01,方差是0.0955;乙的样本均值是14.99,方差是0.0261,对显著性水平在0.1的情况下,判断乙车床的方差是否比甲车床的小? 解:
双方差检验和置信区间
* 注 * 除区间图以外的其他图形均不能使用汇总数据创建。 方法
原假设 西格玛(1) / 西格玛(2) = 1 备择假设 西格玛(1) / 西格玛(2) ≠ 1 显著性水平 Alpha = 0.05 统计量
样本 N 标准差 方差 1 8 0.096 0.009 2 9 0.026 0.001
标准差比 = 3.659 方差比 = 13.388
95% 置信区间
标准差置信 方差置信 变量 方法 区间 区间 C2 卡方 (10.8, 30.7) (117, 943) Bonett (11.1, 29.5) (124, 871)
检验
检验统
变量 方法 计量 自由度 P 值 C2 卡方 20.56 8 0.017 Bonett — — 0.018 检验
方法 DF1 DF2 计量 P 值 F 0.002
检
验
(
正
态
)
7
8
13.39
P 值小于0.1,故拒绝原假设,接受备择假设 西格玛(1) / 西格玛(2) > 1 可得出乙车床的方差比甲车床的小
4、(15)分影响某化工厂产品得率的主要因素是反应温度和使用的催化剂种类。为研究产品的最优生产工艺条件,在其他条件不变的情况下,选择了四种温度和三种催化剂,在不同温度和催化剂的组合下各做了两次试验,测得结果如下:
化工产品得率试验(%)
温度 催化剂B1 催化剂B2 催化剂B3 A1(60℃) 66, 58 73, 68 70, 65
A2(70℃) 81, 79 96, 97 53, 55 A3(80℃) 97, 95 79, 69 66, 56 A4(90℃) 79, 71 76, 56 88, 82
(1) 写出该类问题的一般模型;
分析数据并作出结论, 即在什么情况下化工产品得率高。 解:(1)该问题是双因素重复试验模型。
(2)用软件对双因素重复试验方差分析,可得 方差分析: 实验结果 与 温度, 催化剂
因子 类型 水平数 值
温度 固定 4 A1(60℃), A2(70℃), A3(80℃), A4(90℃) 催化剂 固定 3 B1, B2, B3
双因子方差分析: C6 与 C5, C7
来源 自由度 SS MS F P C5 3 435.46 145.153 4.21 0.030 C7 2 611.08 305.542 8.87 0.004 交互作用 6 2912.92 485.486 14.09 0.000 误差 12 413.50 34.458 合计 23 4372.96
S = 5.870 R-Sq = 90.54% R-Sq(调整) = 81.88% 均值
温度 N 实验结果 A1(60℃) 6 65.000 A2(70℃) 6 76.833 A3(80℃) 6 77.000 A4(90℃) 6 75.333 催化剂 N 实验结果 B1 8 78.250 B2 8 76.750 B3 8 65.625
温度 催化剂 N 实验结果 A1(60℃) B1 2 62.000 A1(60℃) B2 2 70.500 A1(60℃) B3 2 62.500 A2(70℃) B1 2 80.000 A2(70℃) B2 2 96.500 A2(70℃) B3 2 54.000 A3(80℃) B1 2 96.000 A3(80℃) B2 2 74.000 A3(80℃) B3 2 61.000 A4(90℃) B1 2 75.000 A4(90℃) B2 2 66.000
A4(90℃) B3 2 85.000
此任务输出窗共分为三个部分,第一部分注明了各因素名称、水平数及水平值。第二部分为方差分析表,有P 值可知,温度与催化剂的共同作用对该结果影响最显著,第三部分为输出的相关因素不同水平对应的均值得出A2 ,B2交互作用时实验结果为96.5,最高。
即在70度催化剂B2时化工产品得率高。 5、(15分)某地区对某种消费品的销售量(y )进行调查,它与以下四个量有关:居民可支配的收入(x 1)、该类消费品的平均价格指数(x 2)、社会上该消费品的保有量(x 3)、其他消费品的平均价格指数(x 4)。数据见下表:
No. 1 2 3 4 5 6 7 8 9 10
y 8.4 9.6 10.4 11.4 12.2 14.2 15.8 17.9 19.6 20.8
x1 82.9 88.0 99.9 105.3 117.7 131. 148.2 161.8 174.2 184.7
x2 92.0 93.0 96.0 94.0 100.0 101.0 105.0 112.0 112.0 112.0
x3 17.1 21.3 25.1 29.0 34.0 40.0 44.0 49.0 51.0 53.0
x4 94.0 96.0 97.0 97.0 100.0 101.0 104.0 109.0 111.0 111.0
(1) 建立销售量与四个变量之间的标准化线性回归关系式。 (2) 对回归方程及各回归系数进行显著性检验。
解:利用minitab 软件对该例题进行回归分析,结果如下 回归分析:y 与 x1, x2, x3, x4
回归方程为
y = - 17.7 + 0.0901 x1 - 0.231 x2 + 0.0181 x3 + 0.421 x4
自变量 系数 系数标准误 T P 常量 -17.668 5.944 -2.97 0.031 x1 0.09006 0.02095 4.30 0.008 x2 -0.23132 0.07132 -3.24 0.023 x3 0.01806 0.03907 0.46 0.663 x4 0.4207 0.1185 3.55 0.016
S = 0.203715 R-Sq = 99.9% R-Sq(调整) = 99.8% 方差分析
来源 自由度 SS MS F P
回归 4 169.554 42.388 1021.41 0.000 残差误差 5 0.207 0.041 合计 9 169.761
来源 自由度 Seq SS x1 1 168.931 x2 1 0.020 x3 1 0.079 x4 1 0.523
(1)整理后得到多元回归模型为 Y = - 17.7 + 0.0901 x1 - 0.231 x2 + 0.0181 x3 + 0.421 x4
(2)由多元决定系数R 99. 9%且P 值很小,因此方程具有很好的线性,即该消费品的销售量与居民可支配的收入(x 1)、该类消费品的平均价格指数(x 2)、社会上该消费品的保有量(x 3)、其他消费品的平均价格指数(x 4)存在显著的线性关系,观察各变量的取值其中x1 ,x2 ,x4的P 值较0.5要小,因此这几个因素对销售量有显著线性影响,即对该销售品销售量影响大小依次为居民可支配的收入(x 1)|其他消费品的平均价格指数(x 4)、该类消费品的平均价格指数(x 2)、社会上该消费品的保有量(x 3)。
2
机械系工业工程11级《工程统计学》试卷
姓名: 马素伟 学号: [1**********]5 专业:工业工程112班
一、简答题(20分)
1、(10分)简述假设检验的基本原理及P-value 的意义。
解:假设检验的基本思想是概率性质反证法,它的理论根据是小概率事件原理。在假设检验中,接受H 0或拒绝H 0并不代表原假设H 0一定是正确的或错误的,而只是根据样本所提供的信息以一定的概率认为原假设是正确的或错误的。
P-value 的意义:P 值就是拒绝原假设所需的最低显著性水平。如果P 值小于给定的显著性水平 ,则拒绝原假设;否则,接受原假设。或更直观的来说,如果P 值很小,则拒绝原假设;如果P 值很大,则接受原假设。
2、(10分)应用矩估计法的基本原理以及步骤。
解: 原理:矩估计由皮尔逊于1894年提出,基本原理是用样本的k 阶矩来估计总体X 的k 阶矩,还可以用样本矩的函数去替换相应的总体矩的函数。
步骤:先找出总体矩与参数之间的关系;用样本矩替换总体矩,得到关于估计量的方程; 解方程组得到k 个参数的据估计量。
二、计算与分析题(80分)
1、(15分)随机产生一组数据,要求其个数为60个,并且该数据服从标准正态分布。
(1) 绘制出数据的直方图,Box 图,给出各描述性统计量(至少包括均值、方差、中位数、峰度、
偏斜、四分位数等等);
(2) 给出样本均值的95%置信区间、样本中位数的95%置信区间; 解
0.83301 -0.09430 0.495241 -1.74421 -3.40165 1.02059 -1.25638 2.41384 1.04256 0.29187 -1.9450 -0.10166 0.164092 -0.89598 -0.11886 1.16907 1.20360 0.52885 0.59652 0.04767 1.00631 0.77246 -0.394619 -1.50075 -0.23955 0.34661 -0.37906 -0.41947 1.25400 0.80832 -0.05240 -0.85853 -0.175860 -0.68263 0.92446 -1.23045 0.30684 -0.64336 0.63365 -0.80998 -0.40328 -0.05520 -0.825615 0.41974 -0.45409 -1.35617 1.69816 -0.20505 -0.31908 -2.70239 -0.24344 -2.05124 -0.736034 0.91173 -0.69944 0.81932 -0.69232 -0.63098 -0.69784 0.62711
描述性统计: C11
均值标 上四分
变量 均值 准误 标准差 最小值 下四分位数 中位数 位数 最大值 偏度 C11 -0.154 0.136 1.055 -3.402 -0.699 -0.190 0.632 2.414 -0.48
变量 峰度 C11 0.95
单样本 Z: C11
mu = 0 与 ≠ 0 的检验 假定标准差 = 1
均值标
变量 N 均值 标准差 准误 95% 置信区间 Z P C11 60 -0.154 1.055 0.129 (-0.407, 0.099) -1.20 0.232
2、(20分)机器包装食盐,每袋净质量X (单位:克)服从正态分布,规定每袋净质量为500克,标准差不能超过10克。某天开工后,为检验机器工作是否正常,从包装好的食盐中随机抽取9袋,测得其净质量为,497,507,510,475,484,488,524,491,515,在给定显著性水平0.05的情况下,检验这天包装机工
作是否正常。
22
解 检验包装机工作是否正常,就是要检验是否均值为μ0=500,方差小于σ0=10。利用minitab
软件可得
单方差检验和置信区间: C2
方法
原假设 西格玛 = 10 备择假设 西格玛不 = 10
卡方方法仅适用于正态分布。 Bonett 方法适用于任何连续分布。 统计量
变量 N 标准差 方差 C2 9 16.0 257
(1)设H 0:μ=500; H 1:μ≠500 由于σ未知,选统计量
2
t =
-μ0S
n
~t (n -1)
对显著性水平α=0. 05,α/2=0.025 df =9-1=8
由样本值计算得=499,
t =
499-500
≈0. 187
216. 0决策:
∵t 值落入接受域,∴在 =0.05的显著性水平上接受H0 结论:
有证据表明这天自动包装机工作正常
(2)设H 0:σ
2
=102; H 1:σ2>102
由于μ未知,选统计量
χ=
2
(n -1) S 2
σ02
~χ2(n -1)
对显著性水平α=0. 05,查表得χα(n -1) =χ0. 05(8) =15. 5,
χ2=
22
8⨯2572
=20. 56>15. 5=χα(n -1) 100
拒绝H 0,接受H 1,认为标准差大于10。
综上,尽管包装机没有系统误差,但是工作不够稳定,因此这天包装机工作不正常。
3、(15分)有甲乙两车床生产同一型号的滚珠,根据已有经验可以认为,这两台车床生产的滚珠直径都服从正态分布,问题是要比较两台车床生产的滚珠直径的方差。现在从这两台车床生产的产品中分别抽取8个和9个,经计算得到,甲的样本均值是15.01,方差是0.0955;乙的样本均值是14.99,方差是0.0261,对显著性水平在0.1的情况下,判断乙车床的方差是否比甲车床的小? 解:
双方差检验和置信区间
* 注 * 除区间图以外的其他图形均不能使用汇总数据创建。 方法
原假设 西格玛(1) / 西格玛(2) = 1 备择假设 西格玛(1) / 西格玛(2) ≠ 1 显著性水平 Alpha = 0.05 统计量
样本 N 标准差 方差 1 8 0.096 0.009 2 9 0.026 0.001
标准差比 = 3.659 方差比 = 13.388
95% 置信区间
标准差置信 方差置信 变量 方法 区间 区间 C2 卡方 (10.8, 30.7) (117, 943) Bonett (11.1, 29.5) (124, 871)
检验
检验统
变量 方法 计量 自由度 P 值 C2 卡方 20.56 8 0.017 Bonett — — 0.018 检验
方法 DF1 DF2 计量 P 值 F 0.002
检
验
(
正
态
)
7
8
13.39
P 值小于0.1,故拒绝原假设,接受备择假设 西格玛(1) / 西格玛(2) > 1 可得出乙车床的方差比甲车床的小
4、(15)分影响某化工厂产品得率的主要因素是反应温度和使用的催化剂种类。为研究产品的最优生产工艺条件,在其他条件不变的情况下,选择了四种温度和三种催化剂,在不同温度和催化剂的组合下各做了两次试验,测得结果如下:
化工产品得率试验(%)
温度 催化剂B1 催化剂B2 催化剂B3 A1(60℃) 66, 58 73, 68 70, 65
A2(70℃) 81, 79 96, 97 53, 55 A3(80℃) 97, 95 79, 69 66, 56 A4(90℃) 79, 71 76, 56 88, 82
(1) 写出该类问题的一般模型;
分析数据并作出结论, 即在什么情况下化工产品得率高。 解:(1)该问题是双因素重复试验模型。
(2)用软件对双因素重复试验方差分析,可得 方差分析: 实验结果 与 温度, 催化剂
因子 类型 水平数 值
温度 固定 4 A1(60℃), A2(70℃), A3(80℃), A4(90℃) 催化剂 固定 3 B1, B2, B3
双因子方差分析: C6 与 C5, C7
来源 自由度 SS MS F P C5 3 435.46 145.153 4.21 0.030 C7 2 611.08 305.542 8.87 0.004 交互作用 6 2912.92 485.486 14.09 0.000 误差 12 413.50 34.458 合计 23 4372.96
S = 5.870 R-Sq = 90.54% R-Sq(调整) = 81.88% 均值
温度 N 实验结果 A1(60℃) 6 65.000 A2(70℃) 6 76.833 A3(80℃) 6 77.000 A4(90℃) 6 75.333 催化剂 N 实验结果 B1 8 78.250 B2 8 76.750 B3 8 65.625
温度 催化剂 N 实验结果 A1(60℃) B1 2 62.000 A1(60℃) B2 2 70.500 A1(60℃) B3 2 62.500 A2(70℃) B1 2 80.000 A2(70℃) B2 2 96.500 A2(70℃) B3 2 54.000 A3(80℃) B1 2 96.000 A3(80℃) B2 2 74.000 A3(80℃) B3 2 61.000 A4(90℃) B1 2 75.000 A4(90℃) B2 2 66.000
A4(90℃) B3 2 85.000
此任务输出窗共分为三个部分,第一部分注明了各因素名称、水平数及水平值。第二部分为方差分析表,有P 值可知,温度与催化剂的共同作用对该结果影响最显著,第三部分为输出的相关因素不同水平对应的均值得出A2 ,B2交互作用时实验结果为96.5,最高。
即在70度催化剂B2时化工产品得率高。 5、(15分)某地区对某种消费品的销售量(y )进行调查,它与以下四个量有关:居民可支配的收入(x 1)、该类消费品的平均价格指数(x 2)、社会上该消费品的保有量(x 3)、其他消费品的平均价格指数(x 4)。数据见下表:
No. 1 2 3 4 5 6 7 8 9 10
y 8.4 9.6 10.4 11.4 12.2 14.2 15.8 17.9 19.6 20.8
x1 82.9 88.0 99.9 105.3 117.7 131. 148.2 161.8 174.2 184.7
x2 92.0 93.0 96.0 94.0 100.0 101.0 105.0 112.0 112.0 112.0
x3 17.1 21.3 25.1 29.0 34.0 40.0 44.0 49.0 51.0 53.0
x4 94.0 96.0 97.0 97.0 100.0 101.0 104.0 109.0 111.0 111.0
(1) 建立销售量与四个变量之间的标准化线性回归关系式。 (2) 对回归方程及各回归系数进行显著性检验。
解:利用minitab 软件对该例题进行回归分析,结果如下 回归分析:y 与 x1, x2, x3, x4
回归方程为
y = - 17.7 + 0.0901 x1 - 0.231 x2 + 0.0181 x3 + 0.421 x4
自变量 系数 系数标准误 T P 常量 -17.668 5.944 -2.97 0.031 x1 0.09006 0.02095 4.30 0.008 x2 -0.23132 0.07132 -3.24 0.023 x3 0.01806 0.03907 0.46 0.663 x4 0.4207 0.1185 3.55 0.016
S = 0.203715 R-Sq = 99.9% R-Sq(调整) = 99.8% 方差分析
来源 自由度 SS MS F P
回归 4 169.554 42.388 1021.41 0.000 残差误差 5 0.207 0.041 合计 9 169.761
来源 自由度 Seq SS x1 1 168.931 x2 1 0.020 x3 1 0.079 x4 1 0.523
(1)整理后得到多元回归模型为 Y = - 17.7 + 0.0901 x1 - 0.231 x2 + 0.0181 x3 + 0.421 x4
(2)由多元决定系数R 99. 9%且P 值很小,因此方程具有很好的线性,即该消费品的销售量与居民可支配的收入(x 1)、该类消费品的平均价格指数(x 2)、社会上该消费品的保有量(x 3)、其他消费品的平均价格指数(x 4)存在显著的线性关系,观察各变量的取值其中x1 ,x2 ,x4的P 值较0.5要小,因此这几个因素对销售量有显著线性影响,即对该销售品销售量影响大小依次为居民可支配的收入(x 1)|其他消费品的平均价格指数(x 4)、该类消费品的平均价格指数(x 2)、社会上该消费品的保有量(x 3)。
2