统计学笔记|数理统计知识点概要(5)

假设检验收尾

分布拟合检验

单个分布的

拟合检验法

分布族的

拟合检验法

偏度,峰度检验法

假设检验问题的p值法

方差分析引入

单因素实验的方差分析(上)

基本概念

平方和的分解

小结

分布拟合检验

这又是另一个话题了,我们在之前做假设检验的时候,目标总是在讨论我们是否需要接受某一个参数为某一个值这样一个问题,在这基础上我们讨论了第Ⅰ类错误和第Ⅱ类错误。但是大前提是我们都是在假设它们是正态分布(虽然现实生活中这个假设也近似可以满足)!如果大前提也给你挖掉呢?

所以我们也就很明白了,分布拟合检验这个方法就是用来对付这种情况的。现实中,我们有的时候连总体的分布函数都不知道,这个时候使用这个方法,结合假设检验的思想,我们就能解决这个问题。

单个分布的

拟合检验法

这里的假设我们设置成这样:

(我们后面会把

的条件继续剥夺,再讨论)

下面我们来定义检验统计量

我们采用大数定律的思想。首先把

下的

可能取值的总体

分为互不相交的子集

,并且以

记录样本观察值

中落在

的个数。那么这样的话,我们就有了

次独立试验中事件

发生的频率

另一方面,我们根据我们的假设的分布,可以得到

发生的概率,并且假设为

。因此根据大数定律的思想,在n取得足够大的时候,我们有理由相信,只要

真的符合这个分布,那么频率与概率的值就不会差得太多。所以我们最后采用

这个统计量,很明显如果这个值越小,说明我们的假设越正确(如何定义“越正确”,就是显著性水平或置信水平的事情了)。

那么

是什么呢?为了让这个统计量能够有一些方便我们应用的性质,著名统计学家Pearson证明了:如果

,那么就会有以下的定理:

Theorem:Pearson

统计量

在n足够大的时候近似服从分布

这个证明超出了我们的范围,此略。

因此这个统计量

就是我们选取的检验统计量(请自己尝试着去化简原式)

下面我们讨论这个假设检验的拒绝域。之前我们讨论过,

不能太大,也就是说拒绝域的形式应该是

,而根据我们之前的对假设检验的讨论和这里

满足的分布,我们很容易得到

,这就是它的拒绝域。

这个方法我们叫

检验法。

这个方法也不是十全十美的,我们要求分组的时候需要满足

的限制,否则对于

的分组就需要进行合并,直到满足要求。

在实际生活中,我们的分组往往都是很显然的,因此不需要太担心如何分组的问题。

这个部分具体可以详见Pearson's chi-squared test

我们举一个书上的例子。

Example:

我们现在研究牛的毛色和牛角的有无,两对独立的性状。使用黑色无角牛与红色有角牛进行杂交,得到黑色五角牛192头,黑色有角牛78头,红色无角牛72头,红色有角牛18头。问我们可不可以认为这两对性状是否满足

的杂交比例(置信性水平为0.1)。

这个问题的类显然别人已经帮你分好了:四种牛的性状,我们列举如下:

同样的我们的假设自然就是

的比例。它的分布律是

那么我们把各类的数据整理一下,可以得到这一个表

因为这个是四类,所以服从的分布自由度为3。我们现在得到了和为363.37,所以我们的

,又

。所以我们可以认为假设正确。

分布族的

拟合检验

我们这里进一步深化,在上一个问题中,我们的分布函数

(请注意我们说的是累积分布函数)是没有未知参数的。但是生活中,有的时候你并不知道分布函数,也不知道参数。这个时候我们的分布函数就要变成

,其中

是一系列未知参数。

不过我们的做法实际上是没有太大变化的,我们对于未知参数先使用MLE(极大似然估计法),利用样本得到它们的估计值,然后进行并组处理(因为有的组可能并不满足我们的要求,需要合并),再构造相似的统计量

(这里

是通过MLE得到的估计量),同样有点变化的是,这个统计量服从的分布变为了

(因为多了r个未知参数,要多r个方程限制,所以自由度就少了r个,当然这是感性上的理解),所以拒绝域也就变成了

由于方法几乎相同,这里就不再给出例子了。很多人容易犯的一个错误是:在判断最后,做出决策是接受假设

时,认为服从的就是那个给定估计参数的分布。这是不对的,MLE只是给出了概率最大的那个,但是实际上这个分布的参数到底是什么我们并不清楚,因此武断的断言那个函数的参数就是我们通过MLE得到的参数是不科学的。因此我们只能认为这个分布确实符合我们在假设

中给定的概率分布,并且认为存在一系列参数,它符合我们的样本。

偏度,峰度检验

这一部分的内容书本上是有标记的,我们老师也跳过了这个部分,但是R中是存在这一方面的函数的,因此我们简单的介绍一下,如果不需要的可以跳过这一部分。

出现这种检验的原因是:根据CLT,正态分布毫无疑问是实际生活中最广泛存在的一种分布,在刚才的

检验中,统计学家发现,这种方法在检验正态分布的时候,犯第Ⅱ类错误的概率较大。因此科学家就又想出了这一种检验方法,专门对付正态分布。

偏度和峰度指的是X的标准化变量的三阶和四阶矩。具体来说就是

,并且当

服从正态分布的时候,

(这一部分是概率论的内容,不懂的可以翻翻书)

回到样本,我们设

为来自总体

的样本,那么

的矩估计量为

,其中

为样本

阶中心矩,并且分别称

为样本偏度和样本峰度。

关于

,当n充分大的时候,有这样的两个结论:

(当然,是近似意义下的)

对这两个变量做标准化

(其中

因为

依概率收敛为

,所以直观来看,

的观察值

不应该过大(我这里跳过了一步,请大家自己补上)。那么根据这个讨论与假设检验的原本思路,我们容易得到拒绝域的形式为

,并且为了防止犯第Ⅰ类错误,我们根据习惯规定

(我们在前面几节对于这一个问题的逻辑解释得很清楚,如果还有点迷糊的话翻一翻前两节的笔记)。由于在假设

下,它们服从正态分布,因此我们可以得到

,也就是说

在实际的例子中,思路并不难懂,有的时候却不会算,这里为了方便计算,给出样本原点矩与中心矩的关系式:

还有一种有趣的检验方法叫做秩和检验,秩和检验虽然有效,但是它的前提条件有的时候并不能很好的得到满足。所以在实际生活中我们也并不是特别多的会涉及到它。因此我们这里不再提供这方面的解释,感兴趣的可以参考Mann-Whitney U test

假设检验问题的临界值法

临界值又称p值,我们直接给出它的定义,大家就明白它是什么了。

Definition:p-value

由检验统计量的样本观察值得出的原假设可被拒绝的最小显著性水平被称为假设检验问题的p值。

这里我们举个例子,在一个正态分布的概率函数中,我们做右边检验的时候得到了枢纽量根据样本的值

(并且为了方便起见,我们假设

),那么我们现在根据这个值计算

,这个值的结果就是

,也就是p值。

想像一下,如果p值比显著性水平

小,那么就说明我们的

已经比我们的

要大了(因为

增大,

减小,也就是

会减小,所以原来的

比我们的

大),所以根据右边检验的拒绝域,这个值应该让我们做出拒绝

的决策。

实际上我们根据p值和显著性水平

,很容易得到

p值

,那么在显著性水平

下拒绝

p值

,那么接受

事实上p值的规定在不同的假设检验问题中也有不同的定义,但是我这里不详细说的原因是:我们只需要看到的是p值的大小。而这些可以让R告诉我们。从另一方面也说明了,p值表示评价反对原假设的依据的强度。p越小,越显著。

到此,假设检验的概述算是告一段落了。

方差分析

方差分析可以认为是假设检验的一种应用。

从wikipedia抄下来的定义如下

Definition:ANOVA Analysis of variance (ANOVA) is a collection ofstatistical models used to analyze the differences among group means and their associated procedures (such as 'variation' among and between groups), developed bystatistician andevolutionary biologistRonald Fisher. In the ANOVA setting, the observedvariance in a particular variable is partitioned into components attributable to different sources of variation. In its simplest form, ANOVA provides astatistical test of whether or not themeans of several groups are equal, and therefore generalizes the t-test to more than two groups. ANOVAs are useful for comparing (testing) three or more means (groups or variables) forstatistical significance. It is conceptually similar tomultiple two-sample t-tests, but is more conservative (results in lesstype I error)[citation needed] and is therefore suited to a wide range of practical problems. 方差分析是一系列被用来分析组均值和他们的相关过程(比如在组内,组间过程中出现的误差)的统计模型,被统计学家和进化生物学家R.Fisher发展起来。在方差分析中,一个特定的变量,它的观察到的误差会被分割为不同部分的元素,每一部分用来解释一种来源的方差。在它的最简单的形式中,方差分析提供一种“几组的均值是否相等”的统计检验,因此也将t检验推广到了多于两组的情况。方差分析在比较三组及以上的均值的统计显著性上非常有用。它在概念上与多元双样本t检验相似,但更加保守(更少犯第Ⅰ类错误),因此也更加适合于解决大范围数据量的实际问题。

我们简要的对方差分析开个头。

单因素试验的方差分析(上)

基本概念引入

首先我们需要给出几个定义。

我们在之前的统计推断问题中,经常需要围绕分布,或者分布里的某些参数去做文章。在这里我们把它具象,称它为指标。考察的指标我们一般叫试验指标,影响它的条件称为因素。因素我们一般认为是可控因素(也就是说我们的问题一般不考虑不可抗力)。因素所处的状态称为水平,如果一项试验过程中只有一个因素在改变,我们称为单因素试验,多于一个就称为多因素试验。

拿书上的一个问题举个例子。比如说,生产一个铝合金板,我们要判断三种生产的机器在生产铝合金板的厚度上是否有差异。为此我们做了十组独立的试验。这个时候,试验指标就是薄板厚度,机器为因素,不同的三台机器为不同的水平。在它的定义中也说了,这种试验,如果我们要做假设检验,那么假设就是它们的均值(铝合金板的厚度)相等。如果在给定的显著性水平下,我们拒绝了这个假设,就说明这个因素影响了这个指标(且影响显著)。

下面我们开始讨论单因素试验的方差分析。我们要注意的是,它的公式不再是之前的老陈菜了,而且新来的变换和公式也略有复杂,所以……认真看吧。

我们首先假设一个因素

有s个水平

,我们在水平

下进行

次独立试验,就会得到下表的结果

为了方便理解,我们就认为每个水平是一台机器,那么相当于s台机器在互相比较。

显然,单因素试验的方差分析就是为了分析出每一个水平它对应的指标是否有变化。也就是说,我们的检验的假设是

同样的,用来做比较的机器,除了指标层面,其余的误差都应该差不多(实际生活中,毕竟都是一个模子刻出来的),所以我们假设它们每一个水平下的多次独立试验都具有相同方差

。均值则分别为

。并且认为不同水平相互独立,服从分布

,显然,这些参数都是未知的。

注意到,

,所以我们将这个数字记为

,表示随机误差的意思。这样的话,模型就变成了

我们继续探索。因为我们的很重要的一个问题是解决这个假设检验的问题。所以我们需要修改一下我们的式子,让这个问题有办法去解决。

首先我们记下总平均

,然后我们再引入

,这个时候就有

表示总均值与这个水平

下的均值的差异,我们称它为效应。也就是说,假如有s台机器,那么可能在样本检验的过程中,某一台机器的打出来的铝合金板的厚度都高那么一点点,那么它就为增长平均值作出了贡献。也就是说它有一定的正效应。(就和拉高班平均,拉低智商是一个理解)

这样的话,模型就变成了

,假设也就变成了

到这里之后呢?怎么办呢?

平方和的分解

这里必须要佩服一下那些statistician们……因为它们发现了平方和的分解这一有趣的性质。

引入总偏差平方和

,其中

显然,它考虑了所有因素的平方和,因此也称它为总变差。

我们深入到每一个具体的水平下。我们记

,我们在之后可以看到这是一个过渡式。

然后我们将

写成这样的形式

我们注意到

(中括号的一项是0,我相信你们能看出来)

所以我们就把这个平方和分解成了两个独立的平方和,满足

并且为了区分,我们设

可以看出,

强调的是个体与水平均值之间的误差,强调的是个体误差,而

则强调的是水平误差。所以它们的名字也不一样,

称为误差平方和,

为效应平方和。

虽然我们已经有了这个优美的等式,但是我们之后还需要导出一些有趣的东西,不过篇幅够了,我觉得可以留到下一节啦~~

小结

戛然而止的感觉怎么样2333?因为方差分析的原理和推导过程都比较复杂,是一种全新的思想。所以这里给大家先引入一下啦,然后在下一节的时候我们会继续说这些内容,将单因素和双因素下的方差分析结合在一起去说,会很有趣的吧……

在下一节中我们会结束方差分析的内容,如果可以的话,或许还会引入一下回归分析。

持续感谢大家的关注~~我会尽力让文章能够有自己的思路,并且易于被大家接受~

————————————————广告———————————————————————

假设检验收尾

分布拟合检验

单个分布的

拟合检验法

分布族的

拟合检验法

偏度,峰度检验法

假设检验问题的p值法

方差分析引入

单因素实验的方差分析(上)

基本概念

平方和的分解

小结

分布拟合检验

这又是另一个话题了,我们在之前做假设检验的时候,目标总是在讨论我们是否需要接受某一个参数为某一个值这样一个问题,在这基础上我们讨论了第Ⅰ类错误和第Ⅱ类错误。但是大前提是我们都是在假设它们是正态分布(虽然现实生活中这个假设也近似可以满足)!如果大前提也给你挖掉呢?

所以我们也就很明白了,分布拟合检验这个方法就是用来对付这种情况的。现实中,我们有的时候连总体的分布函数都不知道,这个时候使用这个方法,结合假设检验的思想,我们就能解决这个问题。

单个分布的

拟合检验法

这里的假设我们设置成这样:

(我们后面会把

的条件继续剥夺,再讨论)

下面我们来定义检验统计量

我们采用大数定律的思想。首先把

下的

可能取值的总体

分为互不相交的子集

,并且以

记录样本观察值

中落在

的个数。那么这样的话,我们就有了

次独立试验中事件

发生的频率

另一方面,我们根据我们的假设的分布,可以得到

发生的概率,并且假设为

。因此根据大数定律的思想,在n取得足够大的时候,我们有理由相信,只要

真的符合这个分布,那么频率与概率的值就不会差得太多。所以我们最后采用

这个统计量,很明显如果这个值越小,说明我们的假设越正确(如何定义“越正确”,就是显著性水平或置信水平的事情了)。

那么

是什么呢?为了让这个统计量能够有一些方便我们应用的性质,著名统计学家Pearson证明了:如果

,那么就会有以下的定理:

Theorem:Pearson

统计量

在n足够大的时候近似服从分布

这个证明超出了我们的范围,此略。

因此这个统计量

就是我们选取的检验统计量(请自己尝试着去化简原式)

下面我们讨论这个假设检验的拒绝域。之前我们讨论过,

不能太大,也就是说拒绝域的形式应该是

,而根据我们之前的对假设检验的讨论和这里

满足的分布,我们很容易得到

,这就是它的拒绝域。

这个方法我们叫

检验法。

这个方法也不是十全十美的,我们要求分组的时候需要满足

的限制,否则对于

的分组就需要进行合并,直到满足要求。

在实际生活中,我们的分组往往都是很显然的,因此不需要太担心如何分组的问题。

这个部分具体可以详见Pearson's chi-squared test

我们举一个书上的例子。

Example:

我们现在研究牛的毛色和牛角的有无,两对独立的性状。使用黑色无角牛与红色有角牛进行杂交,得到黑色五角牛192头,黑色有角牛78头,红色无角牛72头,红色有角牛18头。问我们可不可以认为这两对性状是否满足

的杂交比例(置信性水平为0.1)。

这个问题的类显然别人已经帮你分好了:四种牛的性状,我们列举如下:

同样的我们的假设自然就是

的比例。它的分布律是

那么我们把各类的数据整理一下,可以得到这一个表

因为这个是四类,所以服从的分布自由度为3。我们现在得到了和为363.37,所以我们的

,又

。所以我们可以认为假设正确。

分布族的

拟合检验

我们这里进一步深化,在上一个问题中,我们的分布函数

(请注意我们说的是累积分布函数)是没有未知参数的。但是生活中,有的时候你并不知道分布函数,也不知道参数。这个时候我们的分布函数就要变成

,其中

是一系列未知参数。

不过我们的做法实际上是没有太大变化的,我们对于未知参数先使用MLE(极大似然估计法),利用样本得到它们的估计值,然后进行并组处理(因为有的组可能并不满足我们的要求,需要合并),再构造相似的统计量

(这里

是通过MLE得到的估计量),同样有点变化的是,这个统计量服从的分布变为了

(因为多了r个未知参数,要多r个方程限制,所以自由度就少了r个,当然这是感性上的理解),所以拒绝域也就变成了

由于方法几乎相同,这里就不再给出例子了。很多人容易犯的一个错误是:在判断最后,做出决策是接受假设

时,认为服从的就是那个给定估计参数的分布。这是不对的,MLE只是给出了概率最大的那个,但是实际上这个分布的参数到底是什么我们并不清楚,因此武断的断言那个函数的参数就是我们通过MLE得到的参数是不科学的。因此我们只能认为这个分布确实符合我们在假设

中给定的概率分布,并且认为存在一系列参数,它符合我们的样本。

偏度,峰度检验

这一部分的内容书本上是有标记的,我们老师也跳过了这个部分,但是R中是存在这一方面的函数的,因此我们简单的介绍一下,如果不需要的可以跳过这一部分。

出现这种检验的原因是:根据CLT,正态分布毫无疑问是实际生活中最广泛存在的一种分布,在刚才的

检验中,统计学家发现,这种方法在检验正态分布的时候,犯第Ⅱ类错误的概率较大。因此科学家就又想出了这一种检验方法,专门对付正态分布。

偏度和峰度指的是X的标准化变量的三阶和四阶矩。具体来说就是

,并且当

服从正态分布的时候,

(这一部分是概率论的内容,不懂的可以翻翻书)

回到样本,我们设

为来自总体

的样本,那么

的矩估计量为

,其中

为样本

阶中心矩,并且分别称

为样本偏度和样本峰度。

关于

,当n充分大的时候,有这样的两个结论:

(当然,是近似意义下的)

对这两个变量做标准化

(其中

因为

依概率收敛为

,所以直观来看,

的观察值

不应该过大(我这里跳过了一步,请大家自己补上)。那么根据这个讨论与假设检验的原本思路,我们容易得到拒绝域的形式为

,并且为了防止犯第Ⅰ类错误,我们根据习惯规定

(我们在前面几节对于这一个问题的逻辑解释得很清楚,如果还有点迷糊的话翻一翻前两节的笔记)。由于在假设

下,它们服从正态分布,因此我们可以得到

,也就是说

在实际的例子中,思路并不难懂,有的时候却不会算,这里为了方便计算,给出样本原点矩与中心矩的关系式:

还有一种有趣的检验方法叫做秩和检验,秩和检验虽然有效,但是它的前提条件有的时候并不能很好的得到满足。所以在实际生活中我们也并不是特别多的会涉及到它。因此我们这里不再提供这方面的解释,感兴趣的可以参考Mann-Whitney U test

假设检验问题的临界值法

临界值又称p值,我们直接给出它的定义,大家就明白它是什么了。

Definition:p-value

由检验统计量的样本观察值得出的原假设可被拒绝的最小显著性水平被称为假设检验问题的p值。

这里我们举个例子,在一个正态分布的概率函数中,我们做右边检验的时候得到了枢纽量根据样本的值

(并且为了方便起见,我们假设

),那么我们现在根据这个值计算

,这个值的结果就是

,也就是p值。

想像一下,如果p值比显著性水平

小,那么就说明我们的

已经比我们的

要大了(因为

增大,

减小,也就是

会减小,所以原来的

比我们的

大),所以根据右边检验的拒绝域,这个值应该让我们做出拒绝

的决策。

实际上我们根据p值和显著性水平

,很容易得到

p值

,那么在显著性水平

下拒绝

p值

,那么接受

事实上p值的规定在不同的假设检验问题中也有不同的定义,但是我这里不详细说的原因是:我们只需要看到的是p值的大小。而这些可以让R告诉我们。从另一方面也说明了,p值表示评价反对原假设的依据的强度。p越小,越显著。

到此,假设检验的概述算是告一段落了。

方差分析

方差分析可以认为是假设检验的一种应用。

从wikipedia抄下来的定义如下

Definition:ANOVA Analysis of variance (ANOVA) is a collection ofstatistical models used to analyze the differences among group means and their associated procedures (such as 'variation' among and between groups), developed bystatistician andevolutionary biologistRonald Fisher. In the ANOVA setting, the observedvariance in a particular variable is partitioned into components attributable to different sources of variation. In its simplest form, ANOVA provides astatistical test of whether or not themeans of several groups are equal, and therefore generalizes the t-test to more than two groups. ANOVAs are useful for comparing (testing) three or more means (groups or variables) forstatistical significance. It is conceptually similar tomultiple two-sample t-tests, but is more conservative (results in lesstype I error)[citation needed] and is therefore suited to a wide range of practical problems. 方差分析是一系列被用来分析组均值和他们的相关过程(比如在组内,组间过程中出现的误差)的统计模型,被统计学家和进化生物学家R.Fisher发展起来。在方差分析中,一个特定的变量,它的观察到的误差会被分割为不同部分的元素,每一部分用来解释一种来源的方差。在它的最简单的形式中,方差分析提供一种“几组的均值是否相等”的统计检验,因此也将t检验推广到了多于两组的情况。方差分析在比较三组及以上的均值的统计显著性上非常有用。它在概念上与多元双样本t检验相似,但更加保守(更少犯第Ⅰ类错误),因此也更加适合于解决大范围数据量的实际问题。

我们简要的对方差分析开个头。

单因素试验的方差分析(上)

基本概念引入

首先我们需要给出几个定义。

我们在之前的统计推断问题中,经常需要围绕分布,或者分布里的某些参数去做文章。在这里我们把它具象,称它为指标。考察的指标我们一般叫试验指标,影响它的条件称为因素。因素我们一般认为是可控因素(也就是说我们的问题一般不考虑不可抗力)。因素所处的状态称为水平,如果一项试验过程中只有一个因素在改变,我们称为单因素试验,多于一个就称为多因素试验。

拿书上的一个问题举个例子。比如说,生产一个铝合金板,我们要判断三种生产的机器在生产铝合金板的厚度上是否有差异。为此我们做了十组独立的试验。这个时候,试验指标就是薄板厚度,机器为因素,不同的三台机器为不同的水平。在它的定义中也说了,这种试验,如果我们要做假设检验,那么假设就是它们的均值(铝合金板的厚度)相等。如果在给定的显著性水平下,我们拒绝了这个假设,就说明这个因素影响了这个指标(且影响显著)。

下面我们开始讨论单因素试验的方差分析。我们要注意的是,它的公式不再是之前的老陈菜了,而且新来的变换和公式也略有复杂,所以……认真看吧。

我们首先假设一个因素

有s个水平

,我们在水平

下进行

次独立试验,就会得到下表的结果

为了方便理解,我们就认为每个水平是一台机器,那么相当于s台机器在互相比较。

显然,单因素试验的方差分析就是为了分析出每一个水平它对应的指标是否有变化。也就是说,我们的检验的假设是

同样的,用来做比较的机器,除了指标层面,其余的误差都应该差不多(实际生活中,毕竟都是一个模子刻出来的),所以我们假设它们每一个水平下的多次独立试验都具有相同方差

。均值则分别为

。并且认为不同水平相互独立,服从分布

,显然,这些参数都是未知的。

注意到,

,所以我们将这个数字记为

,表示随机误差的意思。这样的话,模型就变成了

我们继续探索。因为我们的很重要的一个问题是解决这个假设检验的问题。所以我们需要修改一下我们的式子,让这个问题有办法去解决。

首先我们记下总平均

,然后我们再引入

,这个时候就有

表示总均值与这个水平

下的均值的差异,我们称它为效应。也就是说,假如有s台机器,那么可能在样本检验的过程中,某一台机器的打出来的铝合金板的厚度都高那么一点点,那么它就为增长平均值作出了贡献。也就是说它有一定的正效应。(就和拉高班平均,拉低智商是一个理解)

这样的话,模型就变成了

,假设也就变成了

到这里之后呢?怎么办呢?

平方和的分解

这里必须要佩服一下那些statistician们……因为它们发现了平方和的分解这一有趣的性质。

引入总偏差平方和

,其中

显然,它考虑了所有因素的平方和,因此也称它为总变差。

我们深入到每一个具体的水平下。我们记

,我们在之后可以看到这是一个过渡式。

然后我们将

写成这样的形式

我们注意到

(中括号的一项是0,我相信你们能看出来)

所以我们就把这个平方和分解成了两个独立的平方和,满足

并且为了区分,我们设

可以看出,

强调的是个体与水平均值之间的误差,强调的是个体误差,而

则强调的是水平误差。所以它们的名字也不一样,

称为误差平方和,

为效应平方和。

虽然我们已经有了这个优美的等式,但是我们之后还需要导出一些有趣的东西,不过篇幅够了,我觉得可以留到下一节啦~~

小结

戛然而止的感觉怎么样2333?因为方差分析的原理和推导过程都比较复杂,是一种全新的思想。所以这里给大家先引入一下啦,然后在下一节的时候我们会继续说这些内容,将单因素和双因素下的方差分析结合在一起去说,会很有趣的吧……

在下一节中我们会结束方差分析的内容,如果可以的话,或许还会引入一下回归分析。

持续感谢大家的关注~~我会尽力让文章能够有自己的思路,并且易于被大家接受~

————————————————广告———————————————————————


相关文章

  • 系统概要设计说明书(数据库设计书)
  • [招生管理系统] 概要设计说明书 [V1.0(版本号)] 拟 制 人______________________ 审 核 人______________________ 批 准 人______________________ [二零零八年十 ...查看


  • 项目技术评审制度
  • 技 术 评 审 制 度 编制: 审核: 批准: 1. 目 的 技术评审是对项目交付件的系统检查,目的是尽可能早地发现交付件中的缺陷并提出必要的修改意见,使项目组和相关共利益者对阶段性的交付件取得一致意见,并进行确认. 通过技术评审可以尽早发 ...查看


  • 医药连锁店管理系统规划概要
  • 医药连锁店管理系统规划概要 1 基本需求分析 通过调查,要求系统需要有以下功能: ❑ ❑ 由于操作人员的计算机知识普遍较差,要求有良好的人机界面. ❑ ❑ 由于该系统的使用对象多,要求有较好的权限管理. ❑ ❑ 方便的数据查询,满足顾客快速 ...查看


  • 浙大植物学小白的转录组笔记
  • 转录组入门(1):计算机及软件安装 作业要求 最好是有mac或者linux系统,8G 的内存,500G的存储即可.需要安装的软件包括 sratoolkit,fastqc,hisats,samtools,htseq-count,R,Rstud ...查看


  • 5物流部仓库管理流程
  • 贵州康星油脂(集团)有限公司 物流部仓库管理流程 一.目的 为规范物流部原料.成品.辅料的出入管理,使原料从生产加工.成品入库.出库一个规范的程序,及 有相对准确的衔接,特制订本流程. 二.范围 适用于物流部相关部门. 三.物流部总体职责 ...查看


  • 学生社团管理系统
  • [学生社团管理系统] 概要设计说明书 [V1.0(版本号)] 拟 制 人________ 审 核 人______________________ 批 准 人______________________ [二零一一年七月一日] 概要设计说明书 ...查看


  • [行政职业能力基础]教学大纲
  • <行政职业能力基础>课程教学大纲 [课程编号] [学分数] 3 [学时数] 36 [课程类别] 专业必修课 [适用专业] 语文教育 [编写日期] 2011-1-24 一.课程教学目标 1.知识与过程 2.技能与方法 3.情感态度 ...查看


  • 工作岗位职责怎么写(共6篇)
  • 篇一:岗位职责 车间主任岗位职责 1服从领导调度和安排,及时传达公司.部门的会议精神并监督执行. 2负责本车间生产环境.安全的检查.督促和改进工作,对出现的人身.设备事故负责. 3负责跟踪本车间工艺的实施跟踪工作,如有出现影响产品的情况要报 ...查看


  • 新产品研发流程
  • 新产品研发流程 研发中心新产品开发一共有18过程,有16关键点. 每个过程都有开始条件.工作程序.标准规范.结束事件.工作程序,标准规范请参照公司文件及指标,过程的结束事件即为关键点. ※关键点1:新产品开发输入资料评审 评审时检验资料:& ...查看


热门内容