方差分析原理与最小二乘法及极大似然方法

1.4 方差分析原理与最小二乘法及极大似然方法

方差分析模型与线性回归模型从数学原理上可以统一到一个一般的模型, 即线性模型中去. 所谓线性模型, 是假定: 1) 响应变量(因变量)可以表示为”均值”+”误差”的形式; 2) 均值为未知参数的线性函数; 3)误差为零均值的正态分布(方差相同). 当得到n个独立的观测后, 其数学形式表示如下:

y=Xß+e(1.4.1)

其中y和e为n维列向量, 分别表示响应变量的观测值和误差; ß为k维参数向量(可能需要满足一定的线性约束条件); X为n×k维系数矩阵. e的各分量间相互独立, 各服从N(0,σ2)分布.

不难验证简单线性回归模型是线性模型, 其中参数向量ß=(β0,β1)T(无约束条件); 系数矩阵X有两列, 第一列全部为1, 第二列为自变量(条件变量)在试验点的值. 单因子方差分析模型也可以表示为线性模型(1.4.1). 可以有两种表示方法, 分别对应模型(1.1.1)和(1.1.5). 在模型(1.1.1)下, 观测值向量y可分为I个子向量,第i个子向量yi=(yi1,L,yini)T, 参数向量ß=(µ1,L,µI)T(无约束条件); 系数矩阵X有I列, 第i列中对应yi的行上的元素为1, 其余元素为0. 如果是模型(1.1.5), 则参数向量ß=(µ,α1L,αI)T(约束条件为∑i=1αi=0); 系数矩阵X有I+1列, 第1列上的元素都是1, 第i+1列中对应yi的行上的元素为1, 其余元素为0.对一般的线性模型(1.4.1), 基本的参数估计方法是最小二乘法. 定义

Q(ß)=(y−Xß)T(y−Xß)I

对Q(ß)关于ß求最小(当有线性约束时在约束下求最小), 就得到ß的最小二乘估计. 在简单线性回归模型中, 我们直接用最小二乘法得到参数估计. 不难验证,在单因子方差分析模型中的参数估计也是最小二乘估计. 简单的方法是在模型(1.1.1)下求(µ1,L,µI)T的最小二乘估计, 然后转化为(µ,α1L,αI)T的最小二乘估计. 如果直接从模型(1.1.5)求最小二乘估计, 由于参数有约束条件, 则算法要复杂一些(结果当然是一致的).

在线性模型中用最小二乘法求参数估计, 就等价于用极大似然法求参数估计.由误差的正态分布假定, 可以得到y的分布为Nn(Xß,σ2In). 似然函数(y的密度函数)为

L(ß)=f(y;ß)=11Texp{−(y−Xß)(y−Xß)}2n/22(2πσ)2σ

最大化L(ß)就等价于最小化(y−Xß)T(y−Xß). 这就证明了最小二乘法与极大似然法的等价性.

1.4 方差分析原理与最小二乘法及极大似然方法

方差分析模型与线性回归模型从数学原理上可以统一到一个一般的模型, 即线性模型中去. 所谓线性模型, 是假定: 1) 响应变量(因变量)可以表示为”均值”+”误差”的形式; 2) 均值为未知参数的线性函数; 3)误差为零均值的正态分布(方差相同). 当得到n个独立的观测后, 其数学形式表示如下:

y=Xß+e(1.4.1)

其中y和e为n维列向量, 分别表示响应变量的观测值和误差; ß为k维参数向量(可能需要满足一定的线性约束条件); X为n×k维系数矩阵. e的各分量间相互独立, 各服从N(0,σ2)分布.

不难验证简单线性回归模型是线性模型, 其中参数向量ß=(β0,β1)T(无约束条件); 系数矩阵X有两列, 第一列全部为1, 第二列为自变量(条件变量)在试验点的值. 单因子方差分析模型也可以表示为线性模型(1.4.1). 可以有两种表示方法, 分别对应模型(1.1.1)和(1.1.5). 在模型(1.1.1)下, 观测值向量y可分为I个子向量,第i个子向量yi=(yi1,L,yini)T, 参数向量ß=(µ1,L,µI)T(无约束条件); 系数矩阵X有I列, 第i列中对应yi的行上的元素为1, 其余元素为0. 如果是模型(1.1.5), 则参数向量ß=(µ,α1L,αI)T(约束条件为∑i=1αi=0); 系数矩阵X有I+1列, 第1列上的元素都是1, 第i+1列中对应yi的行上的元素为1, 其余元素为0.对一般的线性模型(1.4.1), 基本的参数估计方法是最小二乘法. 定义

Q(ß)=(y−Xß)T(y−Xß)I

对Q(ß)关于ß求最小(当有线性约束时在约束下求最小), 就得到ß的最小二乘估计. 在简单线性回归模型中, 我们直接用最小二乘法得到参数估计. 不难验证,在单因子方差分析模型中的参数估计也是最小二乘估计. 简单的方法是在模型(1.1.1)下求(µ1,L,µI)T的最小二乘估计, 然后转化为(µ,α1L,αI)T的最小二乘估计. 如果直接从模型(1.1.5)求最小二乘估计, 由于参数有约束条件, 则算法要复杂一些(结果当然是一致的).

在线性模型中用最小二乘法求参数估计, 就等价于用极大似然法求参数估计.由误差的正态分布假定, 可以得到y的分布为Nn(Xß,σ2In). 似然函数(y的密度函数)为

L(ß)=f(y;ß)=11Texp{−(y−Xß)(y−Xß)}2n/22(2πσ)2σ

最大化L(ß)就等价于最小化(y−Xß)T(y−Xß). 这就证明了最小二乘法与极大似然法的等价性.


相关文章

  • 正态分布的前世今生
  • 正态分布的前世今生(上) 神说,要有正态分布,就有了正态分布. 神看正态分布是好的,就让随机误差服从了正态分布. 创世纪-数理统计 1. 正态分布,熟悉的陌生人 学过基础统计学的同学大都对正态分布非常熟悉.这个钟形的分布曲线不但形状优雅,它 ...查看


  • 方差分析 线性回归
  • 1 线性回归 1.1 原理分析 要研究最大积雪深度x 与灌溉面积y 之间的关系,测试得到近10年的数据如下表: 使用线性回归的方法可以估计x 与y 之间的线性关系. 线性回归方程式: 对应的估计方程式为 线性回归完成的任务是,依据观测数据集 ...查看


  • 混合线性模型参数估计与检验研究
  • 山东理工大学 毕业设计(论文) 题 目: 学 院: 理学院 专 业: 统计学 学生姓名: 刘美倩 指导教师: 毕业设计(论文)时间:二ОО 九年 4 月 20 日- 6月21日 共 九 周 中文摘要 摘要 混合线性模型是一种既包含固定效应又 ...查看


  • 计量经济学总题库1
  • 第一章 导论 一.单项选择题 1.计量经济学是__________的一个分支学科. C A统计学 横截面数据是指__________.A A 同一时点上不同统计单位相同统计指标组成的数据 B 同一时点上相同统计单位相同统计指标组成的数据 C ...查看


  • 反馈干扰系统的自校正控制方法
  • 第22卷 第6期 2010年12月 海军工程大学学报 JO U RN A L OF NA V A L U NI VERSIT Y O F EN GIN EERIN G Vo l. 22 No. 6 Dec. 2010 DOI:10. 396 ...查看


  • 计量经济学考点整理
  • 第一章 计量经济学定义:统计学.经济理论和数学三者的结合.正经济学中,我们用数学的函数概念表达对经济变量间的关系的看法. 计量经济学模型建立的步骤:一.理论模型的设计 二.样本数据的收集 三.模型参数的估计 四.模型的检验 计量经济学模型成 ...查看


  • 回归分析的基本概念
  • 回归分析的基本概念 现实生活中的许多现象之间存在着相互依赖.相互制约的关系,这些关系在量上主要有两种类型: 1. 确定性关系,即我们所熟悉的变量之间的函数关系,如圆的半径R 与圆的面积S 之间就存在确定的函数关系: : 2. 非确定性关系, ...查看


  • 最小二乘法及其应用
  • 最小二乘法及其应用 摘要 最小二乘法是一种数学优化技术.它通过最小化误差的平方和寻找数据的最佳函数匹配.利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小.最小二乘法还可用于曲线拟合.其他一些优化问 ...查看


  • 计量经济学复习重点
  • 1 计量经济学复习重点 第一章 1. 计量经济学的性质 计量经济学是以经济理论和经济数据的事实为依据运用数学和统计学的方法 通过建立数学模型来研究经济数量关系和规律的一门经济学科. 研究的主体出发点.归宿.核心经济现象及数量变化规 ...查看


热门内容