稀疏编码最优化编码

稀疏编码最优化解法

稀疏编码最优化解法概述

稀疏编码的概念来自于神经生物学。生物学家提出,哺乳类动物在长期的进化中,生成了能够快速,准确,低代价地表示自然图像的视觉神经方面的能力。我们直观地可以想象,我们的眼睛每看到的一副画面都是上亿像素的,而每一副图像我们都只用很少的代价重建与存储。我们把它叫做稀疏编码,即Sparse Coding.

稀疏编码的目的是在大量的数据集中,选取很小部分作为元素来重建新的数据。 稀疏编码难点之一是其最优化目标函数的求解。

这篇文章先做一个概述,接着再分别讨论各个解法。

X为一个n为特征向量,可以是一个小波信号,可以是一副图片等。

D为标准化的基础矩阵,由组成元素的基本原子构成,也称为字典。在信号中可以是不同频率的波形,在图像中可以是构成图像的基本边,角。

X可以由D中和少量原子线性组合而成,及其表示系数为稀疏。如下:

数学模型

引出稀疏表示的两个基本要求,1是尽可能与原特征相似,2是系数为稀疏。

上式中,我们要求p>m,根据线性代数的知识我们知道,稀疏系数有无穷多组的解。根据稀疏的条件,我们可以在所有的可行解中挑出非零元素最少的解,也就是满足稀疏性。于是得到如下的数学模型:

如果再考虑噪声的话,就得到如下的模型:

目标函数中为零范数约束,是NP难题。

有人做了一个证明,在一定条件下,上述的最优化问题有唯一的解。

Terry tao又证明了,在满足一定条件下,零范数问题与一范数问题是等价的。于是上述模型转化为:

基于上面的思想,还有各种不同版本的数学模型。

常见模型

我们知道上式为非凸优化问题,常用的解法有:greedy algorithm,代表有Matching Pursuit, Orthogonal Matching Pursuit

上式为解不等式约束问题,常用的解法:LASSO

再写成拉格朗日乘子的形式,如果已知lambda,可用soft thresholding方法,常见的还有coordinate descent, Bregman Iteration等;

如果未知lambda,则用Homotopy.

MP算法与OMP算法

稀疏编码的一般最优化公式为:

其中的零范数为非凸优化。那么如何解这么一个非凸优化问题呢?其中一个常用的解法就是MP算法。

MP算法

MP算法是一种贪心算法(greedy),每次迭代选取与当前样本残差最接近的原子,直至残差满足一定条件。

求解方法

首先解决两个问题,怎么定义“最接近原子”,怎么计算残差?

选择最接近残差的原子:MP里定义用向量内积原子与残差的距离,我们用R表示残差,di表示原子,则:Max[Dist(R,di)]=max[];

残差更新:R=R-I;继续选择下一个,直至收敛;

需要注意的是,MP算法中要求字典原子||di||=1,上面的公式才成立。

我们用二维空间上的向量来表示,用如下的图来表述上面的过程:

上图中d1,d2,d3表示归一化的原子,红色向量r表示当前残差;

进过内积计算,最大,于是r分解为d3方向以及垂直于d3方向的两个向量(d3及r-d3),把d3方向的分量(d3)加入到已经求得的重构项中,那么绿色向量(r-d3)变为新的残差。

再一轮迭代得到如下:

R往d1方向投影分解,绿色向量成为新的残差。

具体算法:

收敛性

从上面的向量图我们可以清楚地看出,k+1的残差Rk+1是k步残差Rk的分量。根据直角三角形斜边大于直角边,|Rk+1|

注意事项:

1.上面也讲过,字典的原子是归一化的,也就是||di||=1,因为我们选取max时,如果di长度不统一,不能得出最好的投影。

2.如果我们的字典只有两个向量d1,d2,那么MP算法会在这两个向量间交叉迭代投影,也就是f=a1d1+a2d2+a3d1+a4d2+„..;也就是之前投影过的原子方向,之后还有可能投影。换句话说,MP的方向选择不是最优的,是次优的。

具体算法:

收敛性

从上面的向量图我们可以清楚地看出,k+1的残差Rk+1是k步残差Rk的分量。根据直角三角形斜边大于直角边,|Rk+1|

注意事项:

1.上面也讲过,字典的原子是归一化的,也就是||di||=1,因为我们选取max时,如果di长度不统一,不能得出最好的投影。

2.如果我们的字典只有两个向量d1,d2,那么MP算法会在这两个向量间交叉迭代投影,也就是f=a1d1+a2d2+a3d1+a4d2+„..;也就是之前投影过的原子方向,之后还有可能投影。换句话说,MP的方向选择不是最优的,是次优的。

如下图:

这也是其改进版本OMP要改进的地方。

OMP算法 ( smit正交化)

也就是正交的MP算法。

MP算法的次最优性来源其残差只与当前投影方向垂直,这样在接下来的投影中,很有可能会再次投影到原来的方向。

于是,在投影时,如果我们使得残差Rk+1与x1-xk+1的所有向量垂直,则可以克服这个问题,如下:

求解方法

假设我们已经得到了第k步的最优解:

我们要继续更新到第k+1步,目标是得到:

需要注意的是,我们下一步更新时,之前原子的系数

也要更新,否则不能满足约束。 于是我们需要求得如何更新之前原子系数 ,以及如何求得下一个投影方向 。

收敛性:

同样根据勾股定理,得到如下:

于是算法收敛。

具体步骤:

稀疏编码最优化解法

稀疏编码最优化解法概述

稀疏编码的概念来自于神经生物学。生物学家提出,哺乳类动物在长期的进化中,生成了能够快速,准确,低代价地表示自然图像的视觉神经方面的能力。我们直观地可以想象,我们的眼睛每看到的一副画面都是上亿像素的,而每一副图像我们都只用很少的代价重建与存储。我们把它叫做稀疏编码,即Sparse Coding.

稀疏编码的目的是在大量的数据集中,选取很小部分作为元素来重建新的数据。 稀疏编码难点之一是其最优化目标函数的求解。

这篇文章先做一个概述,接着再分别讨论各个解法。

X为一个n为特征向量,可以是一个小波信号,可以是一副图片等。

D为标准化的基础矩阵,由组成元素的基本原子构成,也称为字典。在信号中可以是不同频率的波形,在图像中可以是构成图像的基本边,角。

X可以由D中和少量原子线性组合而成,及其表示系数为稀疏。如下:

数学模型

引出稀疏表示的两个基本要求,1是尽可能与原特征相似,2是系数为稀疏。

上式中,我们要求p>m,根据线性代数的知识我们知道,稀疏系数有无穷多组的解。根据稀疏的条件,我们可以在所有的可行解中挑出非零元素最少的解,也就是满足稀疏性。于是得到如下的数学模型:

如果再考虑噪声的话,就得到如下的模型:

目标函数中为零范数约束,是NP难题。

有人做了一个证明,在一定条件下,上述的最优化问题有唯一的解。

Terry tao又证明了,在满足一定条件下,零范数问题与一范数问题是等价的。于是上述模型转化为:

基于上面的思想,还有各种不同版本的数学模型。

常见模型

我们知道上式为非凸优化问题,常用的解法有:greedy algorithm,代表有Matching Pursuit, Orthogonal Matching Pursuit

上式为解不等式约束问题,常用的解法:LASSO

再写成拉格朗日乘子的形式,如果已知lambda,可用soft thresholding方法,常见的还有coordinate descent, Bregman Iteration等;

如果未知lambda,则用Homotopy.

MP算法与OMP算法

稀疏编码的一般最优化公式为:

其中的零范数为非凸优化。那么如何解这么一个非凸优化问题呢?其中一个常用的解法就是MP算法。

MP算法

MP算法是一种贪心算法(greedy),每次迭代选取与当前样本残差最接近的原子,直至残差满足一定条件。

求解方法

首先解决两个问题,怎么定义“最接近原子”,怎么计算残差?

选择最接近残差的原子:MP里定义用向量内积原子与残差的距离,我们用R表示残差,di表示原子,则:Max[Dist(R,di)]=max[];

残差更新:R=R-I;继续选择下一个,直至收敛;

需要注意的是,MP算法中要求字典原子||di||=1,上面的公式才成立。

我们用二维空间上的向量来表示,用如下的图来表述上面的过程:

上图中d1,d2,d3表示归一化的原子,红色向量r表示当前残差;

进过内积计算,最大,于是r分解为d3方向以及垂直于d3方向的两个向量(d3及r-d3),把d3方向的分量(d3)加入到已经求得的重构项中,那么绿色向量(r-d3)变为新的残差。

再一轮迭代得到如下:

R往d1方向投影分解,绿色向量成为新的残差。

具体算法:

收敛性

从上面的向量图我们可以清楚地看出,k+1的残差Rk+1是k步残差Rk的分量。根据直角三角形斜边大于直角边,|Rk+1|

注意事项:

1.上面也讲过,字典的原子是归一化的,也就是||di||=1,因为我们选取max时,如果di长度不统一,不能得出最好的投影。

2.如果我们的字典只有两个向量d1,d2,那么MP算法会在这两个向量间交叉迭代投影,也就是f=a1d1+a2d2+a3d1+a4d2+„..;也就是之前投影过的原子方向,之后还有可能投影。换句话说,MP的方向选择不是最优的,是次优的。

具体算法:

收敛性

从上面的向量图我们可以清楚地看出,k+1的残差Rk+1是k步残差Rk的分量。根据直角三角形斜边大于直角边,|Rk+1|

注意事项:

1.上面也讲过,字典的原子是归一化的,也就是||di||=1,因为我们选取max时,如果di长度不统一,不能得出最好的投影。

2.如果我们的字典只有两个向量d1,d2,那么MP算法会在这两个向量间交叉迭代投影,也就是f=a1d1+a2d2+a3d1+a4d2+„..;也就是之前投影过的原子方向,之后还有可能投影。换句话说,MP的方向选择不是最优的,是次优的。

如下图:

这也是其改进版本OMP要改进的地方。

OMP算法 ( smit正交化)

也就是正交的MP算法。

MP算法的次最优性来源其残差只与当前投影方向垂直,这样在接下来的投影中,很有可能会再次投影到原来的方向。

于是,在投影时,如果我们使得残差Rk+1与x1-xk+1的所有向量垂直,则可以克服这个问题,如下:

求解方法

假设我们已经得到了第k步的最优解:

我们要继续更新到第k+1步,目标是得到:

需要注意的是,我们下一步更新时,之前原子的系数

也要更新,否则不能满足约束。 于是我们需要求得如何更新之前原子系数 ,以及如何求得下一个投影方向 。

收敛性:

同样根据勾股定理,得到如下:

于是算法收敛。

具体步骤:


相关文章

  • 压缩感知技术综述
  • 压缩感知技术综述 摘要:信号采样是模拟的物理世界通向数字的信息世界之必备手段.多年来,指导信号采样的理论基础一直是著名的Nyquist 采样定理,但其产生的大量数据造成了存储空间的浪费.压缩感知(Compressed Sensing )提出 ...查看


  • 基于稀疏编码的自然图像特征提取及去噪
  • • 1782 • 系 统 仿 真 学 报 V ol. 17 No. 7 JOURNAL OF SYSTEM SIMULATION July 2005 基于稀疏编码的自然图像特征提取及去噪 尚 丽1,2,郑春厚1,2 (1 中国科学院合肥分院 ...查看


  • 稀疏表示人脸识别的关键问题分析
  • V01.31 AprilNo.22014安徽工业大学学报(自然科学版)J.ofAnhuiUniversity第3l卷第2期2014年4月ofTechnology(NaturalScience) 文章编号:1671-7872(2014)02- ...查看


  • 贪婪算法与压缩感知理论
  • 第37卷第12期2011年12月 自动化学报 ACTA AUTOMATICA SINICA Vol. 37, No. 12December, 2011 贪婪算法与压缩感知理论 方红1 杨海蓉2 摘要贪婪算法以其重建速度快.重建方法实现简便的 ...查看


  • 压缩感知磁共振成像技术综述
  • -158-http://www.cjomp.com 压缩感知磁共振成像技术综述 王水花,张煜东 南京师范大学计算机科学与技术学院,江苏南京210023 [摘 要]目的:综述近年来压缩感知磁共振成像技术的研究进展.方法:磁共振成像是目前临床医 ...查看


  • 年11月电子与信息学报
  • 第31卷第11期 电 子 与 信 息 学 报 Vol.31No.11 2009年11月 Journal of Electronics & Information Technology Nov. 2009 基于复杂度特征的未知雷达辐射 ...查看


  • 稀疏编码算法概述
  • 第20卷 第1期 2009年3月 苏州市职业大学学报 Journal of Suzhou Vocational University Vol.20,No.1Mar. , 2009 稀疏编码算法概述 尚 丽查看


  • 现代设计方法 3
  • 第一章 1机械CAD支撑软件从功能上可分为哪三类?具体包括哪些软件? 答:机械CAD支撑软件从功能上可分三类:第一类解决几何图形设计问题: 第二类解决工程分析与计算问题: 第三类解决文档写作与生成问题. 具体包括:基本图形资源软件:二维绘图 ...查看


  • 自适应遗传算法的改进与应用
  • 第27卷第4期2006年7月 微计算机应用 MICROCOMPUIERAPPLICATIONS July.2006 Vol.27No.4 自适应遗传算法的改进与应用 史明霞1,2 陶林波1 沈建京1 (1信息工程大学理学院电子信息工程系 郑 ...查看


热门内容