支持向量机通俗解释

超级通俗的解释:

支持向量机是用来解决分类问题的。

先考虑最简单的情况,豌豆和米粒,用晒子很快可以分开,小颗粒漏下去,大颗粒保留。 用一个函数来表示就是当直径d大于某个值D,就判定为豌豆,小于某个值就是米粒。 d>D, 豌豆

d

在数轴上就是在d左边就是米粒,右边就是绿豆,这是一维的情况。

但是实际问题没这么简单,考虑的问题不单单是尺寸,一个花的两个品种,怎么分类? 假设决定他们分类的有两个属性,花瓣尺寸和颜色。单独用一个属性来分类,像刚才分米粒那样,就不行了。这个时候我们设置两个值 尺寸x和颜色y.

我们把所有的数据都丢到x-y平面上作为点,按道理如果只有这两个属性决定了两个品种,数据肯定会按两类聚集在这个二维平面上。

我们只要找到一条直线,把这两类划分开来,分类就很容易了,以后遇到一个数据,就丢进这个平面,看在直线的哪一边,就是哪一类。

比如x+y-2=0这条直线,我们把数据(x,y)代入,只要认为x+y-2>0的就是A类,x+y-2

以此类推,还有三维的,四维的,N维的 属性的分类,这样构造的也许就不是直线,而是平面,超平面。

一个三维的函数分类 :x+y+z-2=0,这就是个分类的平面了。

有时候,分类的那条线不一定是直线,还有可能是曲线,我们通过某些函数来转换,就可以转化成刚才的哪种多维的分类问题,这个就是核函数的思想。

例如:分类的函数是个圆形x^2+y^2-4=0。这个时候令x^2=a; y^2=b,还不就变成了a+b-4=0 这种直线问题了。

这就是支持向量机的思想。

机的意思就是 算法,机器学习领域里面常常用“机”这个字表示算法

支持向量意思就是 数据集种的某些点,位置比较特殊,比如刚才提到的x+y-2=0这条直线,直线上面区域x+y-2>0的全是A类,下面的x+y-2

所以就是 支持向量机 了。

超级通俗的解释:

支持向量机是用来解决分类问题的。

先考虑最简单的情况,豌豆和米粒,用晒子很快可以分开,小颗粒漏下去,大颗粒保留。 用一个函数来表示就是当直径d大于某个值D,就判定为豌豆,小于某个值就是米粒。 d>D, 豌豆

d

在数轴上就是在d左边就是米粒,右边就是绿豆,这是一维的情况。

但是实际问题没这么简单,考虑的问题不单单是尺寸,一个花的两个品种,怎么分类? 假设决定他们分类的有两个属性,花瓣尺寸和颜色。单独用一个属性来分类,像刚才分米粒那样,就不行了。这个时候我们设置两个值 尺寸x和颜色y.

我们把所有的数据都丢到x-y平面上作为点,按道理如果只有这两个属性决定了两个品种,数据肯定会按两类聚集在这个二维平面上。

我们只要找到一条直线,把这两类划分开来,分类就很容易了,以后遇到一个数据,就丢进这个平面,看在直线的哪一边,就是哪一类。

比如x+y-2=0这条直线,我们把数据(x,y)代入,只要认为x+y-2>0的就是A类,x+y-2

以此类推,还有三维的,四维的,N维的 属性的分类,这样构造的也许就不是直线,而是平面,超平面。

一个三维的函数分类 :x+y+z-2=0,这就是个分类的平面了。

有时候,分类的那条线不一定是直线,还有可能是曲线,我们通过某些函数来转换,就可以转化成刚才的哪种多维的分类问题,这个就是核函数的思想。

例如:分类的函数是个圆形x^2+y^2-4=0。这个时候令x^2=a; y^2=b,还不就变成了a+b-4=0 这种直线问题了。

这就是支持向量机的思想。

机的意思就是 算法,机器学习领域里面常常用“机”这个字表示算法

支持向量意思就是 数据集种的某些点,位置比较特殊,比如刚才提到的x+y-2=0这条直线,直线上面区域x+y-2>0的全是A类,下面的x+y-2

所以就是 支持向量机 了。


相关文章

  • 梯度通俗解释
  • 记得在高中做数学题时,经常要求曲线的切线.见到形如 管三七二十一直接求导得到,这就是切线的斜率,然后 就得到了处的切线. 之类的函数,不 上大学又学习了曲面切线和法向量的求法,求偏导是法向量,然后套公式求出切线. 一个经典例子如下: (来自 ...查看


  • 张量的基本概念(我觉得说的比较好,关键是通俗)
  • 简单的说:张量概念是矢量概念和矩阵概念的推广,标量是零阶张量,矢量是一阶张量,矩阵(方阵)是二阶张量,而三阶张量则好比立体矩阵,更高阶的张量用图形无法表达. 向量是在一个线性空间中定义的量,当这个线性空间的基变换时,向量的分量也跟着变换.而 ...查看


  • 数据挖掘十大经典算法
  • 数据挖掘十大经典算法 一. C4.5 C4.5算法是机器学习算法中的一种分类决策树算法, 其核心算法是ID3 算 法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用信息增 ...查看


  • 分类算法总结
  • 分类算法 数据挖掘中有很多领域,分类就是其中之一,什么是分类, 分类就是把一些新得数据项映射到给定类别的中的某一个类别,比如说当我们发表一篇文章的时候,就可以自动的把这篇文章划分到某一个文章类别,一般的过程是根据样本数据利用一定的分类算法得 ...查看


  • 小波变换之解读
  • 小波变换 完美通俗解读 这是<小波变换和motion信号处理>系列的第一篇基础普及.第二篇准备写深入小波的东西,第三讲解应用. 记得我还在大四的时候,在申请出国和保研中犹豫了好一阵,骨子里的保守最后让我选择了先保研.当然后来也退 ...查看


  • [平面向量]单元教学设计
  • <平面向量>单元教学设计 武都区两水中学 王斌 向量是近代数学中重要和基本的数学概念之一,有深刻的几何背景,是解决几何问题的有力工具.向量概念引入后,全等和平行(平移).相似.垂直.勾股定理就可转化为向量的加(减)法.数乘向量. ...查看


  • 空间曲线的主法向量方向的探讨
  • 2005年9月 陕西师范大学继续教育学报(西安) Sep. 2005 第22卷第3期Journal of Further Education of Shaanxi Normal University Vol. 22No. 3 空间曲线的主法 ...查看


  • 数据挖掘领域涉及的各种数学与统计学基础概念
  • 加权平均.算数平均: 解释: 例子: 学校算期末成绩,期中考试占30%,期末考试占50%,作业占20%,假如某人期中考试得了84,期末92,作业分91,如果是算数平均,那么就是(84+92+91)/3=89:加权后的,那么加权处理后就是84 ...查看


  • 目标取向和工作经验对绩效的效应
  • 心 理 学 报 2005, 37(1) :136~141 Acta Psychologica Sinica 目标取向和工作经验对绩效的效应* 金杨华 (浙江工商大学工商管理学院, 杭州310035) 摘 要 通过两个样本调查, 对目标取向和 ...查看


热门内容