0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

支持向量机的分类思想

lviY_AI_shequ 来源:未知 作者:李倩 2018-11-23 08:58 次阅读

前言

支持向量机是一种经典的机器学习算法,在小样本数据集的情况下有非常广的应用,我觉得,不懂支持向量机不算是入门机器学习。本篇循序渐进的讲解了支持向量机的分类思想,希望对您有帮助。

目录

1. 函数间隔和几何间隔

2. 支持向量机的分类思想

3. 总结

1. 函数间隔和几何间隔

为了能够更好的阐述支持向量机的分类思想,需要理解函数间隔和几何间隔的定义。

1. 点到超平面的距离

假设超平面方程:

到平面的距离:

由上式可得:没有分类信息,而函数间隔和几何间隔不仅包含了距离信息,还包含了分类信息。

2. 函数间隔和几何间隔

对于给定的训练数据集T,正样本和负样本分别为+1和-1,我们对式(1.1)稍微进行了修改:

(1). 点到平面的距离不作规范化处理,得:

(2). 去掉绝对值符号,并乘以标记结果y0,得:

d2表达式就是函数间隔的定义,有两层含义:大小表示点P0到超平面的距离,正负表示点P0是否正确分类,若d<0,分类错误;反之,则分类正确。

因此,我们定义点到超平面的函数间隔为:

接着定义训练数据集T的函数间隔是所有样本点(xi,yi)的函数间隔的最小值,即:

其中,

但是,若成比例的增加超平面参数w和b,超平面没有改变,但是函数间隔却成比例的增加了,这是不符合理论的,因此,需要对函数间隔进行规范化,得:

(1.7)式就是几何间隔的定义,几何间隔的值是确定的。

2. 支持向量机的分类思想

1. 感知机和logistic回归的分类思想

感知机的损失函数为所有误分类点到超平面的距离之和:

无误分类点时,损失函数为0,满足模型分类条件的超平面有无数个,如下图:

初始超平面为l1,误分类点为红色框,最小化式(2.1)有无穷多个满足损失函数为0的超平面,如上图的l2~ln,然而,最佳分类超平面只有一个,即支持向量机所对应的超平面。

假设logistic回归的模型是,logistic回归的损失函数:

简单分析(2.2)式的分类思想:

(1).当yi=1时,损失函数简化为:

若要使损失函数越小越好,则xi的值越大越好,如下图:

图2.1

往箭头方向移动时,损失函数逐渐变小。

(2). 当yi=0时,损失函数简化为:

若要使损失函数越小越好,则xi的值越小越好,如下图:

当往箭头方向移动时,损失函数逐渐变小。

2. 支持向量机的分类思想

支持向量机结合了感知机和logistic回归分类思想,假设训练样本点(xi,yi)到超平面H的几何间隔为γ(γ>0),由上节定义可知,几何间隔是点到超平面最短的距离,如下图的红色直线:

用logisitic回归模型分析几何间隔:

因此,当γ越大时,损失函数越小,结果为正样本的概率也越大。

因此,感知机的分类思想是最大化点到超平面的几何间隔,这个问题可以表示为下面的约束最优化问题:

根据几何间隔和函数间隔的关系,得几何间隔的约束最优化问题:

函数间隔是样本点到超平面的最短距离,因此,令函数间隔为常数1,那么其他样本点到超平面的距离都大于1,且最大化和最小化是等价的。于是就得到下面的最优化问题:

由(2.8)式和(2.9)式,解得最优解w*,b*,易知最优超平面到正负样本的几何间隔相等(请理解几何间隔的含义,然后仔细回想整个分类过程,就会得到这个结论)。

3. 总结

本文结合了感知机和logistic回归的分类思想来推导支持向量机的最优化问题,即最大间隔分离超平面。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    3866

    浏览量

    61308
  • 机器学习
    +关注

    关注

    66

    文章

    8116

    浏览量

    130550

原文标题:支持向量机(一):支持向量机的分类思想

文章出处:【微信号:AI_shequ,微信公众号:人工智能爱好者社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于支持向量分类问题

    小菜鸟一枚 ,有哪位大神能提供部分基于支持向量积的分类鉴别问题的MATLAB编码,思路过程,不胜感激
    发表于 04-03 18:54

    支持向量——机器学习中的杀手级武器!

    检测的特征描述子。如今,HOG特征结合SVM分类器已经被广泛应用于图像识别中,尤其是在行人检测中,获得了极大的成功。支持向量 VS 深度学习SVM和深度学习(DeepLearning
    发表于 08-24 09:40

    如何用支持向量分类器识别手写字体

    sklearn实例-用支持向量分类器(SVC)识别手写字体
    发表于 06-11 17:02

    介绍支持向量与决策树集成等模型的应用

    本文主要介绍支持向量、k近邻、朴素贝叶斯分类 、决策树、决策树集成等模型的应用。讲解了支持向量
    发表于 09-01 06:57

    基于概率投票策略的多类支持向量机及应用

    传统的支持向量机是基于两类问题提出的,如何将其有效地推广至多类分类仍是一个研究的热点问题。在分析比较现有支持向量机多类
    发表于 04-01 08:53 12次下载

    基于多分类支持向量机的隐写域盲检测

    提出一种区分隐写域(包括像素域、DCT域、DWT域)的盲检测方法,构造图像特征向量,建立一个多分类支持向量机,根据特征向量对图像进行训练。
    发表于 04-20 09:32 14次下载

    特征加权支持向量

    该文针对现有的加权支持向量机(WSVM)和模糊支持向量机(FSVM)只考虑样本重要性而没有考虑特征重要性对分类结果的影响的缺陷,提出了基于特
    发表于 11-21 11:15 15次下载

    基于形态小波范数熵和支持向量机的电能质量分类研究

    基于形态小波范数熵和支持向量机的电能质量分类研究_李梦诗
    发表于 01-07 18:21 0次下载

    大样本支持向量分类策略研究_胡红宇

    大样本支持向量分类策略研究_胡红宇
    发表于 03-19 11:28 0次下载

    分类孪生支持向量机研究进展

    孪生支持向量机因其简单的模型、快速的训练速度和优秀的性能而受到广泛关注.该算法最初是为解决二分类问题而提出的。不能直接用于解决现实生活中普遍存在的多分类问题.近来,学者们致力于将二
    发表于 12-19 11:32 0次下载

    基于可能性二均值聚类的二分类支持向量

    提出基于可能性二均值聚类(Possibilistic Two Means, P2M)的二分类支持向量机(Support Vector Machine,SVM)。该算法先用P2M对未知类别的二
    发表于 01-09 10:45 0次下载

    熵的二叉树多类支持向量机的漏洞分类

    为了有效提高漏洞分类的准确性,针对基于二叉树多类支持向量分类算法的分类复杂性和分类结果依赖二叉
    发表于 01-25 10:40 0次下载

    如何从零推导支持向量

    支持向量机 (SVM) 是一个非常经典且高效的分类模型。 但是, 支持向量机中涉及许多复杂的数学推导, 并需要比较强的凸优化基础, 使得有些
    发表于 06-10 08:00 1次下载
    如何从零推导<b class='flag-5'>支持</b><b class='flag-5'>向量</b>机

    什么是支持向量机 什么是支持向量

    支持向量机,英文为Support Vector Machine,简称SV机(论文中一般简称SVM)。它是一 种监督式学习的方法,它广泛的应用于统计分类以及回归分析中。
    发表于 01-28 16:01 2.1w次阅读
    什么是<b class='flag-5'>支持</b><b class='flag-5'>向量</b>机 什么是<b class='flag-5'>支持</b><b class='flag-5'>向量</b>

    支持向量机(多类问题之1类对K-1类方式)

    支持向量机可求解二分类问题。当需要求解多分类问题时,支持向量机可将二
    的头像 发表于 06-30 16:07 293次阅读