0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Vladimir Vapnik创立支持向量机

RG15206629988 来源:行业学习与研究 2023-05-04 18:03 次阅读

在Vladimir Vapnik创立支持向量机前,已有如下结论:在二分类情况中,如果一个数据集线性可分,即存在一个超平面可将两个类别完全分开,那么一定存在无数个超平面将这两个类别完全分开。

在特征空间为二维平面时,分类训练数据的超平面的具体图形为直线,下文介绍在无数个此类直线中选择可使分类效果最优的直线。

一、直观感觉分类效果最优的直线

如图一左图所示,有三条直线可将图一左图中的圆圈和叉分为两类,该三条直线分别为1号线、2号线、3号线。在选择可使圆圈和叉分类效果最优的直线(下文简称“最优分类直线”)时,可能多数人会选择2号线。但根据免费午餐定理,在未假设训练数据的先验分布的情况下,三条直线对于圆圈和叉分类效果相同。人的直观感觉似乎和免费午餐定理产生矛盾。

其实,似乎矛盾的原因是人们在选择最优分类直线时,已对训练样本的先验分布做出假设。例如,多数人选择2号线为最优分类直线可能的假设为训练样本的位置在空间中具有测量误差(选择2号线为最优分类直线的先验分布假设不唯一)。

如图一右图所示,如果红色实线圆圈的位置分布具有测量误差,其实际位置处于虚线圆圈位置,那么1号线的分类效果不如2号线的分类效果;如果红色叉的位置分布具有测量误差,其实际位置处于虚线圆圈位置,那么3号线的分类效果不如2号线的分类效果,即2号线更可抵御训练样本误差,因此,在训练样本的位置在空间中具有测量误差的先验假设下,2号线为最优分类直线。

170fa3c2-e6a2-11ed-ab56-dac502259ad0.png

172ad39a-e6a2-11ed-ab56-dac502259ad0.png

图一,图片来源:中国慕课大学《机器学习概论》

二、寻找最优分类直线

Vladimir Vapnik基于最优化理论,对寻找最优分类直线的回答如下:任意一条可将圆圈和叉完全分类的直线向一侧平行移动,直至其穿过一侧一个或几个训练样本;再向另一侧平行移动,直至其穿过另一侧一个或几个训练样本。如图二所示,定义被穿过的数据(图二中的红圆圈和叉)为支持向量(Support Vector),定义穿过圆圈和叉的直线间的距离为间隔,则最优分类直线为间隔最大的直线。

17426a6e-e6a2-11ed-ab56-dac502259ad0.png

图二,图片来源:中国慕课大学《机器学习概论》

根据Vladimir Vapnik的回答,因为前文所述问题中的2号线的间隔最大,所以2号线为最优分类直线。

175f9bac-e6a2-11ed-ab56-dac502259ad0.png

图片来源:中国慕课大学《机器学习概论》

但仅根据间隔最大不能得出唯一的最优分类直线,例如,前文所述问题中,所有与2号线平行的线均为间隔最大的直线。因此,为可得出唯一直线,最优分类直线被限定处于穿过两侧支持向量的两条直线中间的直线,即最优直线与两侧支持向量的距离相等。

综上,支持向量机寻找的最优分类直线应满足:

(1)该直线可将训练数据完全分为两类。

(2)该直线可最大化间隔。

(3)该直线处于间隔的中间,其与所有支持向量的距离相等。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 向量机
    +关注

    关注

    0

    文章

    166

    浏览量

    20717

原文标题:机器学习相关介绍(7)——支持向量机(解决线性可分问题)

文章出处:【微信号:行业学习与研究,微信公众号:行业学习与研究】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于支持向量的分类问题

    小菜鸟一枚 ,有哪位大神能提供部分基于支持向量积的分类鉴别问题的MATLAB编码,思路过程,不胜感激
    发表于 04-03 18:54

    支持向量是什么

    初步了解支持向量(SVM)-1
    发表于 09-03 09:59

    支持向量的SVM

    支持向量SVM
    发表于 05-20 10:21

    怎么理解支持向量SVM

    支持向量SVM理解篇
    发表于 06-14 09:05

    特征加权支持向量

    该文针对现有的加权支持向量机(WSVM)和模糊支持向量机(FSVM)只考虑样本重要性而没有考虑特征重要性对分类结果的影响的缺陷,提出了基于特征加权的
    发表于 11-21 11:15 15次下载

    支持向量机在电力系统中的应用

    20 世纪90 年代由Vapnik 等人提出的基于统计学习理论的 支持向量机 (support vector machines, SVM),是数据挖掘中的一项新技术,它能够对小样本学习问题给出较好的解决方案,已成为当前国际
    发表于 06-30 18:12 31次下载
    <b class='flag-5'>支持</b><b class='flag-5'>向量</b>机在电力系统中的应用

    人工智能之机器学习Analogizer算法-支持向量机(SVM)

    支持向量机(SVM)是由Vapnik领导的AT&T Bell实验室研究小组在1995年提出的一种新的非常有潜力的分类技术。刚开始主要针对二值分类问题而提出,成功地应用子解函数回归及一类分类问题,并推广到大量应用中实际存在的多值分
    发表于 05-29 19:11 1840次阅读

    介绍七本在注重打好数据科学的数学基础上的技术读物

    如果说要列一份关于数学的书单,这本书是绕不过去的。本书单中排名第一的就是俄罗斯著名数学家Vladimir Vapnik的《统计学习理论的本质》。在这份清单中的所有书籍中,Vapnik这本是最不好找的。
    的头像 发表于 04-19 08:56 2392次阅读

    什么是支持向量机 什么是支持向量

    支持向量机,英文为Support Vector Machine,简称SV机(论文中一般简称SVM)。它是一 种监督式学习的方法,它广泛的应用于统计分类以及回归分析中。
    发表于 01-28 16:01 2.1w次阅读
    什么是<b class='flag-5'>支持</b><b class='flag-5'>向量</b>机 什么是<b class='flag-5'>支持</b><b class='flag-5'>向量</b>

    Vladimir日志采集工具

    Vladimir.zip
    发表于 04-27 10:03 1次下载
    <b class='flag-5'>Vladimir</b>日志采集工具

    机器学习找一个好用的函数的原因是什么

    (1)机器学习中经典的“支持向量机(SVM)”的主要提出者弗拉基米尔·万普尼克(Vladimir Vapnik),在其著作《统计学习理论的本质》中这样定义机器学习“机器学习就是一个基于
    的头像 发表于 11-02 16:15 548次阅读

    介绍支持向量机的基础概念

    支持向量机(Support Vector Machine)是一种较知名的机器学习算法,该算法由俄罗斯数学家Vladimir Vapnik创立
    的头像 发表于 04-28 09:09 679次阅读
    介绍<b class='flag-5'>支持</b><b class='flag-5'>向量</b>机的基础概念

    支持向量机(核函数的定义)

    根据机器学习相关介绍(10)——支持向量机(低维到高维的映射),支持向量机可通过引入φ(x)函数,将低维线性不可分问题转换为高维线性可分问题。
    的头像 发表于 05-20 10:41 556次阅读
    <b class='flag-5'>支持</b><b class='flag-5'>向量</b>机(核函数的定义)

    支持向量机(多类问题之1类对K-1类方式)

    支持向量机可求解二分类问题。当需要求解多分类问题时,支持向量机可将二分类问题的求解方式转化为多分类问题的求解方式
    的头像 发表于 06-30 16:07 301次阅读

    支持向量机(多类问题之1类对另1类)

    假设测试样本需被分为三类,首先需构建三个支持向量机模型
    的头像 发表于 07-05 16:08 325次阅读
    <b class='flag-5'>支持</b><b class='flag-5'>向量</b>机(多类问题之1类对另1类)