0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

到底谁才是发明了GAN的男人?

DPVg_AI_era 来源:lq 2019-05-14 08:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一般认为GAN是2014年由Ian Goodfellow等人提出的,但有人发现同样的想法早在2010年,就被一位芬兰的电气工程师提出了,引发关于“怎样才算是第一个发明者”的讨论。

Ian Goodfellow于2014年提出的GAN,至今已经是计算机视觉领域最重要、使用最广泛的概念之一。

学术界流传的一则GAN诞生的传说。据说是因为一天晚上Ian Goodfellow在酒吧在喝高的状态下与同事讨论学术问题,突然灵光一闪,提出了GAN初步的想法,当时并没有得到同事的认可。

后来从酒吧回去发现女朋友已经睡了,于是熬夜写了代码,发现还真有效果。经过一番研究后,GAN就诞生了。

GAN的主要灵感来源于博弈论中零和博弈的思想,由一个生成网络与一个判别网络组成,二者不断博弈:生成网络从潜在空间(latent space)中随机采样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。

有人比Ian Goodfellow早4年就提出了GAN?

正当大家都已经认为GAN等于Ian Goodfellow的时候,Reddit上有人挖坟,称其实早在Ian提出GAN这一概念的4年前,就已经有人提出了非常类似的概念。

Reddit讨论地址:

https://www.reddit.com/r/MachineLearning/comments/bnqm0p/d_gans_were_invented_in_2010/

这位叫做Olli Niemitalo的芬兰电气工程师,会在自己的博客上记录他时不时冒出的一些想法。2010年2月24日,他记录了一种训练人工神经网络以在可变上下文内、生成缺失数据的方法。

博客链接:

http://yehar.com/blog/?p=167#2010-02-24

在博客中他写到:图像可能丢失像素,那么如何通过周围已知的像素,去恢复丢失的像素呢?

他提出的方法是一种叫做“生成器”的神经网络,在给定周围像素作为输入的情况下,生成缺失像素。(看,在2010年,Olli就已经提到了generator这个概念!)

那么接下来的问题就是,该如何训练这样的网络呢?

比如一个草原的照片上有一块污渍,我们知道被盖住的部分(缺失的数据)也是草,那么我们就可以训练神经网络用草去修复,并可以根据生成的草,与原始数据之间的均方根差(RMSD),对神经网络的成果进行评分。

但如果生成器遇到不属于训练集的图像,那么神经网络就不可能将所有叶子(尤其是缺失部分的中心位置的数据)放在恰当的位置。如果生成器的结果看起来不理想,就会遭受惩罚。

看,生成/对抗,都有了!接下来,他还画了一个流程图:

解释一下上图。给定一个分类器网络,使之同时和生成器进行训练。分类器网络以随机、或交替顺序给出生成的原始数据。

接着,分类器需要猜测在周围图像上下文的上下文中,输入是原始数据or生成数据,并给猜测结果打分。原始数据给1分,生成数据给0分。

生成器网络的目的就是获得尽可能高的分数。随着生成器网络不断学会获得高分,最终能够生成逼真的、人眼区分不出真假的图像。

看到这里,很多Reddit网友不淡定了,纷纷感慨“这个人是谁?”“可惜他不出名,要不然blahblah”:

MasterSama:Olli是数百万领先他们时代却籍籍无名的例子之一。但我仍然认为虽然Ian可能不是第一个提出GAN的人,却是第一个让GAN火起来的。

whymauri:同意MasterSama。我上课的时候听过一个说法,没有任何一个科学发明是以最早发现它的那个科学家命名的。

alexmlamb:先入为主的感情来说,我并不想承认两者是相同的。但我可能不得不承认两者的相似度高的让人不可思议。

GAN之父的头衔从来不缺质疑,其中就包括LSTM之父

中国古话说,文无第一武无第二。在学术领域,永远不缺乏争论。

比如今年图灵奖的归属,包括南京大学人工智能学院院长周志华教授在内的许多学界人士,均发出质疑为什么图灵奖得主不是LSTM之父Jürgen Schmidhuber?他也是深度学习领域的大家啊。

LSTM之父Jürgen Schmidhuber声称,他在92年提出了一种PM(Predictability Minimization)模型,其与GAN有一些相似之处,所以称Ian Goodfellow的“GAN之父”的说法是站不住脚的。

最后,无奈之下的Goodfellow只好在论文的最终版本里加入了GAN和PM不同之处的比较,这才有了第一篇GAN论文的诞生。

为此,Schmidhuber和Ian不仅在邮件中展开了激烈的争论,甚至在2016 NIPS大会上,趁Ian正在做GAN的tutorial的时候,Schmidhuber站起来打断演讲。首先介绍了一下自己92年提出的PM模型,介绍了PM模型的原理和实现过程等等,然后反问Ian如何看待GAN和PM的相似点。

Ian当场直接明说他们之前已经在邮件里讨论了这个问题,不想牵扯到NIPS大会上来浪费广大听众的时间。

Ian的言论赢得了在场大佬的多次掌声。一位五十多岁的长者试图碾压三十出头的小伙子,但被小伙子反杀,场面一度十分尴尬。

点子一文不值,做出成果的人才有话语权?

人工智能、机器人、空间科学工程师John Cooper在Twitter阐述了他对此事的观点:点子一文不值,做出成果的人才有话语权。

Ian也在下面回复,从侧面认可“做永远比说有价值”:如果你有确切的想法可行,并且领域知识能够认识到它应该有效,那实际上就确实有价值。制作第一个能运作的GAN只花了大约1个小时,写论文只花了2个星期。这绝对是一个“99%灵感,1%汗水”的故事。

言外之意就是“我做出来了,就这么一点工作量,你呢?”

Keras之父François Chollet回复说:这对学术界来说是一个大问题。通常需要数十人(如果不是数百人),花费很多年心血才能正确地发展一个想法。然而,荣誉要归功于第一篇学术论文的第一作者(无论学术界之外的现有技术如何)。

事实上,如果我们翻开维基百科对GAN的定义,就会看到其实Wiki提到了Olli Niemitalod在2010年的博客。不仅如此,还列举了从1990年到2017年,所有和GAN相似的概念。

比如92年Schmidhuber的可预测性最小化;2012Yan Zhou等将对抗原理应用于SVM;2013年Li、Gauci和Gross采用了在竞争环境中推断模型提出“图灵学习”;直到2014年,Ian Goodfellow向公众介绍了GAN的概念,对今后的人工智能领域产生了巨大影响。

大神的成就总会被人记住。而即使一个默默无闻的人,也可能会在10年后被人提到进行热议。

Ian也好,Schmidhuber也好,科学家做出的成果的重要性和原创性,总会有人认可、有人质疑。但无论如何,大神们总有相似之处,那就是坚持!

正如Ian所说:我把整个GAN理念放在一起只需要大约30秒钟。但这是建立在我花了4年时间攻读相关领域的博士学位,加上在攻读博士学位之前、用了2年作为业余爱好的基础之上。

台上30秒,台下需6年!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1097

    浏览量

    42499
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2392

    浏览量

    84957
  • 计算机视觉
    +关注

    关注

    9

    文章

    1716

    浏览量

    47765

原文标题:GAN之父身份遭质疑!一篇2010年的博客挑战Ian Goodfellow

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    视觉摄像头vs毫米波雷达:才是全屋智能的“终极眼睛”?

    当全屋智能从“被动响应”迈向“主动感知”,一个核心问题浮现:系统到底靠什么来“看见”我们?视觉摄像头凭借丰富的图像信息长期占据C位,但毫米波雷达的成熟正在打破这一格局。两者才是全屋智能的“终极眼睛
    的头像 发表于 04-09 13:55 212次阅读
    视觉摄像头vs毫米波雷达:<b class='flag-5'>谁</b><b class='flag-5'>才是</b>全屋智能的“终极眼睛”?

    别再傻傻分不清!无线透传、Zigbee、2.4G模块到底怎么选?(附低功耗秘籍)

    在物联网项目选型时,很多工程师面对“无线透传模块”、“Zigbee模块”、“2.4G模块”这几个概念,常常感到一头雾水。它们到底有什么区别?在低功耗和小体积成为产品核心竞争力今天,我到底该选?
    的头像 发表于 03-14 10:56 1320次阅读

    Neway第三代GaN系列模块的生产成本

    Neway第三代GaN系列模块的生产成本Neway第三代GaN系列模块的生产成本受材料、工艺、规模、封装设计及市场定位等多重因素影响,整体呈现“高技术投入与规模化降本并存”的特征。一、成本构成:核心
    发表于 12-25 09:12

    小巧、轻便、高效,安森美垂直GaN解锁功率器件应用更多可能

    在传统横向结构的GaN器件中,电流沿芯片表面流动。而垂直GaNGaN层生长在氮化镓衬底上,其独特结构使电流能直接从芯片顶部流到底部,而不是仅在表面流动。这种垂直电流路径让器件能够承受
    的头像 发表于 12-04 17:13 822次阅读
    小巧、轻便、高效,安森美垂直<b class='flag-5'>GaN</b>解锁功率器件应用更多可能

    安森美垂直GaN技术赋能功率器件应用未来

    在传统横向结构的GaN器件中,电流沿芯片表面流动。而垂直 GaNGaN 层生长在氮化镓衬底上,其独特结构使电流能直接从芯片顶部流到底部,而不是仅在表面流动。这种垂直电流路径让器件
    的头像 发表于 12-04 09:28 2139次阅读
    安森美垂直<b class='flag-5'>GaN</b>技术赋能功率器件应用未来

    PLC vs 嵌入式:才是工业场景的“最优解”?

    PLC和嵌入式作为工业控制领域的常用方案,应该如何选择?才是工业场景的“最优解”?前言清晨7点的智能车间里,流水线的机械臂正以0.1毫米的精度抓取发动机零部件,传感器实时反馈的温度、压力数据在
    的头像 发表于 11-18 11:46 1065次阅读
    PLC vs 嵌入式:<b class='flag-5'>谁</b><b class='flag-5'>才是</b>工业场景的“最优解”?

    “芯”品发布 | 高可靠GaN专用驱动器,便捷GaN电源设计

    芯品发布高可靠GaN专用驱动器,便捷GaN电源设计GaN功率器件因为其高工作频率和高转化效率的优势,逐渐得到电源工程师的青睐。然而增强型GaN功率器件的驱动电压一般在5~7V,驱动窗口
    的头像 发表于 11-11 11:46 1226次阅读
    “芯”品发布 | 高可靠<b class='flag-5'>GaN</b>专用驱动器,便捷<b class='flag-5'>GaN</b>电源设计

    安森美入局垂直GaNGaN进入高压时代

    电子发烧友网综合报道 近日,安森美发布器垂直GaN功率半导体技术,凭借 GaN-on-GaN 专属架构与多项性能突破,为全球高功率应用领域带来革命性解决方案,重新定义了行业在能效、紧凑性与耐用性上
    的头像 发表于 11-10 03:12 7982次阅读

    VLA和世界模型,才是自动驾驶的最优解?

    Model)路线,这两种路径都为自动驾驶快速落地提供了可能,那才是最优解? 什么是VLA模型? VLA模型,即视觉—语言—行动模型,是将视觉感知、语言理解和动作生成串联起来的一套方法。它先是通过视觉编码器,将摄像头看到的画面转换成语
    的头像 发表于 11-05 08:55 1011次阅读
    VLA和世界模型,<b class='flag-5'>谁</b><b class='flag-5'>才是</b>自动驾驶的最优解?

    Leadway GaN系列模块的功率密度

    Leadway GaN系列模块以120W/in³的功率密度为核心,通过材料创新、电路优化与封装设计,实现了体积缩减40%、效率提升92%+的突破。其价值在于为工业自动化、机器人、电动汽车等空间受限
    发表于 10-22 09:09

    通信之谜:才是无线电的发明者?

    留下了他们的足迹:在英国,物理学家法拉第提出电磁感应定律,麦克斯韦提出电磁场理论、德国物理学家赫兹通过实验证明了电磁波存在之后,许多发明家都开始无线电的应用研究,
    的头像 发表于 09-17 17:32 4373次阅读
    通信之谜:<b class='flag-5'>谁</b><b class='flag-5'>才是</b>无线电的<b class='flag-5'>发明</b>者?

    Si、SiC与GaN更适合上场?| GaN芯片PCB嵌埋封装技术解析

    以下完整内容发表在「SysPro电力电子技术」知识星球-《功率GaN芯片PCB嵌埋封装技术全维解析》三部曲系列-文字原创,素材来源:TMC现场记录、Horse、Hofer、Vitesco-本篇为节选
    的头像 发表于 08-07 06:53 2367次阅读
    Si、SiC与<b class='flag-5'>GaN</b>,<b class='flag-5'>谁</b>更适合上场?| <b class='flag-5'>GaN</b>芯片PCB嵌埋封装技术解析

    淘宝 vs 京东电商 API 接口,才是数据王者?

    API进行客观比较,帮助您判断才是真正的“数据王者”。 1.API功能覆盖范围 API的功能范围决定了开发者能获取的数据类型。淘宝API通过阿里巴巴开放平台提供,覆盖商品、订单、用户、物流等多个模块。例如,商品API支持搜索、详情、评价等,数据
    的头像 发表于 07-08 15:51 1183次阅读
    淘宝 vs 京东电商 API 接口,<b class='flag-5'>谁</b><b class='flag-5'>才是</b>数据王者?

    增强AlN/GaN HEMT

    一种用于重掺杂n型接触的选择性刻蚀工艺实现了AlN/GaN HEMT的缩小 上图:原位SiN/AlN/GaN HEMT外延堆叠示意图 俄亥俄州立大学的工程师们宣称,他们已经打开了一扇大门,有望制备出
    的头像 发表于 06-12 15:44 1277次阅读
    增强AlN/<b class='flag-5'>GaN</b> HEMT

    GaN LLC电源EMC优化技巧

    目录 1,整机线路架构 2,初次极安规Y电容接法 3,PFC校正电路参数选取及PCB布具注意事项 4,LLC环路设计注意事项 5,GaN驱动电路设计走线参考 6,变压器输出整流注意事项 一,整体线路图 获取完整文档资料可下载附件哦!!!!如果内容有帮助可以关注、点赞、评论支持一下哦~
    发表于 05-28 16:15