0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Jurgen:我比GAN之父提前三年想到生成式对抗网络

电子工程师 来源:YXQ 2019-05-14 10:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2014年的一晚,Ian Goodfellow和一个刚刚毕业的博士生一起喝酒庆祝。在蒙特利尔一个酒吧,一些朋友希望他能帮忙看看手头上一个棘手的项目:计算机如何自己生成图片。

研究人员已经使用了神经网络模拟人脑的神经元网络的一种算法),作为生成模型来创造合理的新数据。但结果往往不尽人意。计算机生成的人脸图像通常不是模糊不清,就是缺耳少鼻。

Ian Goodfellow朋友们提出的方案是对那些组成图片的元素进行复杂的统计分析以帮助机器自己生成图片。这需要进行大量的数据运算,Ian Goodfellow告诉他们这根本行不通。

边喝啤酒边思考问题时,他突然有了一个想法。如果让两个神经网络相互对抗会出现什么结果呢?他的朋友对此持怀疑态度。

当他回到家,女朋友已经熟睡,他决定马上实验自己的想法。那天他一直写代码写到凌晨,然后进行测试。第一次运行就成功了!

那天晚上他提出的方法现在叫做GAN,即生成对抗网络(generative adversarial network)。

通过使用两个神经网络的相互对抗,Ian Goodfellow创造了一个强大的AI工具——生成对抗网络GAN(generative adversarial network)。现在,该方法已经在机器学习领域产生了巨大的影响,也让他的创造者Goodfellow成为了人工智能界的重要人物。

GAN的诞生故事早已为技术圈所熟知,但是,产生这样奇妙对抗想法的似乎不止Ian Goodfellow一人。

比如另一位机器学习领袖Jurgen Schmidhuber就声称早些时候已经做过类似的工作。

NIPS 2016上有的相关争论:

https://media.nips.cc/nipsbooks/nipspapers/paper_files/nips27/reviews/1384.html

今天,一篇2010年的博文亦在reddit上引发热议。这是一篇非常简短的文章,但是很精确的提出了GAN的基本想法,其中附带的一张图片更是直接表示出了GAN的部署方式。

https://web.archive.org/web/20120312111546/http://yehar.com:80 /blog /?p = 167

这篇帖子引发了大量讨论,不少人觉得遗憾,称,如果小哥能更重视一下自己的这个想法,“他可能才会成为那个改变世界的人。”

当然,也有人表示,有这样的想法很重要,但真的付诸实践才行,并且,2010年的硬件条件或许也还无法支撑让GAN大火的一些应用。甚至拿出来哥伦布发现新大陆的例子表示,“哥伦布可能是第一个发现者,但一定有很多人早就预言过'也许在大西洋有一些岛屿'?”

事实上,这篇博客的作者Olli Niemitalo的心态其实比吃瓜群众要好很多,Olli是位来自芬兰的电器工程师,在2017年的一篇帖子了,他叙述了自己在刚刚发现GAN的心路历程:“2017年5月,我在YouTube看到了Ian Goodfellow的相关教程,made my day! 我之前写下的只是一个基本的想法,并且已经做了很多工作来使它取得良好的效果。这个演讲回答了我曾经遇到过的问题以及更多问题。”

从这篇博客作者的个人主页可以看出,Olli本身也是位思维活跃并且乐于提出新想法的“宝藏男孩”,从2007年开始,他在博客中记下了从“能唱歌的自行车刹车“到”永不迟到的手表“等超多自己的想法,当然其中也包括了这个“GAN”的雏形。

正如Goodfellow所说,“如果你有一个觉得可行的想法,也具有领域知识能够认识到它切实有效,那么你的想法才会真的价值。我提出GAN只花了大约1个小时,写论文花了2个星期。这绝对是一个“99%灵感,1%汗水”的故事,但是在那之前我花了4年时间在相关主题上攻读博士学位。”

最后,欢迎看看这个比Goodfellow早三年提出的GAN的简短想法。

Amethod for training artificial neural networksto generate missing data within a variable context. As the idea is hard to put in a single sentence, I will use an example:

An image may have missing pixels (let's say, under a smudge). How can one restore the missing pixels, knowing only the surrounding pixels? One approach would be a "generator" neural network that, given the surrounding pixels as input, generates the missing pixels.

But how to train such a network? One can't expect the network to exactly produce the missing pixels. Imagine, for example, that the missing data is a patch of grass. One could teach the network with a bunch of images of lawns, with portions removed. The teacher knows the data that is missing, and could score the network according to the root mean square difference (RMSD) between the generated patch of grass and the original data. The problem is that if the generator encounters an image that is not part of the training set, it would be impossible for the neural network to put all the leaves, especially in the middle of the patch, in exactly the right places. The lowest RMSD error would probably be achieved by the network filling the middle area of the patch with a solid color that is the average of the color of pixels in typical images of grass. If the network tried to generate grass that looks convincing to a human and as such fulfills its purpose, there would be an unfortunate penalty by the RMSD metric.

My idea is this (see figure below): Train simultaneously with the generator a classifier network that is given, in random or alternating sequence, generated and original data. The classifier then has to guess, in the context of the surrounding image context, whether the input is original (1) or generated (0). The generator network is simultaneously trying to get a high score (1) from the classifier. The outcome, hopefully, is that both networks start out really simple, and progress towards generating and recognizing more and more advanced features, approaching and possibly defeating human's ability to discern between the generated data and the original. If multiple training samples are considered for each score, then RMSD is the correct error metric to use, as this will encourage the classifier network to output probabilities.

如果你对GAN的诞生故事感兴趣,也可以看大数据文摘的相关报道:

GAN之父Ian Goodfellow :那个赋予机器想象力的人类

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2392

    浏览量

    84947
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137427

原文标题:“我比Goodfellow提前三年想到了GAN”

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Rigaku携手imec启动三年联合研发

    ,将与全球顶级半导体研究与创新中心imec(总部:比利时鲁汶)启动一项为期三年的联合研发项目,共同推进面向下一代半导体的先进计量技术开发。
    的头像 发表于 05-20 10:05 148次阅读

    韩系大厂功率GaN代工进入量产阶段,Fabless要崛起?

    2023开始,在其举办的晶圆代工论坛活动上宣布将在2025起为消费级、数据中心和汽车应用提供8英寸GaN晶圆代工服务。而在三年后,尽管相比计划略微延后,但
    的头像 发表于 03-25 10:58 8682次阅读

    隆基与Energy 3000续签三年战略合作框架协议

    2月5日,隆基与欧洲知名能源解决方案提供商Energy 3000正式续签为期三年的合作框架协议。根据协议,隆基将持续向Energy 3000供应总计2吉瓦(GW)的高效光伏组件,重点聚焦高价值的HPBC 2.0产品,共同推动其在欧洲更广泛市场的应用。
    的头像 发表于 02-05 17:50 2129次阅读

    CHA6154-99F级单片氮化镓(GaN)中功率放大器

    CHA6154-99F级单片氮化镓(GaN)中功率放大器CHA6154-99F是United Monolithic Semiconductors (UMS) 推出的一款级单片氮化镓(GaN
    发表于 02-04 08:56

    三年行动方案出炉,工业互联网为什么越来越离不开“确定性网络”?

    继《工业互联网和人工智能融合赋能行动方案》印发后,1月13日,工业和信息化部再次发布《推动工业互联网平台高质量发展行动方案(2026—2028)》,明确了未来三年我国工业互联网平台发展的总体目标和重点方向。
    的头像 发表于 01-21 13:51 863次阅读
    <b class='flag-5'>三年</b>行动方案出炉,工业互联网为什么越来越离不开“确定性<b class='flag-5'>网络</b>”?

    行业快讯:第代半导体驶入快车道,碳化硅器件成本有望三年内接近硅基

    行业快讯:第代半导体驶入快车道,碳化硅器件成本有望三年内接近硅基
    的头像 发表于 01-16 11:41 662次阅读

    Neway第GaN系列模块的生产成本

    %。研发与认证成本技术迭代:GaN技术处于快速发展期,Neway需持续投入研发(如第代模块研发费用占超15%)以保持技术领先。行业认证:进入新能源车、轨道交通等领域需通过AEC-Q100、ISO
    发表于 12-25 09:12

    生成人工智能会让自动驾驶更灵活吗?

    [首发于智驾最前沿微信公众号]每当提到“人工智能”(AI),很多人第一反应就是想到它能实现识别图片、听懂语音、做出判断、推荐内容等任务。但在AI领域,还有一个更细致的分类,那便是生成人工智能
    的头像 发表于 12-23 10:05 722次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b>人工智能会让自动驾驶更灵活吗?

    富士通入选2025Gartner生成AI工程新兴市场象限领导者

    Gartner公司于202511月13日发布了《Gartner 生成AI工程创新指南 (Gartner Innovation Guide for Generative AI
    的头像 发表于 12-02 11:50 1056次阅读
    富士通入选2025<b class='flag-5'>年</b>Gartner<b class='flag-5'>生成</b><b class='flag-5'>式</b>AI工程新兴市场象限领导者

    中国星CSR新三年战略收官 扎实履行社会责任

    责任新三年战略”成果论坛上,一组扎实的数据充分展示了其近三年履责成果——在乡村振兴方面,向五个帮扶村投入资金数千万元,带动村民收入实现至少翻一番;在科技教育领域,为近40万青少年搭建了成长与竞技的舞台;在绿色经营方面,
    的头像 发表于 11-25 10:57 521次阅读
    中国<b class='flag-5'>三</b>星CSR新<b class='flag-5'>三年</b>战略收官 扎实履行社会责任

    比亚迪加速欧洲布局,三年内实现本地生产!

    在未来三年内实现电动汽车在欧洲本地化生产,以有效应对欧盟自去年起对中国产电动汽车加征的17%关税。当前,比亚迪匈牙利工厂建设稳步推进,年产能规划20万辆,预计2025底正式投产,首款下线车型将为海豚Surf两厢车。2026
    的头像 发表于 09-10 18:13 968次阅读

    洲明科技连续三年蝉联亚洲品牌500强

    20258月1日,GYBrand全球品牌研究院权威发布,洲明科技以22.08亿美元品牌价值,连续三年蝉联亚洲品牌500强,全球LED显示行业唯一上榜企业。
    的头像 发表于 08-05 17:14 1765次阅读

    理想汽车连续三年获得MSCI ESG全球最高评级

    近日,国际指数公司MSCI公布最新一批全球企业2025ESG(环境、社会和治理)评级,理想汽车连续三年获得MSCI ESG评级“AAA”全球最高评级。
    的头像 发表于 08-04 17:20 1489次阅读

    曙光存储连续三年蝉联教育存储市场份额第一

    在赛迪顾问最新发布的《中国分布存储市场研究报告(2025)》中,曙光存储连续三年蝉联教育存储市场份额第一,面向AI打造的教育存储方案,正在成为高校数字化、智慧化转型的数据底座。
    的头像 发表于 06-28 16:15 2454次阅读

    边缘生成AI面临哪些工程挑战?

    本文由TechSugar编译自electronicdesign当大多数人想到人工智能(AI)时,他们通常能想到的是能够生成新文本、图像或语音内容的应用。像ChatGPT这样流行的文本应用(在几天
    的头像 发表于 06-25 10:44 1375次阅读
    边缘<b class='flag-5'>生成</b><b class='flag-5'>式</b>AI面临哪些工程挑战?