0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI版“双手互搏”有多牛?

电子工程师 2018-03-25 10:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。下面就随网络通信小编一起来了解一下相关内容吧。

什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?能够应用在人工智能的哪些场景?还有哪些关键问题有待攻克?

中国自动化学会混合智能专委会副主任、中国人工智能学会机器学习专委会常委、复旦大学博士生导师张军平教授在接受科技日报记者采访时做了深入浅出的解释。

故事中的GAN幻影

张军平告诉记者,虽然GAN是科技领域的“新贵”,但其实在很久以前的中外小说中就能看到这个想法的影子。

这个想法最早可以追溯到奥地利小说家斯蒂芬·茨威格写于1941年的小说《象棋的故事》。

在该小说中,主人公B博士被长期囚禁在纳粹集中营中。在想尽了各种摆脱空虚和孤独的办法却徒劳无功后,B博士意外得到了一本国际象棋棋谱。

他背完书里的上千棋谱后,用送来的面包做了副国际象棋,开始自己跟自己下棋,最终演变成一盘接一盘的相互疯狂挑战,这令他棋力大涨。出狱后,在一艘游艇上,他居然轻松地在首盘就击败当时的世界冠军。

在中文小说里也有类似的影子,它出现在金庸写于1957年的武侠小说《射雕英雄传》中。

王重阳的师弟周伯通被东邪“黄药师”困在桃花岛的地洞里。为了打发时间,周伯通就用左手与右手打架,自娱自乐。其武功决窍在于要先“左手画圆、右手画方”,分心二用,保证可以同时使出两种武功,从而使得武力倍增。

这两部小说主人公功力大增的关键都是“自己跟自己决斗,试图倾尽全力击败对方”,而结果都是练成后,去跟高手过招时能轻松秒杀对手。用一句俗话来解释,叫“双拳难敌四手”。

让机器学会“左右互搏”

GAN网络的原理本质上就是这两篇小说中主人公练功的人工智能或机器学习版本。

一个网络中有两个角色,修炼的过程中左手扮演攻方,即生成器(generator),试图生成和自然世界中拟完成任务足够相似的目标;右手扮演守方,即判别器(discriminator),试图把这个假的、生成的目标和真实目标区分开来。经过反复多次双手互搏,左手右手的功力都会倍增,从而达到“舍我其谁”的目标。

明白这个道理,就不难明白为什么GAN网络一出,就有独孤求败的感觉了。

正是因为GAN网络的机理是“双手互搏、一心两用”,所以,虽然最初的应用场景是针对图像相关任务,但其机理是普适性的。只要能用这个“诀窍”的地方,都能把自己的功力提升一个档次。不过,需要注意的是,GAN只把双手互搏用来训练自己“双手”的功力。在多数实际应用中,它只用了自己千锤百炼出来的生成器,就得到了非常好的结果。

于是,自2014年GAN网络被Ian J. Goodfellow等人提出,至今其演绎出的各种版本就像攻城掠地般在各个领域蔓延。

在今年的人工智能顶级会议IJCAI、机器学习顶级会议ICML和NIPS、深度学习著名会议ICLR上,光读参会论文的标题,就能发现大量GAN网络的工作痕迹。图像处理、计算机视觉、自然语言处理、语音识别、智能驾驶、安全监控……似乎GAN已经无所不能了。

张军平用几个比较火的人工智能应用场景举例——

在年龄估计中,GAN能通过攻守互搏,基于给定的人脸图像实现对其人衰老或年轻时的样貌生成。

在多视角人脸识别、跨视角步态识别领域,采用类似的机理,实现对人脸角度和步态角度的自动旋转,从而有效提高了多视角、跨视角人脸和步态识别的精度。

自动驾驶领域,需要对智能汽车进行复杂环境下的虚拟训练。此时,就可以利用GAN来实现与实际交通场景分布一致的图像生成。具体来说,可以先给GAN输入一张随机噪声图像,通过其生成器来最小化与真实场景接近的图像,同时判别器最大化生成场景与真实场景间的差异。经过反复迭代的攻守博弈,从而获得与真实环境一致的交通场景。

“不光在应用领域上有了突破,互搏的方式也有了不少变化。既然可以双手互搏,那当然可以三手甚至更多手的互搏,也可以组团逐对互搏、成串互搏,诸如此类。还可以把圆和方换成其他东西或者所谓的函数或结构来互搏。但万变不离其宗,内在的机理是不变的。”张军平补充道。

GAN有什么“软肋”

“毫无疑问,这种可倍增‘功力’的技术入选MIT年度十大突破性技术是当之无愧的。但值得注意的是,这一技术仍然有较大需要改善的空间。”作为《IEEE Intelligent System》(智能系统)和《IEEE Transactions on Intelligent Transportation Systems 》(智能交通系统)等著名期刊的编委,张军平对GAN的“软肋”了如指掌——

首先,对抗不好是容易出问题的。比如那位B博士。国棋象棋的世界冠军在觉察到他的强烈焦躁与急切情绪后,就有意识地放慢下棋速度。结果诱发了B博士的精神分裂,使得他再次陷入狂乱的自我对弈之中,最终才幡然醒悟而告别了棋局。对抗网也是如此,稳定性一直是其存在的问题之一。尽管理论上Wasserstein GAN (WGAN)可以部分解决其收敛性问题,但实际的效果还没有达到尽人意的地步。

其次,枪打出头鸟,既然这项技术这么牛了,过来挑战的也不少。据不完全报告,似乎已经有十五波“武林高手”对GAN网络的抗击打能力进行了挑战。极端情况,在图像中加一个像素就可能使GAN网络产生误判。

第三,GAN网络也是深度网络的一种,在可解释性这条路上,仍然没有找到非常明确的方向。

最后,双手互搏的基础还是手。而这一基础的结构并没有从近几十年来人工智能发展的框架中脱离出来。

因此,张军平提醒,期望以GAN之奇技,从弱人工智能冲击“能真正推理和解决问题,且有知觉、有自主意识的”的强人工智能还遥遥无期。

以上是关于网络通信中-AI版“双手互搏”有多牛?的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38346

    浏览量

    297480
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2339

    浏览量

    79345
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英特尔创新引领AI NAS:软硬结合引领本地数据智慧管理与场景创新应用

    展示面向中小企业、消费者和专业用户,赋能新场景、加速产品落地的最新技术方案。会上,绿联、极空间、铁威马、畅网、飞AI NAS 厂商,发布和展示了一系列基于英特尔® 酷睿™ Ultra处理器和英特尔锐炫™ B60 显卡的场景
    的头像 发表于 12-12 15:45 142次阅读
    英特尔创新引领<b class='flag-5'>AI</b> NAS:软硬结合引领本地数据智慧管理与<b class='flag-5'>多</b>场景创新应用

    RK3576驱动高端显控系统升级:屏拼控与AI视觉融合解决方案

    系统依赖工控主机、外接显卡和解码器,存在功耗高、延迟大的问题。而瑞芯微 RK3576 打造的新一代 AI 多媒体平台,凭借 “三屏异显 + 八路摄像头输入 + AI 边缘计算” 的架构,全面提升高端显
    发表于 11-21 17:51

    荣耀的星际穿越,中国的AI星海

    了这么AI产品,我们为什么还需要千问App
    的头像 发表于 11-18 13:22 6048次阅读
    荣耀的星际穿越,中国的<b class='flag-5'>AI</b>星海

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    2)渗透式AI的优势 5、大型模态模型 模态模型(LMM)可以被理解成大模型的更高级版本,不仅可以处理文本,还可以处理和理解多种类型的数据模态。 模态模型的关键特性是:它通常能
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验科学、理论科学、计算科学、数据驱动科学一起构成
    发表于 09-17 11:45

    云发布灵矽 AI:600ms超低延迟,重塑智能硬件语音交互新范式

    8 月 15 日,七云正式发布灵矽 AI —为新一代智能硬件而生的语音交互新范式,让智能硬件不仅会“说话”,更能听懂情绪、自然交流。这不仅是语音交互技术从“能用”到“好用”的升级,更是语音交互从
    的头像 发表于 08-15 15:33 726次阅读
    七<b class='flag-5'>牛</b>云发布灵矽 <b class='flag-5'>AI</b>:600ms超低延迟,重塑智能硬件语音交互新范式

    模态+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式

    模态+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式
    的头像 发表于 06-12 10:17 426次阅读
    <b class='flag-5'>多</b>模态+空间智能:盾华以<b class='flag-5'>AI</b>+智慧路灯杆,点亮城市治理新方式

    XMOS为普及AI应用推出基于软件定义SoC的模态AI传感器融合接口

    模态传感信号AI处理为智算中心和边缘智能开启感知智能的新篇章
    的头像 发表于 05-12 17:51 407次阅读
    XMOS为普及<b class='flag-5'>AI</b>应用推出基于软件定义SoC的<b class='flag-5'>多</b>模态<b class='flag-5'>AI</b>传感器融合接口

    正点原子 AI BOX0 智能伴侣,1.54寸高清屏+长效续航,语音畅聊,情景对话,知识科普,色可选,随身携带!

    正点原子 AI BOX0携小智AI来袭,专属你的智能伴侣!你的全能AI伙伴,懂你更贴心 正点原子ESP32 AI BOX0 — 不只是桌面摆件,更是能思考、会学习的
    发表于 04-24 16:11

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    模型全链路分析功能,针对AI应用开发的三大痛点逐个击破。 当前AI应用开发者在使用开发工具时会面临一个很头疼的问题,种类、功能不聚合、过于碎片化,导致开发过程非常复杂。Neuron Studio
    发表于 04-13 19:52

    AI模态智能预警系统如何提升油田安全管理水平#人工智能

    AI
    jf_60804796
    发布于 :2025年04月02日 10:52:06

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    架构,赋能场景应用 BPI-AI2N 采用 RZ/V2N 处理器,集成 4 核 Arm® Cortex®-A55(1.8GHz)与 Cortex®-M33(200MHz),提供强劲的计算能力,同时兼顾
    发表于 03-19 17:54

    AIGC和AI什么区别

    AIGC是AI在内容生成领域的一个特定应用方向,AI的技术发展为AIGC提供了基础和支撑。那么,AIGC和AI什么区别呢?下面,AI部落小
    的头像 发表于 02-20 10:33 1725次阅读

    AI项目管理平台什么用

    当今,AI项目的复杂性和多变性给项目管理带来了前所未有的挑战。为了有效应对这些挑战,AI项目管理平台应运而生。那么,AI项目管理平台什么用?下面,
    的头像 发表于 02-19 11:16 633次阅读

    网线股的吗

    是的,网线确实有股的类型。股网线,也被称为绞合导体网线,其特点是由根细导体绞合而成。以下是对股网线的详细解释: 一、构造特点 导体材料:
    的头像 发表于 01-07 11:30 1012次阅读