0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI版“双手互搏”有多牛?

电子工程师 2018-03-25 10:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。下面就随网络通信小编一起来了解一下相关内容吧。

什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?能够应用在人工智能的哪些场景?还有哪些关键问题有待攻克?

中国自动化学会混合智能专委会副主任、中国人工智能学会机器学习专委会常委、复旦大学博士生导师张军平教授在接受科技日报记者采访时做了深入浅出的解释。

故事中的GAN幻影

张军平告诉记者,虽然GAN是科技领域的“新贵”,但其实在很久以前的中外小说中就能看到这个想法的影子。

这个想法最早可以追溯到奥地利小说家斯蒂芬·茨威格写于1941年的小说《象棋的故事》。

在该小说中,主人公B博士被长期囚禁在纳粹集中营中。在想尽了各种摆脱空虚和孤独的办法却徒劳无功后,B博士意外得到了一本国际象棋棋谱。

他背完书里的上千棋谱后,用送来的面包做了副国际象棋,开始自己跟自己下棋,最终演变成一盘接一盘的相互疯狂挑战,这令他棋力大涨。出狱后,在一艘游艇上,他居然轻松地在首盘就击败当时的世界冠军。

在中文小说里也有类似的影子,它出现在金庸写于1957年的武侠小说《射雕英雄传》中。

王重阳的师弟周伯通被东邪“黄药师”困在桃花岛的地洞里。为了打发时间,周伯通就用左手与右手打架,自娱自乐。其武功决窍在于要先“左手画圆、右手画方”,分心二用,保证可以同时使出两种武功,从而使得武力倍增。

这两部小说主人公功力大增的关键都是“自己跟自己决斗,试图倾尽全力击败对方”,而结果都是练成后,去跟高手过招时能轻松秒杀对手。用一句俗话来解释,叫“双拳难敌四手”。

让机器学会“左右互搏”

GAN网络的原理本质上就是这两篇小说中主人公练功的人工智能或机器学习版本。

一个网络中有两个角色,修炼的过程中左手扮演攻方,即生成器(generator),试图生成和自然世界中拟完成任务足够相似的目标;右手扮演守方,即判别器(discriminator),试图把这个假的、生成的目标和真实目标区分开来。经过反复多次双手互搏,左手右手的功力都会倍增,从而达到“舍我其谁”的目标。

明白这个道理,就不难明白为什么GAN网络一出,就有独孤求败的感觉了。

正是因为GAN网络的机理是“双手互搏、一心两用”,所以,虽然最初的应用场景是针对图像相关任务,但其机理是普适性的。只要能用这个“诀窍”的地方,都能把自己的功力提升一个档次。不过,需要注意的是,GAN只把双手互搏用来训练自己“双手”的功力。在多数实际应用中,它只用了自己千锤百炼出来的生成器,就得到了非常好的结果。

于是,自2014年GAN网络被Ian J. Goodfellow等人提出,至今其演绎出的各种版本就像攻城掠地般在各个领域蔓延。

在今年的人工智能顶级会议IJCAI、机器学习顶级会议ICML和NIPS、深度学习著名会议ICLR上,光读参会论文的标题,就能发现大量GAN网络的工作痕迹。图像处理、计算机视觉、自然语言处理、语音识别、智能驾驶、安全监控……似乎GAN已经无所不能了。

张军平用几个比较火的人工智能应用场景举例——

在年龄估计中,GAN能通过攻守互搏,基于给定的人脸图像实现对其人衰老或年轻时的样貌生成。

在多视角人脸识别、跨视角步态识别领域,采用类似的机理,实现对人脸角度和步态角度的自动旋转,从而有效提高了多视角、跨视角人脸和步态识别的精度。

自动驾驶领域,需要对智能汽车进行复杂环境下的虚拟训练。此时,就可以利用GAN来实现与实际交通场景分布一致的图像生成。具体来说,可以先给GAN输入一张随机噪声图像,通过其生成器来最小化与真实场景接近的图像,同时判别器最大化生成场景与真实场景间的差异。经过反复迭代的攻守博弈,从而获得与真实环境一致的交通场景。

“不光在应用领域上有了突破,互搏的方式也有了不少变化。既然可以双手互搏,那当然可以三手甚至更多手的互搏,也可以组团逐对互搏、成串互搏,诸如此类。还可以把圆和方换成其他东西或者所谓的函数或结构来互搏。但万变不离其宗,内在的机理是不变的。”张军平补充道。

GAN有什么“软肋”

“毫无疑问,这种可倍增‘功力’的技术入选MIT年度十大突破性技术是当之无愧的。但值得注意的是,这一技术仍然有较大需要改善的空间。”作为《IEEE Intelligent System》(智能系统)和《IEEE Transactions on Intelligent Transportation Systems 》(智能交通系统)等著名期刊的编委,张军平对GAN的“软肋”了如指掌——

首先,对抗不好是容易出问题的。比如那位B博士。国棋象棋的世界冠军在觉察到他的强烈焦躁与急切情绪后,就有意识地放慢下棋速度。结果诱发了B博士的精神分裂,使得他再次陷入狂乱的自我对弈之中,最终才幡然醒悟而告别了棋局。对抗网也是如此,稳定性一直是其存在的问题之一。尽管理论上Wasserstein GAN (WGAN)可以部分解决其收敛性问题,但实际的效果还没有达到尽人意的地步。

其次,枪打出头鸟,既然这项技术这么牛了,过来挑战的也不少。据不完全报告,似乎已经有十五波“武林高手”对GAN网络的抗击打能力进行了挑战。极端情况,在图像中加一个像素就可能使GAN网络产生误判。

第三,GAN网络也是深度网络的一种,在可解释性这条路上,仍然没有找到非常明确的方向。

最后,双手互搏的基础还是手。而这一基础的结构并没有从近几十年来人工智能发展的框架中脱离出来。

因此,张军平提醒,期望以GAN之奇技,从弱人工智能冲击“能真正推理和解决问题,且有知觉、有自主意识的”的强人工智能还遥遥无期。

以上是关于网络通信中-AI版“双手互搏”有多牛?的相关介绍,如果想要了解更多相关信息,请多多关注eeworld,eeworld电子工程将给大家提供更全、更详细、更新的资讯信息。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42023

    浏览量

    303097
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2392

    浏览量

    84940
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    极客时间 Agent 设计与工程化行动营

    ;。2026年的Agent,是 一套有组织、有纪律、KPI的AI团队 。 第一个变化:从\"聊天\"到\"干活\"。 2024年的Agent只会
    发表于 05-18 17:05

    有人AI算力主机 | 源数据,AI分析,边缘智理

    工业物联网向边缘智能深度演进,机器视觉图像、设备时序传感、环境感知传感、源融合数据的边缘端实时AI 分析,成为工业智能化升级的核心抓手。 有人物联 AI 算力主机 (EG9 系列、EG628-S
    的头像 发表于 04-30 18:11 6411次阅读
    有人<b class='flag-5'>AI</b>算力主机 | <b class='flag-5'>多</b>源数据,<b class='flag-5'>AI</b>分析,边缘智理

    AGV为何“搞不定”田字托?

    AGV地与田字托盘的适配难题:结构差异导致货叉无法稳定插入,精度要求严苛加剧识别困难,技术局限限制搬运能力。
    的头像 发表于 03-12 11:06 177次阅读
    地<b class='flag-5'>牛</b>AGV为何“搞不定”田字托?

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    AGX Orin 150 TOPS+ 本地大模型推理、具身智能控制、模态实时交互 迷你AI服务器 176TOPS 意味着OrangePi AI Station正式迈入 高端边缘AI
    发表于 03-10 14:19

    涂鸦Omni AI Foundation V2.6发布:低代码+模态,重塑AI硬件创新体验

    硬件产品的落地。今天,我们非常高兴地宣布:面向模态AI硬件的基座平台OmniAIFoundation正式发布V2.6版本。本次升级不仅显著提升了端到端模态交互体
    的头像 发表于 12-24 18:58 750次阅读
    涂鸦Omni <b class='flag-5'>AI</b> Foundation V2.6发布:低代码+<b class='flag-5'>多</b>模态,重塑<b class='flag-5'>AI</b>硬件创新体验

    英特尔创新引领AI NAS:软硬结合引领本地数据智慧管理与场景创新应用

    展示面向中小企业、消费者和专业用户,赋能新场景、加速产品落地的最新技术方案。会上,绿联、极空间、铁威马、畅网、飞AI NAS 厂商,发布和展示了一系列基于英特尔® 酷睿™ Ultra处理器和英特尔锐炫™ B60 显卡的场景
    的头像 发表于 12-12 15:45 827次阅读
    英特尔创新引领<b class='flag-5'>AI</b> NAS:软硬结合引领本地数据智慧管理与<b class='flag-5'>多</b>场景创新应用

    RK3576驱动高端显控系统升级:屏拼控与AI视觉融合解决方案

    系统依赖工控主机、外接显卡和解码器,存在功耗高、延迟大的问题。而瑞芯微 RK3576 打造的新一代 AI 多媒体平台,凭借 “三屏异显 + 八路摄像头输入 + AI 边缘计算” 的架构,全面提升高端显
    发表于 11-21 17:51

    何同学“AI”硬件激发创意,2025 SparkS全球AI硬件创新大赛启动

    11月18日杭州,“2025 SparkS全球AI硬件创新大赛”正式启动。大赛是由属地政府和杭州市人才集团、杭创(人工智能)营、涂鸦智能等联合打造的高能级赛事,依托杭州市AI产业高地、杭创(人工智能
    的头像 发表于 11-19 18:01 1424次阅读
    何同学“<b class='flag-5'>AI</b>寻<b class='flag-5'>牛</b>”硬件激发创意,2025 SparkS全球<b class='flag-5'>AI</b>硬件创新大赛启动

    荣耀的星际穿越,中国的AI星海

    了这么AI产品,我们为什么还需要千问App
    的头像 发表于 11-18 13:22 6490次阅读
    荣耀的星际穿越,中国的<b class='flag-5'>AI</b>星海

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    2)渗透式AI的优势 5、大型模态模型 模态模型(LMM)可以被理解成大模型的更高级版本,不仅可以处理文本,还可以处理和理解多种类型的数据模态。 模态模型的关键特性是:它通常能
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验科学、理论科学、计算科学、数据驱动科学一起构成
    发表于 09-17 11:45

    云发布灵矽 AI:600ms超低延迟,重塑智能硬件语音交互新范式

    8 月 15 日,七云正式发布灵矽 AI —为新一代智能硬件而生的语音交互新范式,让智能硬件不仅会“说话”,更能听懂情绪、自然交流。这不仅是语音交互技术从“能用”到“好用”的升级,更是语音交互从
    的头像 发表于 08-15 15:33 1038次阅读
    七<b class='flag-5'>牛</b>云发布灵矽 <b class='flag-5'>AI</b>:600ms超低延迟,重塑智能硬件语音交互新范式

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    领导了多个重要的国际研究项目,多次获得业内奖项。200余项专利在多个国家获授权或在申请中,出版多部专著并发表篇学术论文。 张博士以其多年丰富的专业知识写成两本《AI芯片》,在这一图书领域填补了空白
    发表于 07-28 13:54

    “端云+模态”新范式:《移远通信AI大模型技术方案白皮书》正式发布

    7月28日,移远通信联合智次方研究院正式发布《AI大模型技术方案白皮书》(以下简称“白皮书”)。这份白皮书系统梳理了AI大模型的技术特点、产业发展态势与多元应用场景,以及移远通信“端云+模态”
    的头像 发表于 07-28 13:08 1518次阅读
    “端云+<b class='flag-5'>多</b>模态”新范式:《移远通信<b class='flag-5'>AI</b>大模型技术方案白皮书》正式发布

    模态+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式

    模态+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式
    的头像 发表于 06-12 10:17 872次阅读
    <b class='flag-5'>多</b>模态+空间智能:盾华以<b class='flag-5'>AI</b>+智慧路灯杆,点亮城市治理新方式