0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

讲真,AI研究发表和模型开源,真的该制定一个规范了

DPVg_AI_era 来源:lq 2019-02-24 10:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

深度学习界“最敢说的人”Yann LeCun再次放话,不过今天是提问:要是他早先能够预料到如今CNN被滥用,比如制作DeepFake换脸假视频,他当初还该不该开源CNN?讲真,AI研究发表和模型开源,真的该制定一个规范了。

Yann LeCun今天在Twitter上提问:

讲真,要是当初知道卷积神经网络(CNN)会催生DeepFake,我们还要不要发表CNN?

LeCun说:“问个严肃的问题:卷积神经网络(CNN)被用于(或开发)各种各样的应用。很多这样的应用对世界起到了积极影响,例如,医疗影像、汽车安全、内容过滤、环境监控等等。

“但有的应用则可能起到负面的效果,或者说侵犯隐私,例如,公众场所的人脸识别系统、进攻性武器,以及有偏见的“过滤”系统……

“那么,假设在上世纪80年代那时我们能够预见CNN的这些负面影响,我们该不该把CNN模型保密不公开呢?

“几点想法:

最终,CNN(或者类似的东西)还是会被其他人发明出来(实际上,有些人可以说差不多已经做到了)。其实,福岛邦彦就跟我说,他80年代末的时候正在研究一种用BP训练的新认知机(Neocogitron),但看到我们1989年发表的神经计算论文“大感震惊”(shocked),然后停止了他的项目。

开源CNN或深度学习软件平台直到2002年才出现(CNN是20世纪90年代早期商业软件包SN和2002年开源的Lush软件包的一项功能。20世纪90年代中后期才开始有OSS分发)。因此,在某种程度上,CNN直到2002年才完全发表(released)。但那时基本没有什么人关注CNN,或者想到用Lush来训练CNN。”

LeCun的这番话,可以说是为他此前的“表态”做出了完美的解释。

是的,这里说的还是关于OpenAI模型开源的那件事。

LeCun:担心模型太强大而不开源,干脆别研究AI

2月中旬,OpenAI宣布他们开发了一个通用文本生成模型GPT-2,拥有15亿参数,使用了800万网页进行训练,能够同时完成文本生成、回答问题、总结摘要、机器翻译等多项任务,有的时候效果甚至比专门的文本生成/问答/摘要总结等模型还要好。

接着,OpenAI用一个又一个的示例,充分展示了GPT-2模型有多强大,等到众人迫不及待地要了解设计细节时,突然话锋一转,说他们担心模型“太过强大”,开源后可能遭人滥用,这次决定不公布具体参数和训练数据集,只是放出一个小很多的样本模型供人参考。

谁料,OpenAI这一举动引爆了整个AI圈,相比GPT-2模型本身,对于模型是否该开源的争论在短时间内得到了更多的关注,NLP领域以外的研究人员和开发者也凑过来,而且“群众的意见”几乎是一边倒的反对OpenAI,简而言之:

担心AI过于强大而不开源太矫情,这样还不如一开始就别研究AI。

当时,LeCun不仅转发了一条讽刺OpenAI的推文,还“火上浇油”地写了个段子,大意是:可不能开源在MNIST数据集上精度99.99%的模型,这可能被人用来篡改邮编,发动垃圾邮件恐怖袭击,那还得了。具体见下:

最终,LeCun对OpenAI不予开源的嘲讽发展到了极致:

“每个新生出来的人都可能造谣、传播流言并影响其他人,那我们是不是该别生孩子了?”

这番言论实在称不上严谨,甚至不能算“严肃”,但作为Facebook首席科学家、卷积神经网络发明人和深度学习三巨头之一,LeCun在如今的AI圈子里拥有巨大的影响力,他的这一表态迅速成为重磅砝码,压在了天平“反对不开源”的这边,不仅坚定了此前站出来表示反对的人的信念,还影响了不少后来人的观点。

关于模型开源,我们真正关注的应该是什么?

当然,现在业界的重点已经从最初的口水战聚焦到AI研究发表和开源政策的讨论上来。

LeCun或许也是希望用今天这个“serious question”来阐述自己当初过于简单而容易被人误会的表态。

大多数研究人员都同意,OpenAI决定不开源的出发点是好的,但给出的理由却不尽人意:

首先,GPT-2模型是否真有那么强大?不公布细节无法证明这一点。这也是一开始口水战的一大焦点,如果不给出细节,谁都可以站出来说我实现了强AI,但由于“担心太过强大”,所以我不能发表。

插一句,从OpenAI公布的统计数据中可以看出,GPT-2不仅仅是“记住了”数据,而是确实具有更强的泛化性能。

其次,公开了模型设计和训练数据集,是否就会被人拿去在网上“假言惑众”?先抛开结果复现程度,但看训练成本——OpenAI并没有介绍训练GPT-2模型的时间,但根据知情的研究人员透露,OpenAI取得了特许,使用谷歌TPU来训练模型,1小时花费2048美元。这个费用不是一般人能承担得起的,而能承担起这种费用的,如果真要“作恶”,有大概率不需要借助开源模型。

最后,关于企业研究机构如何宣传AI研究,如何面对公众、媒体和研究人员等不同群体,OpenAI的做法也有一些争议。DeepMind在最初介绍WaveNet,一个能合成与真人语音几乎无二的强大语音生成模型的时候对于潜在危险只字不提,而OpenAI不但主动提出并且还想要牵头制定AI研究发表的相关政策。这里说不出谁对谁错,但OpenAI只给出一个邮箱地址,欢迎“感兴趣的研究人员”联系他们的做法是远远不够的。

现在能够肯定的是,关于AI研究发表和模型开源,相关的政策真的需要制定了。OpenAI在担心模型被滥用时举了DeepFake为例,DeepFake是基于CNN构建的图像生成模型,由于强大的图像生成能力,能够生成以假乱真的人脸,甚至骗过先进的人脸识别模型。

那么回到LeCun一开始问的那个严肃的问题:

要是当初知道卷积神经网络(CNN)会催生DeepFake,我们还要不要发表CNN呢?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38346

    浏览量

    297470
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123994
  • cnn
    cnn
    +关注

    关注

    3

    文章

    355

    浏览量

    23264

原文标题:LeCun:30年前知道DeepFake,我还该不该开源CNN?

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA推动面向数字与物理AI开源模型发展

    NVIDIA 发布系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA) NVIDIA DRI
    的头像 发表于 12-13 09:50 841次阅读

    成都汇阳投资关于国产开源模型持续突破,国产AI 竞争力增强

           国产开源模型领跑 ,AI 生态有望加速繁荣 根据独立 AI 基准测试与分析平台 Artificial Analysis 最新榜单 , 国产
    的头像 发表于 11-24 14:01 227次阅读

    AI模型的配置AI模型怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    和关联性 AI驱动科学:研究和模拟人类思维和认识过程。 本章节作者为我们讲解了第五范式,介绍科学发现的般方法和流程等。、科学发现的5
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    连接定义神经网络的拓扑结构。 不同神经网络的DNN: 、基于大模型AI芯片 1、Transformer 模型与引擎 1.1 Trans
    发表于 09-12 17:30

    IBM联合NASA发布开源AI模型重要突破

    近日,IBM(纽交所代码:IBM)与美国国家航空航天局 (NASA) 联合发布款开创性的开源基础模型,可理解高分辨率的太阳观测数据,从而预测太阳活动对地球和太空技术的影响。
    的头像 发表于 09-02 09:16 684次阅读

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    创新、应用创新、系统创新五部分,接下来一一解读。 算法创新 在深度学习AI芯片的创新上,书中围绕大模型与Transformer算法的算力需求,提出了系列架构与方法创新,包括存内计算
    发表于 07-28 13:54

    自制支持AI 控制的无刷平衡车机器人:开源项目D-BOT全攻略

    今天给大家介绍款创意桌面机器人——D-BOT!它不仅是功能强大的平衡车机器人,也是融合
    发表于 04-28 11:45

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    Studio提供最优解。Neuron Studio可针对模型到应用,提供站式、全链路、自动化的开发协助,不仅让AI应用开发的全流程可视化,更带来整个多种工具的
    发表于 04-13 19:52

    AI开源如何影响IBM的未来

    DeepSeek-R1 是开源的人工智能(AI)推理模型,在某些任务中表现出了极具竞争力的性能,它的
    的头像 发表于 03-03 11:21 702次阅读

    AI开源模型库有什么用

    AI开源模型库作为推动AI技术发展的重要力量,正深刻改变着我们的生产生活方式。接下来,AI部落小编带您了解
    的头像 发表于 02-24 11:50 923次阅读

    模型训练:开源数据与算法的机遇与挑战分析

    最近,开源中国 OSCHINA、Gitee 与 Gitee AI 联合发布《2024 中国开源开发者报告》。 报告聚焦 AI
    的头像 发表于 02-20 10:40 1021次阅读
    大<b class='flag-5'>模型</b>训练:<b class='flag-5'>开源</b>数据与算法的机遇与挑战分析

    C#集成OpenVINO™:简化AI模型部署

    什么是OpenVINO 工具套件? OpenVINO 工具套件是用于优化和部署人工智能(AI模型,提升AI推理性能的
    的头像 发表于 02-17 10:03 2554次阅读
    C#集成OpenVINO™:简化<b class='flag-5'>AI</b><b class='flag-5'>模型</b>部署

    AI基础模型提升癌症诊断精确度,实现个性化治疗方案定制

    每位患者特有的医疗数据为其量身定制治疗方案。 研究的资深学者、放射肿瘤学副教授李瑞江表示:“多模态基础模型是医学 AI 研究
    的头像 发表于 02-11 09:22 1224次阅读
    <b class='flag-5'>AI</b>基础<b class='flag-5'>模型</b>提升癌症诊断精确度,实现个性化治疗方案定制

    Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑

    ​在人工智能领域,Meta的最新动作再次引起了全球的关注。今天,我们见证Meta发布的 Llama 3.3 70B 模型,这是开源的人
    的头像 发表于 12-18 16:46 906次阅读
    Meta重磅发布Llama 3.3 70B:<b class='flag-5'>开源</b><b class='flag-5'>AI</b><b class='flag-5'>模型</b>的新里程碑