讲真，AI研究发表和模型开源，真的该制定一个规范了-电子发烧友网

深度学习界“最敢说的人”Yann LeCun再次放话，不过今天是提问：要是他早先能够预料到如今CNN被滥用，比如制作DeepFake换脸假视频，他当初还该不该开源CNN？讲真，AI研究发表和模型开源，真的该制定一个规范了。

Yann LeCun今天在Twitter上提问：

讲真，要是当初知道卷积神经网络(CNN)会催生DeepFake，我们还要不要发表CNN？

LeCun说：“问个严肃的问题：卷积神经网络(CNN)被用于(或开发)各种各样的应用。很多这样的应用对世界起到了积极影响，例如，医疗影像、汽车安全、内容过滤、环境监控等等。

“但有的应用则可能起到负面的效果，或者说侵犯隐私，例如，公众场所的人脸识别系统、进攻性武器，以及有偏见的“过滤”系统……

“那么，假设在上世纪80年代那时我们能够预见CNN的这些负面影响，我们该不该把CNN模型保密不公开呢？

“几点想法：

最终，CNN(或者类似的东西)还是会被其他人发明出来(实际上，有些人可以说差不多已经做到了)。其实，福岛邦彦就跟我说，他80年代末的时候正在研究一种用BP训练的新认知机(Neocogitron)，但看到我们1989年发表的神经计算论文“大感震惊”(shocked)，然后停止了他的项目。

开源CNN或深度学习软件平台直到2002年才出现(CNN是20世纪90年代早期商业软件包SN和2002年开源的Lush软件包的一项功能。20世纪90年代中后期才开始有OSS分发)。因此，在某种程度上，CNN直到2002年才完全发表(released)。但那时基本没有什么人关注CNN，或者想到用Lush来训练CNN。”

LeCun的这番话，可以说是为他此前的“表态”做出了完美的解释。

是的，这里说的还是关于OpenAI模型开源的那件事。

LeCun：担心模型太强大而不开源，干脆别研究AI

2月中旬，OpenAI宣布他们开发了一个通用文本生成模型GPT-2，拥有15亿参数，使用了800万网页进行训练，能够同时完成文本生成、回答问题、总结摘要、机器翻译等多项任务，有的时候效果甚至比专门的文本生成/问答/摘要总结等模型还要好。

接着，OpenAI用一个又一个的示例，充分展示了GPT-2模型有多强大，等到众人迫不及待地要了解设计细节时，突然话锋一转，说他们担心模型“太过强大”，开源后可能遭人滥用，这次决定不公布具体参数和训练数据集，只是放出一个小很多的样本模型供人参考。

谁料，OpenAI这一举动引爆了整个AI圈，相比GPT-2模型本身，对于模型是否该开源的争论在短时间内得到了更多的关注，NLP领域以外的研究人员和开发者也凑过来，而且“群众的意见”几乎是一边倒的反对OpenAI，简而言之：

担心AI过于强大而不开源太矫情，这样还不如一开始就别研究AI。

当时，LeCun不仅转发了一条讽刺OpenAI的推文，还“火上浇油”地写了个段子，大意是：可不能开源在MNIST数据集上精度99.99%的模型，这可能被人用来篡改邮编，发动垃圾邮件恐怖袭击，那还得了。具体见下：

最终，LeCun对OpenAI不予开源的嘲讽发展到了极致：

“每个新生出来的人都可能造谣、传播流言并影响其他人，那我们是不是该别生孩子了？”

这番言论实在称不上严谨，甚至不能算“严肃”，但作为Facebook首席科学家、卷积神经网络发明人和深度学习三巨头之一，LeCun在如今的AI圈子里拥有巨大的影响力，他的这一表态迅速成为重磅砝码，压在了天平“反对不开源”的这边，不仅坚定了此前站出来表示反对的人的信念，还影响了不少后来人的观点。

关于模型开源，我们真正关注的应该是什么？

当然，现在业界的重点已经从最初的口水战聚焦到AI研究发表和开源政策的讨论上来。

LeCun或许也是希望用今天这个“serious question”来阐述自己当初过于简单而容易被人误会的表态。

大多数研究人员都同意，OpenAI决定不开源的出发点是好的，但给出的理由却不尽人意：

首先，GPT-2模型是否真有那么强大？不公布细节无法证明这一点。这也是一开始口水战的一大焦点，如果不给出细节，谁都可以站出来说我实现了强AI，但由于“担心太过强大”，所以我不能发表。

插一句，从OpenAI公布的统计数据中可以看出，GPT-2不仅仅是“记住了”数据，而是确实具有更强的泛化性能。

其次，公开了模型设计和训练数据集，是否就会被人拿去在网上“假言惑众”？先抛开结果复现程度，但看训练成本——OpenAI并没有介绍训练GPT-2模型的时间，但根据知情的研究人员透露，OpenAI取得了特许，使用谷歌TPU来训练模型，1小时花费2048美元。这个费用不是一般人能承担得起的，而能承担起这种费用的，如果真要“作恶”，有大概率不需要借助开源模型。

最后，关于企业研究机构如何宣传AI研究，如何面对公众、媒体和研究人员等不同群体，OpenAI的做法也有一些争议。DeepMind在最初介绍WaveNet，一个能合成与真人语音几乎无二的强大语音生成模型的时候对于潜在危险只字不提，而OpenAI不但主动提出并且还想要牵头制定AI研究发表的相关政策。这里说不出谁对谁错，但OpenAI只给出一个邮箱地址，欢迎“感兴趣的研究人员”联系他们的做法是远远不够的。

现在能够肯定的是，关于AI研究发表和模型开源，相关的政策真的需要制定了。OpenAI在担心模型被滥用时举了DeepFake为例，DeepFake是基于CNN构建的图像生成模型，由于强大的图像生成能力，能够生成以假乱真的人脸，甚至骗过先进的人脸识别模型。

那么回到LeCun一开始问的那个严肃的问题：

要是当初知道卷积神经网络(CNN)会催生DeepFake，我们还要不要发表CNN呢？

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
26410

浏览量
264018
深度学习

深度学习

+关注

关注
73

文章
5235

浏览量
119893
cnn

cnn

+关注

关注
3

文章
326

浏览量
21296

原文标题：LeCun：30年前知道DeepFake，我还该不该开源CNN？

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

防止AI大模型被黑客病毒入侵控制（原创）聆思大模型AI开发套件评测4

在训练一只聪明的AI小动物解决实际问题，通过构建神经网络模型并进行推理，让电脑也能像人一样根据输入信息做出决策。在上述示例中，我创建了一

发表于 03-19 11:18

cubemx ai导入onnx模型后压缩失败了怎么解决？

cubemx ai导入onnx模型后压缩失败。请问我怎么解决

发表于 03-19 07:58

使用cube-AI分析模型时报错的原因有哪些？

使用cube-AI分析模型时报错，该模型是pytorch的cnn转化成onnx ``` Neural Network Tools for STM32

发表于 03-14 07:09

IBM在watsonx上提供开源的Mistral AI模型

上最新的开源模型，watsonx 提供企业就绪的人工智能开发平台、数据存储和治理功能 IBM（纽约证券交易所代码：IBM）近日宣布，由 Mistral AI 公司开发的广受欢迎的开源

发表于 03-12 19:10 •1088次阅读

谷歌发布轻量级开源人工智能模型Gemma

谷歌近日宣布推出开源人工智能（AI）模型系列Gemma，旨在为开发人员和研究人员提供一个负责任的AI构建平台。这一举措标志着自2022年Op

发表于 02-23 11:38 •410次阅读

AI大模型怎么解决芯片过剩?

AI大模型

电子发烧友网官方

发布于 :2024年01月02日 15:42:05

AI大模型可以设计电路吗?

AI大模型

电子发烧友网官方

发布于 :2024年01月02日 15:09:29

【KV260视觉入门套件试用体验】Vitis AI 构建开发环境，并使用inspector检查模型

/vitis-ai-cpu:latest 第二步，可以使用了………完……… (^_^)，当然不是这么简单，Vitis AI 不仅仅是一个工具，而是

发表于 10-14 15:34

能把百城主官聚在一起的，也只有AI大模型了，和华为云一起，探秘城市+AI的化学反应

AI大模型

脑极体
发布于 :2023年09月20日 20:40:16

盘古大模型测评盘古大模型是开源的吗？盘古ai大模型是软件吗?

盘古大模型测评盘古大模型是开源的吗？盘古ai大模型是软件吗? 盘古大模型测评随着人工智能的快

发表于 08-30 17:26 •3875次阅读

AI大模型的开源算法介绍

AI大模型的开源算法介绍什么是开源？简单来说就是不收取任何费用，免费提供给用户的软件或应用程序。开源是主要用于软件的术语，除了免费用户还可

发表于 08-08 17:25 •1372次阅读

阿里云开源AI大模型，挑战Meta、OpenAI

亲爱的朋友，欢迎收看河套IT WALK总第91期。今日全球重大技术新闻目录： · Google 的 RT-2：当人工智能遇上机器人 ·IBM联手NASA：开源地理空间AI模型，助力气候科学

发表于 08-04 18:45 •541次阅读

训练好的ai模型导入cubemx不成功怎么解决？

训练好的ai模型导入cubemx不成功咋办，试了好几个模型压缩了也不行，ram占用过大，有无解决方案？

发表于 08-04 09:16

Meta开源I-JEPA，“类人”AI模型

，实现比现有模型更准确地分析和完成未完成的图像。目前相关的训练代码和模型已开源，I-JEPA 论文则计划在下周的 CVPR 2023 上发表。

发表于 06-18 17:47 •802次阅读

中国开源未来发展峰会“问道 AI 分论坛”即将开幕！

的发展，一个好的 AI 技术产品该如何迭代与运营…… 为了能够与广大开发者一起更好地拥抱 AI

发表于 05-09 09:49

搜索历史

讲真，AI研究发表和模型开源，真的该制定一个规范了

评论

防止AI大模型被黑客病毒入侵控制（原创）聆思大模型AI开发套件评测4

cubemx ai导入onnx模型后压缩失败了怎么解决？

使用cube-AI分析模型时报错的原因有哪些？

IBM在watsonx上提供开源的Mistral AI模型

谷歌发布轻量级开源人工智能模型Gemma

AI大模型怎么解决芯片过剩?

AI大模型可以设计电路吗?

【KV260视觉入门套件试用体验】Vitis AI 构建开发环境，并使用inspector检查模型

能把百城主官聚在一起的，也只有AI大模型了，和华为云一起，探秘城市+AI的化学反应

盘古大模型测评盘古大模型是开源的吗？盘古ai大模型是软件吗?

AI大模型的开源算法介绍

阿里云开源AI大模型，挑战Meta、OpenAI

训练好的ai模型导入cubemx不成功怎么解决？

Meta开源I-JEPA，“类人”AI模型

中国开源未来发展峰会“问道 AI 分论坛”即将开幕！