0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI发布的史上最强NLP似乎成了负面新

DPVg_AI_era 来源:lq 2019-02-19 09:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前几日,OpenAI发布史上最强“通用”NLP模型,但号称过于强大怕被滥用而没有开源,遭到网友猛怼、炮轰。而做为创始人之一的马斯克,虽然早已离开董事会,碍于舆论,不得不站出来做出澄清:我早已退出。

OpenAI发布的史上最强NLP似乎成了负面新闻。

原因是,OpenAI并没有公布GPT-2模型及代码,只是象征性的公布了一个仅含117M参数的样本模型及代码,给到的理由:因为这个模型能力太强大了!他们目前还有点hold不住它。一旦开源后被坏人拿到,将会贻害无穷。

之后有网友气不过跑到马斯克推特底下,叫骂OpenAI干脆改名CloseAI。

然而,马斯克却连发数文,澄清与OpenAI的关系:我早已退出。

马斯克表示,已经有一年多的时间没有和OpenAI密切合作了,并且也没有管理层和董事会的监督。

而后有网友追问:“一直不知道你为何离开OpenAI,可否给予详细的解释说明?”

马斯克便又在推特上补充道:

我必须集中精力解决大量让人头疼的工程和制造问题,尤其是在特斯拉和SpaceX方面。

此外,特斯拉与OpenAI在人才争夺方面也有一些交集,我并不同意其团队想要做的一些事情。综上所述,希望最好是友好分手。

曾是人工智能的反对者,却创立高端AI公司

2015年12月,马斯克与Y Combinator总裁Sam Altman共同创立这个非营利组织研究机构,以研究人工智能的道德和安全问题。

然而,在亲手创办两年多后,伊隆·马斯克退出了OpenAI董事会。

虽然马斯克于去年2月离开了该组织,但却一直被认为是OpenAI主要资助者之一。

官博地址:

https://blog.openai.com/openai-supporters/

OpenAI在去年2月20日发布的官方博客中也提到:“马斯克将离开OpenAI董事会,但仍将继续为该组织提供捐赠和建议。随着特斯拉将更加关注人工智能,这将消除马斯克未来潜在的冲突。”

值得注意的是,马斯克一直是人工智能最大的批评者之一。2014年在麻省理工学院演讲时,他将人工智能描述为“存在的最大威胁”,甚至称之为“召唤恶魔”。

他还认为人工智能甚至可以导致第三次世界大战。他补充称,大国之间都不会故意发动核战争,但人工智能将是最有可能的、先发制人的取胜之道。

OpenAI称模型使用15亿参数,训练一小时相当于烧掉一台iPhone Xs Max(512G)

马斯克之所以被@出来说明一个问题:Elon离开OpenAI的消息,还有很多人不知道,或者知道他已经离开了董事会却不知为何,导致他又特意出来发推澄清一下,顺便又蹭了一下OpenAI最近的热点。

OpenAI近日宣称他们研究出一个GPT-2的NLP模型,号称“史上最强通用NLP模型”,因为它是:

踩在15亿参数的身体上:爬取了Reddit上点赞超过三票的链接的文本内容,大约用到1000万篇文章,数据体量超过了40G,相当于35000本《白鲸记》。(注:小说约有21万单词,是电影《加勒比海盗》的重要故事参考来源之一。动漫《海贼王》里四皇之一的白胡子海贼团的旗舰就是以故事主角大白鲸的名字Moby Dick命名)。

无需预训练的“zero-shot”:在更通用的数据集基础上,使用自注意力模块迁移学习,不针对任何特定任务的数据进行训练,只是作为最终测试对数据进行评估,在Winograd Schema、LAMBADA以及其他语言建模任务上实现了state-of-the-art 的结果。

最终结果:8个数据集中油7个刷新当前最佳纪录。

下表显示了最先进的zero-shot结果。(+)表示该项分数越高越好。(-)表示分数越低越好。

虽然OpenAI没有在论文中提及具体的计算力及训练时间,但通过公布的数据推测,他们的模型使用了256个谷歌云TPU v3。

TPU v3在Google之外只提供单独使用版本(排除OpenAI可能得到了特别的许可),很可能GPT-2训练时所需的成本将高达8 * 256 = 2048美元/小时,相当于一小时烧掉一台512G的iPhone Xs Max。

然而,OpenAI并没有公布GPT-2模型及代码,只是象征性的公布了一个仅含117M参数的样本模型及代码,相当于他们宣称使用的数据量的0.29%。(有兴趣的读者可以去 https://github.com/openai/gpt-2 查看)

OpenAI给出的理由是:因为这个模型能力太强大了!他们目前还有点hold不住它。一旦开源后被坏人拿到,将会贻害无穷。有点中国武侠小说里,绝世武功秘籍的意思。

面临着实验重现的危机,网友吐槽:不公开代码和训练集就干脆别发表!

于是开发者和学者们不干了,纷纷质疑OpenAI这种做法显得心口不一。甚至盛产吐槽大神的Reddit上,有人建议OpenAI干脆改名CloseAI的言论,获得了数百网友的点赞。

OpenAI干脆改名“CloseAI”算了!

我也做了个超强大的MNIST模型,要不要担心它被滥用而不公开呢?

更有甚者,比如下面这位Ben Recht,还发了一条Twitter长文进行嘲讽:

今天我要介绍我们的论文“Do ImageNet Classifiers Generalize to ImageNet?”我们尝试按照原论文描述复现其结果,但发现这样做实在太难!

……我们完全可以基于一个不能公开的数据集构建一个超大模型,在我们自己的标准ML范式中很难发生过拟合。

但是,测试集上的一个微小改动就会导致分布结果大幅变化,你可以想见把模型和代码全都公布出来以后会发生什么!

PS 这篇论文还在arxiv等候审核发布,要不是我们的最终版PDF过大,那就是因为arxiv也学着OpenAI的做法,觉得AI/ML研究太过危险而不能公开。

因为人工智能这个蓬勃发展的领域正面临着实验重现的危机,AI研究者发现他们很难重现许多关键的结果。

针对主要会议上发表的400篇AI论文的调查显示,只有6%的论文包含算法的代码,约30%包含测试数据,54%包含伪代码。

CREDITS: (GRAPHIC) E. HAND/SCIENCE; (DATA) GUNDERSEN AND KJENSMO, ASSOCIATION FOR THE ADVANCEMENT OF ARTIFICIAL INTELLIGENCE 2018

去年,加拿大蒙特利尔大学的计算机科学家们希望展示一种新的语音识别算法,他们希望将其与一名著名科学家的算法进行比较。

唯一的问题:该benchmark的源代码没有发布。研究人员不得不从已公开发表的描述中重现这一算法。

但是他们重现的版本无法与benchmark声称的性能相符。蒙特利尔大学实验室博士生Nan Rosemary Ke说:“我们尝试了2个月,但都无法接近基准的性能。”

另外一群人更担心GPT-2会导致假新闻出现井喷。OpenAI也拿DeepFake举了个例子。

DeepFake由于其强大的图像生成能力,成了一个“假脸生成器/换脸器”,制造出大量恶意的虚假视频、音频和图像,最终被禁用。

比如这次,不怀好意的人完全可以借助GPT-2,发布有关Elon的假新闻,说他虽然公开宣称去年就退出OpenAI,但实际上私下还在OpenAI身居要职,恐怕也会有很多人相信。

技术是把双刃剑,越是强大的技术,一旦被用于坏用途,约可能造成更坏的结果。那么在这场意外掀起的激烈争论中,你站在哪一边呢?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50542

    浏览量

    267869
  • 马斯克
    +关注

    关注

    1

    文章

    862

    浏览量

    22723
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23382

原文标题:史上最强AI被喷,马斯克躺枪发推:我早就看不惯OpenAI

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    估值万亿美元!OpenAI最快周内递表IPO,2026成AI“变现”元年?

    电子发烧友网综合报道    最新消息显示,OpenAI准备最早于本周五(5月22日)秘密递交IPO招股书草案,为这宗有望成为史上最大规模之一的上市交易做准备。知情人士透露,目前OpenAI正与包括高
    的头像 发表于 05-22 09:11 4688次阅读

    OpenAI启动IPO前夕最大规模重组

    近日,OpenAI毫无预兆地宣布了公司历史上在IPO前夕最大规模、最剧烈的一次组织架构重组。ChatGPT、Codex以及面向开发者的API三大核心产品线被全部打碎,原地合并为一个统一的产品组织
    的头像 发表于 05-18 11:12 1749次阅读

    OpenAI发布多款产品

    联系人"心理健康功能** 。三款产品覆盖通用交互、行业专用和安全治理三个维度,释放出一个清晰信号:OpenAI正在从"造最强模型"转向"让模型在每个场景都能用、都安全"。
    的头像 发表于 05-12 13:40 698次阅读

    OpenAI成立部署公司并收购Tomoro

    近日,OpenAI正式宣布成立 **OpenAI部署公司(OpenAI Deployment)** ,一家专为企业构建和落地人工智能系统的全新子公司。与此同时,OpenAI已同意收购
    的头像 发表于 05-12 11:10 2288次阅读

    OpenAI正式发布ChatGPT Images 2.0版本

    在人工智能技术迅猛发展的浪潮中,OpenAI始终是引领行业变革的先锋力量。近日,OpenAI正式发布ChatGPT Images 2.0版本,这一消息如同一颗重磅炸弹,在科技圈引发了强烈反响,在
    的头像 发表于 04-22 11:32 4617次阅读

    GPT-5.1发布 OpenAI开始拼情商

    OpenAI正式上线了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有网友实测发现OpenAI发布的GPT-5.1大模型的指令执行能力更强了,可以更可靠地回答用户
    的头像 发表于 11-13 15:49 899次阅读

    AI业界新闻:OpenAI官宣自研首颗芯片 黄仁勋时隔9年再次给马斯克“送货”

    设计、博通负责制造与系统集成。博通与OpenAI已经签署战略合作,OpenAI与博通就共同开发和供应AI芯片达成了长期协议。 据悉,这是一款专为OpenAI大模型推理而优化的芯片;
    的头像 发表于 10-14 18:42 2199次阅读

    华为发布全球最强算力超节点和集群

    在华为全联接大会2025(HUAWEI CONNECT 2025)上,华为发布最强算力超节点和集群,并表示将发展生态作为公司核心战略,提升到前所未有的战略高度。在计算领域,鲲鹏昇腾坚持全面开源开放,携手伙伴和开发者共建繁荣的鲲鹏、昇腾产业生态,引领智能未来。
    的头像 发表于 10-10 17:29 2560次阅读

    NVIDIA携手OpenAI构建AI基础设施

    NVIDIA 首席执行官黄仁勋、OpenAI 首席执行官 Sam Altman 和 OpenAI 总裁 Greg Brockman 宣布了一项新的合作伙伴关系,旨在推动 OpenAI 的发展,并支持几乎所有行业和用户大规模使用
    的头像 发表于 09-23 14:38 1166次阅读

    OpenAI开源模型登陆IBM watsonx.ai开发平台

    OpenAI 已向公众发布了两款 AI 模型,允许开发者和企业可自由下载、运行并进行定制。其中一款模型现已部署在 IBM watsonx.ai 开发平台上。
    的头像 发表于 08-26 15:36 1218次阅读

    OpenAI或在周五凌晨发布GPT-5 OpenAI以低价向美国政府提供ChatGPT

    外界一直在期待的OpenAI新一代大语言模型GPT-5或将发布。据外媒的报道,GPT-5很可能在周五凌晨发布。这是OpenAI在2023年的3月份推出自然语言处理模型GPT-4之后,两
    的头像 发表于 08-07 14:13 1.6w次阅读

    OpenAI发布2款开源模型

    OpenAI开源了两款高性能权重语言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 发布了!我们做了一个开放模型,性能达到
    的头像 发表于 08-06 14:25 1212次阅读

    史上最强?520线激光雷达上车!

    电子发烧友网报道(文/梁浩斌) 目前市面上的前向激光雷达主要集中在128线,最高的也不过是192线。但极氪在最近举办的极氪9X技术发布会上,公布了极氪9X车型将首发搭载520线激光雷达,这也是目前
    的头像 发表于 07-14 09:15 4829次阅读

    摆脱依赖英伟达!OpenAI首次转向使用谷歌芯片

    电子发烧友网报道(文/李弯弯)近日,据知情人士透露,OpenAI近期已开始租用谷歌的张量处理单元(TPU),为旗下ChatGPT等热门产品提供算力支持。这一举措不仅标志着OpenAI首次实质性
    的头像 发表于 07-02 00:59 8669次阅读