0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI专家:GPT-3的性能令人惊叹,但存在规模和缺乏透明度等问题

如意 来源:读芯术微信公众号 作者:读芯术微信公众号 2020-09-18 16:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

算法像人一样写作,是人工智能研究实验室OpenAI多年来一直追寻的梦想。其最新研究成果是语言生成算法模型GPT-3,现已被用于生成让人难以分辨的伪文章,其所写博客骗过了黑客新闻(Hacker News)的发布者,甚至成为网站热门文章。

那个帖子是这样的:“要想把事情做好,也许我们根本不需要想太多。这似乎有悖常理,但我相信有时想得多了反而会阻碍我们的创造力。”

OpenAI之所以可以实现如此高效的算法,是因为它能够访问巨额计算量和数据,且此算法本身的容量远大于已有的所有算法:最大版本的GPT-3有1750亿个参数,这种方程式能帮算法做出更精准预测。GPT-2只有15亿个参数。

虽然OpenAI曾公布过它的算法,但这次它选择让GPT-3保持神秘。该公司表示,对大多数操作者来说,GPT-3实在是太大了,对其收费,就能让OpenAI从中获利。

在过去的一年里,OpenAI变革公司结构,使其更能吸引投资者。它放弃了“限制利润”模式的非盈利定位,这样如果OpenAI获利,投资者就能获得回报。它还与微软达成了10亿美元的合作协议,开启了两家公司之间的合作,该协议还允许OpenAI优先访问微软的云计算平台。

研究人员说,他们对OpenAI不公布算法表示质疑,称这违背了基本科学原则,且对该公司声明的核实变得愈发困难。

Facebook人工智能研究(FAIR)的联合董事暨Facebook蒙特利尔人工智能研究实验室负责人乔埃尔?皮诺(Joelle Pineau)在一封电子邮件中说到:“我对目前为止对诸如GPT-2/GPT-3和AlphaGo这类代码不共享的所有争论持怀疑态度。在人工智能领域,有很多类似情况。”

GPT-3的核心是个非常强大的英语写作工具。GPT-3最重要的是它的规模,它通过分析45万亿字节的数据学会了写作。报道称这个训练过程在云计算上花费了数百万美元,它见证了人类数以亿计的书写组合。

这是OpenAI长期战略的关键部分。多年来,该公司一直表示,深度学习算法的规模越大越好。数据越多,计算能力越强,算法的能力就越强。OpenAI就是因为具备同时在数百个GPU上训练算法的能力,才在《刀塔2》中击败了职业电子竞技玩家。

OpenAI的领导曾表示,OpenAI的政策主管杰克·克拉克(Jack Clark)认为算法越大,则“越有条理,越有创造力,也越可靠”。在谈到《刀塔2》机器人需要的训练量时,首席技术官格雷格·布罗克曼表示:“等运气耗尽,我们期待一场棋逢对手的比赛。”

GPT-3采用了类似方法。OpenAI认为,算法更大意味着参数更多,就能进行更普遍的操作。例如,GPT-3最基本的功能是自动补全,给它一个词或句子,它就会逐字逐句地生成它认为接下来该出现的词句。不必对算法进行任何修改,它也能回答问题,甚至进行翻译。这与只能处理一项任务的专项微调算法不同。

有人认为,这向人工智能的圣杯——通用智能迈出了一步,它意味着算法可以像人类一样学习和适应;而另一些人则表示,算法仍不能真正理解它生成的话语。

OpenAI发布了一篇详细的研究报告,解释了该算法的架构和它所取得的结果,而当涉及到GPT-3的功能研究时,其他人工智能研究人员只能选择相信OpenAI。这家研究公司最近不再以非盈利为定位,开始筹集资金开发商业产品,它不再像过去一样公布算法。

2019年2月,OpenAI宣称,前一最大版本GPT-2算法有可能生成错误信息或虚假新闻,太过危险不便发布,这一声明引来了很多质疑。公司先行发布了简易版的GPT-2,并未发现滥用迹象,才最终发布了最大版本算法。现在,与其说GPT-3太危险,不如说它似乎太有利可图而不能发行。

GPT-3只能通过OpenAI运行的API访问,这与亚马逊、谷歌和微软等公司的算法变现方式相类似。开发者可以编写程序向GPT-3发送特定指令,GPT-3在OpenAI的云端中生成响应并回传结果。虽然API在内测期间免费,但OpenAI正在考虑长期定价。这意味着研究人员只能向算法发送特定命令,而OpenAI可以随时取消访问权限。

OpenAI将这种做法归结于对安全和规模的考虑。如果该公司发现有人滥用API做了诸如支持假新闻网站的事情,那么它可以取消该开发者的访问权限。

该公司还表示,这些算法规模庞大,运行成本高昂,更别提开始训练后的花销。“这使得任何除大公司以外的使用者都很难从底层技术中获益。我们希望API能让小型企业和组织更容易地使用强劲的人工智能系统。”

由于云计算的计价方式,OpenAI训练和操作算法的确切成本很难核算。租赁GPU的成本根据特定服务器区域的地理邻近程度,以及基于项目规模的协议费率等因素的不同,差别很大。由于OpenAI为完成任务将其中部分资金用于建造自己的超级计算机,它可能从与微软的10亿美元合作中受益。

但是这些限制,即规模和缺乏透明度,使得其他科学家很难复制和验证该算法的有效性。

尽管涉及风险投资和企业利益,人工智能仍然是研究计算机科学的一个途径,且这种科学方法仍然适用。最好的科学实验,比如建立一个算法来成功完成一项任务并证明一个假设,是可以复制的。

皮诺是可复制计算机科学的热心支持者,她认为像GPT-3和AlphaGo这样尚未公布的算法是“科学文物”。她在电子邮件中说到:“这有点像挖出的恐龙骨头,它为你提供了支持某些理论的证据,但与实际进行实验是不一样的。”皮诺表示,这些“文物”有助于提出未来的研究假设,但它们仍然不能替代确凿的知识。

很多人担心,通过限制对代码和受训算法的访问,人工智能的“民主化”,即任何人都可使用人工智能,会受OpenAI威胁。“使用人工智能”这一用语是多层面的,意思是使用计算能力、数据集以及算法本身。诸如谷歌的TensorFlow和脸书的PyTorch这类开源框架使得算法易于构建和共享,还存在其他很多开源数据集。

然而,计算能力来自硬件,是一种有限的物理资源,大公司和像OpenAI这样资金充足的研究机构更容易获得该资源。

如果OpenAI的实验被证明是人工智能的发展方向,同时算法的扩大转化为性能的提高,那么消费不起先进人工智能的人就无法使用它了。这还会允许拥有资源的大公司制定规则,决定谁有权使用某些人工智能算法。例如,他们可以利用API进行设置,并对访问和使用算法进行收费。

乔治亚理工学院(Georgia Institute of Technology)研究自然语言处理的人工智能教授马克·瑞德尔(Mark Riedl)表示:“如果确信实现更好人工智能的方法实际上是实现更大规模,那么谁能拥有更优人工智能就由OpenAI决定了。”

瑞德尔对OpenAI是否会监视其新API的所有使用情况,以确定是否被用于恶意目的表示质疑,OpenAI曾花了大量精力来思考它的算法会如何被滥用。“OpenAI是否会查看输出,以判断他们的技术是否得到恰当使用?鉴于其宗旨,以及这与他们新盈利模式相冲突,这似乎很关键。他们能做到大规模监控吗?”

并非所有人都认同OpenAI“越大越好”的方法是人工智能的发展方向。例如,自然语言处理研究人员梅拉妮·米歇尔(Melanie Mitchell)就对GPT-3进行了“模仿”测试,要求算法识别特定字母序列的变化模式。如果“abc”变为“abd”,那么“efg”会变成什么?

上世纪80年代,米歇尔开发了一种算法来解决这类人类一直以来所进行类比的微型模拟测试。要正确地进行类比,必须理解所有组件之间的关系。在字母表的例子中,算法必须了解字母表的顺序和每个字母的位置。虽然该算法在众多测试中表现良好,但米歇尔发现,它也无法掌握其他算法数十年前已掌握的一些简单概念。

米歇尔说:“在研究方面,我个人认为,在一个问题上投入过多的计算和参数可能会把人工智能逼进死胡同。如果我们的目标是制造强大、具有普遍智能的机器,我认为这无法取得真正的进展。”

她承认,在制造需要深度学习的人工智能产品时,庞大的计算能力让科技巨头获得优势,但反之并不是所有现代问题都需要高能耗的深度学习算法,不是解决每个问题都需要达到GTP-3的规模。

米切尔在测试该算法时写道:“GPT-3的性能令人惊叹,但它也和当今最先进的人工智能系统中的很多情况类似:似乎很智能的性能中夹杂着一些非人类错误,而且我们搞不清楚它表现好或犯错误的原因。”
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4760

    浏览量

    97146
  • AI
    AI
    +关注

    关注

    89

    文章

    38099

    浏览量

    296620
  • GPT
    GPT
    +关注

    关注

    0

    文章

    368

    浏览量

    16715
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌Gemini 3模型开启智能新纪元

    大约两年前,我们开启了 Gemini 时代,这是公司迄今为止投入最大的科研和产品项目之一。自那时起,看到大家对它的喜爱程度,着实令人惊叹。现在,每月有 20 亿用户使用 AI 概览 (AI
    的头像 发表于 11-24 11:07 468次阅读
    谷歌Gemini <b class='flag-5'>3</b>模型开启智能新纪元

    工业级-专业液晶图形显示加速器RA8889ML3N简介+显示方案选型参考表

    即实现精美图形显示交互界面。‌瑞佑科技推出的专业液晶显示控制器RA8889ML3N内部集成了 128Mb SDRAM显存,最高支持1366*2048分辨率。还集成了画中画(PIP)、图像旋转、透明度
    发表于 11-14 16:03

    OPPO Pad 5搭载MediaTek天玑9400+芯片

    OPPO Pad 5 搭载 3nm 先进制程的天玑 9400+ 旗舰芯,全大核架构设计,内建大容量高速缓存,以更高的单线程和多线程任务处理性能,带来令人惊叹的日常应用、游戏全场景应用
    的头像 发表于 10-30 15:44 459次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+化学或生物方法实现AI

    ,是一种具有良好导电性的共轭聚合物 PSS:一种聚苯乙烯磺酸盐,是一种水溶性聚合物 PSS能够帮助PEDOT在水中形成稳定的分散体。两种聚合物以特定比例混合时,他们会形成一种具有高导电性、高透明度以及高
    发表于 09-15 17:29

    国鑫光电全球首发:LED全息透明双面屏,开启未来视觉新纪元

    传统显示屏往往局限于单一平面的显示,且在透明度和空间利用上存在诸多局限。国鑫光电此次推出的LED全息透明双面屏,以其独特的设计理念和创新技术,彻底打破了这些传统桎梏。
    的头像 发表于 09-11 18:08 3528次阅读
    国鑫光电全球首发:LED全息<b class='flag-5'>透明</b>双面屏,开启未来视觉新纪元

    规模专家并行模型在TensorRT-LLM的设计

    DeepSeek-V3 / R1 模型采用大规模细粒度混合专家模型 (MoE) 架构,大幅提升了开源模型的质量。Llama 4 和 Qwen3
    的头像 发表于 09-06 15:21 916次阅读
    大<b class='flag-5'>规模</b><b class='flag-5'>专家</b>并行模型在TensorRT-LLM的设计

    7个令人惊叹的树莓派应用,让你大开眼界!

    许多人认为树莓派只适合在家做些简单的业余项目。实际上,树莓派远不止于此——它是一台潜力巨大的微型计算机。在本文中,我将分享全球范围内树莓派最令人难以置信的应用。树莓派的应用场景广泛,从水下到太空
    的头像 发表于 07-16 16:51 904次阅读
    7个<b class='flag-5'>令人惊叹</b>的树莓派应用,让你大开眼界!

    利用NVIDIA 3D引导生成式AI Blueprint控制图像生成

    AI 赋能的图像生成技术突飞猛进,从早期模型会生成手指过多的人类图像,到现在能创造出令人惊叹的逼真视觉效果。即使取得了如此飞跃,仍然存在一个挑战:实现创意掌控。
    的头像 发表于 06-05 09:24 737次阅读

    InfiSight 智睿视界,拥抱 AI 做更落地的 ToB 生意

    的反应速度令人惊叹,没有任何一家科技公司能在这股 AI 浪潮的冲击下置身事外, 协创数据(SHARETRONIC) 也不例外。   集团创立至今,已先后成立了多个围绕 AIoT 开展的事业部,从服务器再制造到 AIoT 智能终端,协创数据一直在
    的头像 发表于 05-14 18:20 441次阅读

    高通骁龙8至尊版移动平台革新终端侧AI影像体验

    自智能手机时代以来,人们对于手机摄影的专业追求从未停歇。骁龙凭借前沿的影像和终端侧AI技术,持续引领移动计算摄影发展。最新的骁龙8至尊版移动平台,实现了突破性的技术升级和影像体验,全新打造的AI ISP带来令人惊叹的终端侧
    的头像 发表于 03-31 11:09 1599次阅读

    采用微米级三角形横截面栅线,实现99.86%透明度与低电阻,引领前接触技术革新与应用

    设计一种既能减少光损失又能保持高导电性的前接触结构。采用微米级三角形横截面栅线,通过光散射原理实现了99.86%的光学透明度和低至4.8Ω/sq的薄层电阻。三角形栅线设
    的头像 发表于 03-12 09:02 780次阅读
    采用微米级三角形横截面栅线,实现99.86%<b class='flag-5'>透明度</b>与低电阻,引领前接触技术革新与应用

    性能到商业,Grok3GPT-4o、DeepSeek如何重塑AI版图?

    2025年2月,AI领域仿佛上演了一场激烈的“诸神之战”,马斯克旗下xAI发布的Grok3、OpenAI推出的GPT-4o以及持续凭借R1模型大放异彩的DeepSeek,三大巨头强势登场,让A
    的头像 发表于 02-19 18:14 1559次阅读
    从<b class='flag-5'>性能</b>到商业,Grok<b class='flag-5'>3</b>、<b class='flag-5'>GPT</b>-4o、DeepSeek如何重塑<b class='flag-5'>AI</b>版图?

    AI模型思维链功能升级,提升透明度与可信度

    透明度。 值得注意的是,此次更新发生在DeepSeek-R1推理模型发布之后。作为OpenAI的竞争对手,DeepSeek-R1同样具备展示其反应背后思维过程的能力。两大模型在这一功能上的不谋而合,无疑彰显了AI领域对于提升决策透明度
    的头像 发表于 02-10 09:06 788次阅读

    腾讯混元3D AI创作引擎正式发布

    AI技术,能够根据用户提供的提示词或图片,直接生成高质量的3D模型。这一功能极大地降低了3D内容创作的门槛,使得即使是缺乏专业3D建模技能
    的头像 发表于 01-23 10:33 980次阅读

    AI训练数据面临枯竭困境,马斯克专家达成共识

    据知名科技媒体TechCrunch报道,近期,特斯拉创始人埃隆·马斯克与众多人工智能领域的专家共同表达了一个令人担忧的观点:现实世界中可用于训练AI模型的高质量数据正迅速接近枯竭的边缘。 这一观点
    的头像 发表于 01-10 15:31 1189次阅读