0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌Gemini被曝夸大营销?碾压GPT4纯靠“一张嘴”

新火种 来源:新火种 作者:新火种 2023-12-09 09:09 次阅读

Gemini对谷歌来说可能走了一大步,但对整个AI领域而言,并没有说的那么夸张。

涉嫌虚假宣传,交互非实时感知

才短短一天时间,谷歌Gemini就被曝涉嫌造假,夸大宣传。

作为谷歌用来应对GPT-4的“杀手锏”,Gemini一经亮相就有了两个硕大的标签:超过人类专家,碾压GPT-4。随便单拎一条出来,都是目前其他大模型所不能比拟的成绩。

但也有越来越多的人开始质疑它的真实性,彭博社的Parmy Olsen就是第一个质疑视频造假的人。

wKgZomVzEneAXXjZAAVz8X4uiIk237.jpg

就在大家震惊于谷歌发布的6分钟互动视频里,他指出,Gemini所有交互都不是实时感知的,存在后期制作和剪辑配音的成分。随后这一说法也得到了谷歌官方的证实,承认Gemini的确使用了静态图片和多段提示词拼凑,才能达成这样的效果。

简单来说就是,Gemini不能直接看懂一段动作视频,只能看懂多张图片。像演示视频里人类在玩石头剪刀布,实际上是把“布”“拳头”“剪刀”三张照片依次传给Gemini,然后加上良好的提示词,才能让Gemini给出回答,然后再由员工配音念出来。

wKgaomVzEneAV8QDAAO13Fe4PyA903.jpg

而且视频中展示的许多其他功能并不是谷歌独有的,GPT Plus3也可以做得到,沃顿商学院教授伊森·莫里克(Ethan Mollick)就用实验证实了这一点。

虽然从技术原理上来看,能够读取图片和能够看懂视频之间,并没有技术上的鸿沟。但是从产品实现落地的角度看,把读取图片约等于能实时看懂视频,过于强调实时性而压缩了交互过程中的延迟,这几乎已经可以理解为虚假宣传。而是否需要良好的提示词工程,更是评价模型能力的关键问题。

混淆跑分,GPT4测试标准不一致

从谷歌对Gemini的宣传信息来看,它声称Gemini在32项标准性能指标中,有30 项指标都优于GPT-4,跑出90%的高分,超过GPT-4。但实际上,差距微乎其微,而且这种比较并不公平。

Gemini Ultra的90%得分是基于谷歌研究人员开发的一种基于32个样本的思维链的方法。对于同一个问题,Gemini Ultra会生成32个答案以及这些答案的推理。然后,模型会选择最常见的答案作为最终答案。

wKgZomVzEniAQXv7AAD_QaiUz00699.jpg

但GPT-4的86.4%分数是基于行业评估标准5-shot。HuggingFace技术主管Philipp Schmid特意从Gemini的技术报告中提取数据重做计算,在5-shot的标准下,Gemini的得分实为83.7%,比GPT-4更低。

wKgaomVzEniAay9kAAT7Sd3k3Ts400.jpg

也就是说只有CoT(思维链)达到32个例子时,Gemini Ultra才能达到90分超过GPT-4;当例子数量减少到5个,Gemini Ultra得分就不如GPT-4。难怪连谷歌公司高管在之前都回避了关于该模型比GPT-4 强多少的问题,因为它们只是“强”在了不同的标准上。

就像谷歌在5月份发布Palm-2的时候,也挑出了两个优于GPT-4的指标,但是后来这个大模型怎么样,大家都清楚。

斯坦福大学基础模型研究中心主任 Percy Liang也谈到,虽然Gemini有很好的基准分数,但由于不知道训练数据的内容,因此很难解释这些数据。华盛顿大学计算语言学教授 Emily Bender也指出,谷歌宣传Gemini是一台万能机器,是一个可用于多种不同用途的通用模型。但是谷歌却在使用狭隘的基准,来评估它期望用于这些不同用途的模型,这意味着它实际上无法得到彻底评估。

仓促上阵,只为趁OpenAI动荡搞事?

今年3月,OpenAI发布GPT人工智能模型,并推出其支持的付费聊天AI机器人ChatGPT,这其实对谷歌来说压力很大。

毕竟谷歌已经耗费了数年心血,在人工智能领域投入巨资研究,却没想到被半路杀出来的OpenAI弯道超车。

所以在4月,谷歌迫于投资方的巨大压力,将负责人工智能研究的Google Brain,与母公司Alphabet位于伦敦的人工智能研究实验室DeepMind合并,为了在今年接下来的时间里研发Gemini模型来回应GPT-4的挑战。

而在两周前,OpenAI刚刚重新任命了奥特曼为首席执行官,并任命了新的董事会成员,勉强给这家初创公司的一段动荡期画上了句号。这场内斗事件也促使一些客户开始评估其他AI提供商,谷歌选择在这个时间点推出Gemini的心思不言而喻。

据报道,当OpenAI董事会暂时罢免首席执行官奥特曼,使公司的未来发展受到质疑时,谷歌迅速发起了一场营销活动,说服OpenAI企业客户转向谷歌。现在,随着Gemini的发布,谷歌也正是在利用这种不确定性。

然而,目前大多数人还是不能完整地体验Gemini。最强大的对标GPT-4的满血版Gemini Ultra,还需要等待几个月才能和公众见面。据谷歌高管的说法,预计将于明年初上市。而现在推出的版本是为谷歌基于文本的搜索聊天机器人Bard的后台,为其提供更高级的推理、规划和理解能力。

在接下来的几个月里,新的Gemini增强版Bard会在170多个国家提供英语版本的首发,不包括欧盟和英国。谷歌负责Bard的副总裁Sissie Hsiao表示,这是因为公司需要与当地监管机构“接轨”。除此之外,Gemini还有一个名为Nano的版本,可以直接在设备上运行的,例如谷歌的新款Pixel手机

谷歌VS OpenAI:瑜亮之争鹿死谁手?

12月7日,随着Gemini的高调发布,谷歌市值一晚就增加逾870亿美元,增量相当于OpenAI的最新估值。就目前来说,未上市的OpenAI估值在800亿至900亿美元之间。

要知道,今年以来谷歌的股价已经上涨了逾50%,大幅跑赢了纳斯达克综合指数,但却落后于一些科技同行,里面就包括OpenAI最大的投资方微软。

事实上,谷歌在过去的发展历史中已经吃过很多次苦头,推出有缺陷的产品。这对公司发展来说,适得其反。就像今年2月为了应对ChatGPT急急忙忙推出的Bard,因为一次小小失误就导致股价蒸发了高达1000亿美元。

wKgZomVzEnqAdrotAADFpBReZXw314.jpg

哪怕是5月,谷歌宣布在大部分产品中植入生成型人工智能,比如谷歌邮箱和其他软件,试图用这个举动改变市场的看法,但效果却微乎其微。这也让谷歌深刻认识到,推出有缺陷的产品带来的反噬。

但在科技行业,只要足够强大就足以抢占市场。早期的手机霸主诺基亚和黑莓就经历过惨痛教训,苹果用功能更强大、更直观的iPhone抢走了它们的市场。在软件领域,商业上的成功往往来自于性能最好的系统。

几乎可以肯定的是,随着Gemini的发布,谷歌或许有望逐渐扭转那些不利的局面。摩根大通分析师就表示,“谷歌开始通过结合 Gemini的不同模型版本,来解决投资者对生成式人工智能创新和GenAI模型运行成本过高的担忧。”

不过如果Gemini Ultra真如谷歌所说那样在明年1月初发布,那么在顶级人工智能模型的头部就呆不了太久时间。毕竟在谷歌努力追赶OpenAI的过程中,后者有将近一年的时间来开发新一代人工智能模型GPT-5。

但有一点不能否认,谷歌和OpenAI的这场对决,已是箭在弦上。

审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5861

    浏览量

    103269
  • Gemini
    +关注

    关注

    0

    文章

    35

    浏览量

    7476
  • 人工智能
    +关注

    关注

    1776

    文章

    43888

    浏览量

    230633
  • GPT
    GPT
    +关注

    关注

    0

    文章

    302

    浏览量

    14869
  • OpenAI
    +关注

    关注

    8

    文章

    761

    浏览量

    5918
收藏 人收藏

    评论

    相关推荐

    谷歌Gemini自曝用文心一言训练,字节被OpenAI封号,大模型互薅羊毛是常态?

    博主@阑夕爆料,对谷歌Gemini进行测试时,如果用中文询问Gemini的身份,其回答竟然是百度文心一言。   更让人大跌眼镜的是,测试人员可以使用“小爱同学”“小度”等提示词唤醒Gemini
    的头像 发表于 12-20 09:03 2206次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>自曝用文心一言训练,字节被OpenAI封号,大模型互薅羊毛是常态?

    谷歌发布史上最强大模型Gemini,全方位领先GPT-4,MMLU基准达人类专家水平

    电子发烧友网报道(文/吴子鹏)美国当地时间周三,谷歌发布了其新一代人工智能模型Gemini(双子星)。谷歌CEO桑达尔・皮查伊和Deepmind CEO戴密斯·哈萨比斯在谷歌官网联名发
    的头像 发表于 12-08 00:11 2525次阅读
    <b class='flag-5'>谷歌</b>发布史上最强大模型<b class='flag-5'>Gemini</b>,全方位领先<b class='flag-5'>GPT</b>-4,MMLU基准达人类专家水平

    谷歌推出新一代大模型Gemini 1.5

    近日,谷歌在无预警的情况下发布了其下一代大模型——Gemini 1.5,这款模型在性能上实现了显著增强,并在长上下文理解方面取得了令人瞩目的突破。更令人惊叹的是,Gemini 1.5甚至能够仅凭提示词学会一门训练数据中没有的新语
    的头像 发表于 02-20 13:55 330次阅读

    谷歌Gemini 1.5深夜爆炸上线,史诗级多模态硬刚GPT-5!最强MoE首破100万极限上下文纪录

    我们经历了LLM划时代的一夜。GeminiUltra发布还没几天,Gemini1.5就来了。卯足劲和OpenAI微软一较高下的谷歌,开始进入了高产模式。自家最强的Gemini1.0Ultra才发布
    的头像 发表于 02-19 12:28 469次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b> 1.5深夜爆炸上线,史诗级多模态硬刚<b class='flag-5'>GPT</b>-5!最强MoE首破100万极限上下文纪录

    谷歌最新人工智能模型Gemini Pro已在欧洲上市

    近日,谷歌宣布其最新人工智能模型Gemini Pro已在欧洲市场上市,向欧洲用户开放。Gemini Pro是谷歌最大的人工智能(AI)模型之一,被视为巴德(Bard)的升级版。
    的头像 发表于 02-04 15:10 724次阅读

    Gemini和ChatGPT有什么不同,Gemini将超越ChatGPT?

    Gemini Ultra是首个在MMLU测评上超过人类专家的大模型,取得90.0%的成绩。作为对比,人类专家的成绩为89.8%,GPT-4为86.4%。
    发表于 12-20 11:45 250次阅读
    <b class='flag-5'>Gemini</b>和ChatGPT有什么不同,<b class='flag-5'>Gemini</b>将超越ChatGPT?

    新火种AI | 谷歌Gemini“抄袭”百度文心一言?AI训练数据陷难题

    谷歌自己放出“实锤”,Gemini化身百度文心大模型?
    的头像 发表于 12-20 09:09 235次阅读
    新火种AI | <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>“抄袭”百度文心一言?AI训练数据陷难题

    谷歌推出Gemini 希望击败GPT-4

    Gemini不仅仅是一个单一的人工智能模型。有一个简单版本叫Gemini Nano,旨在在安卓设备上离线运行。有一个更强大的版本叫Gemini Pro,很快将为谷歌的许多人工智能服务提
    的头像 发表于 12-14 17:30 481次阅读

    谷歌声称Gemini超越GPT-4,你有何看法呢?

    谁能想到,一夜之间,人们对于谷歌 Gemini 的看法竟发生了 180° 转变。
    的头像 发表于 12-14 09:54 272次阅读
    <b class='flag-5'>谷歌</b>声称<b class='flag-5'>Gemini</b>超越<b class='flag-5'>GPT</b>-4,你有何看法呢?

    成都汇阳投资关于谷歌Gemini 王者归来,AI 算力和应用值得期待

    Gemini 大模型主打多模态,性能对标GPT-4】 当地时间12月6日, 谷歌公司宣布推出其规模最大、功能最强的多模态大模型 Gemini, 其最强大的 TPU (张量处理单元)系
    的头像 发表于 12-11 14:40 630次阅读
    成都汇阳投资关于<b class='flag-5'>谷歌</b>携 <b class='flag-5'>Gemini</b> 王者归来,AI 算力和应用值得期待

    新火种AI|谷歌深夜发布复仇神器Gemini,原生多模态碾压GPT-4?

    谷歌背水一战,发布Gemini,狙击GPT-4
    的头像 发表于 12-08 09:09 769次阅读
    新火种AI|<b class='flag-5'>谷歌</b>深夜发布复仇神器<b class='flag-5'>Gemini</b>,原生多模态<b class='flag-5'>碾压</b><b class='flag-5'>GPT</b>-4?

    谷歌Gemini被曝算力达GPT-4五倍,手握TPU王牌碾压OpenAI

    根据Patel和Nishball的说法,此前屡屡被爆料将成为GPT-4大杀器的谷歌Gemini,已经开始在新的TPUv5 Pod上进行训练了,算力高达~1e26 FLOPS,比训练GPT
    的头像 发表于 09-04 16:02 590次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>被曝算力达<b class='flag-5'>GPT</b>-4五倍,手握TPU王牌<b class='flag-5'>碾压</b>OpenAI

    chatGPT和GPT4有什么区别

    chatGPT和GPT4有什么区别 GPT(Generative Pre-trained Transformer)系列模型由OpenAI公司开发,是一组用于自然语言处理(NLP)任务的人工智能模型
    的头像 发表于 08-09 15:18 1802次阅读

    你考虑用GPT4搞电机吗?

    最近的GPT4有多火这里不需要赘述了。微软,苹果,baidu等各巨头纷纷跟进。这个赛道最近是各种资本涌入,犹如PC互联网转型到移动互联网时的爆发。
    发表于 07-05 09:16 228次阅读
    你考虑用<b class='flag-5'>GPT4</b>搞电机吗?

    GPT-4创造力竟全面碾压人类!最新创造力测试GPT4排名前1%

    来源:新智元 最近,一项有关GPT-4的创造力思维测试火了。 来自蒙大拿大学和UM Western大学的研究团队发现,GPT-4在Torrance创造性思维测试(TTCT)中的得分直接排在
    的头像 发表于 06-25 10:35 270次阅读
    <b class='flag-5'>GPT</b>-4创造力竟全面<b class='flag-5'>碾压</b>人类!最新创造力测试<b class='flag-5'>GPT4</b>排名前1%