0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出Gemini 希望击败GPT-4

IEEE电气电子工程师 来源:IEEE电气电子工程师 2023-12-14 17:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌首席执行官Sundar Pichai表示,这是人工智能新时代的开始:Gemini时代。Gemini是谷歌最新的大型语言模型,Pichai在6月份的I/O开发者大会上首次提出,现在向公众发布。听Pichai和谷歌DeepMind首席执行官Demis Hassabis描述,这是人工智能模型的一个巨大飞跃,最终将影响谷歌几乎所有的产品。Pichai说:“这一时刻的一个强大之处是,你可以研究一种底层技术,并使其变得更好,并且它会立即衍生到我们的产品中。”

Gemini不仅仅是一个单一的人工智能模型。有一个简单版本叫Gemini Nano,旨在在安卓设备上离线运行。有一个更强大的版本叫Gemini Pro,很快将为谷歌的许多人工智能服务提供动力,从今天开始,它是Bard的支柱。还有一个功能更强大的模型叫Gemini Ultra,这是谷歌迄今为止创建的最强大的LLM,似乎主要是为数据中心和企业应用程序设计的。

从12月13日开始,开发者和企业客户将能够通过谷歌Generative AI Studio或谷歌云中的Vertex AI访问Gemini Pro。Gemini目前只提供英语版本,其他语言显然很快就会出现。但Pichai表示,该模式最终将在全球范围内集成到谷歌的搜索引擎、广告产品、Chrome浏览器等中。这是谷歌的未来,它马上就要到来了。

OpenAI在一年多前推出了ChatGPT,该公司和产品立即成为人工智能领域最火爆的内容。现在,谷歌——这家创造了当前人工智能繁荣背后大部分基础技术的公司,近十年来一直称自己为“人工智能第一”组织,终于准备好反击了。

Hassabis表示:“我们已经对系统进行了非常彻底的并排分析和基准测试。” 谷歌运行了32个完善的基准测试来比较这两个模型,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力的测试。Hassabis面带微笑地说:“我认为我们在32个基准中有30个基本领先。”

在这些基准(实际上大多非常接近)中,Gemini最明显的优势来自于它理解视频和音频并与之互动的能力。这在很大程度上是有意为之:多模式从一开始就是Gemini计划的一部分。谷歌没有像OpenAI创建DALL-E和Whisper那样,为图像和语音训练单独的模型;它从一开始就建立了一个多感官模型。“我们一直对非常、非常通用的系统感兴趣,”Hassabis说。他特别感兴趣的是如何混合所有这些模式——从任何数量的输入和感觉中收集尽可能多的数据,然后给出尽可能多种类的响应。

目前,Gemini最基本的模型是文本输入和文本输出,但像Gemini Ultra这样功能更强大的模型可以处理图像、视频和音频。Hassabis说:“这将变得更加普遍。还有一些东西,比如动作和触摸,更像机器人类型的东西。” 他说,随着时间的推移,Gemini会有更多的感觉,在这个过程中变得更准确、更接地气。Hassabis表示,这些模型知道的越多,他们就会得到更好的结果。

不过,基准测试只是基准测试,最终,对Gemini能力的真正考验将来自那些想用它集思广益、查找信息、编写代码等的日常用户。谷歌似乎特别将编码视为Gemini的杀手级应用;它使用了一种名为AlphaCode 2的新代码生成系统,称其性能优于85%的编码比赛参与者,高于原始AlphaCode的50%。但Pichai表示,用户会注意到该模型所涉及的几乎所有方面都有所改进。

对谷歌来说同样重要的是,Gemini显然是一个效率高得多的模式。它是在谷歌自己的张量处理单元上训练的,运行起来比谷歌以前的模型(如PaLM)更快、更便宜。除了新模型,谷歌还推出了其TPU系统的新版本TPU v5p,这是一种设计用于数据中心的计算系统,用于训练和运行大型模型。

与Pichai和Hassabis交谈发现,很明显,他们认为Gemini的发布既是一个更大项目的开始,也是其本身的一个阶段性变化。Gemini是谷歌一直在等待的模式,也是它多年来一直在努力打造的模式,甚至可能是它在OpenAI和ChatGPT“接管”世界之前就应该准备好的模式。

谷歌在ChatGPT发布后宣布进入“code red”,此后一直被认为在迎头赶上,似乎仍在努力坚持其“大胆而负责任”的口号。Hassabis和Pichai都表示,他们不愿意为了跟上而走得太快,尤其是在我们离终极人工智能梦想通用人工智能越来越近的时候。通用人工智能是一种自我塑造、比人类更聪明并准备改变世界的人工智能。“随着我们接近AGI,情况将有所不同,”Hassabis说,“这是一种积极的技术,所以我认为我们必须谨慎、谨慎但乐观地对待它。”谷歌表示,它通过内部和外部测试以及红队合作,努力确保Gemini的安全和责任。Pichai指出,确保数据安全性和可靠性对于企业优先的产品尤为重要,而这正是最具生成性的人工智能赚钱的地方。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6246

    浏览量

    110294
  • Gemini
    +关注

    关注

    0

    文章

    73

    浏览量

    8113
  • 人工智能
    +关注

    关注

    1813

    文章

    49772

    浏览量

    261730

原文标题:谷歌推出Gemini 希望击败GPT-4

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌AI霸主归来!多线反击OpenAI,开启安卓Gemini时代

    电子发烧友网报道(文/莫婷婷)北京时间5月21日,谷歌2025 Google I/O开发者大会正式召开,从其发布的新品来看,这可以说是一场AI盛会。 在AI大模型方面,发布了Gemini 2.5
    的头像 发表于 05-22 09:01 6386次阅读
    <b class='flag-5'>谷歌</b>AI霸主归来!多线反击OpenAI,开启安卓<b class='flag-5'>Gemini</b>时代

    谷歌正式推出最新Gemini 3 AI模型

    今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,与之前的版本相比,它在所有主要的 AI 基准测试中都取得了无与伦比的结果,尤其是在编程方
    的头像 发表于 11-24 11:10 854次阅读
    <b class='flag-5'>谷歌</b>正式<b class='flag-5'>推出</b>最新<b class='flag-5'>Gemini</b> 3 AI模型

    谷歌推出Gemini 2.5 Pro预览版(I/O版本)

    我们目睹了开发者使用 Gemini 2.5 Pro 取得了令人赞叹的成就。因此,我们决定提前数周发布更新版本,以便开发者尽早体验新版模型。
    的头像 发表于 06-10 10:43 1017次阅读

    GPT-5即将面市 性能远超GPT-4

    行业芯事
    电子发烧友网官方
    发布于 :2025年06月04日 13:38:23

    谷歌Gemini API最新进展

    今年的 Cloud Next 大会上,我们推出了一系列突破性更新与强大功能,旨在赋能广大开发者,与大家携手共创人工智能的未来。本次发布亮点包括:最新的 Gemini 2.5 思考模型,实时互动
    的头像 发表于 04-12 16:10 1480次阅读

    OpenAI即将发布GPT-4.5与GPT-5

    GPT-4.5将在未来几周内率先亮相,它将是OpenAI通用GPT-4模型的继承者。这款新的算法在技术上进行了诸多优化和升级,旨在为用户提供更加精准、高效的AI服务。 而在GPT-4.5发布后不久
    的头像 发表于 02-13 13:43 1036次阅读

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗舰大模型
    的头像 发表于 02-07 15:07 1098次阅读

    DeepSeek用户量超越谷歌Gemini

    在聊天AI领域的竞争中,中国AI产品DeepSeek展现出了强劲的增长势头。据最新数据显示,1月底,DeepSeek的用户量已经成功超越了谷歌Gemini。 具体来看,1月31日这一天
    的头像 发表于 02-07 14:59 803次阅读

    三星 Galaxy S25 系列与谷歌 Gemini 深度整合

    在Galaxy Unpacked发布会上,三星Galaxy S25系列手机震撼登场,其与谷歌Gemini的深度整合成为一大亮点。 此次整合后,Gemini AI助手为Galaxy S25系列带来
    的头像 发表于 01-23 17:41 1333次阅读

    如何在边缘端获得GPT4-V的能力:算力魔方+MiniCPM-V 2.6

    本 OpenCompass 榜单上(综合 8 个主流多模态评测基准)平均得分 65.2,以8B量级的大小在单图理解方面超越了 GPT-4o mini、GPT-4V、Gemini 1.5 Pro 和 Cl
    的头像 发表于 01-20 13:40 1117次阅读
    如何在边缘端获得<b class='flag-5'>GPT4</b>-V的能力:算力魔方+MiniCPM-V 2.6

    谷歌Gemini AI目标年底用户达5亿

    近日,谷歌CEO桑达尔·皮查伊在内部会议上向员工透露,他对公司自主研发的Gemini AI技术充满信心,认为其能力已经超越了当前的竞争对手。这一表态不仅彰显了谷歌在AI领域的雄心壮志,也预示着
    的头像 发表于 01-18 11:30 1290次阅读

    谷歌CEO:Gemini AI技术超越竞品,目标年底5亿用户

    近日,谷歌CEO皮查伊近期向员工传达了他对公司Gemini AI技术的信心。据悉,皮查伊认为Gemini的能力已经超越了当前的竞争对手。 皮查伊表示,他期望到今年年底,全球能有5亿人
    的头像 发表于 01-17 10:37 1143次阅读

    谷歌推出Gemini 2.0 Flash体验版

    我们正赋予开发者构建 AI 未来的能力,包括尖端模型、智能代码编写工具以及跨平台和设备的无缝集成。自 2023 年 12 月我们推出 Gemini 1.0 以来,数百万的开发者已经使用 Google AI Studio 和 Vertex AI 在 109 种语言中使用
    的头像 发表于 01-06 09:52 2585次阅读

    借助谷歌Gemini和Imagen模型生成高质量图像

    在快速发展的生成式 AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌Gemini 模型来制作详细且富有创意的提示,然后使用 Imagen 3 模型根据这些提示生成高质量的图像,您可
    的头像 发表于 01-03 10:38 1360次阅读
    借助<b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>和Imagen模型生成高质量图像

    谷歌发布“深度研究”AI工具,利用Gemini模型进行网络信息检索

    据外媒最新报道,谷歌近期发布了一款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言模型,实现了对网络信息的高效检索与深度挖掘,进一步满足了用户对精准、详尽信息的需求。 据悉
    的头像 发表于 12-16 09:35 1043次阅读