0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出Gemini 希望击败GPT-4

IEEE电气电子工程师 来源:IEEE电气电子工程师 2023-12-14 17:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌首席执行官Sundar Pichai表示,这是人工智能新时代的开始:Gemini时代。Gemini是谷歌最新的大型语言模型,Pichai在6月份的I/O开发者大会上首次提出,现在向公众发布。听Pichai和谷歌DeepMind首席执行官Demis Hassabis描述,这是人工智能模型的一个巨大飞跃,最终将影响谷歌几乎所有的产品。Pichai说:“这一时刻的一个强大之处是,你可以研究一种底层技术,并使其变得更好,并且它会立即衍生到我们的产品中。”

Gemini不仅仅是一个单一的人工智能模型。有一个简单版本叫Gemini Nano,旨在在安卓设备上离线运行。有一个更强大的版本叫Gemini Pro,很快将为谷歌的许多人工智能服务提供动力,从今天开始,它是Bard的支柱。还有一个功能更强大的模型叫Gemini Ultra,这是谷歌迄今为止创建的最强大的LLM,似乎主要是为数据中心和企业应用程序设计的。

从12月13日开始,开发者和企业客户将能够通过谷歌Generative AI Studio或谷歌云中的Vertex AI访问Gemini Pro。Gemini目前只提供英语版本,其他语言显然很快就会出现。但Pichai表示,该模式最终将在全球范围内集成到谷歌的搜索引擎、广告产品、Chrome浏览器等中。这是谷歌的未来,它马上就要到来了。

OpenAI在一年多前推出了ChatGPT,该公司和产品立即成为人工智能领域最火爆的内容。现在,谷歌——这家创造了当前人工智能繁荣背后大部分基础技术的公司,近十年来一直称自己为“人工智能第一”组织,终于准备好反击了。

Hassabis表示:“我们已经对系统进行了非常彻底的并排分析和基准测试。” 谷歌运行了32个完善的基准测试来比较这两个模型,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力的测试。Hassabis面带微笑地说:“我认为我们在32个基准中有30个基本领先。”

在这些基准(实际上大多非常接近)中,Gemini最明显的优势来自于它理解视频和音频并与之互动的能力。这在很大程度上是有意为之:多模式从一开始就是Gemini计划的一部分。谷歌没有像OpenAI创建DALL-E和Whisper那样,为图像和语音训练单独的模型;它从一开始就建立了一个多感官模型。“我们一直对非常、非常通用的系统感兴趣,”Hassabis说。他特别感兴趣的是如何混合所有这些模式——从任何数量的输入和感觉中收集尽可能多的数据,然后给出尽可能多种类的响应。

目前,Gemini最基本的模型是文本输入和文本输出,但像Gemini Ultra这样功能更强大的模型可以处理图像、视频和音频。Hassabis说:“这将变得更加普遍。还有一些东西,比如动作和触摸,更像机器人类型的东西。” 他说,随着时间的推移,Gemini会有更多的感觉,在这个过程中变得更准确、更接地气。Hassabis表示,这些模型知道的越多,他们就会得到更好的结果。

不过,基准测试只是基准测试,最终,对Gemini能力的真正考验将来自那些想用它集思广益、查找信息、编写代码等的日常用户。谷歌似乎特别将编码视为Gemini的杀手级应用;它使用了一种名为AlphaCode 2的新代码生成系统,称其性能优于85%的编码比赛参与者,高于原始AlphaCode的50%。但Pichai表示,用户会注意到该模型所涉及的几乎所有方面都有所改进。

对谷歌来说同样重要的是,Gemini显然是一个效率高得多的模式。它是在谷歌自己的张量处理单元上训练的,运行起来比谷歌以前的模型(如PaLM)更快、更便宜。除了新模型,谷歌还推出了其TPU系统的新版本TPU v5p,这是一种设计用于数据中心的计算系统,用于训练和运行大型模型。

与Pichai和Hassabis交谈发现,很明显,他们认为Gemini的发布既是一个更大项目的开始,也是其本身的一个阶段性变化。Gemini是谷歌一直在等待的模式,也是它多年来一直在努力打造的模式,甚至可能是它在OpenAI和ChatGPT“接管”世界之前就应该准备好的模式。

谷歌在ChatGPT发布后宣布进入“code red”,此后一直被认为在迎头赶上,似乎仍在努力坚持其“大胆而负责任”的口号。Hassabis和Pichai都表示,他们不愿意为了跟上而走得太快,尤其是在我们离终极人工智能梦想通用人工智能越来越近的时候。通用人工智能是一种自我塑造、比人类更聪明并准备改变世界的人工智能。“随着我们接近AGI,情况将有所不同,”Hassabis说,“这是一种积极的技术,所以我认为我们必须谨慎、谨慎但乐观地对待它。”谷歌表示,它通过内部和外部测试以及红队合作,努力确保Gemini的安全和责任。Pichai指出,确保数据安全性和可靠性对于企业优先的产品尤为重要,而这正是最具生成性的人工智能赚钱的地方。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6271

    浏览量

    112229
  • Gemini
    +关注

    关注

    0

    文章

    87

    浏览量

    8197
  • 人工智能
    +关注

    关注

    1821

    文章

    50547

    浏览量

    267922

原文标题:谷歌推出Gemini 希望击败GPT-4

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌发布Gemini for Science

    2026年5月20日,谷歌I/O开发者大会上,谷歌正式推出Gemini for Science——一款专门面向科研场景的AI模型。这不是又一个能帮你查文献的聊天机器人,而是
    的头像 发表于 05-21 10:42 1213次阅读

    谷歌正式发布Gemini Spark

    5月20日,谷歌在I/O 2026上正式发布了Gemini Spark——一款全天候运行的个人AI助手。它基于Gemini 3.5打造,运行在Google Cloud虚拟机上,用户通过Gemi
    的头像 发表于 05-21 10:39 543次阅读

    谷歌推出Gemini 3.5系列模型

    2026年5月20日凌晨,谷歌I/O 2026开发者大会正式拉开帷幕。谷歌首席执行官桑达尔·皮查伊在舞台上抛出了一枚重磅炸弹—— **Gemini 3.5 Flash** ,谷歌迄今为
    的头像 发表于 05-21 10:19 585次阅读

    谷歌发布安卓17+Gemini Intelligence

    近日,谷歌正式公布了安卓17(Android 17)的详细特性,同时抛出了一颗重磅炸弹—— **Gemini Intelligence** ,谷歌将自家最强AI能力全面植入安卓系统,推动安卓从
    的头像 发表于 05-13 11:26 1390次阅读

    2026实测教程:系统指令调优Gemini 3.1 Pro镜像站,稳定输出结构化内容

    ( www.rsk.cn ) 免费使用Gemini 3.1 Pro、GPT-4o、Claude 3.5等模型,本教程所有实测均在该平台完成,结果可复现。 为什么你的结构化Prompt经常“抽风”? 答案胶囊
    的头像 发表于 05-07 10:08 477次阅读

    Gemini CLI 中转站配置使用教程

    Gemini CLI 中文使用指南 基本介绍 Gemini CLI 是谷歌提供的开源命令行 AI 工具,将 Gemini 的强大功能直接带入您的终端。它提供轻量级的
    发表于 02-10 17:29

    晶晨携手谷歌,助力端侧大模型Gemini的硬件落地

    AI)相关产品的核心芯片供应商,双方在人工智能领域紧密协作,聚焦于谷歌端侧大模型Gemini的硬件生态落地。   公司积极推出适配Gemini的智能音箱、智能可视化门铃、室内及室外智
    的头像 发表于 01-29 10:44 2602次阅读

    谷歌正式推出Gemini 3 Flash模型

    我们正式推出Gemini 3 Flash,这是以较低成本打造的高效前沿智能,成功地进一步扩展了 Gemini 3 模型系列。
    的头像 发表于 01-22 16:04 849次阅读

    每年10亿美元,苹果与谷歌官宣合作,Gemini大模型注入Siri

    该协议,下一代苹果基础模型(Apple Foundation Models)将基于谷歌Gemini模型和云技术。   苹果:借Gemini之力,加速AI追赶   长期以来,苹果在AI领域的发展相对滞后,其语音助手Siri的功能
    的头像 发表于 01-13 14:59 6021次阅读

    奥比中光正式推出超小型双目3D相机Gemini 305

    1月6日,CES 2026首日,奥比中光正式推出超小型双目3D相机Gemini 305。该产品专为机械臂腕部设计,最小成像距离仅4厘米,视场角达88°×65°,且支持灵活切换成像模式。Gemi
    的头像 发表于 01-08 17:14 784次阅读

    Gemini AI 再进化:谷歌联合XREAL发布Project Aura, 打开“看见世界”的新能力

    被定位为迄今为止最完整、最接近 Android XR 理想形态的硬件样本。作为谷歌官方认可的系统级参考硬件,Project Aura 标志着 Gemini AI 第一次真正拥有“看见世界”的能力
    发表于 12-09 11:06 1484次阅读
    <b class='flag-5'>Gemini</b> AI 再进化:<b class='flag-5'>谷歌</b>联合XREAL发布Project Aura, 打开“看见世界”的新能力

    谷歌正式推出最新Gemini 3 AI模型

    今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,与之前的版本相比,它在所有主要的 AI 基准测试中都取得了无与伦比的结果,尤其是在编程方
    的头像 发表于 11-24 11:10 1510次阅读
    <b class='flag-5'>谷歌</b>正式<b class='flag-5'>推出</b>最新<b class='flag-5'>Gemini</b> 3 AI模型

    谷歌Gemini 3模型开启智能新纪元

    大约两年前,我们开启了 Gemini 时代,这是公司迄今为止投入最大的科研和产品项目之一。自那时起,看到大家对它的喜爱程度,着实令人惊叹。现在,每月有 20 亿用户使用 AI 概览 (AI
    的头像 发表于 11-24 11:07 1068次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b> 3模型开启智能新纪元

    谷歌推出Gemini 2.5 Pro预览版(I/O版本)

    我们目睹了开发者使用 Gemini 2.5 Pro 取得了令人赞叹的成就。因此,我们决定提前数周发布更新版本,以便开发者尽早体验新版模型。
    的头像 发表于 06-10 10:43 1380次阅读

    GPT-5即将面市 性能远超GPT-4

    行业芯事
    电子发烧友网官方
    发布于 :2025年06月04日 13:38:23