0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌Gemini 3模型开启智能新纪元

谷歌开发者 来源:谷歌黑板报 2025-11-24 11:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

以下文章来源于谷歌黑板报,作者谷歌黑板报

Sundar Pichai 寄语

Google 和 Alphabet 首席执行官

大约两年前,我们开启了 Gemini 时代,这是公司迄今为止投入最大的科研和产品项目之一。自那时起,看到大家对它的喜爱程度,着实令人惊叹。现在,每月有 20 亿用户使用 AI 概览 (AI Overviews)。Gemini app 的月用户量已突破 6.5 亿,超过 70% 的 Cloud 客户使用我们的 AI,1300 万开发者在使用我们的生成模型进行构建——而这只是我们所看到的巨大影响的一个缩影。

我们能够以前所未有的速度将先进的能力带给全世界,这得益于我们独有的全栈式 AI 创新研究——从业界领先的基础设施、世界一流的研究与模型工具,再到服务全球数十亿用户的产品。

每一代 Gemini 都在前一代基础上进行构建,让您能够实现更多可能。Gemini 1 在原生多模态和长上下文窗口方面的突破,扩展了可处理的信息种类及其信息量。Gemini 2 则为智能体能力奠定了基础,并在推理和思考方面推动了前沿,帮助处理更复杂的任务和想法,使得 Gemini 2.5 Pro 连续六个多月在 LMArena 上位居榜首。

而现在,我们即将推出 Gemini 3,这是我们最智能的模型,它集合了 Gemini 的所有功能,能够帮助您将任何想法变为现实。

它具备最先进的推理能力,能够理解深层次内容与细微差别——无论是感知创意中细微的线索,还是剖析复杂难题中相互交织的结构维度。Gemini 3 在理解用户请求的上下文和真实意图方面也更为出色,您只需更精简的提示就能获取所需结果。更令人惊叹的是,仅仅用了两年时间,AI 已经从单纯的文本和图像识别,发展到能够 "洞察语境"。

从今天起,我们将 Gemini 全面融入谷歌的产品生态。其中包括在搜索的 AI 模式 (AI Mode) 下的 Gemini 3,具备更复杂的推理能力和全新的动态体验。这是我们首次在产品发布当日就将 Gemini 引入搜索。此外,Gemini 3 今天也同步向 Gemini app 用户、AI Studio 和 Vertex AI 的开发者、以及我们全新的智能体开发平台 Google Antigravity 中同步推出。——更多信息详见下文。

正如其前几代模型一样,Gemini 3 再次推动了技术的最前沿。在这个全新的篇章中,我们将继续推动智能、智能体和个性化服务的边界,让 AI 能够真正助力于每个人。

我们希望您会喜欢 Gemini 3,我们也将持续改进它,并期待看到您用它创造的成果。更多精彩,敬请期待!

作者:

Demis Hassabis,Google DeepMind 首席执行官

Koray Kavukcuoglu,Google DeepMind 首席技术官兼 Google 首席 AI 架构师

谨代表 Gemini 团队

今天,我们在通往 AGI (通用人工智能) 的道路上又迈出重要一步,正式发布 Gemini 3。

它不仅是全球领先的多模态理解模型,更是我们迄今为止最强大的智能体 (Agentic) 和氛围编程 (Vibe Coding) 模型,能够提供更丰富的可视化效果和更深度的交互体验——而这一切都构建在最先进的推理能力之上。

我们现已正式开启 Gemini 3 时代,并于今日推出 Gemini 3 Pro 预览版,将其集成到 Google 的全栈产品中。用户在日常生活中即可使用它来学习、构建和规划一切事务。同时,我们还推出了 Gemini 3 Deep Think 模式——这一增强型推理模式将 Gemini 3 的性能再次提升至全新高度。该模式在向 Google AI Ultra 订阅用户开放前,会首先供安全测试人员试用。

最先进的推理能力

具备前所未有的深度与洞察力

凭借领先的推理能力和强大的多模态功能,Gemini 3 Pro 能够将任何创意变为现实。在每个关键的 AI 基准测试中,它的性能均显著超越 2.5 Pro。

它在 LMArena 排行榜上以 1501 的突破性 Elo 评分高居榜首。其在推理能力上展现出博士水平,在 "人类终极考试" 中 (未使用任何工具的情况下得分率达 37.5%) 及 GPQA Diamond 基准测试中 (准确率高达 91.9%) 均获得最高分。此外,它在数学领域为前沿模型树立了全新标杆,在 MathArena Apex 测试中,以 23.4% 达到了最先进水平 (State-of-the-Art)。

除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成绩,在 Video-MMMU 上达到 87.6%。同时,该模型在 SimpleQA Verified 基准测试中也斩获了当前最先进的 72.1% 得分,展现出其在事实准确性方面的显著进步。这意味着 Gemini 3 Pro 具备高度可靠性,能够有效解决跨越科学和数学等广泛主题的复杂问题。

513eaaee-c4ed-11f0-8c8f-92fbcf53809c.png

Gemini 3 在一系列关键 AI 基准测试中达到了最先进水平

Gemini 3 Pro 为每一次交互带来了全新的深度和细致入微的体验。它的回复智能、简洁、直接,用真知灼见取代了陈词滥调和奉承——它会告诉您真正需要了解的信息,而不仅仅是您希望听到的。作为您真正的思考伙伴,Gemini 3 Pro 提供了理解信息和自我表达的全新途径,无论是通过生成高保真可视化代码来解析深奥的科学概念,还是进行创意头脑风暴,都能为您提供强大助力。

Gemini 3 可以编写托卡马克 (tokamak) 中等离子体流动的可视化代码,并创作一首诗歌来捕捉核聚变的物理学原理

Gemini 3 深度思考

Gemini 3 的 "深度思考模式 (Deep Think mode)" 进一步拓展了智能的边界,为 Gemini 3 的推理和多模态理解能力带来了跨越式提升,能够助力您攻克更复杂的难题。

在测试中,Gemini 3 Deep Think 在 "人类最终考试 (Humanity's Last Exam)" 中的表现 (未使用工具的情况下达到 41.0%) 以及在 GPQA Diamond 测试中的表现 (达到 93.8%),均超越了 Gemini 3 Pro 已经令人印象深刻的成绩。此外,它还在 ARC-AGI-2 基准测试中取得了 45.1% 的突破性成绩 (启用代码执行),充分展现了其解决新型挑战的能力。

51997514-c4ed-11f0-8c8f-92fbcf53809c.png

Gemini 3 的 "深度思考模式 (Deep Think mode)" 在一些最具挑战性的 AI 基准测试中表现出色

Gemini 3 助力学习、构建和规划一切

学习一切

Gemini 从设计之初,就致力于无缝整合任何主题的跨模态信息,涵盖文本、图像、视频、音频和代码。Gemini 3 以其领先的推理能力、视觉与空间理解能力、多语言性能以及 100 万令牌的上下文窗口,进一步突破了多模态推理的前沿,帮助您以最适合自己的方式进行学习。

举例来说,如果您想学习烹饪家族传统菜肴,Gemini 3 可以解读并翻译不同语言的手写菜谱,整理成一本可分享的家族食谱。又或者,当您希望研究一个新主题时,只需提供学术论文、冗长的视频讲座或教程,它便能生成用于交互式闪卡、可视化图表或其他形式的代码,帮助您快速掌握素材。它甚至可以分析您匹克球比赛的视频,识别技术短板,并生成全面提升动作技巧的训练计划。

为了帮助您更好地理解网络信息,Search 中的 AI 模式 (AI Mode) 现已整合 Gemini 3,带来全新的生成式用户界面 (Generative UI) 体验,例如沉浸式视觉布局、交互式工具和模拟,所有内容均可根据您的查询实时生成。

构建一切

在 2.5 Pro 成功的基础上,Gemini 3 兑现了帮助开发者将创意变为现实的承诺。它在零样本生成 (Zero-shot Generation) 方面表现出色,能够处理复杂的提示和指令,从而渲染出更丰富、更具交互性的网页用户界面 (Web UI)。

Gemini 3 是我们迄今为止构建的最出色的氛围编程 (Vibe Coding) 和智能体编程 (Agentic Coding) 模型——让我们的产品更具自主性,同时提高开发者生产力。它在 WebDev Arena 排行榜上以令人瞩目的 1487 ELO 名列前茅。在 Terminal-Bench 2.0 测试 (一个测试模型通过终端操作计算机的工具使用能力) 中也取得 54.2% 的好成绩;同时,在衡量编程智能体 (coding agents) 的 SWE-bench Verified (76.2%) 基准测试中,其表现远超 2.5 Pro。

您现在可以通过 Google AI Studio、Vertex AI、Gemini CLI 以及我们全新的智能体开发平台 Google Antigravity 中使用 Gemini 3 进行开发和构建。同时,它也已在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台上线。

通过代码构建、解构和混编精细的 3D 体素 (voxel) 艺术,将您的想象力变为现实。请在 AI Studio 中试用

推出全新的以智能体为核心的开发体验

随着 Gemini 3 模型智能的不断加速,我们有机会重新构想整个开发者体验 (developer experience)。今天,我们正式发布 Google Antigravity,我们全新的智能体开发平台,让开发者能够在更高层次上,以任务为导向的方式进行开发。

Google Antigravity 利用 Gemini 3 的高级推理、工具使用和智能编码能力,将 AI 辅助从开发者工具包中的工具转变为一个活跃的伙伴。尽管 Google Antigravity 的核心仍沿用熟悉的 AI 集成开发环境 (IDE),但其智能体已被提升到一个专属的界面,并被赋予直接访问编辑器、终端和浏览器的权限。现在,智能体能够代表您自主规划和执行复杂的端到端软件任务,并在此过程中自行验证代码。

除了 Gemini 3 Pro 之外,Google Antigravity 还深度整合了我们最新的用于浏览器控制的 Gemini 2.5 Computer Use 模型,以及我们广受好评的图像编辑模型 Nano Banana (Gemini 2.5 Image)。

Google Antigravity 使用 Gemini 3 来驱动航班追踪应用所需的端到端智能体工作流程。该智能体能够独立规划、编写应用程序代码,并通过基于浏览器的计算机使用来验证其执行效果

规划一切

自从 Gemini 2 开启智能体时代以来,我们取得了巨大的进展,不仅提升了 Gemini 的编码智能体 (coding agent) 能力,还提高了它在更长周期内可靠地提前规划能力。Gemini 3 在 Vending-Bench 2 排行榜上名列榜首,印证了这一点。该基准测试通过管理模拟自动售货机业务来测试长周期规划能力。Gemini 3 在整整一年的模拟运营过程中,保持了工具使用和决策的一致性,在没有偏离任务的前提下,带来了更高的回报。

51f11bd4-c4ed-11f0-8c8f-92fbcf53809c.png

Gemini 3 Pro 展示了更优秀的长期规划能力,与其他前沿模型相比,能够产生显著更高的回报

这意味着 Gemini 3 能更好地帮助您完成日常事务。凭借更深入的推理能力和更稳定的工具使用,Gemini 3 能在您的控制和指导下,帮您完成整个复杂、多步骤的工作流程——例如整理 Gmail 收件箱或规划完整的旅行行程。

Google AI Ultra 订阅者今天就可以在 Gemini 应用中使用 Gemini Agent 来体验这些智能体能力。我们在提升 Gemini 的智能体能力方面收获良多,我们也很快会将这些功能扩展到更多 Google 产品,非常期待看到您如何使用它。

负责任地构建 Gemini 3

Gemini 3 是我们迄今为止最安全的模型,并且接受了 Google AI 模型中最全面的一套安全评估。该模型展现了更低的谄媚性 (sycophancy),更高的抗提示注入 (prompt injection) 能力,并强化了抵御网络攻击滥用的保护措施。

除了对我们前沿安全框架 (Frontier Safety Framework) 中关键领域进行内部测试外,我们还与全球前沿领域的专家合作进行了评估,向英国人工智能安全研究所 (UK AISI) 等机构提供了早期访问,并获得了 Apollo、Vaultis、Dreadnode 等行业专家的独立评估意见。更多信息,详见 Gemini 3 模型卡。

Gemini 的下一个时代

这仅仅是 Gemini 3 时代的开始。从今天起,Gemini 3 逐步向用户开放,供您试用体验:

适用于所有 Gemini app 的用户,以及在 Search 的 AI Mode 下的 Google AI Pro 和 Ultra 订阅用户。

适用于 AI Studio 中 Gemini API 的开发者,我们全新的智能体开发平台 Google Antigravity 以及 Gemini CLI。

适用于 Vertex AI 和 Gemini Enterprise 的企业用户。

对于 Gemini 3 "深度思考模式 (Deep Think mode)",我们正在投入更多时间进行安全评估并收集安全测试人员的反馈,预计将在未来几周内向 Google AI Ultra 订阅用户开放该功能。

我们计划很快发布 Gemini 3 系列中的其他模型,以便您能够借助 AI 完成更多任务。我们期待收到您的反馈,也期待看到您使用 Gemini 进行学习、构建和规划的成果。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Gemini
    +关注

    关注

    0

    文章

    73

    浏览量

    8108
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296590
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51712

原文标题:Gemini 3 开启智能新纪元

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌AI霸主归来!多线反击OpenAI,开启安卓Gemini时代

    Pro、扩散语言模型Gemini Diffusion、视频生成模型Veo 3+ Flow应用、图像生成模型Imagen 4等。在硬件端,分
    的头像 发表于 05-22 09:01 6354次阅读
    <b class='flag-5'>谷歌</b>AI霸主归来!多线反击OpenAI,<b class='flag-5'>开启</b>安卓<b class='flag-5'>Gemini</b>时代

    谷歌正式推出最新Gemini 3 AI模型

    今天我们正式推出 Gemini 3,这是我们迄今为止最智能模型,能够帮助用户实现任何创意。Gemini
    的头像 发表于 11-24 11:10 778次阅读
    <b class='flag-5'>谷歌</b>正式推出最新<b class='flag-5'>Gemini</b> <b class='flag-5'>3</b> AI<b class='flag-5'>模型</b>

    麦捷科技与光明实验室开启AI物理交互新纪元

    麦捷科技与人工智能与数字经济广东省实验室(深圳)(以下简称“光明实验室”)“微型驱动关节与仿生灵巧手” 联合实验室揭牌仪式暨合作启动会在深圳市光明区科润大厦B 座7 楼活动厅隆重举行。此次活动汇聚了双方领导、高校专家代表,共同见证这一兼具战略意义与创新价值的合作里程碑,开启
    的头像 发表于 08-27 11:27 1115次阅读

    泰芯半导体开启AIOT高效传输新纪元

    今天,Wi-Fi/蓝牙/星闪音视频SOC芯片TXW82x及Wi-Fi Halow TXW8301S正式亮相!开启高效传输的新纪元
    的头像 发表于 05-29 14:30 1319次阅读

    谷歌Gemini 2.5模型系列更新

    今年 3 月,我们发布了迄今为止最智能模型 Gemini 2.5 Pro,两周前,我们提前为您带来了 I/O 更新,以便开发者构建出色的网络应用。
    的头像 发表于 05-23 14:56 996次阅读

    Gemini API集成Google图像生成模型Imagen 3

    开发者现在可以通过 Gemini API 访问 Google 最先进的图像生成模型 Imagen 3。该模型最初仅对付费用户开放,不久后也将面向免费用户推出。
    的头像 发表于 05-14 16:53 942次阅读

    福田欧航智蓝EHL开启城市环卫新纪元

    行业亟待突破的痛点。基于此,欧航欧马可凭借深厚的技术积淀与场景化洞察,推出福田首款卡车低入口新能源环卫车——欧航智蓝EHL,凝聚了福田汽车多项前沿技术,开启“人本化、智能化、低碳化”的城市环卫新纪元。 以人为本:
    的头像 发表于 04-23 09:31 624次阅读

    深蓝汽车携手华为开创全民智驾新纪元

    2月9日,深蓝汽车与华为在重庆正式签署全面深化业务合作协议。作为普及全民智驾的长期战略合作伙伴,双方宣布将全面推动智能网联汽车领域的合作,共同研发前沿技术,开创全民智驾新纪元,加速推动智驾平权,引领中国智能网联汽车产业的未来。
    的头像 发表于 02-10 10:28 918次阅读

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以
    的头像 发表于 02-07 15:07 1083次阅读

    中国信通院栗蔚:云计算与AI加速融合,如何开启智算时代新纪元

    中国信通院栗蔚:云计算与AI加速融合,如何开启智算时代新纪元
    的头像 发表于 01-17 18:48 1385次阅读
    中国信通院栗蔚:云计算与AI加速融合,如何<b class='flag-5'>开启</b>智算时代<b class='flag-5'>新纪元</b>?

    谷歌推出Gemini 2.0 Flash体验版

    我们正赋予开发者构建 AI 未来的能力,包括尖端模型智能代码编写工具以及跨平台和设备的无缝集成。自 2023 年 12 月我们推出 Gemini 1.0 以来,数百万的开发者已经使用 Google AI Studio 和 Ve
    的头像 发表于 01-06 09:52 2559次阅读

    借助谷歌Gemini和Imagen模型生成高质量图像

    在快速发展的生成式 AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌Gemini 模型来制作详细且富有创意的提示,然后使用 Imagen
    的头像 发表于 01-03 10:38 1335次阅读
    借助<b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>和Imagen<b class='flag-5'>模型</b>生成高质量图像

    谷歌发布“深度研究”AI工具,利用Gemini模型进行网络信息检索

    据外媒最新报道,谷歌近期发布了一款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言模型,实现了对网络信息的高效检索与深度挖掘,进一步满足了用户对精准、详尽信息的需求。 据悉
    的头像 发表于 12-16 09:35 1035次阅读

    谷歌正式发布Gemini 2.0 性能提升近两倍

    智能体时代,谷歌再次引领技术潮流,正式发布了其最新力作——Gemini 2.0。这款AI模型不仅在性能上实现了显著提升,更是在多模态表现和原生工具应用方面展现了前所未有的强大功能。
    的头像 发表于 12-12 14:22 1117次阅读

    谷歌发布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性,旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高
    的头像 发表于 12-12 10:13 967次阅读