0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌正式推出最新Gemini 3 AI模型

谷歌开发者 来源:谷歌黑板报 2025-11-24 11:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

以下文章来源于谷歌黑板报,作者谷歌黑板报

作者:

Logan Kilpatrick,Google AI Studio 及 Gemini API 产品负责人

今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,与之前的版本相比,它在所有主要的 AI 基准测试中都取得了无与伦比的结果,尤其是在编程方面也超越了 2.5 Pro,能够熟练地处理智能体工作流程和复杂的零样本任务。

57a0b882-c4ed-11f0-8c8f-92fbcf53809c.png

Gemini 3 Pro 可以无缝融入现有的生产智能体和编程工作流程,同时还能实现从前无法实现的全新应用场景。它目前提供预览版,通过 Google AI Studio 和面向企业的 Vertex AI 中的 Gemini API,对于 20 万令牌或更少令牌的提示词,输入价格为 2 美元/百万令牌,输出价格为 12 美元/百万令牌。此外,它还可以通过您常用的开发工具在更广泛的生态系统中使用,并在 Google AI Studio 中提供带有速率限制的免费版。

智能体编程

开发者们正花费越来越多的时间,借助 AI 进行开发。在 Gemini 2.5 Pro 所提供的成功经验和用户反馈基础上,Gemini 3 Pro 将作为智能体编程模型的新基石,拓展实现边界。

Gemini 3 Pro 在 Terminal-Bench 2.0 测试中得分为 54.2%,该测试旨在评估模型通过终端操作计算机的工具使用能力。

除了 Gemini CLI、Android Studio 的智能体模式 (Agent Mode) 以及 Cursor、Cline、JetBrains、Manus 等其他编程产品之外,您还可以在我们新的智能体开发平台 Google Antigravity 中亲身体验该模型的强大性能。

Cline AI 负责人Nik Pash:"Cline 正在使用 Gemini 3 来为开发者集成开发环境 (IDE) 提供自主代码生成功能……Gemini 3 Pro 能够在整个代码库范围内处理复杂的长周期任务,并在多文件重构、调试会话和功能实现的各阶段保持上下文连贯。它比 Gemini 2.5 Pro 更有效地利用上下文,并解决了让其他领先模型都束手无策的问题。"

Google Antigravity

为了进一步提升模型与集成开发环境 (IDE) 的协同方式,我们推出了 Google Antigravity,以展示基于 Gemini 3 所能实现的能力。它是一个智能体开发平台,并通过跨工作区管理智能体,使开发者能够在更高的任务导向层面进行操作,同时保留其核心的 AI IDE 体验。

这是一种更高效的开发方式: 您充当架构师,与在编辑器、终端和浏览器中自主运作的智能体协同完成工作。这些智能体能够规划并执行复杂的软件任务,并通过清晰的产出向用户同步它们的工作进展。这全面提升了开发的各个环节——从功能搭建、UI 迭代、漏洞修复,到调研与报告生成。您可以访问 Google Antigravity 网站,免费下载公测预览版,该版本现已支持 MacOS、Windows 和 Linux 系统。

在 Google Antigravity 这款多人协作数字白板应用中,

您可以看到多个智能体并行构建内容。

Gemini API

随着 Gemini 3 的发布,我们正在推出一款客户端 bash 工具,让模型能够在智能体工作流中提出可通过命令行实现的任意任务所需的 shell 命令,用于完成诸如本地文件系统导航、推动开发流程以及自动化系统操作等任务。此外,我们还将上线一个托管服务器端 bash 工具,用于多语言代码生成和安全的原型开发。该工具现已在 Gemini API 中面向早期访问合作伙伴开放,不久将全面开放。

此外,Gemini 托管工具中的 "Grounding with Google Search" 和 "URL context" 功能现在可以与结构化输出相结合。这在构建需要抓取与提取数据、并将结果按特定格式输出以供后续智能体任务使用的场景中,尤其强大。

氛围编程 (Vibe coding)

Gemini 3 Pro 释放了 "氛围编程" 的真正潜力,让自然语言作为唯一的语法。通过大幅提升对复杂指令的理解和深入的工具使用能力,该模型能够仅凭提示词,就将高层级的想法变成可交互的应用。它承担了多步骤规划和变成细节的繁杂工作,带来更丰富的视觉呈现和更深入的交互,让您可以专注于创意本身。

Gemini 3 Pro 在 WebDev Arena 排行榜上位列第一,并取得了令人印象深刻的 1487 Elo。

Emergent 联合创始人兼首席技术官Madhav Jha:"Gemini 3 出色的提示词遵循度极大地提升了 Emergent 全栈应用开发平台的性能,尤其是在 UI/前端工作流程中。我们在将 Gemini 3 的多步骤工具调用整合到我们的智能体代码开发设置中后,看到了令人难以置信的成果。"

Google AI Studio

无论是仅凭单一提示词构建一款游戏,根据非结构化的语音备忘录生成一个交互式登录页,还是根据一张餐巾纸草图开发一个完整的应用程序,开发者们都能用 Gemini 3 将他们的想法变为现实。借助这款模型,我们将单一提示词生成能力提升到前所未有的水平。这意味着,您只需通过单一提示词,就能将想法转化为一个由 AI 驱动的应用程序,例如在 Google AI Studio 中构建的这款复古游戏。

在 Google AI Studio 中使用 Gemini 3 Pro 构建的零样本游戏

我们构建 Google AI Studio 的目标是: 让其成为您从一个提示词到 AI 原生应用的最快路径。其中的构建模式 (Build mode) 让您能够以前所未有的速度添加 AI 功能,并自动连接合适的模型和 API,而像 "注释 (annotation)" 这类功能则能帮助您实现快速且直观的迭代修改。您现在就可以在 Google AI Studio 中开始使用 Gemini 3 进行构建。

多模态理解

Gemini 3 是全球范围内在复杂多模态理解方面表现最佳的模型,它在用于复杂图像推理的 MMMU-Pro 和用于视频理解的 Video MMMU 上均创下了新高。结合其智能性与 100 万令牌的上下文窗口,开发者在构建关键多模态应用场景时可以看到显著提升。为了更好地控制延迟和成本,您现在可以根据应用所需的视觉保真度,在 Gemini API 中更精细地配置多模态视觉处理。

视觉推理

Gemini 3 Pro 在文档理解方面处于业界领先地位,它超越了简单的光学字符识别 (OCR),能够智能地处理复杂文档理解和推理任务。

您可以在我们的演示应用中,看到该模型的视觉理解、推理和编程能力,它能在 Google AI Studio 中将任何创意变为现实。

Gemini 3 Pro 仅凭一张图片,就能利用其视觉理解、推理和编程能力,将其转化为交互式网络体验。

空间推理

该模型在空间推理能力上的提升,也显著提升了其在具身推理任务 (例如指向、轨迹预测和任务进度追踪) 中的表现,从而为自动驾驶汽车、XR 设备和机器人技术领域解锁新应用场景。

它的空间推理能力也为桌面、移动设备和操作系统界面的智能屏幕理解提供了支持,为计算机使用智能体带来显著性能提升。该模型还能根据鼠标移动和屏幕注解来理解用户操作背后的意图,从而解锁了全新的体验 (例如这款 Visual Computer 演示应用)。

Gemini 3 不仅能理解用户手绘的指令,还能基于对屏幕及其元素的空间推理,智能地执行相应的操作。

视频推理

Gemini 3 Pro 能够通过高帧率理解来捕捉快速动作,确保开发者绝不会错过快速移动场景中的关键时刻。除了速度之外,其长上下文回忆能力还能在跨越数小时的连续画面中构建连贯叙事,并准确捕捉关键细节。

OpusClip 联合创始人兼首席技术官Jay Wu:"在我们的智能体视频推理和工具调用中,Gemini 3 为 Agent Opus 从三个方面提供了关键支持: 速度,相比我们目前的实施方案,速度提升超过了 32%;精度,展现了其卓越的复杂指令执行能力和准确的结构化解码能力;可靠性,能够在避免常见幻觉错误的同时,管理长上下文推理并调用精细工具。"

从今天起构建未来

Gemini 3 Pro 现已集成到许多开发者产品和工具中,能够无缝融入您现有的工作流程,同时解锁全新的编程方式。

使用 Gemini API 进行构建:

您可以立即通过 Google AI Studio 和面向企业的 Vertex AI 将 Gemini 3 Pro 集成到您的应用中。为了让模型具备更深层次的推理能力,我们在 API 中引入了新的思维级别和更精细的媒体分辨率参数,同时对思维特征进行更严格的验证。此更新对于在多轮对话中保留模型的思维至关重要。您可以查看 Developer Guide 了解更多技术细节,阅读 Prompting Guide 学习如何使用 Gemini 3 Pro 进行构建。

体验模型的智能体能力:

无论您是为 Android 应用添加 AI 原生功能、通过 Gemini CLI 自动化工作流程,还是在 Google Antigravity 中管理一组自主运行智能体,Gemini 3 Pro 都能为复杂的智能体架构提供所需的可靠性支撑。

使用 Gemini 3 Pro 进行氛围编程:

Google AI Studio 是将创意变为现实的最快途径。即刻在 "构建模式 (Build mode)" 中开始,仅用提示词即可生成完整应用。如果您需要一些灵感构思,可以点击 "I'm feeling lucky",让 Gemini 3 Pro 在激发创意的同时完成代码实现。

软件行业格局正在发生改变。当前,AI 正在改变 "谁在开发" 以及 "如何开发",我们致力于在您需要的时刻提供支持——为您提供工具,以突破现有界限,实现无限可能。

这仅仅是 Gemini 3 时代的开始,但我们已经迫不及待地想看到您即将用 Gemini 3 Pro 创造的成果!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Gemini
    +关注

    关注

    0

    文章

    74

    浏览量

    8175
  • AI
    AI
    +关注

    关注

    91

    文章

    41156

    浏览量

    302619
  • 模型
    +关注

    关注

    1

    文章

    3819

    浏览量

    52272

原文标题:即刻使用 Gemini 3 开始构建

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌AI霸主归来!多线反击OpenAI,开启安卓Gemini时代

    电子发烧友网报道(文/莫婷婷)北京时间5月21日,谷歌2025 Google I/O开发者大会正式召开,从其发布的新品来看,这可以说是一场AI盛会。 在AI模型方面,发布了
    的头像 发表于 05-22 09:01 6800次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>AI</b>霸主归来!多线反击OpenAI,开启安卓<b class='flag-5'>Gemini</b>时代

    Gemini CLI 中转站配置使用教程

    Gemini CLI 中文使用指南 基本介绍 Gemini CLI 是谷歌提供的开源命令行 AI 工具,将 Gemini 的强大功能直接带入
    发表于 02-10 17:29

    晶晨携手谷歌,助力端侧大模型Gemini的硬件落地

    AI)相关产品的核心芯片供应商,双方在人工智能领域紧密协作,聚焦于谷歌端侧大模型Gemini的硬件生态落地。   公司积极推出适配
    的头像 发表于 01-29 10:44 2405次阅读

    谷歌正式推出Gemini 3 Flash模型

    我们正式推出Gemini 3 Flash,这是以较低成本打造的高效前沿智能,成功地进一步扩展了 Gemini 3
    的头像 发表于 01-22 16:04 752次阅读

    每年10亿美元,苹果与谷歌官宣合作,Gemini模型注入Siri

    该协议,下一代苹果基础模型(Apple Foundation Models)将基于谷歌Gemini模型和云技术。   苹果:借Gemini
    的头像 发表于 01-13 14:59 5884次阅读

    Gemini AI 再进化:谷歌联合XREAL发布Project Aura, 打开“看见世界”的新能力

    被定位为迄今为止最完整、最接近 Android XR 理想形态的硬件样本。作为谷歌官方认可的系统级参考硬件,Project Aura 标志着 Gemini AI 第一次真正拥有“看见世界”的能力
    发表于 12-09 11:06 1440次阅读
    <b class='flag-5'>Gemini</b> <b class='flag-5'>AI</b> 再进化:<b class='flag-5'>谷歌</b>联合XREAL发布Project Aura, 打开“看见世界”的新能力

    谷歌Gemini 3模型开启智能新纪元

    Overviews)。Gemini app 的月用户量已突破 6.5 亿,超过 70% 的 Cloud 客户使用我们的 AI,1300 万开发者在使用我们的生成模型进行构建——而这只是我们所看到的巨大影响的一个缩影。
    的头像 发表于 11-24 11:07 1000次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b> <b class='flag-5'>3</b><b class='flag-5'>模型</b>开启智能新纪元

    谷歌AlphaEarth和维智时空AI模型的核心差异

    谷歌AlphaEarth和维智时空AI模型在技术理念上存在诸多共性,但两者在目标尺度、数据来源、技术实现和应用模式上存在显著差异。
    的头像 发表于 10-22 14:50 1055次阅读

    谷歌AlphaEarth和维智时空AI模型的技术路径

    谷歌AlphaEarth和维智时空AI模型在应用场景和技术实现上各有侧重,但两者在底层技术理念上存在显著共性。
    的头像 发表于 10-22 14:48 1054次阅读

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3 和 Gemma 3 QAT,为单一云端和桌面加速器带来了最先进的性能。
    的头像 发表于 09-11 15:09 1313次阅读

    谷歌新一代生成式AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI推出新一代生成式 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1309次阅读

    谷歌推出Gemini 2.5 Pro预览版(I/O版本)

    我们目睹了开发者使用 Gemini 2.5 Pro 取得了令人赞叹的成就。因此,我们决定提前数周发布更新版本,以便开发者尽早体验新版模型
    的头像 发表于 06-10 10:43 1321次阅读

    谷歌Gemini 2.5模型系列更新

    今年 3 月,我们发布了迄今为止最智能的模型 Gemini 2.5 Pro,两周前,我们提前为您带来了 I/O 更新,以便开发者构建出色的网络应用。
    的头像 发表于 05-23 14:56 1357次阅读

    Gemini API集成Google图像生成模型Imagen 3

    开发者现在可以通过 Gemini API 访问 Google 最先进的图像生成模型 Imagen 3。该模型最初仅对付费用户开放,不久后也将面向免费用户
    的头像 发表于 05-14 16:53 1460次阅读