0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出Gemini 2.0 Flash体验版

谷歌开发者 来源:谷歌开发者 2025-01-06 09:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / Gemini API 小组产品经理 Shrestha Basu Mallick 和 Google Labs 产品总监 Kathy Korevec

我们正赋予开发者构建 AI 未来的能力,包括尖端模型、智能代码编写工具以及跨平台和设备的无缝集成。自 2023 年 12 月我们推出 Gemini 1.0 以来,数百万的开发者已经使用 Google AI Studio 和 Vertex AI 在 109 种语言中使用 Gemini 进行构建。

我们推出了 Gemini 2.0 Flash 体验版,旨在支持更具沉浸感和交互性的应用。同时,我们还推出了能够代开发者执行任务、优化开发流程的全新编码智能体。

使用 Gemini 2.0 Flash 进行构建

在 Gemini 1.5 Flash 成功的基础上,Flash 2.0 的速度是 1.5 Pro 的两倍,具有更优越的性能,包括新的多模态输出,并支持原生工具使用。我们还推出了 Multimodal Live API,用于构建具有实时音频和视频流的动态应用。

即日起,开发者可以通过 Google AI Studio 和 Vertex AI中的 Gemini API,测试和探索实验阶段的 Gemini 2.0 Flash,正式版预计将于 2025 年初全面推出。

借助 Gemini 2.0 Flash,开发者可以获得:

1. 更佳性能

Gemini 2.0 Flash 比 1.5 Pro 更强大,同时在速度和效率上依然符合开发者对 Flash 的期望。它还在关键基准测试中展示了更优越的多模态、文本、代码、视频、空间理解和推理性能。改进后的空间理解能力能够在复杂图像中为小对象生成更精确的边界框,并实现更好的对象识别和图像描述。如需了解详情,您可以观看空间理解视频或阅读 Gemini API 文档。

2. 新的输出模式

开发者将能够使用 Gemini 2.0 Flash 通过单次 API 调用,生成包含文本、音频和图像的综合响应。这些新的输出模态已提供给早期测试人员使用,预计 2025 年将在更大范围推广。所有图像和音频输出都将启用 SynthID 隐形水印,这有助于减少错误信息和错误归因问题。

多语言原生音频输出: Gemini 2.0 Flash 具有原生文本转语音的音频输出功能,开发者不仅可以控制模型输出的内容,还可以精细控制说话方式,并提供 8 种高品质的声音以及各种语言和口音选择。您可以聆听原生音频输出的实际效果,或在开发者文档中了解更多信息。

原生图像输出: Gemini 2.0 Flash 现在可以生成原生图像,并支持对话式多轮编辑,因此您可以在此前的输出基础上进行构建和完善。它可以输出交错的文本和图像,使其在食谱等多模态内容中非常实用。您可以观看原生图像输出视频以了解更多信息。

3. 原生工具使用

Gemini 2.0 已经过训练,能够使用工具,这是构建智能体体验的基础能力。除了通过函数调用自定义第三方函数之外,它还可以原生调用 Google Search 和代码执行等工具。使用原生 Google Search 作为工具,不仅能提供更真实、更全面的答案,还能为发行商带来更多流量。它可以同时运行多项搜索,从多个来源找到更多相关事实并将其组合以提升准确率,从而改进信息检索效率。您可以在原生工具使用视频中了解详情,或从 Notebook 上开始构建。

4. Multimodal Live API

开发者现在可以使用来自摄像头或屏幕的音频和视频流输入,构建实时多模态应用。同时,应用可以支持诸如中断和语音活动检测等自然对话模式。该 API 支持将多个工具集成在一起,通过单个 API 调用即可完成复杂的用例。您可以在多模态直播视频中查看更多内容,尝试使用 Web console或入门代码 (Python)。

我们很高兴看到初创公司在使用 Gemini 2.0 Flash 方面取得了令人瞩目的进展,他们正在研发各种新体验的原型,例如 tldraw 的视觉游乐场、Viggle 的虚拟角色创建和音频旁白、Toonsutra 的情景多语言翻译以及 Rooms 正在实现的实时音频功能等。

为了加速开发,我们在 Google AI Studio 中发布了三个入门级应用体验,并提供了空间理解、视频分析和 Google 地图探索的开源代码,以便您可以开始使用 Gemini 2.0 Flash 进行构建。

赋能 AI 代码辅助的演进

随着 AI 代码辅助功能从简单的代码搜索迅速发展到嵌入开发者工作流程中的 AI 助手,我们希望分享使用 Gemini 2.0 的最新进展: 可以代表您执行任务的编码智能体。 在我们最新的研究中,我们已能够使用配备代码执行工具的 2.0 Flash,在 SWE-bench Verified 基准测试中达到 51.8% 的成绩,该基准测试用于评估智能体在实际软件工程任务中的表现。Gemini 2.0 Flash 的尖端推理速度使智能体能够采样数百种潜在的解决方案,再根据现有的单元测试和 Gemini 自身的判断来选择最佳解决方案。我们正在将这项研究成果转化为新的开发者产品。

认识您的 AI 编码智能体 Jules

想象一下,您的团队刚刚完成了一次 Bug Bash,现在有一长串的 Bug 等着您解决。现在,您可以将 Python 和 Javascript 编码任务分配给 Jules,这是一个使用 Gemini 2.0 的实验性 AI 编码智能体。Jules 可以异步工作,并与您的 GitHub 工作流程集成,处理 Bug 修复和其他耗时任务,让您可以专注于真正想要构建的内容。Jules 会创建全面的多步骤计划来解决问题,高效地修改多个文件,甚至还会准备拉取请求,以便将修复直接提交回 GitHub。

Jules 还处于早期阶段,但根据我们内部使用 Jules 的经验,它可为开发者提供:

更高的生产力:将问题和编码任务分配给 Jules,以提高异步编码效率。

进度跟踪:通过实时更新,随时了解情况并优先处理需要您关注的任务。

开发者全面掌控:随时查看 Jules 制定的方案,并根据需要提出反馈或进行调整。轻松审查 Jules 编写的代码,并在适当的时候将其合并到您的项目中。

我们目前将 Jules 提供给部分受信任的测试人员,并计划将于 2025 年初为其他感兴趣的开发者提供该功能。欢迎您在 labs.google.com/jules 上注册,获取有关 Jules 的最新进展。

Colab 的数据科学智能体

将为您创建 Notebook

在 2024 年的 I/O 大会上,我们在 labs.google/code 上推出了实验性的数据科学智能体,任何用户都可以上传数据集,并在几分钟内获得洞察,所有这些都基于可运行的 Colab Notebook。我们收到了开发者社区的积极反馈,并见证了该功能的影响力,这令我们倍感欣喜。例如,在数据科学智能体的帮助下,Lawrence Berkeley 国家实验室研究全球热带湿地甲烷排放项目的科学家估计,原本要花一周时间分析和处理的内容,现在只需五分钟。 Colab 已经开始使用 Gemini 2.0 整合这些相同的智能体功能。只需用简单的语言描述您的分析目标,就可以自动生成 Notebook,帮助您提升研究和数据分析的能力。开发者可以通过加入受信任的测试人员计划来抢先体验这项新功能,该功能将于 2025 年上半年更广泛地面向 Colab 用户推出。

开发者正在构建未来

我们的 Gemini 2.0 模型可以让您更快、更轻松地构建更强大的 AI 应用,让您可以专注于为用户打造卓越的体验。我们将在未来几个月内把 Gemini 2.0 引入 Android Studio、Chrome DevTools 和 Firebase 等平台。开发者可以在 Gemini Code Assist中注册以使用 Gemini 2.0 Flash,从而在 Visual Studio Code、IntelliJ、PyCharm 等流行 IDE 中体验增强的代码辅助功能。您可以访问 ai.google.dev 开始使用,并关注 Google AI for Developers,获取后续更新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Gemini
    +关注

    关注

    0

    文章

    84

    浏览量

    8192
  • API
    API
    +关注

    关注

    2

    文章

    2506

    浏览量

    67136
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303077
  • 开发者
    +关注

    关注

    1

    文章

    793

    浏览量

    18104

原文标题:为开发者开启 Gemini 时代新篇章

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌发布Gemini for Science

    2026年5月20日,谷歌I/O开发者大会上,谷歌正式推出Gemini for Science——一款专门面向科研场景的AI模型。这不是又一个能帮你查文献的聊天机器人,而是
    的头像 发表于 05-21 10:42 915次阅读

    谷歌正式发布Gemini Spark

    5月20日,谷歌在I/O 2026上正式发布了Gemini Spark——一款全天候运行的个人AI助手。它基于Gemini 3.5打造,运行在Google Cloud虚拟机上,用户通过Gemi
    的头像 发表于 05-21 10:39 476次阅读

    谷歌推出Gemini 3.5系列模型

    2026年5月20日凌晨,谷歌I/O 2026开发者大会正式拉开帷幕。谷歌首席执行官桑达尔·皮查伊在舞台上抛出了一枚重磅炸弹—— **Gemini 3.5 Flash** ,
    的头像 发表于 05-21 10:19 527次阅读

    谷歌发布安卓17+Gemini Intelligence

    近日,谷歌正式公布了安卓17(Android 17)的详细特性,同时抛出了一颗重磅炸弹—— **Gemini Intelligence** ,谷歌将自家最强AI能力全面植入安卓系统,推动安卓从
    的头像 发表于 05-13 11:26 1090次阅读

    Gemini CLI 中转站配置使用教程

    Gemini CLI 中文使用指南 基本介绍 Gemini CLI 是谷歌提供的开源命令行 AI 工具,将 Gemini 的强大功能直接带入您的终端。它提供轻量级的
    发表于 02-10 17:29

    晶晨携手谷歌,助力端侧大模型Gemini的硬件落地

    AI)相关产品的核心芯片供应商,双方在人工智能领域紧密协作,聚焦于谷歌端侧大模型Gemini的硬件生态落地。   公司积极推出适配Gemini的智能音箱、智能可视化门铃、室内及室外智
    的头像 发表于 01-29 10:44 2576次阅读

    谷歌正式推出Gemini 3 Flash模型

    我们正式推出Gemini 3 Flash,这是以较低成本打造的高效前沿智能,成功地进一步扩展了 Gemini 3 模型系列。
    的头像 发表于 01-22 16:04 838次阅读

    谷歌评论卡,碰一碰即可完成谷歌评论 #谷歌评论卡 #NFC标签 #nfc卡

    谷歌
    深圳市融智兴科技有限公司
    发布于 :2026年01月15日 17:02:00

    每年10亿美元,苹果与谷歌官宣合作,Gemini大模型注入Siri

    该协议,下一代苹果基础模型(Apple Foundation Models)将基于谷歌Gemini模型和云技术。   苹果:借Gemini之力,加速AI追赶   长期以来,苹果在AI领域的发展相对滞后,其语音助手Siri的功能
    的头像 发表于 01-13 14:59 6006次阅读

    奥比中光正式推出超小型双目3D相机Gemini 305

    1月6日,CES 2026首日,奥比中光正式推出超小型双目3D相机Gemini 305。该产品专为机械臂腕部设计,最小成像距离仅4厘米,视场角达88°×65°,且支持灵活切换成像模式。Gemini 305为协作机械臂、人形机器人
    的头像 发表于 01-08 17:14 761次阅读

    Infineon SEMPER NOR Flash与HYPERRAM™ 2.0 Gen2 Flash+RAM MCP产品解析

    启动代码,用RAM进行暂存扩展内存。英飞凌(Infineon)推出Flash+RAM多芯片封装(MCP)Gen 2产品,将SEMPER™ NOR Flash和HYPERRAM™ 2.0
    的头像 发表于 12-20 16:20 1473次阅读

    Gemini AI 再进化:谷歌联合XREAL发布Project Aura, 打开“看见世界”的新能力

    被定位为迄今为止最完整、最接近 Android XR 理想形态的硬件样本。作为谷歌官方认可的系统级参考硬件,Project Aura 标志着 Gemini AI 第一次真正拥有“看见世界”的能力
    发表于 12-09 11:06 1479次阅读
    <b class='flag-5'>Gemini</b> AI 再进化:<b class='flag-5'>谷歌</b>联合XREAL发布Project Aura, 打开“看见世界”的新能力

    谷歌正式推出最新Gemini 3 AI模型

    今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,与之前的版本相比,它在所有主要的 AI 基准测试中都取得了无与伦比的结果,尤其是在编程方
    的头像 发表于 11-24 11:10 1501次阅读
    <b class='flag-5'>谷歌</b>正式<b class='flag-5'>推出</b>最新<b class='flag-5'>Gemini</b> 3 AI模型

    谷歌Gemini 3模型开启智能新纪元

    大约两年前,我们开启了 Gemini 时代,这是公司迄今为止投入最大的科研和产品项目之一。自那时起,看到大家对它的喜爱程度,着实令人惊叹。现在,每月有 20 亿用户使用 AI 概览 (AI
    的头像 发表于 11-24 11:07 1061次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b> 3模型开启智能新纪元

    谷歌推出Gemini 2.5 Pro预览版(I/O版本)

    我们目睹了开发者使用 Gemini 2.5 Pro 取得了令人赞叹的成就。因此,我们决定提前数周发布更新版本,以便开发者尽早体验新版模型。
    的头像 发表于 06-10 10:43 1372次阅读