0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出Gemini 2.0 Flash体验版

谷歌开发者 来源:谷歌开发者 2025-01-06 09:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / Gemini API 小组产品经理 Shrestha Basu Mallick 和 Google Labs 产品总监 Kathy Korevec

我们正赋予开发者构建 AI 未来的能力,包括尖端模型、智能代码编写工具以及跨平台和设备的无缝集成。自 2023 年 12 月我们推出 Gemini 1.0 以来,数百万的开发者已经使用 Google AI Studio 和 Vertex AI 在 109 种语言中使用 Gemini 进行构建。

我们推出了 Gemini 2.0 Flash 体验版,旨在支持更具沉浸感和交互性的应用。同时,我们还推出了能够代开发者执行任务、优化开发流程的全新编码智能体。

使用 Gemini 2.0 Flash 进行构建

在 Gemini 1.5 Flash 成功的基础上,Flash 2.0 的速度是 1.5 Pro 的两倍,具有更优越的性能,包括新的多模态输出,并支持原生工具使用。我们还推出了 Multimodal Live API,用于构建具有实时音频和视频流的动态应用。

即日起,开发者可以通过 Google AI Studio 和 Vertex AI中的 Gemini API,测试和探索实验阶段的 Gemini 2.0 Flash,正式版预计将于 2025 年初全面推出。

借助 Gemini 2.0 Flash,开发者可以获得:

1. 更佳性能

Gemini 2.0 Flash 比 1.5 Pro 更强大,同时在速度和效率上依然符合开发者对 Flash 的期望。它还在关键基准测试中展示了更优越的多模态、文本、代码、视频、空间理解和推理性能。改进后的空间理解能力能够在复杂图像中为小对象生成更精确的边界框,并实现更好的对象识别和图像描述。如需了解详情,您可以观看空间理解视频或阅读 Gemini API 文档。

2. 新的输出模式

开发者将能够使用 Gemini 2.0 Flash 通过单次 API 调用,生成包含文本、音频和图像的综合响应。这些新的输出模态已提供给早期测试人员使用,预计 2025 年将在更大范围推广。所有图像和音频输出都将启用 SynthID 隐形水印,这有助于减少错误信息和错误归因问题。

多语言原生音频输出: Gemini 2.0 Flash 具有原生文本转语音的音频输出功能,开发者不仅可以控制模型输出的内容,还可以精细控制说话方式,并提供 8 种高品质的声音以及各种语言和口音选择。您可以聆听原生音频输出的实际效果,或在开发者文档中了解更多信息。

原生图像输出: Gemini 2.0 Flash 现在可以生成原生图像,并支持对话式多轮编辑,因此您可以在此前的输出基础上进行构建和完善。它可以输出交错的文本和图像,使其在食谱等多模态内容中非常实用。您可以观看原生图像输出视频以了解更多信息。

3. 原生工具使用

Gemini 2.0 已经过训练,能够使用工具,这是构建智能体体验的基础能力。除了通过函数调用自定义第三方函数之外,它还可以原生调用 Google Search 和代码执行等工具。使用原生 Google Search 作为工具,不仅能提供更真实、更全面的答案,还能为发行商带来更多流量。它可以同时运行多项搜索,从多个来源找到更多相关事实并将其组合以提升准确率,从而改进信息检索效率。您可以在原生工具使用视频中了解详情,或从 Notebook 上开始构建。

4. Multimodal Live API

开发者现在可以使用来自摄像头或屏幕的音频和视频流输入,构建实时多模态应用。同时,应用可以支持诸如中断和语音活动检测等自然对话模式。该 API 支持将多个工具集成在一起,通过单个 API 调用即可完成复杂的用例。您可以在多模态直播视频中查看更多内容,尝试使用 Web console或入门代码 (Python)。

我们很高兴看到初创公司在使用 Gemini 2.0 Flash 方面取得了令人瞩目的进展,他们正在研发各种新体验的原型,例如 tldraw 的视觉游乐场、Viggle 的虚拟角色创建和音频旁白、Toonsutra 的情景多语言翻译以及 Rooms 正在实现的实时音频功能等。

为了加速开发,我们在 Google AI Studio 中发布了三个入门级应用体验,并提供了空间理解、视频分析和 Google 地图探索的开源代码,以便您可以开始使用 Gemini 2.0 Flash 进行构建。

赋能 AI 代码辅助的演进

随着 AI 代码辅助功能从简单的代码搜索迅速发展到嵌入开发者工作流程中的 AI 助手,我们希望分享使用 Gemini 2.0 的最新进展: 可以代表您执行任务的编码智能体。 在我们最新的研究中,我们已能够使用配备代码执行工具的 2.0 Flash,在 SWE-bench Verified 基准测试中达到 51.8% 的成绩,该基准测试用于评估智能体在实际软件工程任务中的表现。Gemini 2.0 Flash 的尖端推理速度使智能体能够采样数百种潜在的解决方案,再根据现有的单元测试和 Gemini 自身的判断来选择最佳解决方案。我们正在将这项研究成果转化为新的开发者产品。

认识您的 AI 编码智能体 Jules

想象一下,您的团队刚刚完成了一次 Bug Bash,现在有一长串的 Bug 等着您解决。现在,您可以将 Python 和 Javascript 编码任务分配给 Jules,这是一个使用 Gemini 2.0 的实验性 AI 编码智能体。Jules 可以异步工作,并与您的 GitHub 工作流程集成,处理 Bug 修复和其他耗时任务,让您可以专注于真正想要构建的内容。Jules 会创建全面的多步骤计划来解决问题,高效地修改多个文件,甚至还会准备拉取请求,以便将修复直接提交回 GitHub。

Jules 还处于早期阶段,但根据我们内部使用 Jules 的经验,它可为开发者提供:

更高的生产力:将问题和编码任务分配给 Jules,以提高异步编码效率。

进度跟踪:通过实时更新,随时了解情况并优先处理需要您关注的任务。

开发者全面掌控:随时查看 Jules 制定的方案,并根据需要提出反馈或进行调整。轻松审查 Jules 编写的代码,并在适当的时候将其合并到您的项目中。

我们目前将 Jules 提供给部分受信任的测试人员,并计划将于 2025 年初为其他感兴趣的开发者提供该功能。欢迎您在 labs.google.com/jules 上注册,获取有关 Jules 的最新进展。

Colab 的数据科学智能体

将为您创建 Notebook

在 2024 年的 I/O 大会上,我们在 labs.google/code 上推出了实验性的数据科学智能体,任何用户都可以上传数据集,并在几分钟内获得洞察,所有这些都基于可运行的 Colab Notebook。我们收到了开发者社区的积极反馈,并见证了该功能的影响力,这令我们倍感欣喜。例如,在数据科学智能体的帮助下,Lawrence Berkeley 国家实验室研究全球热带湿地甲烷排放项目的科学家估计,原本要花一周时间分析和处理的内容,现在只需五分钟。 Colab 已经开始使用 Gemini 2.0 整合这些相同的智能体功能。只需用简单的语言描述您的分析目标,就可以自动生成 Notebook,帮助您提升研究和数据分析的能力。开发者可以通过加入受信任的测试人员计划来抢先体验这项新功能,该功能将于 2025 年上半年更广泛地面向 Colab 用户推出。

开发者正在构建未来

我们的 Gemini 2.0 模型可以让您更快、更轻松地构建更强大的 AI 应用,让您可以专注于为用户打造卓越的体验。我们将在未来几个月内把 Gemini 2.0 引入 Android Studio、Chrome DevTools 和 Firebase 等平台。开发者可以在 Gemini Code Assist中注册以使用 Gemini 2.0 Flash,从而在 Visual Studio Code、IntelliJ、PyCharm 等流行 IDE 中体验增强的代码辅助功能。您可以访问 ai.google.dev 开始使用,并关注 Google AI for Developers,获取后续更新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Gemini
    +关注

    关注

    0

    文章

    73

    浏览量

    8108
  • API
    API
    +关注

    关注

    2

    文章

    2151

    浏览量

    66241
  • AI
    AI
    +关注

    关注

    89

    文章

    38106

    浏览量

    296641
  • 开发者
    +关注

    关注

    1

    文章

    732

    浏览量

    17925

原文标题:为开发者开启 Gemini 时代新篇章

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌AI霸主归来!多线反击OpenAI,开启安卓Gemini时代

    电子发烧友网报道(文/莫婷婷)北京时间5月21日,谷歌2025 Google I/O开发者大会正式召开,从其发布的新品来看,这可以说是一场AI盛会。 在AI大模型方面,发布了Gemini 2.5
    的头像 发表于 05-22 09:01 6355次阅读
    <b class='flag-5'>谷歌</b>AI霸主归来!多线反击OpenAI,开启安卓<b class='flag-5'>Gemini</b>时代

    谷歌正式推出最新Gemini 3 AI模型

    今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,与之前的版本相比,它在所有主要的 AI 基准测试中都取得了无与伦比的结果,尤其是在编程方
    的头像 发表于 11-24 11:10 781次阅读
    <b class='flag-5'>谷歌</b>正式<b class='flag-5'>推出</b>最新<b class='flag-5'>Gemini</b> 3 AI模型

    谷歌推出Gemini 2.5 Pro预览版(I/O版本)

    我们目睹了开发者使用 Gemini 2.5 Pro 取得了令人赞叹的成就。因此,我们决定提前数周发布更新版本,以便开发者尽早体验新版模型。
    的头像 发表于 06-10 10:43 1002次阅读

    谷歌Gemini 2.5模型系列更新

    今年 3 月,我们发布了迄今为止最智能的模型 Gemini 2.5 Pro,两周前,我们提前为您带来了 I/O 更新,以便开发者构建出色的网络应用。
    的头像 发表于 05-23 14:56 998次阅读

    谷歌Gemini API最新进展

    今年的 Cloud Next 大会上,我们推出了一系列突破性更新与强大功能,旨在赋能广大开发者,与大家携手共创人工智能的未来。本次发布亮点包括:最新的 Gemini 2.5 思考模型,实时互动
    的头像 发表于 04-12 16:10 1465次阅读

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 FlashGemin
    的头像 发表于 02-07 15:07 1084次阅读

    DeepSeek用户量超越谷歌Gemini

    在聊天AI领域的竞争中,中国AI产品DeepSeek展现出了强劲的增长势头。据最新数据显示,1月底,DeepSeek的用户量已经成功超越了谷歌Gemini。 具体来看,1月31日这一天
    的头像 发表于 02-07 14:59 785次阅读

    三星 Galaxy S25 系列与谷歌 Gemini 深度整合

    在Galaxy Unpacked发布会上,三星Galaxy S25系列手机震撼登场,其与谷歌Gemini的深度整合成为一大亮点。 此次整合后,Gemini AI助手为Galaxy S25系列带来
    的头像 发表于 01-23 17:41 1310次阅读

    谷歌Gemini AI目标年底用户达5亿

    近日,谷歌CEO桑达尔·皮查伊在内部会议上向员工透露,他对公司自主研发的Gemini AI技术充满信心,认为其能力已经超越了当前的竞争对手。这一表态不仅彰显了谷歌在AI领域的雄心壮志,也预示着
    的头像 发表于 01-18 11:30 1267次阅读

    谷歌CEO:Gemini AI技术超越竞品,目标年底5亿用户

    近日,谷歌CEO皮查伊近期向员工传达了他对公司Gemini AI技术的信心。据悉,皮查伊认为Gemini的能力已经超越了当前的竞争对手。 皮查伊表示,他期望到今年年底,全球能有5亿人
    的头像 发表于 01-17 10:37 1132次阅读

    借助谷歌Gemini和Imagen模型生成高质量图像

    在快速发展的生成式 AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌Gemini 模型来制作详细且富有创意的提示,然后使用 Imagen 3 模型根据这些提示生成高质量的图像,您可
    的头像 发表于 01-03 10:38 1340次阅读
    借助<b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>和Imagen模型生成高质量图像

    谷歌发布“深度研究”AI工具,利用Gemini模型进行网络信息检索

    据外媒最新报道,谷歌近期发布了一款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言模型,实现了对网络信息的高效检索与深度挖掘,进一步满足了用户对精准、详尽信息的需求。 据悉
    的头像 发表于 12-16 09:35 1036次阅读

    谷歌Gemini 2.0 Flash体验版发布

    信息是人类进步的基石。26 年来,我们始终专注于我们的使命——整合全球信息,供大众使用,让人人受益。这也是我们持续拓展人工智能前沿领域的原因。我们整合来自世界各地的信息,并通过多样化的输出方式,让这些信息触手可及,真正为您所用。
    的头像 发表于 12-13 13:52 939次阅读

    谷歌正式发布Gemini 2.0 性能提升近两倍

    在智能体时代,谷歌再次引领技术潮流,正式发布了其最新力作——Gemini 2.0。这款AI模型不仅在性能上实现了显著提升,更是在多模态表现和原生工具应用方面展现了前所未有的强大功能。 Gemi
    的头像 发表于 12-12 14:22 1117次阅读

    谷歌发布Gemini 2.0 AI模型

    下文处理技术,能够更有效地支持用户在学术及专业领域进行深入研究。这一新功能的推出,将为用户在探索复杂问题时提供更为精准和全面的帮助。 目前,Gemini 2.0 Flash
    的头像 发表于 12-12 10:13 967次阅读