0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌Gemma 3n预览版全新发布

谷歌开发者 来源:谷歌开发者 2025-06-26 17:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 产品经理 Lucas Gonzalez 和软件工程师 Rakesh Shivanna

继 Gemma 3 和 Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单一云端或桌面加速器上运行的能力,我们正在进一步推进我们对可访问 AI 的愿景。Gemma 3 为开发者提供了强大的功能,现在我们正将这一愿景扩展到能够在您日常使用的设备 (您的手机、平板电脑和笔记本电脑) 上直接运行的高性能实时 AI。

为了驱动下一代的 On-device AI 并支持各种应用,包括提升 Gemini Nano 的能力,我们设计了一种全新的尖端架构。这个下一代基础架构是在与高通技术 (Qualcomm Technologies)、联发科 (MediaTek) 和三星系统 LSI (Samsung System LSI) 等移动硬件领导者的紧密合作下打造的,并针对闪电般快速的多模态 AI 进行了优化,从而能够在您的设备上直接实现真正个性化和私密的体验。

Gemma 3n 是我们首个基于此突破性的共享架构构建的开放模型,开发者即日起就可以在早期预览版中开始体验这项技术。同样的先进架构也为下一代 Gemini Nano 提供支持,它将这些功能带到 Google 应用和我们的 On-device 生态系统的广泛功能中,并将在今年晚些时候推出。Gemma 3n 使您能够开始在此基础上进行构建,该基础将应用于 Android 和 Chrome 等主要平台。

Gemma 3n 利用了 Google DeepMind 一项名为 Per-Layer Embeddings (PLE) 的创新技术,该技术显著降低了 RAM 的使用量。虽然原始参数规模为 5B 和 8B,但这项创新允许您在移动设备上运行更大的模型,或从云端进行实时流式传输,其内存消耗与 2B 和 4B 模型相当,这意味着这些模型可以在仅 2GB 和 3GB 的动态内存占用下运行。

通过探索 Gemma 3n,开发者可以提前预览开放模型的核心功能以及将通过 Gemini Nano 在 Android 和 Chrome 上提供的移动优先架构创新。

在本文中,我们将探讨 Gemma 3n 的新功能、我们负责任的开发方法,以及如何访问预览版。

Gemma 3n 的关键功能

Gemma 3n 专为在本地运行的快速、低占用空间的 AI 体验而设计,提供:

优化的 On-Device 性能和效率: 与 Gemma 3 4B 相比,Gemma 3n 在移动设备上的响应速度提升了约 1.5 倍,质量显著提高,并通过 Per Layer Embeddings、KVC sharing 和高级 activation quantization 等创新技术降低了内存占用。

Many-in-1 灵活性: 一个具有 4B 活跃内存占用 (active memory footprint) 的模型,原生包含一个嵌套的先进 2B 活跃内存占用子模型 (这要归功于 MatFormer 训练)。这提供了在运行中动态权衡性能和质量的灵活性,而无需托管单独的模型。我们还在 Gemma 3n 中引入了 mix'n'match 能力,可以从 4B 模型中动态创建子模型,以最佳地适应您的特定用例以及相关的质量/延迟权衡。敬请关注我们即将发布的技术报告中有关此研究的更多信息。

Privacy-First 和 Offline Ready: 即使没有互联网连接,也可以在本地执行能够实现尊重用户隐私并可靠运行的功能。

通过音频扩展的多模态理解: Gemma 3n 可以理解和处理音频、文本和图像,并提供显著增强的视频理解能力。其音频能力使模型能够执行高质量的自动语音识别 (转录) 和翻译 (语音到翻译文本)。此外,该模型还接受跨模态的交错输入,从而能够理解复杂的多模态交互。(相关功能即将公开发布)

改进的多语言能力: 提升了多语言性能,特别是在日语、德语、韩语、西班牙语和法语方面。在多种语言基准测试中表现出色,例如在 WMT24++ (ChrF) 上取得了 50.1% 的优异成绩。

解锁全新 On-the-go 体验

Gemma 3n 将通过以下方式赋能新一代智能 On-the-go 应用,使开发者能够:

构建实时的互动体验,能够理解并响应用户环境中的实时视觉和听觉信息。

利用组合的音频、图像、视频和文本输入 (全部在设备上私密处理) 来实现更深层次的理解和基于上下文的文本生成。

开发先进的以音频为中心的应用,包括实时语音转录、翻译和丰富的语音驱动互动。

携手共建负责任的 AI

我们对负责任的 AI 开发的承诺至关重要。与所有 Gemma 模型一样,Gemma 3n 经过了严格的安全评估、数据治理以及与我们的安全政策进行微调对齐。我们以谨慎的风险评估方式对待开放模型,并在 AI 领域不断发展的同时持续完善我们的实践。

开始使用: 立即预览 Gemma 3n

您可以通过预览版率先体验 Gemma 3n 的强大功能:

初始访问 (现已可用):

通过 Google AI Studio 进行基于云的探索: 无需任何配置,您可直接通过浏览器访问 Google AI Studio,即刻上手试用 Gemma 3n。立即探索其文本输入能力。

使用 Google AI Edge 进行 On-Device 开发: 对于希望在本地集成 Gemma 3n 的开发者,Google AI Edge 提供了工具和库。您即刻就可以开始使用文本和图像理解/生成能力。

Gemma 3n 标志着在普及前沿且高效 AI 的道路上又迈出了新的一步。我们非常期待能看到,随着这项技术的预览版开始逐步开放,您将构建出怎样的精彩应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1817

    浏览量

    60658
  • Gemini
    +关注

    关注

    0

    文章

    79

    浏览量

    8182
  • AI
    AI
    +关注

    关注

    91

    文章

    41435

    浏览量

    302781
  • 模型
    +关注

    关注

    1

    文章

    3836

    浏览量

    52293

原文标题:Gemma 3n 预览版发布: 强劲性能,高效运行,专为移动设备而生

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Google正式推出最新开放模型Gemma 4

    源于社区的巨大推动力: 自第一代模型发布以来,Gemma 的下载量已突破 4 亿次,并构建了一个拥有超过 10 万个衍生模型且充满活力的 Gemmaverse 生态系统。我们密切关注开发者对 AI
    的头像 发表于 04-08 10:06 608次阅读
    Google正式推出最新开放模型<b class='flag-5'>Gemma</b> 4

    谷歌推出TranslateGemma全新开放翻译模型系列

    我们已正式推出 TranslateGemma,这一全新的开放翻译模型系列基于 Gemma 3 构建,并提供 4B、12B 和 27B 三种参数规模。TranslateGemma 的问世标志着开放翻译领域迈出了重要一步,它可帮助人
    的头像 发表于 02-26 10:22 775次阅读

    开发智能体调试与预览---真机测试

    用户组,开发者需要创建一个用户组并添加用于真机测试的用户信息,创建方式见下方真机测试用户组列表部分。 3、再次在调试与预览区域点击【真机测试】-【发布真机测试】。提示请求成功后,开发者及白名单内人员可通过
    发表于 02-09 15:37

    CastFox利用Google开放模型Gemma 3n重塑播客互动体验

    Guru Network Limited 是一家全球化的娱乐与游戏公司,其开发的 CastFox 彻底改变了用户与播客的交互方式,应用上线仅 3 周下载量就突破 100 万次。
    的头像 发表于 02-09 14:50 650次阅读

    谷歌Android Studio Otter 3功能更新发布

    我们很高兴地宣布,Android Studio Otter 3 功能更新稳定版现已发布!本次更新干货满满,不仅重磅升级了 Android Studio 中的智能体工作流,还为开发者提供了更高的灵活性和掌控力,助力大家轻松利用 AI 构建 Android 应用。
    的头像 发表于 01-28 14:15 922次阅读
    <b class='flag-5'>谷歌</b>Android Studio Otter <b class='flag-5'>3</b>功能更<b class='flag-5'>新发布</b>

    谷歌正式发布Gemma Scope 2模型

    大语言模型 (LLM) 具备令人惊叹的推理能力,但其内部决策过程在很大程度上仍然不透明。如果系统未按预期运行,对其内部运作机制缺乏可见性将难以准确定位问题根源。过去,我们通过发布 Gemma
    的头像 发表于 01-24 14:01 775次阅读

    微软Visual Studio 2026 发布!AI 深度融合、性能提升

    “  微软发布 Visual Studio 2026 预览版,新版本以深度融合的 AI Copilot 为核心,结合全新的 Fluent Design 界面与显著的性能提升,旨在打造前所未有的智能
    的头像 发表于 09-16 11:17 2392次阅读
    微软Visual Studio 2026 <b class='flag-5'>发布</b>!AI 深度融合、性能提升

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3Gemma 3 QAT,为单一云端和桌面加速器带来了
    的头像 发表于 09-11 15:09 1343次阅读

    亚马逊云科技推出Amazon Nova Act SDK预览版,加速浏览器自动化Agent落地

    Storage Service (Amazon S3),以及全新推出的、支持大规模云端浏览器执行的Amazon Bedrock AgentCore Browser Tool。 Amazon Nova Act SDK最初于2025年初以研究
    的头像 发表于 08-06 08:42 1003次阅读

    谷歌Gemma 3n模型的新功能

    从第一个 Gemma 模型于去年年初推出以来,已逐渐发展为生机勃勃的 Gemmaverse 生态系统,累计下载量突破 1.6 亿。这个生态系统包括十余款专业模型系列,涵盖从安全防护到医疗应用的各领
    的头像 发表于 07-25 10:16 1682次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemma</b> <b class='flag-5'>3n</b>模型的新功能

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTX 与 NVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma 3n 现可借助 RTX 和 NVIDIA Jetson 加速运行。
    的头像 发表于 07-16 09:16 2225次阅读

    NVIDIA Isaac Sim和Isaac Lab现已推出早期开发者预览版

    NVIDIA 发布了机器人仿真参考应用 Isaac Sim 和机器人学习框架 Isaac Lab 的开发者预览版。开发者现在可以通过 GitHub 访问早期版本,抢先体验先进功能,用于在基于物理的仿真环境中构建、训练和测试 AI 驱动的机器人。
    的头像 发表于 07-04 14:23 2077次阅读

    树莓派5上的Gemma 2:如何打造高效的边缘AI解决方案?

    从数学基础到边缘实现,研究团队:Conecta.ai(ufrn.br)摘要1.引言2.GEMMA2:通用集成机器模型算法2.1模型架构2.2预训练2.3后训练3.边缘AI实现1.引言GEMMA
    的头像 发表于 06-20 16:57 1841次阅读
    树莓派5上的<b class='flag-5'>Gemma</b> 2:如何打造高效的边缘AI解决方案?

    立锜科技全新发布RT8581升压型转换器

    立锜全新发布的 RT8581 是一款专为 SSD、无线充电设备、便携式 POS 机等应用设计的升压型转换器,支持最高 12V 输入、电流峰值可达 10A,兼具高效率与简化系统设计的优势。
    的头像 发表于 06-19 17:25 1353次阅读

    谷歌推出Gemini 2.5 Pro预览版(I/O版本)

    我们目睹了开发者使用 Gemini 2.5 Pro 取得了令人赞叹的成就。因此,我们决定提前数周发布更新版本,以便开发者尽早体验新版模型。
    的头像 发表于 06-10 10:43 1340次阅读