0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌Gemma 3n预览版全新发布

谷歌开发者 来源:谷歌开发者 2025-06-26 17:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 产品经理 Lucas Gonzalez 和软件工程师 Rakesh Shivanna

继 Gemma 3 和 Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单一云端或桌面加速器上运行的能力,我们正在进一步推进我们对可访问 AI 的愿景。Gemma 3 为开发者提供了强大的功能,现在我们正将这一愿景扩展到能够在您日常使用的设备 (您的手机、平板电脑和笔记本电脑) 上直接运行的高性能实时 AI。

为了驱动下一代的 On-device AI 并支持各种应用,包括提升 Gemini Nano 的能力,我们设计了一种全新的尖端架构。这个下一代基础架构是在与高通技术 (Qualcomm Technologies)、联发科 (MediaTek) 和三星系统 LSI (Samsung System LSI) 等移动硬件领导者的紧密合作下打造的,并针对闪电般快速的多模态 AI 进行了优化,从而能够在您的设备上直接实现真正个性化和私密的体验。

Gemma 3n 是我们首个基于此突破性的共享架构构建的开放模型,开发者即日起就可以在早期预览版中开始体验这项技术。同样的先进架构也为下一代 Gemini Nano 提供支持,它将这些功能带到 Google 应用和我们的 On-device 生态系统的广泛功能中,并将在今年晚些时候推出。Gemma 3n 使您能够开始在此基础上进行构建,该基础将应用于 Android 和 Chrome 等主要平台。

Gemma 3n 利用了 Google DeepMind 一项名为 Per-Layer Embeddings (PLE) 的创新技术,该技术显著降低了 RAM 的使用量。虽然原始参数规模为 5B 和 8B,但这项创新允许您在移动设备上运行更大的模型,或从云端进行实时流式传输,其内存消耗与 2B 和 4B 模型相当,这意味着这些模型可以在仅 2GB 和 3GB 的动态内存占用下运行。

通过探索 Gemma 3n,开发者可以提前预览开放模型的核心功能以及将通过 Gemini Nano 在 Android 和 Chrome 上提供的移动优先架构创新。

在本文中,我们将探讨 Gemma 3n 的新功能、我们负责任的开发方法,以及如何访问预览版。

Gemma 3n 的关键功能

Gemma 3n 专为在本地运行的快速、低占用空间的 AI 体验而设计,提供:

优化的 On-Device 性能和效率: 与 Gemma 3 4B 相比,Gemma 3n 在移动设备上的响应速度提升了约 1.5 倍,质量显著提高,并通过 Per Layer Embeddings、KVC sharing 和高级 activation quantization 等创新技术降低了内存占用。

Many-in-1 灵活性: 一个具有 4B 活跃内存占用 (active memory footprint) 的模型,原生包含一个嵌套的先进 2B 活跃内存占用子模型 (这要归功于 MatFormer 训练)。这提供了在运行中动态权衡性能和质量的灵活性,而无需托管单独的模型。我们还在 Gemma 3n 中引入了 mix'n'match 能力,可以从 4B 模型中动态创建子模型,以最佳地适应您的特定用例以及相关的质量/延迟权衡。敬请关注我们即将发布的技术报告中有关此研究的更多信息。

Privacy-First 和 Offline Ready: 即使没有互联网连接,也可以在本地执行能够实现尊重用户隐私并可靠运行的功能。

通过音频扩展的多模态理解: Gemma 3n 可以理解和处理音频、文本和图像,并提供显著增强的视频理解能力。其音频能力使模型能够执行高质量的自动语音识别 (转录) 和翻译 (语音到翻译文本)。此外,该模型还接受跨模态的交错输入,从而能够理解复杂的多模态交互。(相关功能即将公开发布)

改进的多语言能力: 提升了多语言性能,特别是在日语、德语、韩语、西班牙语和法语方面。在多种语言基准测试中表现出色,例如在 WMT24++ (ChrF) 上取得了 50.1% 的优异成绩。

解锁全新 On-the-go 体验

Gemma 3n 将通过以下方式赋能新一代智能 On-the-go 应用,使开发者能够:

构建实时的互动体验,能够理解并响应用户环境中的实时视觉和听觉信息。

利用组合的音频、图像、视频和文本输入 (全部在设备上私密处理) 来实现更深层次的理解和基于上下文的文本生成。

开发先进的以音频为中心的应用,包括实时语音转录、翻译和丰富的语音驱动互动。

携手共建负责任的 AI

我们对负责任的 AI 开发的承诺至关重要。与所有 Gemma 模型一样,Gemma 3n 经过了严格的安全评估、数据治理以及与我们的安全政策进行微调对齐。我们以谨慎的风险评估方式对待开放模型,并在 AI 领域不断发展的同时持续完善我们的实践。

开始使用: 立即预览 Gemma 3n

您可以通过预览版率先体验 Gemma 3n 的强大功能:

初始访问 (现已可用):

通过 Google AI Studio 进行基于云的探索: 无需任何配置,您可直接通过浏览器访问 Google AI Studio,即刻上手试用 Gemma 3n。立即探索其文本输入能力。

使用 Google AI Edge 进行 On-Device 开发: 对于希望在本地集成 Gemma 3n 的开发者,Google AI Edge 提供了工具和库。您即刻就可以开始使用文本和图像理解/生成能力。

Gemma 3n 标志着在普及前沿且高效 AI 的道路上又迈出了新的一步。我们非常期待能看到,随着这项技术的预览版开始逐步开放,您将构建出怎样的精彩应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1801

    浏览量

    60264
  • Gemini
    +关注

    关注

    0

    文章

    73

    浏览量

    8108
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296563
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51710

原文标题:Gemma 3n 预览版发布: 强劲性能,高效运行,专为移动设备而生

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    微软Visual Studio 2026 发布!AI 深度融合、性能提升

    “  微软发布 Visual Studio 2026 预览版,新版本以深度融合的 AI Copilot 为核心,结合全新的 Fluent Design 界面与显著的性能提升,旨在打造前所未有的智能
    的头像 发表于 09-16 11:17 1292次阅读
    微软Visual Studio 2026 <b class='flag-5'>发布</b>!AI 深度融合、性能提升

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3Gemma 3 QAT,为单一云端和桌面加速器带来了
    的头像 发表于 09-11 15:09 879次阅读

    亚马逊云科技推出Amazon Nova Act SDK预览版,加速浏览器自动化Agent落地

    Storage Service (Amazon S3),以及全新推出的、支持大规模云端浏览器执行的Amazon Bedrock AgentCore Browser Tool。 Amazon Nova Act SDK最初于2025年初以研究
    的头像 发表于 08-06 08:42 644次阅读

    谷歌Gemma 3n模型的新功能

    从第一个 Gemma 模型于去年年初推出以来,已逐渐发展为生机勃勃的 Gemmaverse 生态系统,累计下载量突破 1.6 亿。这个生态系统包括十余款专业模型系列,涵盖从安全防护到医疗应用的各领
    的头像 发表于 07-25 10:16 1024次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemma</b> <b class='flag-5'>3n</b>模型的新功能

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTX 与 NVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma 3n 现可借助 RTX 和 NVIDIA Jetson 加速运行。
    的头像 发表于 07-16 09:16 1862次阅读

    NVIDIA Isaac Sim和Isaac Lab现已推出早期开发者预览版

    NVIDIA 发布了机器人仿真参考应用 Isaac Sim 和机器人学习框架 Isaac Lab 的开发者预览版。开发者现在可以通过 GitHub 访问早期版本,抢先体验先进功能,用于在基于物理的仿真环境中构建、训练和测试 AI 驱动的机器人。
    的头像 发表于 07-04 14:23 1486次阅读

    Google Gemma 3开发者指南

    自首次推出以来,Gemma 模型的下载量已超过 1 亿次,社区为各种用例创建了超过 60,000 个变体1。我们很高兴推出 Gemma 3,这是 Gemma 开放模型系列中最强大、最先
    的头像 发表于 04-08 10:50 855次阅读
    Google <b class='flag-5'>Gemma</b> <b class='flag-5'>3</b>开发者指南

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    2025年3月19日——Banana Pi 今日正式发布 BPI-AI2N & BPI-AI2N Carrier,基于瑞萨电子(Renesas)同步
    的头像 发表于 03-19 17:53 1441次阅读
    Banana Pi <b class='flag-5'>发布</b> BPI-AI2<b class='flag-5'>N</b> &amp; BPI-AI2<b class='flag-5'>N</b> Carrier,助力 AI 计算与嵌入式开发

    Google发布最新AI模型Gemma 3

    Gemma 开放模型系列是 Google 推动实用 AI 技术普惠大众的重要基石。上个月,Gemma 迎来了首个生日。回望过去一年,其成果斐然:全球下载量突破 1 亿,社区欣欣向荣,衍生模型超过 6 万个1。Gemma 生态的蓬
    的头像 发表于 03-18 09:51 1463次阅读

    在龙芯3a6000上部署DeepSeek 和 Gemma2大模型

    run deepseek-r1:1.5b 3.运行Gemma 2大模型 如果想体验 Google Gemma 2 可以到下面的网站选择不同参数的大模型https://ollama.com
    发表于 02-07 19:35

    谷歌推出Android XR SDK开发者预览版

    近期推出的 Android XR SDK 开发者预览版是一款适用于 Android XR 的综合开发工具套件。它是 Android 系列中最新的平台,专为扩展现实 (XR) 头显设备 (以及未来
    的头像 发表于 01-10 10:13 990次阅读

    智谱推出深度推理模型GLM-Zero预览版

    近日,智谱公司正式发布了其深度推理模型GLM-Zero的预览版——GLM-Zero-Preview。这款模型标志着智谱在扩展强化学习技术训练推理模型方面的重大突破,成为其首个专注于增强AI推理能力
    的头像 发表于 01-03 10:42 764次阅读

    谷歌推出Android 16首个开发者预览版

    Android 16 首个开发者预览版现已推出,可用于测试您的应用。此后,Android 会开始增加 API 的发布频次,助力应用和设备的加速创新。
    的头像 发表于 12-18 09:25 2040次阅读

    谷歌与三星联合发布Android XR操作系统

    系统整合了谷歌在人工智能、增强现实(AR)以及虚拟现实(VR)领域的技术积累,充分展现了谷歌在技术创新方面的实力。通过这一系统,用户将能够享受到更加逼真、生动的虚拟世界,以及更加智能、便捷的操作体验。 此次发布的Android
    的头像 发表于 12-16 10:08 811次阅读

    微软预览版Copilot Vision AI功能上线

    微软公司近日宣布,将面向美国地区的Copilot Pro用户推出预览版的Copilot Vision AI功能。这一创新功能旨在通过人工智能技术,进一步提升用户的网页浏览体验。 Copilot
    的头像 发表于 12-09 14:38 889次阅读