0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google正式推出最新开放模型Gemma 4

谷歌开发者 来源:谷歌开发者 2026-04-08 10:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / Google DeepMind 研究副总裁 Clement Farabet 和 Google DeepMind 小组产品经理 Olivier Lacombe

今天,我们正式推出Gemma 4—— 这是我们迄今为止最智能的开放模型。Gemma 4 专为高级推理和智能体 (Agentic) 工作流而设计,实现了单位参数下前所未有的智能水平。这一突破性进展源于社区的巨大推动力: 自第一代模型发布以来,Gemma 的下载量已突破 4 亿次,并构建了一个拥有超过 10 万个衍生模型且充满活力的Gemmaverse生态系统。我们密切关注开发者AI 未来愿景的渴望,并以 Gemma 4 作为回馈: 依托Apache 2.0 许可,我们将这些突破性能力交到每一位创新者手中。

a04c3e42-2f02-11f1-90a1-92fbcf53809c.png

△ 截至 4 月 1 日,Arena.ai的 Chat Arena 中开放模型的性能与参数规模对比。

Gemma 4 基于与 Gemini 3 相同的世界级研究和技术构建,是您可以在自有硬件上运行的最强模型系列。它们与我们的 Gemini 模型相辅相成,为开发者提供了业内最强大的开放工具与专有工具组合。

业界领先的能力与移动优先的 AI

我们共发布了四种不同规格的 Gemma 4:Effective 2B (E2B)、Effective 4B (E4B)、26B 混合专家模型 (MoE)以及31B Dense。全系列模型已不仅仅局限于简单的对话,而是能够轻松处理复杂的逻辑和智能体工作流。

我们更大规格的模型在同等规模下展现出了顶尖的性能。其中,31B 模型目前在行业标准的Arena AI 文本排行榜上名列全球开放模型第 3 位,26B 模型则名列第 6 位。在榜单中,Gemma 4 的表现甚至超越了规模达其 20 倍的模型。对于开发者而言,这种单位参数智能水平的新高度意味着只需极低的硬件开销,即可获得前沿模型级别的能力。

在边缘侧,我们的 E2B 和 E4B 模型重新定义了设备端的实用性,它们优先考虑多模态能力、低延迟处理以及无缝的生态集成,而非单纯追求参数规模。

性能强劲,触手可及,全面开放

为了赋能下一代开拓性研究和产品,我们专门设计了 Gemma 4 的模型规模,使其能够在各种硬件上高效运行和微调 —— 从全球数十亿台 Android 设备到笔记本电脑 GPU,再到开发者工作站和加速器。

借助这些深度优化的模型,您可以微调 Gemma 4 以在特定任务上实现顶尖的性能。这种方法已取得显著成效: 例如,INSAIT 构建了以保加利亚语为优先的语言模型 (BgGPT),我们还与耶鲁大学合作开展了Cell2Sentence-Scale项目,用于探索癌症治疗的新途径。

Gemma 4 之所以能成为我们迄今最强大的开放模型系列,归功于以下核心特质:

高级推理: 能够进行多步规划和深度逻辑推理,Gemma 4 在需要此类能力的数学和指令遵循基准测试中表现出显著的提升。

智能体工作流: 原生支持函数调用 (Function-calling)、结构化 JSON 输出和原生系统指令,助您构建能够与不同工具和 API 交互并稳定执行工作流的自主智能体。

代码生成: Gemma 4 支持生成高质量的离线代码,能够将您的工作站转变为本地优先的 AI 代码助手。

视觉与音频: 所有模型均原生支持视频与图像处理,支持可变分辨率,并在 OCR (光学字符识别) 和图表理解等视觉任务中表现出色。此外,E2B 和 E4B 模型还具备原生音频输入功能,可用于语音识别和理解。

更长的上下文: 可无缝处理长文本内容。边缘模型支持 128K 上下文窗口,更大参数的模型则提供高达 256K 的支持,让您可以在单次提示中处理整个代码库或长篇文档。

支持 140 多种语言: Gemma 4 经过 140 多种语言的原生训练,帮助开发者为全球用户构建包容、高性能的应用。

适配各类硬件的灵活模型

我们发布的 Gemma 4 模型权重针对特定硬件和使用场景进行了量身定制,确保您随时随地都能获得顶尖的推理能力:

26B 和 31B 模型:

在个人电脑上实现离线的前沿智能体验

我们未经量化的 bfloat16 权重可以高效适配单个 80GB NVIDIA H100 GPU,旨在为研究人员和开发者在常用硬件上提供顶尖的推理能力。对于本地配置,量化版本可在消费级 GPU 上原生运行,为您的 IDE、编程助手和智能体工作流提供动力。我们的26B 混合专家模型 (MoE)专注于低延迟,推理时仅激活 38 亿参数,提供极快的每秒 Token 生成数;而31B Dense则追求极致的原始质量,为微调提供了强大的基础。

a0a4e056-2f02-11f1-90a1-92fbcf53809c.png

△这些模型通过大量不同的数据集和指标进行了评估,以涵盖文本生成的各个方面。请前往我们的Model Card中查看其他的基准测试。

E2B 和 E4B 模型:

移动和物联网设备智能的新高度

这些模型从底层开始构建,旨在实现计算和内存效率的最大化,在推理时分别激活 20 亿和 40 亿的有效参数,以节省内存和延长电池寿命。通过与 Google Pixel 团队以及高通 (Qualcomm Technologies)、联发科 (MediaTek) 等移动硬件领军企业的紧密合作,这些多模态模型可以在手机树莓派 (Raspberry Pi)、NVIDIA Jetson Orin Nano 等边缘设备上实现近乎零延迟的完全离线运行。Android 开发者现在即可在AICore 开发者预览版中原型化智能体流程,实现与 Gemini Nano 4 的前向兼容。

开源许可

我们悉心听取了大家的反馈。构建 AI 的未来需要通力合作,我们相信赋能开发者生态不应设限。因此,Gemma 4 采用商业友好的Apache 2.0 许可发布。

Apache 2.0 许可

https://goo.gle/gemma-4-apache-2

这一开源许可为开发者实现充分的灵活性和数字主权奠定了基础,赋予您对数据、基础架构和模型的完全控制权。它允许您在任何环境 (无论是本地部署还是云端) 中自由构建并安全部署。

"Gemma 4 采用 Apache 2.0 许可发布是一个巨大的里程碑。我们非常激动能在发布首日就在 Hugging Face 上支持 Gemma 4 系列。"

Clément Delangue,Hugging Face 联合创始人兼 CEO

以信任与安全为基石

和我们的专有模型一样,这些模型遵循严苛的基础架构安全协议。通过选择 Gemma 4,企业和主权组织可以获得一个值得信赖且透明的基础,在满足最高安全和可靠性标准的同时,交付顶尖的能力。

多元选择的生态系统

立即开始试验: 即刻获取 Gemma 4 访问权限并开始构建。在Google AI Studio(31B 和 26B MoE) 或 GoogleAI Edge Gallery(E4B 和 E2B) 中探索 Gemma 4。在Android 开发方面,可使用它驱动Android Studio中的智能体模式 (Agent Mode),并开始使用ML Kit GenAI Prompt API构建可投入生产环境的 Android 应用。

使用您喜爱的工具: 发布首日即支持Hugging Face(Transformers, TRL, Transformers.js, Candle),LiteRT-LM, vLLM, llama.cpp,MLX,Ollama,NVIDIA NIM和NeMo,LM Studio,Unsloth, SGLang, Cactus,Baseten,Docker, MaxText, Tunix, Keras,您可以根据项目需求灵活选择最合适的工具。

下载模型: 前往Hugging Face、Kaggle或Ollama获取模型权重。

根据您的特定需求定制 Gemma 4: 借助您首选的平台 (如 Google Colab、Vertex AI甚至您的游戏 GPU) 对模型进行训练与适配。

在 Google Cloud 上扩展至生产环境: 虽然本地设备端推理是离线使用的理想选择,但 Google Cloud 打破了所有算力瓶颈。您可以根据需求通过 Vertex AI、Cloud Run、GKE、Sovereign Cloud 及 TPU 加速推理服务进行部署,并获得针对受监管工作负载的最高级别合规保障。您可以进一步了解如何在 Google Cloud 上快速入门。

跨多硬件平台加速 AI 开发:Gemma 4 针对业界领先的硬件进行了优化,实现开箱即用。您可以在从 NVIDIA Jetson Orin Nano 到 Blackwell GPU 的 NVIDIA AI 基础设施上体验极致性能,通过开源 ROCm 栈与 AMD GPU 集成,或在 Trillium 和 Ironwood TPU 上进行大规模部署和高效运算。

以技术创造深远影响:参加 Kaggle 上的Gemma 4 Good 挑战赛,构建能够为世界带来深远且积极影响的作品。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1812

    浏览量

    60623
  • 模型
    +关注

    关注

    1

    文章

    3810

    浏览量

    52253
  • 智能体
    +关注

    关注

    1

    文章

    551

    浏览量

    11642

原文标题:Gemma 4 现已发布: 同等规模下性能最强的开放模型

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    天数智芯Day 0适配MiniMax最新开源M2.7大模型

      4月12 日,MiniMax 最新开源 M2.7 大模型正式发布,凭借自主迭代能力与优异的工程、办公性能引发行业关注。天数智芯与FlagOS 统一开源技术栈合作实现Day0落地,在模型
    的头像 发表于 04-15 15:42 624次阅读

    谷歌推出TranslateGemma全新开放翻译模型系列

    我们已正式推出 TranslateGemma,这一全新的开放翻译模型系列基于 Gemma 3 构建,并提供 4B、12B 和 27B 三种参
    的头像 发表于 02-26 10:22 704次阅读

    谷歌正式发布Gemma Scope 2模型

    Scope 工具包推动了可解释性科学的发展,该工具旨在帮助研究人员理解我们轻量级开放模型系列 Gemma 2 的内部运作机制。
    的头像 发表于 01-24 14:01 710次阅读

    借助谷歌FunctionGemma模型构建下一代端侧智能体

    对于 Gemma 模型系列而言,2025 年是充满变革的一年。我们的下载量已从 1 亿次增长到超过 3 亿次,同时还展现了开放模型的变革潜力: 从凭借
    的头像 发表于 01-20 09:11 802次阅读
    借助谷歌FunctionGemma<b class='flag-5'>模型</b>构建下一代端侧智能体

    NVIDIA在CES 2026发布全新开放模型、数据和工具

    为扩展开放模型生态,NVIDIA 发布全新开放模型、数据和工具,推动各行业 AI 技术的发展。
    的头像 发表于 01-09 10:42 710次阅读

    深入解析NVIDIA Nemotron 3系列开放模型

    这一全新开放模型系列引入了开放的混合 Mamba-Transformer MoE 架构,使多智能体系统能够进行快速长上下文推理。
    的头像 发表于 12-24 10:34 4287次阅读
    深入解析NVIDIA Nemotron 3系列<b class='flag-5'>开放</b><b class='flag-5'>模型</b>

    NVIDIA 推出 Nemotron 3 系列开放模型

    token 数。 ● Nemotron 通过先进的强化学习技术以及大规模并行多环境后训练,实现了卓越的准确率。 ● NVIDIA 率先推出整套前沿的开放模型、训练数据集及强化学习环境与
    的头像 发表于 12-16 09:27 800次阅读
    NVIDIA <b class='flag-5'>推出</b> Nemotron 3 系列<b class='flag-5'>开放</b><b class='flag-5'>模型</b>

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出Gemma 3 和 Gemma
    的头像 发表于 09-11 15:09 1294次阅读

    2025联想创新开放日正式开启

    今天,以“创新ING 热AI进行时”为主题的联想2025创新开放日正式开启,全面呈现联想集团在“人工智能+”方面的布局与落地成果。
    的头像 发表于 08-29 15:39 1118次阅读

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企业级 AI 生产力!
    的头像 发表于 08-14 11:34 1530次阅读

    亚马逊云科技现已上线OpenAI开放权重模型

    开放权重模型,向数百万亚马逊云科技客户开放。 客户可利用这些全新开放权重模型的先进推理能力,支持Agentic工作流、代码生成、科学分析和数
    的头像 发表于 08-06 19:29 939次阅读

    谷歌Gemma 3n模型的新功能

    从第一个 Gemma 模型于去年年初推出以来,已逐渐发展为生机勃勃的 Gemmaverse 生态系统,累计下载量突破 1.6 亿。这个生态系统包括十余款专业模型系列,涵盖从安全防护到医
    的头像 发表于 07-25 10:16 1629次阅读
    谷歌<b class='flag-5'>Gemma</b> 3n<b class='flag-5'>模型</b>的新功能

    谷歌Gemma 3n预览版全新发布

    Gemma 3 和 Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单一云端或桌面加速器上运行的能力,我们正在进一步推进我们对可访问 AI 的愿景。
    的头像 发表于 06-26 17:18 1076次阅读

    树莓派5上的Gemma 2:如何打造高效的边缘AI解决方案?

    从数学基础到边缘实现,研究团队:Conecta.ai(ufrn.br)摘要1.引言2.GEMMA2:通用集成机器模型算法2.1模型架构2.2预训练2.3后训练3.边缘AI实现1.引言GEMMA
    的头像 发表于 06-20 16:57 1798次阅读
    树莓派5上的<b class='flag-5'>Gemma</b> 2:如何打造高效的边缘AI解决方案?

    Gemini API集成Google图像生成模型Imagen 3

    开发者现在可以通过 Gemini API 访问 Google 最先进的图像生成模型 Imagen 3。该模型最初仅对付费用户开放,不久后也将面向免费用户
    的头像 发表于 05-14 16:53 1436次阅读