0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出AI模型Gemma 3 270M

谷歌开发者 来源:谷歌开发者 2025-09-11 15:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 小组产品经理 Olivier Lacombe、研究工程师 Kathleen Kenealy、Kat Black、Ravin Kumar、Francesco Visin、Jiageng Zhang

过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3 和 Gemma 3 QAT,为单一云端和桌面加速器带来了最先进的性能。以移动设备优先的架构 Gemma 3n 的推出,能够将强大的实时多模态 AI 直接应用于边缘设备。我们的目标是为开发者提供使用 AI 进行构建的实用工具,也一直对大家共同创造的 Gemmaverse 生态系统蓬勃发展而倍感欣喜,目前下载量已经突破 2 亿次,让我们共同庆祝这一时刻。

现在,我们在 Gemma 3 工具包中新增了一款高度专业化的工具: Gemma 3 270M。此模型是拥有 2.7 亿参数的紧凑型模型,专为针对特定任务进行微调而设计,并且已内置强大的指令遵循和文本结构化能力。

Gemma 3 270M 为小尺寸模型带来强大的指令遵循能力。正如 IFEval 基准测试 (该测试用于检验模型遵循可验证指令的能力) 所示,它为同尺寸模型确立了新的性能水平,使复杂的 AI 功能更容易用于设备端和研究应用。

Gemma 3 270M 的核心能力

紧凑但功能强大的架构: 我们的新模型总共有 2.7 亿参数: 其中的 1.7 亿是嵌入参数 (因词汇量较大),另外的 1 亿参数用于我们的 Transformer 模块。得益于 256k token 的大词汇量,该模型可以处理特定和罕见的 token,使其成为可在特定领域和语言中进一步微调的强大基础模型。

极致的能效表现: Gemma 3 270M 的一个关键优势是其低功耗。在 Pixel 9 Pro SoC 上进行的内部测试显示,由于采用了 INT4 量化技术,该模型在 25 次对话中仅消耗了 0.75% 的电量,成为我们最节能的 Gemma 模型。

指令遵循: 我们同步发布了指令微调版模型和预训练检查点。虽然此模型并非专为复杂的对话用例而设计,但它是一个强大的模型,能够开箱即用直接遵循一般指令。

可用于生产环境的量化: 量化感知训练 (QAT) 检查点已正式推出,使您能够在 INT4 精度下运行模型,同时将性能损失降至最低,这对于在资源受限的设备上部署模型至关重要。

选择合适的工具

在工程领域,衡量成功的标准在于效率,而不仅仅是原始算力。避免 "大材小用",同样的道理也适用于使用 AI 进行构建。

Gemma 3 270M 体现了 "选择合适的工具" 这一理念。这是一款性能卓越的基础模型,开箱即用即可遵循指令,而通过微调更能释放其全部潜能。经过专业化设置后,模型能以惊人的准确率、速度和成本效益执行文本分类和数据提取等任务。从一款功能强大的紧凑型模型着手,您可以构建出精简、快速且显著降低运营成本的生产系统。

现实世界的成功蓝图

这种方法已经在现实世界中取得了令人惊叹的成果。Adaptive ML 与 SK Telecom 合作完成的项目便是一个绝佳的例证。面对复杂、多语言的内容审核这一挑战,他们选择了走专业化路线。Adaptive ML 没有使用大型通用模型,而是对 Gemma 3 4B 模型进行了微调。结果令人惊叹: 专业的 Gemma 模型在特定任务上的性能不仅比肩、甚至超越了更大规模的专有模型。

Gemma 3 270M 旨在让开发者更进一步地采用这种方法,从而更高效地处理明确的任务。该模型是打造小型专业模型的完美起点,因为每个模型都有各自擅长处理的任务类型。

而且,这种专业化的能力不仅适用于企业任务,还能赋能强大的创意应用。例如下面这款 "睡前故事生成器" Web 应用:

何时选择使用 Gemma 3 270M

Gemma 3 270M 沿袭了 Gemma 3 系列的先进架构和强大的预训练能力,为您的自定义应用奠定了坚实的基础。

理想应用场景如下:

您有大量明确的任务。非常适合情感分析、实体提取、查询路由、非结构化文本到结构化文本的转换、创意写作以及合规性检查等功能。

您需要充分利用每分每秒的时间。大幅降低或消除生产环境中的推理成本,并为用户提供更快的响应速度。经过微调的 270M 模型可以在轻量级、低成本的基础设施上运行,也可以直接在设备上运行。

您需要快速迭代和部署。Gemma 3 270M 体积小巧,可进行快速微调实验,帮助您在数小时而非几天内找到适合用例的理想配置。

您需要确保用户隐私。由于该模型可以完全在设备上运行,因此您可以构建处理敏感信息的应用,而无需将数据发送到云端。

您想拥有一系列能够处理各种任务的专业模型。构建并部署多个自定义模型,每个模型都针对不同的任务经过专业训练,并且不会超出您的预算。

微调入门

我们致力于让每一位开发者都能轻松地将 Gemma 3 270M 打造为专属的定制化解决方案。该模型采用与其他 Gemma 3 模型相同的架构,并配备了相关教程和工具,助您快速入门。您可以

在 Gemma 文档中查阅关于使用 Gemma 3 270M 进行全面微调的指南。

下载模型: 从 Hugging Face、Ollama、Kaggle、LM Studio 或 Docker 获取 Gemma 3 270M 模型。我们将发布经过预训练和指令微调的模型。

试用模型: 在 Vertex AI 或热门推理工具 (如 llama.cpp、Gemma.cpp、LiteRT、Keras 和 MLX) 上试用模型。

开始微调: 使用您最喜欢的工具,包括 Hugging Face、UnSloth 和 JAX。

部署解决方案: 微调完成后,您可以在任何地方部署您的专业模型,从您自己的本地环境到 Google Cloud Run。

Gemmaverse 建立在 "创新无关大小" 这一理念之上。借助 Gemma 3 270M,我们让开发者能够构建更智能、更迅捷、更高效的 AI 解决方案。我们热切期待您创建的专业模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41143

    浏览量

    302609
  • 模型
    +关注

    关注

    1

    文章

    3819

    浏览量

    52270

原文标题:Gemma 3 270M 发布 | 兼具轻量化与卓越性能的 AI 模型

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    在Google AI Edge Gallery中探索Gemma 4的Agent Skills

    前不久,Google DeepMind 推出Gemma 4,这是一系列业界领先的开放模型,重塑了端侧 AI 的可能性。Gemma 4 已
    的头像 发表于 04-23 09:19 424次阅读

    Google正式推出最新开放模型Gemma 4

    今天,我们正式推出 Gemma 4 —— 这是我们迄今为止最智能的开放模型Gemma 4 专为高级推理和智能体 (Agentic) 工作流而设计,实现了单位参数下前所未有的智能水平。
    的头像 发表于 04-08 10:06 519次阅读
    Google正式<b class='flag-5'>推出</b>最新开放<b class='flag-5'>模型</b><b class='flag-5'>Gemma</b> 4

    NVIDIA Jetson模型赋能AI在边缘端落地

    和 Isaac GR00T 等模型以及千问大模型Gemma、Mistral AI、GPT-OSS、PI 等社区模型的通用平台。
    的头像 发表于 03-16 16:27 645次阅读
    NVIDIA Jetson<b class='flag-5'>模型</b>赋能<b class='flag-5'>AI</b>在边缘端落地

    谷歌推出TranslateGemma全新开放翻译模型系列

    我们已正式推出 TranslateGemma,这一全新的开放翻译模型系列基于 Gemma 3 构建,并提供 4B、12B 和 27B 三种参数规模。TranslateGemma 的问世
    的头像 发表于 02-26 10:22 735次阅读

    解锁谷歌FunctionGemma模型的无限潜力

    在智能体 AI 领域,工具调用能力是将自然语言转化为可执行软件操作的关键。此前,我们发布了专门针对函数调用而特别优化的 Gemma 3 270M
    的头像 发表于 02-04 11:30 441次阅读
    解锁<b class='flag-5'>谷歌</b>FunctionGemma<b class='flag-5'>模型</b>的无限潜力

    谷歌正式发布Gemma Scope 2模型

    大语言模型 (LLM) 具备令人惊叹的推理能力,但其内部决策过程在很大程度上仍然不透明。如果系统未按预期运行,对其内部运作机制缺乏可见性将难以准确定位问题根源。过去,我们通过发布 Gemma
    的头像 发表于 01-24 14:01 738次阅读

    谷歌正式推出Gemini 3 Flash模型

    我们正式推出了 Gemini 3 Flash,这是以较低成本打造的高效前沿智能,成功地进一步扩展了 Gemini 3 模型系列。
    的头像 发表于 01-22 16:04 745次阅读

    借助谷歌FunctionGemma模型构建下一代端侧智能体

    对于 Gemma 模型系列而言,2025 年是充满变革的一年。我们的下载量已从 1 亿次增长到超过 3 亿次,同时还展现了开放模型的变革潜力: 从凭借
    的头像 发表于 01-20 09:11 826次阅读
    借助<b class='flag-5'>谷歌</b>FunctionGemma<b class='flag-5'>模型</b>构建下一代端侧智能体

    谷歌正式推出最新Gemini 3 AI模型

    今天我们正式推出 Gemini 3,这是我们迄今为止最智能的模型,能够帮助用户实现任何创意。Gemini 3 Pro 基于最先进的推理技术,与之前的版本相比,它在所有主要的
    的头像 发表于 11-24 11:10 1429次阅读
    <b class='flag-5'>谷歌</b>正式<b class='flag-5'>推出</b>最新Gemini <b class='flag-5'>3</b> <b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    谷歌与耶鲁大学合作发布最新C2S-Scale 27B模型

    我们很荣幸发布与耶鲁大学合作研究的 Cell2Sentence-Scale 27B (C2S-Scale),这是一个新的 270 亿参数基础模型,旨在理解单个细胞的 "语言"。C2S-Scale 建立在 Gemma 开放
    的头像 发表于 11-06 10:35 1023次阅读

    谷歌AlphaEarth和维智时空AI模型的技术路径

    谷歌AlphaEarth和维智时空AI模型在应用场景和技术实现上各有侧重,但两者在底层技术理念上存在显著共性。
    的头像 发表于 10-22 14:48 1053次阅读

    谷歌Gemma 3n模型的新功能

    从第一个 Gemma 模型于去年年初推出以来,已逐渐发展为生机勃勃的 Gemmaverse 生态系统,累计下载量突破 1.6 亿。这个生态系统包括十余款专业模型系列,涵盖从安全防护到医
    的头像 发表于 07-25 10:16 1646次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemma</b> <b class='flag-5'>3</b>n<b class='flag-5'>模型</b>的新功能

    谷歌Gemma 3n预览版全新发布

    Gemma 3Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单一云端或桌面加速器上运行的能力,我们正在进一
    的头像 发表于 06-26 17:18 1098次阅读

    树莓派5上的Gemma 2:如何打造高效的边缘AI解决方案?

    从数学基础到边缘实现,研究团队:Conecta.ai(ufrn.br)摘要1.引言2.GEMMA2:通用集成机器模型算法2.1模型架构2.2预训练2.3后训练
    的头像 发表于 06-20 16:57 1812次阅读
    树莓派5上的<b class='flag-5'>Gemma</b> 2:如何打造高效的边缘<b class='flag-5'>AI</b>解决方案?

    谷歌新一代生成式AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI推出新一代生成式 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1309次阅读