谷歌推出AI模型Gemma 3 270M-电子发烧友网

作者 / 小组产品经理 Olivier Lacombe、研究工程师 Kathleen Kenealy、Kat Black、Ravin Kumar、Francesco Visin、Jiageng Zhang

过去几个月，Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3 和 Gemma 3 QAT，为单一云端和桌面加速器带来了最先进的性能。以移动设备优先的架构 Gemma 3n 的推出，能够将强大的实时多模态 AI 直接应用于边缘设备。我们的目标是为开发者提供使用 AI 进行构建的实用工具，也一直对大家共同创造的 Gemmaverse 生态系统蓬勃发展而倍感欣喜，目前下载量已经突破 2 亿次，让我们共同庆祝这一时刻。

现在，我们在 Gemma 3 工具包中新增了一款高度专业化的工具: Gemma 3 270M。此模型是拥有 2.7 亿参数的紧凑型模型，专为针对特定任务进行微调而设计，并且已内置强大的指令遵循和文本结构化能力。

Gemma 3 270M 为小尺寸模型带来强大的指令遵循能力。正如 IFEval 基准测试 (该测试用于检验模型遵循可验证指令的能力) 所示，它为同尺寸模型确立了新的性能水平，使复杂的 AI 功能更容易用于设备端和研究应用。

Gemma 3 270M 的核心能力

紧凑但功能强大的架构: 我们的新模型总共有 2.7 亿参数: 其中的 1.7 亿是嵌入参数 (因词汇量较大)，另外的 1 亿参数用于我们的 Transformer 模块。得益于 256k token 的大词汇量，该模型可以处理特定和罕见的 token，使其成为可在特定领域和语言中进一步微调的强大基础模型。

极致的能效表现: Gemma 3 270M 的一个关键优势是其低功耗。在 Pixel 9 Pro SoC 上进行的内部测试显示，由于采用了 INT4 量化技术，该模型在 25 次对话中仅消耗了 0.75% 的电量，成为我们最节能的 Gemma 模型。

指令遵循: 我们同步发布了指令微调版模型和预训练检查点。虽然此模型并非专为复杂的对话用例而设计，但它是一个强大的模型，能够开箱即用直接遵循一般指令。

可用于生产环境的量化: 量化感知训练 (QAT) 检查点已正式推出，使您能够在 INT4 精度下运行模型，同时将性能损失降至最低，这对于在资源受限的设备上部署模型至关重要。

选择合适的工具

在工程领域，衡量成功的标准在于效率，而不仅仅是原始算力。避免 "大材小用"，同样的道理也适用于使用 AI 进行构建。

Gemma 3 270M 体现了 "选择合适的工具" 这一理念。这是一款性能卓越的基础模型，开箱即用即可遵循指令，而通过微调更能释放其全部潜能。经过专业化设置后，模型能以惊人的准确率、速度和成本效益执行文本分类和数据提取等任务。从一款功能强大的紧凑型模型着手，您可以构建出精简、快速且显著降低运营成本的生产系统。

现实世界的成功蓝图

这种方法已经在现实世界中取得了令人惊叹的成果。Adaptive ML 与 SK Telecom 合作完成的项目便是一个绝佳的例证。面对复杂、多语言的内容审核这一挑战，他们选择了走专业化路线。Adaptive ML 没有使用大型通用模型，而是对 Gemma 3 4B 模型进行了微调。结果令人惊叹: 专业的 Gemma 模型在特定任务上的性能不仅比肩、甚至超越了更大规模的专有模型。

Gemma 3 270M 旨在让开发者更进一步地采用这种方法，从而更高效地处理明确的任务。该模型是打造小型专业模型的完美起点，因为每个模型都有各自擅长处理的任务类型。

而且，这种专业化的能力不仅适用于企业任务，还能赋能强大的创意应用。例如下面这款 "睡前故事生成器" Web 应用:

何时选择使用 Gemma 3 270M

Gemma 3 270M 沿袭了 Gemma 3 系列的先进架构和强大的预训练能力，为您的自定义应用奠定了坚实的基础。

理想应用场景如下:

您有大量明确的任务。非常适合情感分析、实体提取、查询路由、非结构化文本到结构化文本的转换、创意写作以及合规性检查等功能。

您需要充分利用每分每秒的时间。大幅降低或消除生产环境中的推理成本，并为用户提供更快的响应速度。经过微调的 270M 模型可以在轻量级、低成本的基础设施上运行，也可以直接在设备上运行。

您需要快速迭代和部署。Gemma 3 270M 体积小巧，可进行快速微调实验，帮助您在数小时而非几天内找到适合用例的理想配置。

您需要确保用户隐私。由于该模型可以完全在设备上运行，因此您可以构建处理敏感信息的应用，而无需将数据发送到云端。

您想拥有一系列能够处理各种任务的专业模型。构建并部署多个自定义模型，每个模型都针对不同的任务经过专业训练，并且不会超出您的预算。

微调入门

我们致力于让每一位开发者都能轻松地将 Gemma 3 270M 打造为专属的定制化解决方案。该模型采用与其他 Gemma 3 模型相同的架构，并配备了相关教程和工具，助您快速入门。您可以

在 Gemma 文档中查阅关于使用 Gemma 3 270M 进行全面微调的指南。

下载模型: 从 Hugging Face、Ollama、Kaggle、LM Studio 或 Docker 获取 Gemma 3 270M 模型。我们将发布经过预训练和指令微调的模型。

试用模型: 在 Vertex AI 或热门推理工具 (如 llama.cpp、Gemma.cpp、LiteRT、Keras 和 MLX) 上试用模型。

开始微调: 使用您最喜欢的工具，包括 Hugging Face、UnSloth 和 JAX。

部署解决方案: 微调完成后，您可以在任何地方部署您的专业模型，从您自己的本地环境到 Google Cloud Run。

Gemmaverse 建立在 "创新无关大小" 这一理念之上。借助 Gemma 3 270M，我们让开发者能够构建更智能、更迅捷、更高效的 AI 解决方案。我们热切期待您创建的专业模型。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
91

文章
41143

浏览量
302609
模型

模型

+关注

关注
1

文章
3819

浏览量
52270

原文标题：Gemma 3 270M 发布 | 兼具轻量化与卓越性能的 AI 模型

文章出处：【微信号：Google_Developers，微信公众号：谷歌开发者】欢迎添加关注！文章转载请注明出处。

搜索历史

谷歌推出AI模型Gemma 3 270M

评论