0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google Gemma 3开发者指南

谷歌开发者 来源:Android 开发者 2025-04-08 10:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者 / 资深开发者关系工程师 Omar Sanseviero;开发者关系工程师 Philipp Schmid

自首次推出以来,Gemma 模型的下载量已超过 1 亿次,社区为各种用例创建了超过 60,000 个变体1。我们很高兴推出 Gemma 3,这是 Gemma 开放模型系列中最强大、最先进的版本,建立在之前成功推出的 Gemma 版本之上。我们听取了社区反馈,并添加了最受欢迎的功能,例如更长的上下文、多模态支持等等!

Gemma 有哪些新功能?

Gemma 3 中引入了多模态功能,支持视觉语言输入和文本输出。它处理的上下文窗口最多可达 128k tokens,理解超过 140 种语言,并提供经过改进的数学、推理和聊天能力,包括结构化输出和函数调用。Gemma 3 提供四种规格 (1B、4B、12B 和 27B),既有可针对您自己的用例和领域进行微调的预训练模型,也有通用指令调优版本。

d60204d4-106f-11f0-9310-92fbcf53809c.png

Gemma 是如何构建的?

Gemma 组合运用蒸馏、强化学习和模型合并等技术,优化了预训练和后训练流程。这种方法提高了其在数学、编码和指令遵循方面的性能。Gemma 3 使用了新的分词器,以更好地支持 140 多种语言,并在 Google TPU 上使用 JAX 框架进行了训练,数据量分别为:1B 模型 2T tokens,4B 模型 4T tokens,12B 模型 12T tokens,以及 27B 模型 14T tokens。

对于后训练流程,Gemma 3 使用 4 个组件:

从较大的 INSTRUCT 模型蒸馏到 Gemma 3 预训练检查点。

从人类反馈 (RLHF) 中强化学习,以使模型预测与人类偏好保持一致。

从机器反馈 (RLMF) 中强化学习,以增强数学推理。

从执行反馈 (RLEF) 中强化学习,以提升编码能力。

这些更新显著改善了模型的数学、编码和指令遵循能力,使其成为 LMArena 中最优秀的开源紧凑模型,得分为 1,338。

d61b8a94-106f-11f0-9310-92fbcf53809c.png

Gemma 3 的指令版本沿用与 Gemma 2 相同的对话格式,因此您无需更新工具即可更新到最新版本以进行纯文本输入。对于图像输入,Gemma 3 允许指定与文本交错的图像。

多轮文本示例

user
knock knock
model
who is there
user
Gemma
model
Gemma who?

交错图像示例

user
Image A:
Image B:
Label A: water lily
Label B:
model
Desert rote

多模态性

Gemma 3 集成了基于 SigLIP 的视觉编码器。Gemma 3 视觉模型在训练期间保持冻结状态,并且在不同规格 (4B、12B 和 27B) 的模型中都是相同的。因此,Gemma 可以使用图像和视频作为输入,从而分析图像、回答有关图像的问题、比较图像、识别物体,甚至回复图像中的文本。虽然该模型最初是为处理 896x896 像素的图像而创建的,但由于使用了一种新的自适应窗口算法来分割输入图像,Gemma 3 现在能够处理高分辨率和非方形图像。

d65169a2-106f-11f0-9310-92fbcf53809c.png

△ 输出:根据图像,可能会打开加热功能的按钮是暖房 (Danbou)。在日语中,"暖房" 意为 "加热"。您可以按下该按钮来激活空调/温度控制系统的加热功能。带有加号 (+) 的按钮可能会在您选择加热模式后用来调节温度。

ShieldGemma 2

ShieldGemma 2 是基于 Gemma 3 构建的 4B 图像安全分类器。它针对各个关键安全类别输出标签,以安全审核合成图像 (来自图像生成模型) 和自然图像 (可作为诸如 Gemma 3 等视觉语言模型的输入过滤器)。了解有关 ShieldGemma 2 的更多信息。

您要开发哪些应用?

Gemma 社区的创造力和 Gemmaverse 的爆发式增长,正不断给我们带来惊喜。从研究实验室探索创新微调技术的实践,到开发者用全新模态训练 Gemma,我们热切期待看到您的下一个突破。普林斯顿 NLP 开发的 SimPO 方法,该方法在没有参考模型的情况下直接针对人类偏好进行优化,是实验室创新微调的典型案例;另一例子是 INSAIT 针对保加利亚语训练出最先进的大语言模型。而 Nexa 在 OmniAudio 上的尝试为开发者使用全新模态训练 Gemma 提供了典型案例。我们迫不及待地想看看您接下来会取得哪些突破。

Gemma 3 快速入门指南

准备好探索 Gemma 3 的潜力了吗?下面是操作步骤:

直接体验:只需点击几下,即可在 Google AI Studio 中试用 Gemma 3。

下载模型:在 Hugging Face 和 Kaggle 上查找模型权重。

学习并整合:深入了解我们的技术报告和全面的文档,以快速将 Gemma 集成到您的项目中;您也可以从我们的推理指南开始体验,或尝试使用自定义数据集进行微调。

使用您喜欢的开发工具:运用您偏好的工具和框架,包括 Hugging Face Transformers、Ollama、我们的新 Gemma JAX 库、MaxText、LiteRTGemma.cpp、llama.cpp 和 Unsloth。

灵活部署:Gemma 3 提供多种部署选项,包括 Google GenAI API、Vertex AI、Cloud Run、Cloud TPU、Cloud GPU 以及跨平台集成,让您灵活选择最适合自身用例的方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1801

    浏览量

    60247
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134420
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296330
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51693
  • 开发者
    +关注

    关注

    1

    文章

    732

    浏览量

    17921

原文标题:Gemma 3 开发者指南 | 快速集成与部署,轻松释放 AI 潜力

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌开发者大会2016北京站图文直播 Google开发者大会精彩内容回顾

    电子发烧友网小编汇总报道:今日(12月8日)2016 Google 开发者大会(Google Developer Day - GDD)登陆中国,首站在北京国家会议中心盛大举行。这是谷歌继5年前再次在中国举行发布会,此处发布会旨在
    发表于 12-08 11:41 6832次阅读

    【转载】Google Glass应用开发探索

    ,这样促使开发者了解用户,并关注信息内容及推送时段。图3 利用CSS美化的效果开发语言目前Google推荐了持3
    发表于 06-28 02:21

    Android开发者如何快速体验Android N

    ,目前只有开发者版本。不过小编相信大多数开发者们连Android M和Android L都还没有机会体验到,因为各手机厂商动作太慢了。为了让大家能够在第一时间体验到最新的Android系统,给大家介绍一
    发表于 05-26 10:20

    OpenHarmony开发者文档

    此工程存放OpenHarmony提供的快速入门、开发指南、API参考等开发者文档,欢迎参与OpenHarmony开发者文档开源项目,与我们一起完善开发者文档。View English文
    发表于 04-23 18:08

    java开发者现在可以使用Google的PaaS云服务来构建网页应用

    Java开发者现在可以使用Google的PaaS云服务来构建网页应用和移动端的服务了! Google宣布,将于Node.js的的企业平台提供方NodeSource合作,在Google
    发表于 10-11 17:28 0次下载

    【数转时事】Google年度开发者大会传达出怎样的技术趋势?

    【数转时事】Google年度开发者大会传达出怎样的技术趋势?
    的头像 发表于 06-27 19:39 3336次阅读

    一文知晓 2023 Google 游戏开发者峰会主要产品更新

    开发和发布生命周期中为您提供帮助。在今年的 Google 游戏开发者峰会 上,我们有幸与您分享了 Android 和 Google Play 的一些激动人心的新工具和洞见。希望这些工具
    的头像 发表于 03-28 00:05 1064次阅读

    助力游戏开发者,看 Google 有哪些 "上新"?

    今年, Google 游戏开发者峰会 发布了诸多新的游戏解决方案和工具,旨在助力广大游戏开发者打造出众的游戏,与玩家建立更紧密的联系,拓展业务并获得更多增长。 点击观看中文版主题演讲 现在,我们将带
    的头像 发表于 03-29 00:10 1196次阅读

    【出海日系列活动】谷歌开发者社区 | 今日起航,谷歌陪中国开发者出海!

    软件行业的发展。 Google 开发者社区、Google 开发者关系部门联合 Google 各产品部门诚邀
    的头像 发表于 05-15 22:15 952次阅读
    【出海日系列活动】谷歌<b class='flag-5'>开发者</b>社区 | 今日起航,谷歌陪中国<b class='flag-5'>开发者</b>出海!

    明日开幕|2023 Google 谷歌开发者大会线上观看指南

    2023 Google 开发者大会 将于 9 月 6 日正式开幕 上午 9 点 30 分,主旨演讲准时上演 想要线上探索大会精彩内容? 速速收下这份观看指南 即刻扫描二维码前往官网 明天上午 9 点
    的头像 发表于 09-05 17:40 1085次阅读
    明日开幕|2023 <b class='flag-5'>Google</b> 谷歌<b class='flag-5'>开发者</b>大会线上观看<b class='flag-5'>指南</b>

    多元共进|2023 Google 谷歌开发者大会主旨演讲亮点回顾

    2023 Google 开发者大会 今日正式拉开帷幕 一起回顾主旨演讲精华内容 收获技术新知,实现多元共进! 主旨演讲亮点合集速览 扫码前往官网 查看主旨演讲完整回放 Google 大中华区总裁陈俊
    的头像 发表于 09-06 20:20 1702次阅读
    多元共进|2023 <b class='flag-5'>Google</b> 谷歌<b class='flag-5'>开发者</b>大会主旨演讲亮点回顾

    Zynq UltraScale+ MPSoC:软件开发者指南

    电子发烧友网站提供《Zynq UltraScale+ MPSoC:软件开发者指南.pdf》资料免费下载
    发表于 09-14 10:03 15次下载
    Zynq UltraScale+ MPSoC:软件<b class='flag-5'>开发者</b><b class='flag-5'>指南</b>

    Google Gemma优化后可在NVIDIA GPU上运行

    2024 年 2 月 21 日,NVIDIA 携手 Google 在所有 NVIDIA AI 平台上发布面向 Gemma 的优化功能,GemmaGoogle 最先进的新型轻量级
    的头像 发表于 02-25 11:01 886次阅读

    Google发布最新AI模型Gemma 3

    Gemma 开放模型系列是 Google 推动实用 AI 技术普惠大众的重要基石。上个月,Gemma 迎来了首个生日。回望过去一年,其成果斐然:全球下载量突破 1 亿,社区欣欣向荣,衍生模型超过 6 万个1。
    的头像 发表于 03-18 09:51 1458次阅读

    谷歌Gemma 3n预览版全新发布

    Gemma 3Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单一云端或桌面加速器上运行的能力,我们正在进一步推进我们对可访问 AI 的愿景。
    的头像 发表于 06-26 17:18 729次阅读