0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新火种AI|谷歌深夜***!史上最强开源模型Gemma,打响新一轮AI之战

新火种 来源:新火种 作者:新火种 2024-02-23 10:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:文子

编辑:小迪

谷歌,2024年卷出新高度。

全球最强开源模型,Gemma重燃战局

短短12天连放三次大招,谷歌AI更新迭代之快,让人始料未及。

当地时间2月21日,谷歌毫无预兆地发布号称“全球性能最强大、轻量级”的新一代开源系列模型Gemma,瞬间打响AI开源战争。

wKgaomXXUZGAQG8uAACoBfQX4bI124.jpg

据官方介绍,Gemma模型使用了和Gemini同源的技术,总共有20亿参数和70亿参数两种规模,每个规模又分预训练和指令微调两个版本。

其中20亿参数版本可以直接在笔记本电脑上运行,而70亿参数版本在一系列语言理解、推理、数学等标准测试上击败了主流开源模型Llama-2和Mistral,一度登顶Hugging Face开源大模型排行榜,成为目前全球最强的开源大模型。

wKgZomXXUZGAEfLYAADnDORohNo341.jpg

可见,谷歌除了将目光瞄向山姆奥特曼的GPT-5以外,也没打算放过针对扎克伯格的Llama-2,先后推出的Gemini和Gemma都是对标产品。

而和Gemini的全家桶路线不同,Gemma这一次主打轻量级、高性能,除了笔记本电脑电脑,还可以在台式机、物联网设备、移动设备和云端等不同平台运行。

wKgaomXXUZKAeTNxAAKgh0JKT08258.jpg

除了模型本身,谷歌还提供了一整套工具帮助开发者,确保Gemma模型负责任的使用,帮助开发者用Gemma构建更安全的AI应用程序。

按照谷歌CEO 桑达尔·皮查伊的说法,Gemma即日起就将在全球范围内开放使用,用户可以在Kaggle、Hugging Face等平台上进行下载和试用。据一位X平台的用户分享,Gemma不仅速度飞快,而且输出很稳定。

wKgZomXXUZKAM7nsAACCR_eZ-mA629.jpg

值得注意的是,谷歌目前已与英伟达达成战略合作,将利用英伟达TensorRT-LLM对Gemma进行优化。同时,英伟达刚刚发布的聊天机器人Chat with RTX也将很快增加对Gemma的支持。

技术报告首度曝光,31人来自亚洲

与Gemini发布时一样,谷歌此次也同步公开了Gemma的技术报告。

wKgaomXXUZOAMps6AAEJvtFkMSM882.jpg

报告称,Gemma数据主要来自网络文档、数学和代码的英语数据。不同于Gemini,这些模型不是多模态的,也没有针对多语言任务进行训练。而且谷歌保证了兼容性,它分割数字但不去除额外的空格,这可能意味着它更容易扩展到其他语言。

不过Gemma也并不是完全“开源”,虽然Gemma模型在性能、安全性和负责任开发方面实现了突飞猛进的进展,但谷歌承认“此发布是不可逆转的”,并且开放模型造成的危害尚未明确定义。

因此谷歌仍然可制定使用该模型的条款及所有权条款,也会进一步研究并创建可靠、按预期执行的稳健、安全的模型。

wKgZomXXUZOAb52hAAFagttAFDw633.jpg

此外,根据技术论文显示,此次参与谷歌Gemma开源模型的研发人员数量高达57位。其中包括核心贡献者14人,参与者35人,产品管理2人,项目管理1人,执行赞助人5人。

根据研发者名字进行梳理和猜测,此次参与Gemma模型研发的57人中,可能有大约一半以上的开发者来自亚洲,或与华人或具有华人血统的个人有关。

wKgaomXXUZSAPE5MAALkK4oo6Fc391.jpg

比如谷歌Gemma团队的侯乐博士曾是谷歌FLAN-T5技术的作者。在加入谷歌之前,侯乐在纽约州立大学石溪分校攻读博士学位,专注于高分辨率图像的分析,涵盖卫星图像和医学图像等领域。加入谷歌后,侯乐研究主要集中于NLP方面,包括高效的语言模型训练、指令微调和提示工程等,核心能力是通过更好的微调和提示工程来提高最先进语言模型的推理能力。

另一位华人Geng Yan同样也是AI领域大神级人物。他毕业于浙江大学计算机科学系,随后在美国美国卡内基梅隆大学完成计算机视觉专业的硕士学位。Geng Yan曾就职于商汤和亚马逊,专注研究人工智能机器算法技术,在谷歌曾参与研发Google Facemesh追踪面部的AI模型,该模型在谷歌相机自拍、手机支付等多个场景中均发挥巨大作用。

截至目前,开发者可以在Kaggle中免费使用Gemma,首次使用Google Cloud 的用户将获得 300美元的积分,并可申请高达50万美元的Google Cloud积分来使用这些模型。

此外,谷歌的Google One AI Premium正在将Gemini整合到谷歌Gmail、Docs、Sheets、Slides和Meet当中,提供书写、校对和生成图像等 AI 增强功能。而作为账户付费产品,前两个月免费使用,之后每月19.99美元。

全球四面开战,谷歌野心暴露无遗

可以说,谷歌想要成为AI行业王者的野心已经暴露无遗。

2月9日,谷歌宣布最强大模型Gemini Ultra免费使用,向OpenAI发起强势一击。2月16日,谷歌放出大模型核弹Gemini 1.5,将上下文窗口长度扩展到100万个tokens,向OpenAI还没发布的GPT-5发起挑战。再到2月21日,谷歌发布Gemma疯狂狙击Mate,一举登上开源大模型铁王座,为生成式AI的应用开发者带来福音,更为闭源的代表OpenAI狠狠地上了一课。

OpenAI CEO山姆奥特曼就曾在私下表示过,与谷歌相比,OpenAI在算力上处于劣势。无论是在算力、算法,还是数据方面,谷歌都具有很明显的技术领先优势。

而这一次的谷歌,也的确有拳打OpenAI,脚踢Meta的风范。尤其是近两年来,头部科技大厂你追我赶,厮杀异常激烈。前有闭源代表OpenAI推出的GPT-4 Turbo大模型,后有Meta大力进攻开源权重模型,留给谷歌本就不多了。

按照谷歌开发者 X 副总裁兼总经理、谷歌开发者关系主管Jeanine Banks的说法,Gemma模型就像是谷歌开源AI开发技术历史的延续,从TensorFlow等工具开始,经过PaLM2、AlphaFold的演进,最终形成了Gemma。

目前摆在Gemma面前的竞争对手并不少,有Meta的开源大型语言模型 Llama 2、Mistral AI 的7B 模型、Deci的DecilLM和Microsoft的Phi-2,以及旨在在组织自己的硬件上运行的类似小型生成式 AI 模型。可以说,憋坏了的谷歌正在四面开战了。

接下来,就看刚刚跌落神坛的Meta会如何接招了。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42209

    浏览量

    303212
  • 开源
    +关注

    关注

    3

    文章

    4431

    浏览量

    46611
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    完结9章 AI训练师 入门与实战 教程资料2026

    AI 分布式存储:我觉得这才是大模型真正的地基,但没人愿意聊 所有人都在聊大模型怎么训练、怎么微调、怎么部署,但很少有人聊个更基础的问题:数据怎么存、怎么读、怎么在几百张卡之间不打架
    发表于 05-28 18:23

    NVIDIA为本地代理式AI加速Gemma 4开放模型

    开放模型正在推动新一轮设备端 AI 浪潮,将创新从云端扩展到日常本地设备。随着这些模型不断进步,它们的价值愈发取决于能否访问本地实时上下文,从而将有意义的洞察转化为行动。
    的头像 发表于 05-08 09:23 784次阅读
    NVIDIA为本地代理式<b class='flag-5'>AI</b>加速<b class='flag-5'>Gemma</b> 4开放<b class='flag-5'>模型</b>

    AI模型微调企业项目实战课

    数据、懂业务的“AI 架构师”。当企业真正掌握了从开源基座到专属模型的转化能力时,就拥有了抵御外部不确定性的最强护城河。筑牢自主可控的 AI
    发表于 04-16 18:48

    自研算/存/电/连,AI算力芯片黑马宣布完成新一轮融资

    电子发烧友网报道(文/李弯弯)近日,AI算力芯片领域的创新企业图灵进化(TuringEvo)宣布完成新一轮数千万级别的融资。这笔资金将主要用于核心产品量产、研发团队扩充以及全球市场拓展,为图灵进化
    的头像 发表于 04-15 15:29 5445次阅读
    自研算/存/电/连,<b class='flag-5'>AI</b>算力芯片黑马宣布完成<b class='flag-5'>新一轮</b>融资

    Google正式推出最新开放模型Gemma 4

    源于社区的巨大推动力: 自第模型发布以来,Gemma 的下载量已突破 4 亿次,并构建了个拥有超过 10 万个衍生模型且充满活力的 G
    的头像 发表于 04-08 10:06 733次阅读
    Google正式推出最新开放<b class='flag-5'>模型</b><b class='flag-5'>Gemma</b> 4

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron、Cosmos
    的头像 发表于 03-16 16:27 812次阅读
    NVIDIA Jetson<b class='flag-5'>模型</b>赋能<b class='flag-5'>AI</b>在边缘端落地

    谷歌正式发布Gemma Scope 2模型

    大语言模型 (LLM) 具备令人惊叹的推理能力,但其内部决策过程在很大程度上仍然不透明。如果系统未按预期运行,对其内部运作机制缺乏可见性将难以准确定位问题根源。过去,我们通过发布 Gemma
    的头像 发表于 01-24 14:01 847次阅读

    星融元完成新一轮融资,携手产业资本加速AI网络市场布局

    星融元完成新一轮融资,由厦门联合、湖南财信共同投资。公司作为AI网络架构领先者,构建“云网融合、开放解耦”技术体系,提供全栈网络解决方案。其AI Fabric高性能网络已支持头部客户千卡至万卡级
    的头像 发表于 01-23 16:10 1338次阅读
    星融元完成<b class='flag-5'>新一轮</b>融资,携手产业资本加速<b class='flag-5'>AI</b>网络市场布局

    亿铸科技完成新一轮融资

    近日,亿铸科技完成新一轮融资。本次融资由兴湘资本、农银国际、盈科值得、合鼎共资本共同参与。此次融资的完成,标志着亿铸科技在AI大算力芯片领域的创新实力再获重要认可。
    的头像 发表于 10-31 17:06 1183次阅读

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    成都汇阳投资关于AI驱动电子行业迎来新一轮业绩爆发

    分化 、封测先进封装亮眼 ;DeepSeek 等开源模型降低部署门槛 ,推动 SoC 芯片需求 。TWS 耳机 、智能手表算力需求提升 。DDR4 短期 紧缺(Q2 价格季增 18-23%),AI
    的头像 发表于 09-16 10:21 1205次阅读

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3 和 Gemma 3 QAT,为单云端和桌面加速器带来了
    的头像 发表于 09-11 15:09 1422次阅读

    谷歌Gemma 3n预览版全新发布

    Gemma 3 和 Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单云端或桌面加速器上运行的能力,我们正在进
    的头像 发表于 06-26 17:18 1181次阅读

    树莓派5上的Gemma 2:如何打造高效的边缘AI解决方案?

    从数学基础到边缘实现,研究团队:Conecta.ai(ufrn.br)摘要1.引言2.GEMMA2:通用集成机器模型算法2.1模型架构2.2预训练2.3后训练3.边缘
    的头像 发表于 06-20 16:57 1885次阅读
    树莓派5上的<b class='flag-5'>Gemma</b> 2:如何打造高效的边缘<b class='flag-5'>AI</b>解决方案?