0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新火种AI|谷歌深夜***!史上最强开源模型Gemma,打响新一轮AI之战

新火种 来源:新火种 作者:新火种 2024-02-23 10:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:文子

编辑:小迪

谷歌,2024年卷出新高度。

全球最强开源模型,Gemma重燃战局

短短12天连放三次大招,谷歌AI更新迭代之快,让人始料未及。

当地时间2月21日,谷歌毫无预兆地发布号称“全球性能最强大、轻量级”的新一代开源系列模型Gemma,瞬间打响AI开源战争。

wKgaomXXUZGAQG8uAACoBfQX4bI124.jpg

据官方介绍,Gemma模型使用了和Gemini同源的技术,总共有20亿参数和70亿参数两种规模,每个规模又分预训练和指令微调两个版本。

其中20亿参数版本可以直接在笔记本电脑上运行,而70亿参数版本在一系列语言理解、推理、数学等标准测试上击败了主流开源模型Llama-2和Mistral,一度登顶Hugging Face开源大模型排行榜,成为目前全球最强的开源大模型。

wKgZomXXUZGAEfLYAADnDORohNo341.jpg

可见,谷歌除了将目光瞄向山姆奥特曼的GPT-5以外,也没打算放过针对扎克伯格的Llama-2,先后推出的Gemini和Gemma都是对标产品。

而和Gemini的全家桶路线不同,Gemma这一次主打轻量级、高性能,除了笔记本电脑电脑,还可以在台式机、物联网设备、移动设备和云端等不同平台运行。

wKgaomXXUZKAeTNxAAKgh0JKT08258.jpg

除了模型本身,谷歌还提供了一整套工具帮助开发者,确保Gemma模型负责任的使用,帮助开发者用Gemma构建更安全的AI应用程序。

按照谷歌CEO 桑达尔·皮查伊的说法,Gemma即日起就将在全球范围内开放使用,用户可以在Kaggle、Hugging Face等平台上进行下载和试用。据一位X平台的用户分享,Gemma不仅速度飞快,而且输出很稳定。

wKgZomXXUZKAM7nsAACCR_eZ-mA629.jpg

值得注意的是,谷歌目前已与英伟达达成战略合作,将利用英伟达TensorRT-LLM对Gemma进行优化。同时,英伟达刚刚发布的聊天机器人Chat with RTX也将很快增加对Gemma的支持。

技术报告首度曝光,31人来自亚洲

与Gemini发布时一样,谷歌此次也同步公开了Gemma的技术报告。

wKgaomXXUZOAMps6AAEJvtFkMSM882.jpg

报告称,Gemma数据主要来自网络文档、数学和代码的英语数据。不同于Gemini,这些模型不是多模态的,也没有针对多语言任务进行训练。而且谷歌保证了兼容性,它分割数字但不去除额外的空格,这可能意味着它更容易扩展到其他语言。

不过Gemma也并不是完全“开源”,虽然Gemma模型在性能、安全性和负责任开发方面实现了突飞猛进的进展,但谷歌承认“此发布是不可逆转的”,并且开放模型造成的危害尚未明确定义。

因此谷歌仍然可制定使用该模型的条款及所有权条款,也会进一步研究并创建可靠、按预期执行的稳健、安全的模型。

wKgZomXXUZOAb52hAAFagttAFDw633.jpg

此外,根据技术论文显示,此次参与谷歌Gemma开源模型的研发人员数量高达57位。其中包括核心贡献者14人,参与者35人,产品管理2人,项目管理1人,执行赞助人5人。

根据研发者名字进行梳理和猜测,此次参与Gemma模型研发的57人中,可能有大约一半以上的开发者来自亚洲,或与华人或具有华人血统的个人有关。

wKgaomXXUZSAPE5MAALkK4oo6Fc391.jpg

比如谷歌Gemma团队的侯乐博士曾是谷歌FLAN-T5技术的作者。在加入谷歌之前,侯乐在纽约州立大学石溪分校攻读博士学位,专注于高分辨率图像的分析,涵盖卫星图像和医学图像等领域。加入谷歌后,侯乐研究主要集中于NLP方面,包括高效的语言模型训练、指令微调和提示工程等,核心能力是通过更好的微调和提示工程来提高最先进语言模型的推理能力。

另一位华人Geng Yan同样也是AI领域大神级人物。他毕业于浙江大学计算机科学系,随后在美国美国卡内基梅隆大学完成计算机视觉专业的硕士学位。Geng Yan曾就职于商汤和亚马逊,专注研究人工智能机器算法技术,在谷歌曾参与研发Google Facemesh追踪面部的AI模型,该模型在谷歌相机自拍、手机支付等多个场景中均发挥巨大作用。

截至目前,开发者可以在Kaggle中免费使用Gemma,首次使用Google Cloud 的用户将获得 300美元的积分,并可申请高达50万美元的Google Cloud积分来使用这些模型。

此外,谷歌的Google One AI Premium正在将Gemini整合到谷歌Gmail、Docs、Sheets、Slides和Meet当中,提供书写、校对和生成图像等 AI 增强功能。而作为账户付费产品,前两个月免费使用,之后每月19.99美元。

全球四面开战,谷歌野心暴露无遗

可以说,谷歌想要成为AI行业王者的野心已经暴露无遗。

2月9日,谷歌宣布最强大模型Gemini Ultra免费使用,向OpenAI发起强势一击。2月16日,谷歌放出大模型核弹Gemini 1.5,将上下文窗口长度扩展到100万个tokens,向OpenAI还没发布的GPT-5发起挑战。再到2月21日,谷歌发布Gemma疯狂狙击Mate,一举登上开源大模型铁王座,为生成式AI的应用开发者带来福音,更为闭源的代表OpenAI狠狠地上了一课。

OpenAI CEO山姆奥特曼就曾在私下表示过,与谷歌相比,OpenAI在算力上处于劣势。无论是在算力、算法,还是数据方面,谷歌都具有很明显的技术领先优势。

而这一次的谷歌,也的确有拳打OpenAI,脚踢Meta的风范。尤其是近两年来,头部科技大厂你追我赶,厮杀异常激烈。前有闭源代表OpenAI推出的GPT-4 Turbo大模型,后有Meta大力进攻开源权重模型,留给谷歌本就不多了。

按照谷歌开发者 X 副总裁兼总经理、谷歌开发者关系主管Jeanine Banks的说法,Gemma模型就像是谷歌开源AI开发技术历史的延续,从TensorFlow等工具开始,经过PaLM2、AlphaFold的演进,最终形成了Gemma。

目前摆在Gemma面前的竞争对手并不少,有Meta的开源大型语言模型 Llama 2、Mistral AI 的7B 模型、Deci的DecilLM和Microsoft的Phi-2,以及旨在在组织自己的硬件上运行的类似小型生成式 AI 模型。可以说,憋坏了的谷歌正在四面开战了。

接下来,就看刚刚跌落神坛的Meta会如何接招了。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38355

    浏览量

    297491
  • 开源
    +关注

    关注

    3

    文章

    4052

    浏览量

    45641
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    亿铸科技完成新一轮融资

    近日,亿铸科技完成新一轮融资。本次融资由兴湘资本、农银国际、盈科值得、合鼎共资本共同参与。此次融资的完成,标志着亿铸科技在AI大算力芯片领域的创新实力再获重要认可。
    的头像 发表于 10-31 17:06 825次阅读

    夏厦精密开启新一轮投资布局

    继9月份与华夏股权、建投华科、马红燕、王萌共同投资华夏卓智创业投资基金(北京)合伙企业(有限合伙)后,夏厦精密又开启了新一轮的投资布局。
    的头像 发表于 10-18 14:10 1488次阅读

    穹彻智能完成新一轮融资

    10月17日,穹彻智能通过官方微信公众号宣布,近日已顺利完成新一轮融资。此次融资由阿里巴巴集团领投,多位老股东同步参与追投,融资资金将用于加速技术产品研发、具身应用落地和行业生态拓展。
    的头像 发表于 10-18 14:02 1499次阅读

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    成都汇阳投资关于AI驱动电子行业迎来新一轮业绩爆发

    分化 、封测先进封装亮眼 ;DeepSeek 等开源模型降低部署门槛 ,推动 SoC 芯片需求 。TWS 耳机 、智能手表算力需求提升 。DDR4 短期 紧缺(Q2 价格季增 18-23%),AI
    的头像 发表于 09-16 10:21 711次阅读

    谷歌推出AI模型Gemma 3 270M

    过去几个月,Gemma 开放模型系列的发展是激动人心的。我们推出了 Gemma 3 和 Gemma 3 QAT,为单云端和桌面加速器带来了
    的头像 发表于 09-11 15:09 921次阅读

    谷歌Gemma 3n预览版全新发布

    Gemma 3 和 Gemma 3 QAT 的成功发布之后,我们的先进开放模型系列具备了在单云端或桌面加速器上运行的能力,我们正在进
    的头像 发表于 06-26 17:18 776次阅读

    树莓派5上的Gemma 2:如何打造高效的边缘AI解决方案?

    从数学基础到边缘实现,研究团队:Conecta.ai(ufrn.br)摘要1.引言2.GEMMA2:通用集成机器模型算法2.1模型架构2.2预训练2.3后训练3.边缘
    的头像 发表于 06-20 16:57 1416次阅读
    树莓派5上的<b class='flag-5'>Gemma</b> 2:如何打造高效的边缘<b class='flag-5'>AI</b>解决方案?

    新一轮的工业“智变”

    当下,全球产业链正面临供应链重构、个性化需求增长以及深度数字化与可持续发展的重要节点。工业需要经历新一轮的“智变”,从自动化升级到自主化,并向着柔性化、智能化、以及人机协同的工业5.0愿景迈进。
    的头像 发表于 05-15 13:46 995次阅读

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    基石。 Neuron Studio打造全流程站式开发体验,为AI应用开发按下加速键 AI 应用的开发瓶颈,从来都不是“点的问题”,而是“链的问题”:开发工具碎片化,调优过程靠手动,单模型
    发表于 04-13 19:52

    低至¥2.27/h!就能使用全球最强开模型——千问 QwQ-32B

    ABSTRACT摘要捷智算平台上新全球最强开模型——千问QwQ-32B。JAEALOT2025年3月18日3月17日,阿里通义千问发布的最新开源推理模型QwQ-32B,在国际权威测评
    的头像 发表于 03-19 12:34 907次阅读
    低至¥2.27/h!就能使用全球<b class='flag-5'>最强开</b>元<b class='flag-5'>模型</b>——千问 QwQ-32B

    Google发布最新AI模型Gemma 3

    Gemma 开放模型系列是 Google 推动实用 AI 技术普惠大众的重要基石。上个月,Gemma 迎来了首个生日。回望过去年,其成果斐
    的头像 发表于 03-18 09:51 1494次阅读

    AI开源模型库有什么用

    AI开源模型库作为推动AI技术发展的重要力量,正深刻改变着我们的生产生活方式。接下来,AI部落小编带您了解
    的头像 发表于 02-24 11:50 929次阅读

    海纳AI获5000万新一轮融资

    近日,国内领先的AI面试测评解决方案提供商海纳AI宣布成功获得5000万元人民币的新一轮融资。本轮融资由德同资本领投,求是资本跟投,共同为海纳AI的未来发展注入新的活力。 这笔资金将主
    的头像 发表于 02-19 10:10 776次阅读

    知行科技完成新一轮超2亿元融资

    知行科技新一轮超2亿元融资将主要用于提升研发能力,包括基于AI的高阶智驾、舱驾体解决方案及产品,升级优化研发生产设施,进步扩大海外市场。
    的头像 发表于 02-12 18:18 1125次阅读