0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

搭建万卡GPU集群,小米AI大模型即将全力启动

Simon观察 来源:电子发烧友网 作者:黄山明 2024-12-29 00:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄山明)近日,有媒体报道,小米正在着手搭建自家的GPU万卡集群,将对AI大模型加大投入。该计划已进行数月,据悉小米大模型团队在成立之初便已拥有6500张GPU资源,小米创始人兼董事长雷军在该团队扮演重要的领导角色。

高性能计算是大模型发展的基础,而GPU在其中扮演重要作用。随着AI在如今社会中发挥着越来越重要的作用,应用领域不断扩展,需要的计算资源也越来越多,因此对于GPU的需求也在不断上升。

小米搭建万卡GPU集群,加大AI大模型投入

如今我们生活中已经有不少领域开始充斥着AI的身影,包括AI配音、AI影像、AI图片、AI导航,以及不少人正在使用的免费AI大模型等。但相比ChatGPT、豆包、Kimi、通义千问等知名度不小的大模型,小米的MiLM显得相对低调。

这是一款在今年5月份才正式通过大模型备案的小米大预言模型,小米宣布将把相关模型逐步应用于小米汽车、手机智能家居等产品中,后续“将面向更多用户开放体验”。

而到了近期,市场更是传出小米准备搭建GPU万卡集群,决心加大对AI的投入。但搭建GPU的万卡集群并不容易,一方面在于昂贵的成本。训练AI大模型通常需要使用高性能的GPU芯片,如英伟达的A100、H100等。

这些高端芯片的单价本身就非常高,A100芯片价格约9万元一张,H100阉割后的HGX H20渠道价格约11万一张,而万卡集群需要至少一万张以上的GPU卡,仅芯片采购成本就可能达到数十亿元。

并且除了GPU芯片本身,构建万卡集群还需要大量的配套硬件设备,如服务器、存储设备、网络设备等。这些设备的采购和安装成本也相当恐怖,进一步增加了总体投入。

而之所以需要GPU万卡集群,是因为AI大模型通常包含数十亿乃至数万亿的参数,例如GPT-3就有1750亿个参数,训练和推理过程中需要进行海量的矩阵运算和复杂的数学计算。如此大规模的计算任务,单张GPU的计算能力远远无法满足,需要借助GPU万卡集群并行计算来加速。

当然,这些技术的出现,其实并非突然,而是早有布局。小米早在2016年便开始组建第一只视觉AI团队,逐步建立了视觉、语音、声学、知识图谱、NLP、机器学习、多模态等AI技术能力。

到2017年,小米正式发布了智能语音助手“小爱同学”。尽管当时的AI技术和现在相比可能显得较为基础,但小爱同学已经运用了语音识别、NLP、机器学习等核心技术来实现人机交互。

去年4月份,小米成立AI实验室大模型团队,初始团队便拥有6500张GPU资源。并认为栾剑担任该团队的负责人,栾剑此前曾任东芝(中国)研究院研究员、微软(中国)工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。

并且在近期,有消息称DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,有望进一步加强小米AI大模型团队实力。

端侧拥抱AI已成共识,小米具备重大优势

国内目前已经有多家企业开展了万卡集群的建设,例如华为昇腾、科大讯飞、中国电信、中国移动等,其中中国电信在上海、北京两个万卡集群已经投产,而中国移动位于呼和浩特、哈尔滨两大万卡级别的智算中心也已经先后投产运行。

更别说百度等公司已经在探讨构建十万卡集群,有业内人士认为,市场中很快便会有更多的十万卡集群出现。

另一方面,海外则更加激进。例如由马斯克旗下xAI公司打造的xAI Colossus 超级AI集群,拥有10万个英伟达H100 GPU。其第一阶段建设已完成并全面上线,未来计划增加5万张H100 GPU和5万张下一代H200 GPU,届时GPU总数将翻倍。

OpenAI正在设计能够将1000万块GPU连在一起的计算模型,Meta CEO扎克伯格曾在年初宣布,计划购买35万块英伟达H100 GPU,将Meta的算力扩展到相当于60万块英伟达H100 GPU的水平。

与此同时,越来越多的企业开始更为注重AI,包括理想汽车创始人李想此前公开表示,理想汽车不仅是一家汽车制造企业,更是一家AI企业。

加上如今的AI手机、AI手表、AIPC甚至智能汽车等,这些端侧产品均在积极拥抱AI,AI的加入也为这些产品带来了更多的差异化与个性化,甚至有望成为未来产品体验差异的分水岭。

而相比其他企业,小米拥有一项重大的优势,其AI大模型可以与自身的“人车家”战略完美契合,甚至可以说AI大模型的加入,让小米“人车家”全生态完成了最后一项闭环。

从手机到智能家居,再到新能源汽车,小米均有涉猎,并且大多已经成为行业中的主要参与者,例如小米为全球第三大手机厂商,米家更是全球最大的智能家居平台,其中小爱音箱以超过40%的市场份额稳居中国智能音箱榜首。

小米汽车更是后来居上,不仅屡屡出圈,自今年3月份发布以来,有望在今年内实现超过13万辆的交付成绩,为小米集团贡献近百亿元的营收。同时小米汽车更是小米集团独资控股,保证了小米汽车能够贯彻未来小米集团的发展方向。

另一方面,雷军不仅是小米的创始人,如今依然是金山软件的董事长,意味着未来小米AI大模型有望在WPS等办公软件中布局。

从硬件端的互联网入口,到办公软件、游戏等领域,都已经为小米的MiLM大模型预留足够的发展空间,这是许多AI大模型企业没有的巨大优势。不仅保障了未来小米AI大模型的迭代升级,同时也解决了其数据归属问题,进一步加速AI大模型的升级。

总结

从小米过往布局新赛道的步伐来看,通常是确定了某个赛道已经得到市场验证,并相对成熟再决定进入。进入赛道后,再利用小米集团的自身优势,迅速做大做强。如今小米采用万卡集群,加大投入到AI大模型领域,意味着不久后便有望看到该模型的普及。也期待未来市场中小米AI大模型的表现。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134459
  • 小米
    +关注

    关注

    70

    文章

    14509

    浏览量

    151179
  • AI大模型
    +关注

    关注

    0

    文章

    394

    浏览量

    942
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构向AI工厂与AI云的转型。AI工厂依赖超大规模
    发表于 08-13 19:01

    燧原科技国产集群通过中国信通院权威认证

    近日,中国信息通信研究院(以下简称“中国信通院”)成功召开智算集群服务推进方阵年中总交流会。会议期间,中国信通院重磅发布了首批《大规模智算集群服务成熟度》评估结果。燧原科技作为算力
    的头像 发表于 07-04 16:50 944次阅读

    弘信电子旗下燧弘华创加入智算集群服务推进方阵

    近日,中国信息通信研究院在北京召开智算集群服务推进方阵(ICCPA)年中总结交流会。会上为第二批成员单位办法证书,发布一系列产业研究成果,并通过深度交流研讨,凝聚产业共识,规范产品建设体系,
    的头像 发表于 07-03 15:43 632次阅读

    智算加速是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得一塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",可真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI企业不光用
    的头像 发表于 06-05 13:39 1279次阅读
    智算加速<b class='flag-5'>卡</b>是什么东西?它真能在<b class='flag-5'>AI</b>战场上干掉<b class='flag-5'>GPU</b>和TPU!

    RAKsmart高性能服务器集群:驱动AI大语言模型开发的算力引擎

    RAKsmart高性能服务器集群凭借其创新的硬件架构与全栈优化能力,成为支撑大语言模型开发的核心算力引擎。下面,AI部落小编带您了解RAKsmart如何为AI开发者提供从
    的头像 发表于 04-15 09:40 514次阅读

    算力破局:科通技术以&quot;AI模型+AI芯片&quot;重构智算底座

    “科通技术”)推出的“DeepSeek+AI芯片”全场景方案,在云AI领域取得重大突破。除了GPU的算力总量,云AI的一大挑战来源于GPU
    的头像 发表于 03-17 11:14 708次阅读

    百度智能云发布昆仑芯三代集群及DeepSeek-R1/V3上线

    01百度智能云点亮昆仑芯三代集群 近日,百度智能云成功点亮昆仑芯三代集群,这也是国内首个
    的头像 发表于 02-11 10:58 960次阅读

    百度成功点亮国内首个昆仑芯三代集群

    近日,百度智能云宣布了一项重大技术突破:成功点亮了国内首个自研的昆仑芯三代集群。这一里程碑式的成就标志着百度在AI芯片领域取得了显著进展。
    的头像 发表于 02-06 17:52 1401次阅读

    昆仑芯P800集群成功点亮,将进一步点亮3集群

    的。而24年9月升级的百度百舸AI异构计算平台4.0,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型训练、模型推理四大方面,能为
    发表于 02-05 17:58 1091次阅读
    昆仑芯P800<b class='flag-5'>万</b><b class='flag-5'>卡</b><b class='flag-5'>集群</b>成功点亮,将进一步点亮3<b class='flag-5'>万</b><b class='flag-5'>卡</b><b class='flag-5'>集群</b>

    百度智能云点亮昆仑芯三代集群

    的人工智能算力需求。 昆仑芯三代作为百度自研的AI芯片,其性能卓越,能够满足复杂的人工智能任务需求。此次集群的成功点亮,不仅展示了百度在AI
    的头像 发表于 02-05 14:58 989次阅读

    雷军千万年薪挖角95后AI天才少女 DeepSeek开源大模型DeepSeek-V2关键开发者之一罗福莉

    就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。毕业后罗福莉先进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,后来加入DeepSeek研发MoE大模型DeepSeek-V2。 近期小米正积极发力
    的头像 发表于 12-30 10:58 1745次阅读

    小米加速布局AI模型搭建GPU集群

    近日,有消息称小米正在紧锣密鼓地搭建自己的GPU集群,旨在加大对
    的头像 发表于 12-28 14:25 791次阅读

    国产智算集群黑马!曦源一号SADA算力集群综合评测表现优异

    稳定性、线性度、模型支持度等多个维度均表现优异。加佳科技长期深耕国产替代数字科技的技术研发、平台运营与解决方案提供。旗下曦源一号SADA集群通过构建开放、标准、
    的头像 发表于 12-25 11:16 1186次阅读
    国产智算<b class='flag-5'>集群</b>黑马!曦源一号SADA算力<b class='flag-5'>集群</b>综合评测表现优异

    GPU是如何训练AI模型

    AI模型的训练过程中,大量的计算工作集中在矩阵乘法、向量加法和激活函数等运算上。这些运算正是GPU所擅长的。接下来,AI部落小编带您了解GPU
    的头像 发表于 12-19 17:54 1322次阅读

    MetaGPU集群稳定性剖析与最佳实践

    一、背景 本文中我们将具体介绍 Meta 对其 AI 集群稳定性的剖析和刻画,以及在其中遇到的各种挑战,并在其中补充了一些真实场景中遇到的 Case,便于理解。 对应的论文为
    的头像 发表于 12-17 09:51 2888次阅读
    Meta<b class='flag-5'>万</b><b class='flag-5'>卡</b><b class='flag-5'>GPU</b><b class='flag-5'>集群</b>稳定性剖析与最佳实践