搭建万卡GPU集群，小米AI大模型即将全力启动-电子发烧友网

电子发烧友网报道（文/黄山明）近日，有媒体报道，小米正在着手搭建自家的GPU万卡集群，将对AI大模型加大投入。该计划已进行数月，据悉小米大模型团队在成立之初便已拥有6500张GPU资源，小米创始人兼董事长雷军在该团队扮演重要的领导角色。

高性能计算是大模型发展的基础，而GPU在其中扮演重要作用。随着AI在如今社会中发挥着越来越重要的作用，应用领域不断扩展，需要的计算资源也越来越多，因此对于GPU的需求也在不断上升。

小米搭建万卡GPU集群，加大AI大模型投入

如今我们生活中已经有不少领域开始充斥着AI的身影，包括AI配音、AI影像、AI图片、AI导航，以及不少人正在使用的免费AI大模型等。但相比ChatGPT、豆包、Kimi、通义千问等知名度不小的大模型，小米的MiLM显得相对低调。

这是一款在今年5月份才正式通过大模型备案的小米大预言模型，小米宣布将把相关模型逐步应用于小米汽车、手机、智能家居等产品中，后续“将面向更多用户开放体验”。

而到了近期，市场更是传出小米准备搭建GPU万卡集群，决心加大对AI的投入。但搭建GPU的万卡集群并不容易，一方面在于昂贵的成本。训练AI大模型通常需要使用高性能的GPU芯片，如英伟达的A100、H100等。

这些高端芯片的单价本身就非常高，A100芯片价格约9万元一张，H100阉割后的HGX H20渠道价格约11万一张，而万卡集群需要至少一万张以上的GPU卡，仅芯片采购成本就可能达到数十亿元。

并且除了GPU芯片本身，构建万卡集群还需要大量的配套硬件设备，如服务器、存储设备、网络设备等。这些设备的采购和安装成本也相当恐怖，进一步增加了总体投入。

而之所以需要GPU万卡集群，是因为AI大模型通常包含数十亿乃至数万亿的参数，例如GPT-3就有1750亿个参数，训练和推理过程中需要进行海量的矩阵运算和复杂的数学计算。如此大规模的计算任务，单张GPU的计算能力远远无法满足，需要借助GPU万卡集群并行计算来加速。

当然，这些技术的出现，其实并非突然，而是早有布局。小米早在2016年便开始组建第一只视觉AI团队，逐步建立了视觉、语音、声学、知识图谱、NLP、机器学习、多模态等AI技术能力。

到2017年，小米正式发布了智能语音助手“小爱同学”。尽管当时的AI技术和现在相比可能显得较为基础，但小爱同学已经运用了语音识别、NLP、机器学习等核心技术来实现人机交互。

去年4月份，小米成立AI实验室大模型团队，初始团队便拥有6500张GPU资源。并认为栾剑担任该团队的负责人，栾剑此前曾任东芝（中国）研究院研究员、微软（中国）工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。

并且在近期，有消息称DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米，有望进一步加强小米AI大模型团队实力。

端侧拥抱AI已成共识，小米具备重大优势

国内目前已经有多家企业开展了万卡集群的建设，例如华为昇腾、科大讯飞、中国电信、中国移动等，其中中国电信在上海、北京两个万卡集群已经投产，而中国移动位于呼和浩特、哈尔滨两大万卡级别的智算中心也已经先后投产运行。

更别说百度等公司已经在探讨构建十万卡集群，有业内人士认为，市场中很快便会有更多的十万卡集群出现。

另一方面，海外则更加激进。例如由马斯克旗下xAI公司打造的xAI Colossus 超级AI集群，拥有10万个英伟达H100 GPU。其第一阶段建设已完成并全面上线，未来计划增加5万张H100 GPU和5万张下一代H200 GPU，届时GPU总数将翻倍。

OpenAI正在设计能够将1000万块GPU连在一起的计算模型，Meta CEO扎克伯格曾在年初宣布，计划购买35万块英伟达H100 GPU，将Meta的算力扩展到相当于60万块英伟达H100 GPU的水平。

与此同时，越来越多的企业开始更为注重AI，包括理想汽车创始人李想此前公开表示，理想汽车不仅是一家汽车制造企业，更是一家AI企业。

加上如今的AI手机、AI手表、AIPC甚至智能汽车等，这些端侧产品均在积极拥抱AI，AI的加入也为这些产品带来了更多的差异化与个性化，甚至有望成为未来产品体验差异的分水岭。

而相比其他企业，小米拥有一项重大的优势，其AI大模型可以与自身的“人车家”战略完美契合，甚至可以说AI大模型的加入，让小米“人车家”全生态完成了最后一项闭环。

从手机到智能家居，再到新能源汽车，小米均有涉猎，并且大多已经成为行业中的主要参与者，例如小米为全球第三大手机厂商，米家更是全球最大的智能家居平台，其中小爱音箱以超过40%的市场份额稳居中国智能音箱榜首。

小米汽车更是后来居上，不仅屡屡出圈，自今年3月份发布以来，有望在今年内实现超过13万辆的交付成绩，为小米集团贡献近百亿元的营收。同时小米汽车更是小米集团独资控股，保证了小米汽车能够贯彻未来小米集团的发展方向。

另一方面，雷军不仅是小米的创始人，如今依然是金山软件的董事长，意味着未来小米AI大模型有望在WPS等办公软件中布局。

从硬件端的互联网入口，到办公软件、游戏等领域，都已经为小米的MiLM大模型预留足够的发展空间，这是许多AI大模型企业没有的巨大优势。不仅保障了未来小米AI大模型的迭代升级，同时也解决了其数据归属问题，进一步加速AI大模型的升级。

总结

从小米过往布局新赛道的步伐来看，通常是确定了某个赛道已经得到市场验证，并相对成熟再决定进入。进入赛道后，再利用小米集团的自身优势，迅速做大做强。如今小米采用万卡集群，加大投入到AI大模型领域，意味着不久后便有望看到该模型的普及。也期待未来市场中小米AI大模型的表现。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
5271

浏览量
136065
小米

小米

+关注

关注
70

文章
14547

浏览量
152586
AI大模型

AI大模型

+关注

关注
0

文章
407

浏览量
1038

搜索历史

搭建万卡GPU集群，小米AI大模型即将全力启动

评论