近日,阿里云峰会上,平头哥正式发布新一代训推一体AI芯片真武M890,内置144GB HBM显存,片间互联带宽达800GB/s,整体性能是上一代真武810E的三倍,原生支持FP32到FP4全精度,已应用于阿里云磐久AL128超节点服务器。
上一代真武810E于今年1月发布,96GB HBM2e显存,性能对标英伟达H20。M890显存扩容50%至144GB,互联带宽从700GB/s提升至800GB/s,配合自研ICN Switch 1.0互联芯片,128卡超节点P2P时延压至150ns以下,单柜带宽达Pb/s级,可让128张芯片在逻辑上组成一台计算机。
这款芯片专为Agentic时代设计。单卡并发推理能力较同级GPU高2.8倍,在高并发Agent推理场景下综合成本比主流GPU方案低45%。目前已上线阿里云百炼平台,支持Qwen、DeepSeek、Kimi等主流模型。
平头哥同步公布了"一年一代"的迭代路线图:2027年Q3推出真武V900,性能再翻三倍,显存达216GB;2028年Q3发布真武J900。截至目前,真武系列芯片累计出货56万片,服务中国电信、中国一汽、浦发银行等20多个行业400多家客户,在国内AI芯片厂商中排名第二,仅次于华为昇腾。
M890的硬件参数已摸到英伟达H200门槛,显存甚至多出3GB。但客观来看,在超大参数长上下文推理和CUDA生态依赖度高的场景中,迁移成本依然存在。它不是要取代所有GPU,而是为Agent高并发推理提供了一条更经济的国产路径。
-
服务器
+关注
关注
14文章
10452浏览量
91860 -
阿里云
+关注
关注
3文章
1053浏览量
45957 -
AI芯片
+关注
关注
17文章
2187浏览量
36890 -
平头哥
+关注
关注
0文章
83浏览量
10339
发布评论请先 登录
HBM迎头赶上!国产AI芯片飞跃
阿里云重构芯片-云-模型-推理全栈技术体系
平头哥发布首款智能网卡磐脉920
阿里消息:平头哥发布智能网卡“磐脉920”;QoderWake发布
汽车行业在阿里云使用平头哥自研真武PPU超10万卡
平头哥镇岳510芯片累计出货量超50万片
技嘉 Z890 Plus 系列主板正式上市,CQDIMM 技术引领 Z890 AORUS ELITE DUO X 释放完整性能
平头哥羽阵芯片助力菜鸟打造高性价比RFID数字供应链解决方案
阿里平头哥发布真武M890:144GB显存,三倍性能
评论