近日,在2026阿里云峰会上,阿里云发布基于平头哥新一代AI芯片真武M890的128卡超节点服务器,搭载互联芯片ICN Switch 1.0,通信时延低至百纳秒级,可让128张AI芯片组成一台计算机,满足海量Agent并发推理和大模型训练需求。目前,该超节点服务器已上线阿里云百炼,支持Qwen、DeepSeek、Kimi等主流模型。
Agent时代,算力集群需要承载成千上万个Agent同时运行,每个Agent在一次任务中可能连续发起数十次模型调用,这对通信时延和带宽有极高要求。磐久AL128超节点服务器基于自研AI芯片和互联芯片打造,通过单机柜128卡紧密耦合互联,P2P时延低于150ns,单柜带宽达到Pb/s级,可支海量Agent的并发请求。
首次亮相的真武M890采用自研并行计算架构,内置144GB显存,性能是真武810E的3倍,片间互联带宽达到800GB/s,芯片原生支持FP32到FP4等多种数据精度,可应用于高精度训练、低精度和超低精度推理的全场景,低精度推理场景下,不仅可以保证模型输出质量,还能显著降低单次推理的算力开销。
平头哥互联芯片ICN Switch 1.0支持自研ICN互联总线协议和PCCL通信库,吞吐量达25.6Tbps,可支持真武M890的高效互联,提升AI集群的算力效率。
真武M890搭配ICN Switch 1.0芯片,可实现64卡全带宽互联,显著提升大规模智算集群计算的效率与稳定性。基于平头哥自研T-Head SAIL软件栈的软硬协同,可最大程度释放芯片的算力。
大会现场,平头哥首次公布真武系列AI芯片的规划,未来两年将陆续推出算力更强的真武V900、真武J900两代芯片,以满足Agent时代千行百业的AI算力需求。目前,真武系列芯片已累计出货56万片,服务了中国电信、中国一汽、浦发银行等20多个行业的400多家客户。
随着Agent应用的爆发,AI的核心任务逐渐从纯对话转向任务执行,这不仅需要高AI算力支撑,其任务规划、状态管理、工具调用等环节极其依赖CPU,CPU成为影响Agent执行效率的关键部件。平头哥拥有自研的服务器CPU倚天系列,可与真武AI芯片高效协同,大幅提升AI推理效率,有效应对Agent高并发任务的负载压力。
目前,平头哥已推出真武系列AI芯片、倚天系列Arm服务器CPU、磐脉系列智能网卡、镇岳系列存储主控芯片、ICN Switch互联芯片等数据中心核心芯片,实现算力、网力和存力的全栈自研。
-
服务器
+关注
关注
14文章
10438浏览量
91844 -
AI芯片
+关注
关注
17文章
2181浏览量
36883 -
平头哥
+关注
关注
0文章
82浏览量
10337
原文标题:真武M890 AI芯片首次亮相,构建Agentic算力芯底座
文章出处:【微信号:gh_65bdec3412bd,微信公众号:平头哥半导体】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
平头哥发布首款智能网卡磐脉920
阿里消息:平头哥发布智能网卡“磐脉920”;QoderWake发布
汽车行业在阿里云使用平头哥自研真武PPU超10万卡
平头哥镇岳510芯片累计出货量超50万片
曦智科技携手合作伙伴正式发布光跃超节点128卡商用版
华为发布新一代超节点产品,支持8192张NPU卡高速互联
华为开发者大会2025(HDC 2025)亮点:华为云发布盘古大模型5.5 宣布新一代昇腾AI云服务上线
阿里云发布基于平头哥新一代AI芯片真武M890的128卡超节点服务器
评论