0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里云重构芯片-云-模型-推理全栈技术体系

阿里巴巴 来源:阿里巴巴 2026-05-22 10:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

阿里云在峰会上宣布实现“芯片-云-模型-推理”全栈Agent化升级,同步推出全新AI产品官网“千问云”、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max。

芯片:基于新一代真武芯片的超节点服务器

峰会上,阿里发布基于新一代AI芯片真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0,可让128张AI芯片组成一台计算机,P2P时延低于150ns,主打解决Agent场景下的海量并发推理和大模型训练需求。

首次亮相的真武M890采用自研并行计算架构,内置144GB显存,性能是真武810E的3倍,片间互联带宽达到800GB/s,芯片原生支持FP32到FP4等多种数据精度,可应用于高精度训练、低精度和超低精度推理的全场景,低精度推理场景下,不仅可以保证模型输出质量,还能显著降低单次推理的算力开销。

未来两年,平头哥将陆续推出算力更强的真武V900、真武J900两代芯片。目前真武系列AI芯片累计出货56万片,已服务中国电信、中国一汽、浦发银行等20多个行业的400多家客户。

平头哥半导体副总裁高慧表示,Agentic时代,一个Agent在执行任务时可能在毫秒间连续发起数十次模型调用,同时需要CPUGPU、网络和存储等核心部件紧密协同。平头哥构建全栈自研芯片矩阵,核心就是实现算力、网力、存力的系统级协同,让每一个Agent都能流畅、稳定运行。

全面迈入Agentic Cloud

阿里云还在做一件更底层的事:把云产品本身变成Agent能用的东西。

阿里云对云产品进行了Skill化、MCP化和CLI化改造,让每一个云产品都变成Agent可以“像调函数一样调用”的标准化能力模块。

阿里云CTO李飞飞认为,传统云产品的交互逻辑是为人设计的——用户看着控制台点击按钮,或者通过API编写代码调用。但Agent工作负载是“无规律弹性、短生命周期、瞬时起量即走”,与传统云计算的稳态负载截然不同。

阿里云为Agent构建了完整的运行环境支撑,提供轻量高效的沙箱执行环境、多Agent协同能力、跨任务的记忆能力、顺畅的数据流转通路,以及全域智能运维能力。

全新一代千问旗舰模型Qwen3.7-Max

Qwen3.7-Max是最新发布的旗舰大模型。在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max位列国产模型第一,对标全球最强模型。

Qwen3.7-Max面向Agent全新设计,在编程、推理等核心能力上持续突破,可胜任复杂编程、多智能体协作、生产级办公自动化等高难度任务。

在训练时从未接触过的真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作35小时,独立完成了一个生产级AI计算内核的编写与调优,最终性能较官方版本提升10倍。

ecc2f09c-5421-11f1-90a1-92fbcf53809c.png

阿里巴巴通义大模型事业部负责人周靖人表示:“大模型正在经历一次核心范式转移——从对齐人类偏好,到对齐任务目标。过去我们追求的是模型‘说得好’,现在要求模型‘做得到’。Qwen3.7-Max的设计初衷,就是让模型真正成为Agent的智能内核,具备自主规划、持续迭代、跨工具协作的能力。”

百炼推理平台实现极致弹性

在百炼推理平台,阿里巴巴构建了大规模GPU资源集群,并通过并池调度实现资源高效利用。

在此基础上,百炼通过上下文缓存消除重复计算,借助吞吐弹性调度机制应对流量波峰波谷与负载波动。在效果优化方面,百炼引入了Agentic RL,基于Agent执行反馈的强化学习机制,驱动模型持续迭代。

此外,百炼内建了安全治理能力,确保自主运行的Agent始终不越界。

在生态策略上百炼保持开放接入,除了阿里自研的千问模型矩阵,还将接入第三方模型。

千问云:Agentic时代的新入口

峰会上,全新产品官网千问云(www.qianwenai.com)正式发布。

打开官网页面,首页只有一行字:

这是一条Agent可读的prompt指令。阿里云将所有模型服务的核心能力封装为标准化的Skills和CLI工具,智能体可以直接解析这条指令,“学会”网站的全部能力,并根据需求自主调用。

千问云提供Qwen、GLM、Kimi、DeepSeek、Wan、HappyHorse等150多款主流模型API,并将模型服务的核心能力封装为Skills和CLI工具,可让Agent工具高效地用模型和开发AI应用。

阿里云资深副总裁刘伟光表示,过去模型服务平台为人服务,未来用模型的主力将是Agent,千问云正在全面重构模型服务平台,为开发者和Agent提供更友好的体验。

从底层芯片、Agentic Cloud、模型到推理平台全面升级,阿里云进行了全栈技术革新。

Agentic时代,我们准备好了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    14

    文章

    10438

    浏览量

    91844
  • 阿里云
    +关注

    关注

    3

    文章

    1051

    浏览量

    45942
  • AI芯片
    +关注

    关注

    17

    文章

    2181

    浏览量

    36884

原文标题:面向Agentic时代,阿里云重构全栈技术体系

文章出处:【微信号:alibabagroup2014,微信公众号:阿里巴巴】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里发布基于平头哥新一代AI芯片真武M890的128卡超节点服务器

    ,满足海量Agent并发推理和大模型训练需求。目前,该超节点服务器已上线阿里百炼,支持Qwen、DeepSeek、Kimi等主流模型
    的头像 发表于 05-22 10:23 160次阅读

    阿里发布128卡超节点服务器

    ,将128张AI芯片聚合成一台超级计算机,通信时延低至百纳秒级。这一发布标志着阿里面向Agentic时代完成了一次全面而深刻的技术升级,当天阿里
    的头像 发表于 05-21 09:06 623次阅读

    SD-WAN/SASE 运维服务:构建企业数字网络的坚实后盾

    ,传统“被动救火式”运维模式已无法满足业务对高可用、高性能、高安全的要求。基于自研SD-WAN、SASE技术,打造覆盖网络生命周期
    的头像 发表于 05-19 09:40 599次阅读
    <b class='flag-5'>云</b>边<b class='flag-5'>云</b><b class='flag-5'>全</b><b class='flag-5'>栈</b> SD-WAN/SASE 运维服务:构建企业数字网络的坚实后盾

    科技再获阿里卓越架构生态合作伙伴认证 共筑混合数智化新底座

    前言近日,科技再次获得阿里卓越架构生态合作伙伴认证,并凭借最佳实践荣膺筑领航奖。这一认可,既是对
    的头像 发表于 05-18 10:01 641次阅读
    <b class='flag-5'>云</b>边<b class='flag-5'>云</b>科技再获<b class='flag-5'>阿里</b><b class='flag-5'>云</b>卓越架构生态合作伙伴认证 共筑混合<b class='flag-5'>云</b>数智化新底座

    黑马-Java+AI新版V16零基础就业班百度网盘下载+Java+AI开发工程师

    能力引入增加了系统的复杂性与不确定性。生产环境必须建立专用的可观测性体系:每个推理请求应携带唯一追踪 ID,贯穿业务层调用、特征提取、模型推理、后处理
    发表于 05-01 11:29

    曙光AI平台解锁政企AI新效能

    AI风口席卷政企,能扎进实际场景的实战型AI才是政企刚需!行业空谈AI概念时,曙光AI平台已将自研
    的头像 发表于 04-07 15:29 505次阅读

    企业数字化转型:服务的核心能力与应用指南

    前言随着数字经济的深入发展,企业数字化转型已从“可选项”变为关乎生存与发展的“必选项”。面对复杂多变的业务需求、快速迭代的技术环境与日益严格的合规要求,单一的产品或碎片化的服务已难以支撑企业的
    的头像 发表于 03-26 15:16 481次阅读
    企业数字化转型:<b class='flag-5'>全</b><b class='flag-5'>栈</b><b class='flag-5'>云</b>服务的核心能力与应用指南

    天数智芯完成阿里通义千问Qwen3.5系列多模态模型量适配

    近日,天数智芯携手众智FlagOS 社区完成阿里通义千问 Qwen3.5 系列多模态模型量适配,实现模型精度精准对齐与端到端无缝部署,再
    的头像 发表于 03-26 09:25 2425次阅读

    阿里自研AI芯片“真武”亮相 “通哥”黄金三角浮出水面

    ”首次浮出水面。 阿里巴巴正在将“通哥”打造成一台AI超级计算机,它同时拥有自研芯片平头哥、亚太第一的
    的头像 发表于 01-29 09:42 789次阅读
    <b class='flag-5'>阿里</b>自研AI<b class='flag-5'>芯片</b>“真武”亮相 “通<b class='flag-5'>云</b>哥”黄金三角浮出水面

    双百!100%中国车企全球业务接入阿里

    摘要:AI和汽车行业正在加速融合,未来阿里AI将支撑全球车企建立领先的技术架构与智能体验。 近日,在2026年新加坡国际车展上,
    的头像 发表于 01-13 10:25 363次阅读
    双百!100%中国车企全球业务接入<b class='flag-5'>阿里</b><b class='flag-5'>云</b>

    2025年曙光可信平台为行业智能化铺就安全之路

    2025年,随着“十四五”规划走向纵深,各关键行业智能化转型进入攻坚阶段。围绕政企客户在AI创新、安全合规、迁移适配等方面的核心需求,曙光能力为基石,以场景化解决方案为抓手,
    的头像 发表于 01-07 09:36 582次阅读

    延锋国际 X 阿里AI加速汽车产业智能升级!

    近日,全球领先汽车零部件企业延锋国际与阿里正式签署AI合作协议。未来,依托阿里领先的
    的头像 发表于 12-12 09:16 498次阅读
    延锋国际 X <b class='flag-5'>阿里</b><b class='flag-5'>云</b>:<b class='flag-5'>全</b><b class='flag-5'>栈</b>AI加速汽车产业智能升级!

    广汽集团与阿里签署AI战略合作协议

    11月14日,广汽集团与阿里正式签署AI战略合作协议。双方将发挥各自在汽车与AI领域的优势,共建汽车行业面向未来的基础设施,为消费者
    的头像 发表于 11-18 10:18 869次阅读

    阿里设备的物模型数据里面始终没有值是哪里的问题?

    如上图,不知道讲清楚没有。 IG502自定义TOPIC 上发到阿里没问题。采用阿里模型的格式来上发就不行。请大佬指教!
    发表于 08-05 06:43

    超低延时重构AI推理体验!白山发布“大模型API”产品

    优势,打造超低延时、超稳定、简单易用的API接口服务,降低大模型应用成本和开发门槛,助力企业和个人用户快速开启AI创新之旅。专注边缘推理,构建“边端”算力协同新范
    的头像 发表于 07-02 17:26 1329次阅读
    超低延时<b class='flag-5'>重构</b>AI<b class='flag-5'>推理</b>体验!白山<b class='flag-5'>云</b>发布“大<b class='flag-5'>模型</b>API”产品