0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI Agent如何重构互联范式

奇异摩尔 来源:奇异摩尔 2025-08-28 09:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,在OpenAI发布GPT-5模型14天后,深度求索的新模型版本DeepSeek-V3.1正式发布。

深度求索正式发布DeepSeek-V3.1后,称其为“迈向Agent时代的第一步”。 DeepSeek-V3.1具有更智能的工具调用能力,可以支持多种Code Agent框架,开发者可以自己搭建智能体。

2025年开启了AI Agent新纪元。各大模型公司纷纷在AI Agent战场发力: 今年7月,月之暗面发布的Kimi K2迈出了智能体化的一步,可帮助用户直接制定旅行计划并预订机票和酒店;智谱AI在7月28日发布的GLM-4.5系列,也定位为 "Agent原生基础模型",并于8月20日发布了全球首个手机Agent AutoGLM2.0,可帮助用户Agent代理操作,具备推理、代码与多模态的全能能力,例如可一键订票、订咖啡等。

从行业应用角度,AI Agent在电商、医疗和安全等多个领域已经有深度落地案例;在企业内部,AI Agent能够促进研发、营销、销售和客户服务等多部门和工种的效率提升。根据Grand View Reasearch数据,全球AI Agent市场于2023年规模已达38.6亿美元,预计从2024~2030年将以CAGR 45.1%快速增长,2030年市场规模有望突破503亿美元。

根据Open AI和Deepseek等厂商的大模型版本推出节奏,未来国产大模型的竞争或将围绕AI Agent等场景落地而展开。

AI Agent:基于大模型的人工智能代理

在AI演进的道路上,目前正处于向Agents进化的阶段。

2024年OpenAI开发者日(Dev Day)上, Sam Altman提出了一个关于通用人工智能(AGI)的五层框架理论,将AGI的发展分为五个阶段,逐一代表更高级的能力水平,分别为:

L1聊天机器人(Chatbots),具有对话能力的AI;

L2推理者(Reasoners),能够在人类层面解决问题的AI;

L3智能体(Agents),能思考并可以采取行动的AI系统;

L4创新者 (Innovators),能够协助发明创造的AI;

L5组织者(Organizations),可以完成组织工作的AI。

目前,AI正从L2(推理者)向L3(智能体) 发展,根据Open AI前研究员预测,五级AGI最快将在27年实现。

a046e076-7f3c-11f0-a18e-92fbcf53809c.png

(图源:Kore.ai, COBUS GREYLING)

AI Agent在当下有着非常广阔的市场空间,并在全球范围内高速增长,重塑了各行业的运营模式和客户交互体验。

与遵循基本“请求和响应”框架的传统生成式AI不同,AI Agent是智能体,能感知环境、决策并行动,而非单纯响应刺激。大模型依赖用户prompt的清晰度,而AI Agent能独立思考、调用工具完成任务,还能编排资源,与其他Agents协作,并使用各种工具,如LLM、RAG、向量数据库、API以及Python等高级编程语言。

从传统AI,进一步到AI Agent,再到系统化的Agentic AI,这是一场范式转移,核心是自主性(Autonomy) 和通用性(Generality) 的阶梯式提升,也佐证了我们在通往AGI的路上始终在不断深挖探索。但这样的演进路线绝非单一技术的线性发展,而需要架构、算法、硬件和应用场景的协同进化。

AI Agent的技术特性

驱动Scale Up需求升级

随着AI的飞速发展,DeepSeek等开源模型不断涌现,大大降低了技术应用门槛,也推动了“AI平权”进程。但与之同时,大模型参数量已突破万亿级别,这一规模的急剧扩张带来了前所未有的算力挑战。

大模型向更大规模和更长上下文演进的发展趋势,导致推理时KV Cache需求急剧增长,已远超当前单颗AI芯片乃至主流多卡服务器的承载极限。

同时,Agentic AI具备自主决策、连续任务执行、多模态交互等核心能力,多Agent系统的推理过程需要生成比传统模型多100倍的Token。此外,AI Agent中的大模型输出往往是下一步的输入,要求推理速度越快越好,当前主流大模型API普遍拥有50-100 Tokens/s的推理速度,这对显存带宽提出了更高的要求。

面对单点算力、显存的天花板,构建大规模Scale Up系统,通过并行计算技术(如专家并行EP、张量并行TP)将模型权重与KV Cache拆分到多个AI芯片上协同工作,已成为支持万亿参数模型推理挑战的关键路径。

此外,AI Agent的自主决策、多轮交互、环境感知等核心能力发展,也随之对目前的算力架构提出新挑战:

1实时决策链式依赖

Agent的“感知-规划-执行”闭环需毫秒级响应,但长任务序列导致KV Cache指数级增长(如100轮对话的Cache达GB级),远超单卡显存容量。Scale Up通过超节点构建统一显存池承载大规模状态数据。

2记忆与状态同步需求

Agent的长期记忆(LTM)需跨会话持久化,而工作记忆(WM)需在边-云间同步。Scale Up架构的内存语义互联(如华为UB总线延迟200ns)比传统TCP/IP(ms级)更适合高频状态更新。

3多智能体协作瓶颈

多Agent协作(如游戏NPC集群)需实时交换策略参数。NVLink 5.0的超节点内1.8TB/s带宽支持千级Agent参数同步,而传统Scale Out易因网络抖动导致策略失准。

可以说,AI Agent,尤其是多智能体系统Agentic AI的持续运行和复杂推理,对底层算力基础设施(如集群的性能、网络互联、大容量低延迟存储)提出了极高要求。算力成本和能源消耗依然是规模化部署需考虑的因素,推动着芯片架构、模型压缩和推理优化等技术的创新。

AI Agent正在扛起云端协同大旗

云边端协同重构互联范式

AI Agent不仅将在云端基础大模型中扮演重要角色,也是AI端侧落地的重要一环。

2024年12月,智谱的GLM-4V模型和腾讯的混元大模型均与高通展开深度合作,基于芯片优化的角度将端侧多模态交互能力和终端侧部署能力进行提升。不难发现,一些硬件厂商纷纷集体加入大模型赛道,探索AI Agent能赋予用户的更多可能。

预计端侧应用在未来很长一段时间都将是端侧+云端搭配使用,考虑到AI Agent需要规划+多次调用大模型,端侧AI还会带来大量的云端推理算力增量从而推动云端推理集群的建设。

这一趋势对数据通路提出了前所未有的苛刻要求:极高的吞吐以应对海量交互数据,极低的延时以确保Agent决策链路的实时性与流畅性。因此,现有高性能、低延时组网方案的选型与优化,不再仅是基础设施的配套,而已成为决定AI Agent体验成败与规模化可行性的核心瓶颈。

对于AI发展和目前AI Agent应用的热潮,国内外各家厂商也针对性地端出了不同的高性能低时延组网方案。

在超节点组网技术的演进中,无论是致力于单节点内超高密度集成的架构方案,还是依托光互连技术以实现能效优化与延迟收敛的组网策略;无论是采用专用硬件与私有协议构建闭环生态,还是积极融入开放标准并引入光互连等新兴技术——尽管在具体实现路径上存在差异,但其演进脉络均清晰指向同一方向:超节点组网技术正朝着高性能、低延迟、可扩展的目标加速迭代与发展。

英伟达:DGX SuperPOD - GB200

NVL72(NVLink+ RDMA)

作为Nvidia DGX SuperPOD的代表案例,GB200 NVL72 SuperNode将36个 Grace CPU和72个Blackwell GPU集成到一个液冷机柜中,采用“GPU-GPU NVLink ScaleUp + Node-Node RDMA ScaleOut”的互联方式。

其中Scale Up网络方面,NVL72内部采用NVLink 5和NVSwitch构建,提供极高的带宽(每个Compute Tray含2个GB200,通过NVLink/NVSwitch具备7.2TB/s的Scale Up连接带宽,整机柜Compute Tray提供带宽高达129.6TB/s)和超低时延(铜电缆连接节省了光模块引入的时延)。NVL72整机柜具有超大内存空间,支持高达13.5TB的HBM和17TB的LPDDR5X内存容量。NVL72利用NVLink和NVLink C2C,所有GPU都可以访问整个超节点其他GPU的HBM和Grace CPU的DDR,实现基于内存语义的统一内存空间。

未来,英伟达的Rubin架构将升级到NVLink 6.0和7.0,进一步提升带宽密度、降低延迟,并优化互连拓扑的灵活性。

Google:基于私有ICI协议 3D Torus拓扑

Google的Scale UP组网采用私有ICI协议,机柜内部采用DAC,机柜之间运用OCS光交换技术。ICI协议被设计为可编程的,以便软件能够应对具有可重构性和弹性的运行复杂性。

以Google TPU v4 pod为例,一个TPU v4 pod就是一个ICI域,在该域中,任意一对TPU都能相互进行RDMA。TPU v4的拓扑结构为一个3D Torus环面,由4×4×4的TPU v4芯片互连而成,形成类似立方体的结构。一个机架中容纳64颗TPU v4芯片及16台CPU主机,机柜内的两个TPU v4托盘通过DAC连接。随后,用OCS光交换机将64个这样的立方体结构连接起来,组成一个包含4096个TPU的V4超级计算机。

a0944dc0-7f3c-11f0-a18e-92fbcf53809c.jpg

(图源:Google)

谷歌已将超100,000个TPU v6 Trillium连接到一个网络结构中,构建了世界上最强大的AI超级计算机之一。该系统将超过100,000个TPU v6 Trillium与每秒13 PB带宽的Jupiter网络结构相结合,使单个分布式训练作业能够扩展到数十万个加速器上。这种大规模芯片集群可以提供强大的计算能力,实现高效的并行计算,从而加速大模型的训练过程,提高AI系统的性能和效率。目前Google最新的第七代TPU Ironwood已于今年4月正式推出,这是为支持新一代人工智能模型的需求,Google专门为推理(inference)任务设计的TPU。(更多阅读:Kiwi Talks | 软硬协同,全栈制胜——谷歌如何成为AI领先综合玩家)

阿里云:HPN7.0 新型智算网络

阿里云HPN7.0面向AI大模型训练场景设计,通过创新的拓扑设计、多路径冗余和自研通信技术,解决万卡级GPU集群的高性能、高稳定性及可扩展性挑战。

架构方面,HPN7.0采用“双上联+多轨+双平面”设计,以确保网络在超高负载下仍保持高效、稳定运行,满足AI大模型对计算资源的高需求。技术方面,HPN7.0采用基于RDMA的Solar-RDMA协议,能够实现数据的快速传输和高效处理,提供高精度拥塞控制算法,结合网络负载的动态感知,能够实现对数据流级别的精细控制;使用专门面向AI计算场景设计的ACCL通信库,能显著提升计算的效率和稳定性,为大模型提供稳定可靠的网络通信支持。

a0a4265a-7f3c-11f0-a18e-92fbcf53809c.jpg

(图源:阿里云)

阿里云HPN7.0高性能网络集群于2023年9月大规模部署,通义千问2.5版本基于该集群训练而成。目前阿里云已推出了采用全自研软硬件系统的下一代训推一体网络融合架构HPN8.0。

华为:Cloud Matrix 384系统

华为Cloud Matrix 384系统创新性地提出了对等计算架构,将总线从服务器内部扩展到整机柜甚至跨机柜。该系统将总计384颗昇腾910C芯片分布在16个机架上,其中12个计算机架各部署32颗昇腾910C,通过全连接拓扑结构互联,另外4个机架用于安装Scale up交换机。Cloud Matrix 384通过超高速低延迟的统一总线(UB)网络实现互连,能够对计算、内存和网络资源进行动态池化与统一访问。

为了构建超大规模算力集群,华为采用跨多机架的Scale Up方案,因而选择光互连方式来实现横向扩展。每个Cloud Matrix 384 Pod共配置6912个400G光模块/收发器,其中5,376个用于Scale Up网络,1,536个用于Scale Out网络。Cloud Matrix 384的Scale Up带宽高达269TB/s,因物理距离限制,采用400G低功耗光模块(LPO),省略了传统DSP芯片以降低功耗和时延。

a0b09840-7f3c-11f0-a18e-92fbcf53809c.jpg

(图源:华为)

从以上国内外厂家不同的组网方式可以看到,AI Agent是“大脑”,决定了任务的复杂度;端云算力是“肌肉”,负责执行任务;而高性能网络则是“神经系统”,负责在“大脑”和“肌肉”之间进行高速、精准的信号传导。不同厂家针对自身的产品组合以及技术优势,对自身的Scale Up超节点系统做出了高性能定制化的设计。

奇异摩尔构筑了基于高性能RDMA、网络控制和芯粒的全栈互联产品解决方案。Scale Out侧的高性能AI原生超级网卡Kiwi SNIC,实现超高RDMA性能、复杂网络控制;Scale Up侧的Kiwi G2G IOD互联芯粒方案,是国内少有的开源&通用化超节点互联方案,支持内存语义/消息语义,实现G2G芯粒和xPU间互联互通。

展望未来,AI Agent的演进正在倒逼网络技术朝“确定性地高性能”方向演进,基于高速通信、超大带宽、RDMA无损网络等强劲性能指标不再是针对超大规模企业的可选奢侈方案,而是蜕变为通用AI的基座级刚需。

云侧模型凭借其高算力密度持续保持领先,而端侧AI则凭借独立性与即时性形成了差异化的竞争优势。展望下一阶段,云端协同模型将通过高质量数据训练飞轮与隐私计算框架的深度融合,推动用户体验迈向新的高峰。然而在当下,AI Agent的落地应用仍高度依赖于国内外AI网络产业全栈——包括云厂商、运营商、AI芯片、交换机及服务器等企业——在Scale Up方向上持续突破极限、不断加压发力。

关于我们

AI网络全栈式互联架构产品及解决方案提供商

奇异摩尔,成立于2021年初,是一家行业领先的AI网络全栈式互联产品及解决方案提供商。公司依托于先进的高性能RDMA 和Chiplet技术,创新性地构建了统一互联架构——Kiwi Fabric,专为超大规模AI计算平台量身打造,以满足其对高性能互联的严苛需求。我们的产品线丰富而全面,涵盖了面向不同层次互联需求的关键产品,如面向北向Scale-out网络的AI原生超级网卡、面向南向Scale-up网络的GPU片间互联芯粒、以及面向芯片内算力扩展的2.5D/3D IO Die和UCIe Die2Die IP等。这些产品共同构成了全链路互联解决方案,为AI计算提供了坚实的支撑。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296594
  • Agent
    +关注

    关注

    0

    文章

    162

    浏览量

    28569
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2811

原文标题:KiwiTalks | AI Agent驱动云边端协同重构互联范式

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为超节点互联技术引领AI基础设施新范式

    今日,华为全联接大会2025在上海启幕,华为副董事长、轮值董事长徐直军发表题为“以开创的超节点互联技术,引领AI基础设施新范式”的主题演讲,正式发布全球最强算力超节点和集群。
    的头像 发表于 09-20 16:15 1733次阅读

    开源鸿蒙AI Agent TSG正式成立

    鸿蒙 AI Agent TSG(技术专家组)正式宣布成立,旨在联合产学研力量,共同洞察 Agent 在通信、协同、自演进等方面的技术趋势,并规划和探索下一代 Agent 技术框架。该组
    的头像 发表于 07-28 17:38 729次阅读

    【「零基础开发AI Agent」阅读体验】+读《零基础开发AI Agent》掌握扣子平台开发智能体方法

    收到发烧友网站寄来的《零基础开发AI Agent》这本书已经有好些天了,这段时间有幸拜读了一下全书,掌握了一个开发智能体的方法。 该书充分从零基础入手,先阐述了Agent是什么,它的基本概念和知识
    发表于 05-14 19:51

    【「零基础开发AI Agent」阅读体验】+Agent开发平台

    Agent开发平台是专门用于创建、配置、部署、训练和运行Agent的平台。 随着Agent开发框架的发展,很多Agent开发平台能够以图形化、零代码或低代码的方式为开发者提供一站式服务
    发表于 05-13 12:24

    【「零基础开发AI Agent」阅读体验】+Agent的工作原理及特点

    如图2所示。 图2 提示词编写万能公式 要搭建AI应用可分为5个层次,见图3所示。 图3 AI应用层次 Agent的能力与特点: 以设置闹钟和Agent叫醒服务的对比为例来说明
    发表于 05-11 10:24

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、管锴、张心雨。 大模型的普及是近三年来的一件大事,万物皆可大模型已成为趋势。作为大模型开发应用中重要组成部分,提示词
    发表于 05-02 09:26

    【「零基础开发AI Agent」阅读体验】+关于AI Agent开发入门的第一印象与相关官方文档和社区资料的内容补充

    今天有幸收到了电子发烧友寄来的由中国工信出版集团和电子工业出版社联合出版的关于AI Agent开发的《零基础开发AI Agent》的新书,不禁高兴雀跃,以下是我拍下的书的页封和背面:
    发表于 04-22 18:16

    【「零基础开发AI Agent」阅读体验】+初品Agent

    期待中的《零基础开发AI Agent——手把手教你用扣子做智能体》终于寄到了,该书由叶涛、 管锴、张心雨完成,并由电子工业出版社出版发行。 全书分为三个部分,即入门篇、工具篇及实践篇。由此可见这是
    发表于 04-22 11:51

    《零基础开发AI Agent——手把手教你用扣子做智能体》

    《零基础开发AI Agent——手把手教你用扣子做智能体》是一本为普通人量身打造的AI开发指南。它不仅深入浅出地讲解了Agent的概念和发展,还通过详细的工具介绍和实战案例,帮助读者快
    发表于 03-18 12:03

    【「AI Agent应用与项目实战」阅读体验】书籍介绍

    会追根溯源,让你有种“大彻大悟”的感觉。 这本书主要讲大语言模型的内容,教我们做一个AI Agent应用出来,其实这个东西现在也叫智能体了,他跟我们平常使用大语言模型有个不同点在于他会专注某个领域
    发表于 03-05 20:40

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发一个视频应用。AI Agent是一种智能应用,能够根据用户需求和环境变化做出相应响应
    发表于 03-05 19:52

    AI Agent应用与项目实战》阅读体验--跟着迪哥学Agent

    感谢电子发烧友的这次活动,让我有幸抽中了《AI Agent应用与项目实战》(以下简称《Agent》)这本书的赠送。 收到书本之后我就迫不及待地学习书本中的知识。如果说依靠各种平台上的文章了解关于
    发表于 03-02 12:28

    AI Agent 应用与项目实战》第1-2章阅读心得——理解Agent框架与Coze平台的应用

    过年前申请的活动,这本书我早就在关注了,也是目前市面上少有的专门从技术角度结合实战讲解AI Agent 的书籍。我了解到本书主编是被戏称为“深度学习——中国分父”的迪哥,就知道这本书写的相对会贴近
    发表于 02-19 16:35

    研华AI Agent引领工业物联网应用革新

    在工业物联网领域,变革正在发生。研华AI Agent引领工业物联网应用革新,以创新重构为核心,挖掘AI潜力,赋能行业智能转型。
    的头像 发表于 01-22 18:01 1446次阅读

    名单公布!【书籍评测活动NO.55】AI Agent应用与项目实战

    技术发展惠及所有人, 需要明确的是,AI Agent不是要取代人类,而是成为人类能力的放大器。未来,我们与AI将形成一种更加紧密、智能和谐的 共生关系 。 AI
    发表于 01-13 11:04