0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm计算子系统平台推动定制AI芯片普及

Arm社区 来源:Arm社区 2025-10-15 16:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着人工智能 (AI) 工作负载在复杂性和规模方面的激增,传统的系统级芯片 (SoC) 模式正面临三重挑战——能效低下、性能瓶颈和产品上市时间延长。头部云服务提供商曾主导的单芯片设计领域已无法满足现代 AI 基础设施的发展需求。

在即将于下周拉开帷幕的 2025 年 OCP 全球峰会上,Arm 将重点聚焦一大转变:由Arm 计算子系统 (Compute Subsystems, CSS)和芯粒系统架构 (Chiplet System Architecture, CSA)所赋能的芯粒创新,正为芯片提供商创造新的机遇,这些企业无需具备头部云服务提供商的规模,也可构建 AI 优化的设计。

从单芯片到模块化 AI 芯片

多年来,全定制 SoC 主导着高端 AI 基础设施。计算单元、内存控制器、互连系统和加速器等都集成在一个单晶粒 (die) 上。虽然这种设计可确保严格的控制,并带来性能优势,但也存在显著的利弊权衡,包括:

随着工艺节点不断突破极限,功耗和散热成本持续上升;

大型异构模块的验证和确认相对复杂;

设计、工具开发和制造的交付时间长。

而采用芯粒技术的计算,则通过将系统分解为更小的专用晶粒(包括计算、内存、I/O、加速器),让 SoC 架构师和设计人员能够灵活搭配组件,并按需扩展,以实现产品的快速迭代。目前,这种模块化仍有其局限性,例如设计的碎片化、标准化互连的缺乏、IP 复用的挑战,以及较大的前期风险和成本。

解题关键:Arm CSS 和 CSA 模式

Arm 正通过两个基本框架弥合差距:

CSS:这是一套整合了经过预先验证的高性能 IP 构建模块的计算子系统,涵盖计算核心、AI 加速器、内存子系统等,其设计、验证和性能特性已在真实或仿真芯片中得到验证。通过使用 CSS,设计人员无需从头开始打造每个模块,也无需再次验证其可行性;而能直接利用成熟且经优化的组件。

CSA:这是一个开放且以标准为导向的架构,用于实现芯粒在不同供应商间的互连、通信与集成。CSA 定义了电气、物理和协议层的兼容性,以便不同来源的 IP(例如,来自合作伙伴 A 的加速器和来自代工厂 B 的内存晶粒)可以在共享平台上可靠地进行互操作。

CSS 和 CSA 让 Socionext、Rebellions 等芯片提供商实现定制的 AI 优化芯片,其性能可媲美头部云服务提供商的设计方案,与此同时所承担的风险更低、开发周期更短,且灵活性更高。芯片提供商可根据其具体的工作负载需求(如视觉模型、推理引擎和多租户实例)灵活选择计算模块、加速器、内存类型及集成路径,而非受制于单片设计的权衡取舍中。

OCP 助力加速行业发展

开放计算项目 (Open Compute Project, OCP) 长期以来是开放硬件协作、模块化和高效率的核心阵地,这些原则与芯粒技术的革新密切相关。在 2025 年 OCP 全球峰会上,Arm 不仅将展示其技术理论架构,还会通过实际案例,生动呈现云服务提供商、OEM 厂商和芯片提供商如何结合使用 CSS 和 CSA,打造面向未来需求的 AI 基础设施。

OCP 合作伙伴所获得的主要优势包括:

灵活性:针对特定区域的功耗、散热或可靠性限制,灵活定制芯片;

更低的总体拥有成本 (TCO):通过供应链可选性降低 TCO,即能够从多家代工厂采购芯粒或晶粒,并随着产量的扩大灵活组合晶粒,而非受制于单一供应商;

更快的上市时间:经过验证的 CSS 模块和标准化的互连使得大部分设计工作得以“预先完成”,从而实现更快速的原型设计、测试和部署。

业务影响及未来展望

对于 AI 基础设施建设者来说,无论是云服务提供商、OEM 厂商还是刚刚涉足 AI 领域的芯片公司,CSS 和 CSA 方法都能帮助他们实现以下的成果:

每瓦性能的提升:计算和内存被置于最高效的位置,避免资源浪费。

设计风险的降低:复用经过验证的 IP,以及利用标准互连技术。

供应链弹性的提高:模块化设计使更换供应商、扩展晶粒产量或首选代工厂工艺节点变得更为可行。

设计周期的加速:设计周期的缩短能实现 AI 模型、特性集和部署的快速迭代。

这不仅仅是芯片架构,它更是 AI 时代企业实现业务敏捷性的关键杠杆。

了解更多信息

在 2025 年 OCP 全球峰会上,Arm 将举办系列会议和技术简报会,现场展示 CSS 和 CSA 的实际应用。无论你是探索 AI 硬件未来的芯片设计人员、基础设施架构师还是云服务提供商,这都为你突破现有局限、见证无限可能提供了绝佳契机。

数据中心的未来仰赖于各种规模的创新,Arm 始终致力于让所有企业(不仅是头部云服务提供商)都有打造定制 AI 芯片的能力!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9619

    浏览量

    394710
  • 内存
    +关注

    关注

    9

    文章

    3263

    浏览量

    76618
  • AI芯片
    +关注

    关注

    17

    文章

    2187

    浏览量

    36896

原文标题:探索芯粒革新,Arm 计算子系统平台推动定制 AI 芯片普及

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    从手机芯片到通用计算平台:为什么开发者该重新认识高通

    ,可能会觉得内容偏硬;但如果你正在做,或者准备做下面这些方向,它会很有价值: 端侧 AI / 边缘 AI / 本地大模型部署 高通 QCS / QCM 平台开发 ARM Linux、B
    发表于 05-21 10:32

    Arm亲自下场!自研首款数据中心AGI CPU发布!

    历程中,Arm 首次推出自己的芯片产品,将 Arm Neoverse 平台从 IP 和计算子系统 (Compute Subsystems,
    的头像 发表于 03-25 08:39 3256次阅读
    <b class='flag-5'>Arm</b>亲自下场!自研首款数据中心AGI CPU发布!

    一文掌握瑞芯微RK系列NPU算子支持全景:覆盖6大平台,新增硬件加速算子,嵌入式AI开发不踩坑

    在嵌入式 AI 领域,瑞芯微(Rockchip)RK 系列 NPU 凭借低功耗、高兼容性的特性,广泛应用于智能监控、边缘计算、物联网设备等场景。近期发布的《RKNN Compiler Support
    的头像 发表于 02-06 16:33 1794次阅读
    一文掌握瑞芯微RK系列NPU<b class='flag-5'>算子</b>支持全景:覆盖6大<b class='flag-5'>平台</b>,新增硬件加速<b class='flag-5'>算子</b>,嵌入式<b class='flag-5'>AI</b>开发不踩坑

    技嘉于 CES 2026 展示 AI TOP 产品线 推动以人为本的本地 AI 生态系统发展

     CES 2026 展示 AI TOP 产品线  推动以人为本的本地 AI 生态系统发展 AI TOP
    的头像 发表于 01-12 19:49 1437次阅读
    技嘉于 CES 2026 展示 <b class='flag-5'>AI</b> TOP 产品线 <b class='flag-5'>推动</b>以人为本的本地 <b class='flag-5'>AI</b> 生态<b class='flag-5'>系统</b>发展

    软件定义的硬件辅助验证如何助力AI芯片开发

    半导体行业正处于关键转折点。2025 年,1927 亿美元的风险投资涌入 AI 领域,市场对匹配 AI 快速创新周期的验证平台的需求激增。随着 AI、Multi-Die 架构和边缘
    的头像 发表于 12-29 11:17 879次阅读
    软件定义的硬件辅助验证如何助力<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>开发

    Arm架构计算平台驱动融合型AI数据中心变革

    的意义远不止于一个统计数字,更重要的是它们构成了融合型人工智能 (AI) 数据中心这一新型基础设施的计算核心。从云原生服务到最具挑战性的 AI 工作负载,超大规模云服务提供商正逐步将基于 Ar
    的头像 发表于 12-15 14:51 790次阅读

    Arm Neoverse平台集成NVIDIA NVLink Fusion

    新闻重点 Arm 与 NVIDIA 持续深化合作,在 AI 时代推动协同设计与合作迈向新高度。 生态系统合作伙伴可将高效的 Arm 架构
    的头像 发表于 11-26 11:08 624次阅读

    Arm Flexible Access方案引入Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台(专为物联网及边缘 AI 工作负载优化)将纳入 Arm Flexible Access 方案,助力
    的头像 发表于 10-29 15:27 1370次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    流体芯片AI计算平台 ⑥基于AI的自主决策系统 ⑦基于A
    发表于 09-17 11:45

    Arm正式取消Cortex命名!CPU向着高算力进发,Lumex CSS平台加持!

    工智能 (AI) 体验的先进计算平台。   CSS是Arm推出的计算子系统,针对不同的应用领域,提供包括
    的头像 发表于 09-17 08:25 3472次阅读
    <b class='flag-5'>Arm</b>正式取消Cortex命名!CPU向着高算力进发,Lumex CSS<b class='flag-5'>平台</b>加持!

    全新Arm Lumex CSS平台实现两位数性能提升

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称 Arm)今日宣布推出全新 Arm Lumex 计算子系统 (Compute Sub
    的头像 发表于 09-10 16:14 1145次阅读
    全新<b class='flag-5'>Arm</b> Lumex CSS<b class='flag-5'>平台</b>实现两位数性能提升

    深入解析面向不同市场的多样化Arm计算子系统

    如果你曾基于 Arm 技术开发过产品,很大机会已经感受到了 Arm 计算子系统 (Arm Compute Subsystems, Arm C
    的头像 发表于 09-06 14:09 1185次阅读
    深入解析面向不同市场的多样化<b class='flag-5'>Arm</b><b class='flag-5'>计算子系统</b>

    如何在基于Arm架构的边缘AI设备上部署飞桨模型

    Arm 与领先的开源深度学习平台强强联合,会带来什么?那就是推动创新的“火箭燃料”。Arm 携手百度,利用双方在高能效计算
    的头像 发表于 09-06 14:07 1602次阅读

    Arm Zena CSS加速软件和芯片开发进程

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称 Arm)近期宣布推出 Arm Zena 计算子系统 (Compute Subsys
    的头像 发表于 08-25 16:22 2358次阅读

    西门子 Veloce CS 助力 Arm Neoverse 计算子系统验证与确认

    西门子数字化工业软件近日宣布,Veloce Strato CS 与Veloce proFPGA CS 已被 Veloce 的长期合作伙伴 Arm 部署应用,作为Arm Neoverse 计算子系统
    的头像 发表于 08-06 09:26 3153次阅读