0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm正式取消Cortex命名!CPU向着高算力进发,Lumex CSS平台加持!

花茶晶晶 来源:电子发烧友网 作者:黄晶晶 2025-09-17 08:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶)日前,在ArmUnlocked上海站峰会上,Arm重磅推出智能终端专属 Lumex CSS平台。Lumex CSS是一套专为旗舰级智能手机及下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。

CSS是Arm推出的计算子系统,针对不同的应用领域,提供包括Arm Neoverse 计算子系统、面向汽车行业的 Zena、面向移动市场的 Lumex、面向PC市场的Niva,以及面向物联网和边缘 AI的Orbis。

Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能 ArmCPUGPU及系统 IP,不仅能助力生态伙伴更快将AI设备推向市场,还可支持桌面级移动游戏、实时翻译、智能助手及个性化应用等多样的丰富体验。

wKgZO2jIyuWAAonlAAq_Y31VTNs316.png

取消Cortex命名,Lumex平台CPU采用新的命名规则

Arm高级副总裁兼终端事业部总经理Chris Bergey表示,在终端业务方面,从Lumex 平台开始,Arm引入新的命名规则。在这个新命名体系下,Lumex平台里面的CPU系列会以C1-Ultra、C1-Premium、C1-Pro以及C1-Nano等名称出现。这一命名体系清晰直观,能让整个行业和合作伙伴一目了然。同样的命名体系也应用于GPU产品线。例如,过去的 “Immortalis” 品牌,现统一采用 Lumex 体系下的Mali命名。关于面向汽车市场的 Zena CSS 平台,Arm之前介绍过一些信息,但关于面向个人电脑的 Niva CSS 平台,Arm尚未发布相关信息。

具体来看,搭载SME2的Armv9.3架构在CPU、GPU方面都有较大提升。Arm C1-Ultra CPU是Arm至今推出的性能最强的CPU,其单线程峰值性能较上一代 Arm Cortex-X925 CPU提升高达 25%,非常适合处理严苛的 AI 与计算工作负载。针对功耗敏感型的用例,Arm C1-Pro CPU 较 Cortex-A725能效提升幅度达12%。

wKgZPGjIyv-AZy-OAAz3eVBLwyo299.png

借助SME2实现AI就绪端侧AI性能可提升达五倍,能效可提升三倍。显著的性能提升还包括语音识别延迟改善超4.7倍,经典大语言模型任务性能提升4.7 倍,生成式 AI 处理速度快2.8倍。

GPU方面,Mali G1-Ultra 集性能与能效于一身,性能提升20% 的同时,每帧能耗也降低9%。该 GPU 在 AI 与机器学习网络上的推理速度比 Immortalis-G925 快上 20%,光线追踪性能提升两倍。

在CSS模式的交付方面,合作伙伴无论是希望选用RTL交付形式的技术授权方式,还是采用接近生产就绪的实现方案,Arm均能提供充分的灵活性与定制化能力,助力合作伙伴借助Lumex CSS快速推进项目,大规模交付具备旗舰级加速性能的丰富AI体验。

SME2较前代性能的提升

此次,Arm在所有新推出的CPU平台上全面启用第二代可伸缩矩阵扩展(SME2) 技术,为开发者带来更强的AI性能、更低的内存占用,并让端侧AI运行更加流畅,尤其对于音频生成、摄像头推理、计算机视觉或聊天交互等对实时性要求严苛的应用而言。SME2的推出,标志着端侧AI 开发迈入对开发者更为友好的新时代。

Arm终端事业部产品管理副总裁James McNiven解析,SME2是SME的新一代版本。它新增了更多指令集,可进一步提升性能和能效。它支持更小的数据类型——具体而言是2 bit和4 bit,随着每年高度量化模型的不断增多,这类小数据类型在移动生态系统中的重要性正日益凸显。这也是Arm将SME2 整合到Lumex 平台中的原因所在。

Arm预计到2030年SME和SME2将为超30亿台设备新增超100亿TOPS的计算能力。这将使端侧AI能力实现指数级飞跃,它将降低成本、减少延迟、增强隐私,整体提升用户体验。对开发者而言,这意味着他们能更迅速地将创新成果推向市场。

借助Lumex,Arm助力下一代旗舰级智能手机的快速发展,让AI真正实现个性化。它具备实时适配能力,从核心到上层进行了全面优化,能将平台级的智能体验置于用户的掌心。

提供额外2到6 TOPS算力,CPU算力对端侧AI更友好

James McNiven表示,随着AI应用的日趋成熟,许多AI工作负载会从云端转向端侧。但云端与端侧的混合模式将会长期共存——云端AI不会被取代,只是出于隐私考量,许多AI功能的运行需要同时满足三个条件:随时可用、低延迟交付,且必须在端侧运行。从功能提供者的视角来看,让用户设备承载尽可能多的AI 工作负载以降低云端成本,亦是合理之举。

因此,若某项工作负载需在端侧运行,开发者接下来要做的决策是该让它在设备的哪个模块上运行。如今的移动端系统级芯片 (SoC) 非常复杂,它们均配备 CPU(大部分计算工作负载在此运行)与高性能 GPU(专门处理图形工作负载)。旗舰或高端智能手机还会搭载 NPU,作为 AI 工作负载的专用加速器。

wKgZPGjIyyKABgpTAA2-X8cH454302.png

从开发者的角度出发,他们大多需要较强的 CPU,从而进一步为工作负载提供更多灵活性。所以对于Arm来说,重点就是不断的增强这些平台的计算体验。CPU 能够带来最大的灵活性,以实现整个生态系统普遍的性能。

那么,在引入SME2之后,CPU的AI性能得到了怎样的提升呢?

进一步来说,根据具体的实现方案和运行频率,第二代可伸缩矩阵扩展 (SME2) 在技术上可提供额外2到6 TOPS的算力。James McNiven解析,你可能会想“才 6 TOPS?而一些 NPU 已经超过100 TOPS了。”相比之下这听起来似乎并不突出。但实际情况是,对于低延迟、模型较小的AI任务,例如图像预处理、语音识别或实时语境助手,这种级别的算力不仅足够,往往还绰绰有余。

更重要的是,当今许多 AI 工作负载受限于内存带宽,而非算力本身。因此,即使 NPU 拥有 100 TOPS 的算力,如果无法足够快速地提供数据,这种峰值性能也难以被充分利用。通过启用 SME2 直接在 CPU 核心上运行,能够以低延迟访问缓存和系统内存,因此在处理这些规模小、频繁触发且对延迟敏感的任务时极为高效。因此,尽管 2 到 6 TOPS 的数值看似不高,但在实际应用中的效率和响应速度上,却是一次巨大的跃升。此外,SME2 还带来了可编程性优势。与功能固定的 NPU 不同,它能适应不断演进的各类 AI 模型和用例。

当然,NPU不会消失,GPU上的推理也不会被取代。Arm 深信不同的计算单元有不同的长处,各自针对不同类型的 AI 工作负载进行优化。NPU擅长高吞吐量、大模型的推理任务,例如大语言模型 (LLM)、视觉 Transformer;GPU更适合并行性强、与图形相关的 AI 任务,例如渲染加上 AI 图形优化升级;而搭载 SME2 的 CPU,则在需要与系统逻辑紧密集成的低延迟、持续在线的小模型任务中有卓越表现。

这些计算单元并非相互竞争,而是相辅相成。SME2 带来了全新的灵活性,尤其对那些希望AI特性能够在尽可能多的设备上运行的第三方开发者而言,这个灵活性意义重大,包括那些没有专用NPU的设备。因为每一台基于 Arm 架构的智能手机都具备 CPU,且在不久的将来,许多智能手机都将支持启用 SME2 的CPU 核心。这意味着开发者可以依赖一个一致且广泛可用的 AI 加速层,无需担心硬件碎片化的问题。

在AI计算时代,Arm 的产品体系从 IP 到计算子系统 (CSS),再到“AI 优先”的计算平台。这项着眼“平台优先”的产品战略,整合了高性能 CPU/GPU 硬件、KleidiAI 软件工具及集成库,构建起“芯片-软件-工具”的端到端平台。凭借卓越的性能、能效和可扩展性,该计算平台能助力合作伙伴实现快速集成,降低研发复杂度与规模化风险,满足 AI 时代的多样化需求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    MWC Doha 2025|美格智能全新发布60 Tops AI、支持Linux系统的SNM982AI模组

    11月25日,在MWCDoha展会期间,美格智能全新发布基于通QCS8650平台研发设计的SNM982AI模组。搭载Linux5.1
    的头像 发表于 11-25 16:34 607次阅读
    MWC Doha 2025|美格智能全新发布60 Tops AI<b class='flag-5'>算</b><b class='flag-5'>力</b>、支持Linux系统的SNM982<b class='flag-5'>高</b><b class='flag-5'>算</b><b class='flag-5'>力</b>AI模组

    CPU、GPU到NPU,美格智能持续优化异构计算效能

    前言AI已成为数字经济时代的核心生产,但全球AI产业正面临“供给不足、成本企、生态待建”三重挑战。据行业统计,行业
    的头像 发表于 11-21 16:05 770次阅读
    从<b class='flag-5'>CPU</b>、GPU到NPU,美格智能持续优化异构<b class='flag-5'>算</b><b class='flag-5'>力</b>计算效能

    全新Arm Lumex CSS平台实现两位数性能提升

    及下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能
    的头像 发表于 09-10 16:14 753次阅读
    全新<b class='flag-5'>Arm</b> <b class='flag-5'>Lumex</b> <b class='flag-5'>CSS</b><b class='flag-5'>平台</b>实现两位数性能提升

    Arm Zena CSS加速软件和芯片开发进程

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称 Arm)近期宣布推出 Arm Zena 计算子系统 (Compute Subsystems,
    的头像 发表于 08-25 16:22 1817次阅读

    Arm产品命名体系的演变

    Arm 首席执行官 Rene Haas 宣布 Arm 推出新的产品命名体系后,本文将为你详解新的计算平台名称,以及新命名体系内的新 IP
    的头像 发表于 06-19 10:38 784次阅读
    <b class='flag-5'>Arm</b>产品<b class='flag-5'>命名</b>体系的演变

    迅为RK3576开发板低成本工业级核心板卡开发平台

    迅为RK3576开发板低成本工业级核心板卡开发平台
    的头像 发表于 06-09 15:13 1448次阅读
    迅为RK3576开发板<b class='flag-5'>高</b><b class='flag-5'>算</b><b class='flag-5'>力</b>低成本工业级核心板卡开发<b class='flag-5'>平台</b>

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    面向移动端市场的 ​ Arm Lumex ​ 深度解读 ​ Arm Lumex ​ 是 Arm 公司面向移动设备市场推出的新一代计算
    的头像 发表于 05-29 09:54 4060次阅读

    Arm 公司面向汽车市场的 ​Arm Zena​ 深度解读

    面向汽车市场的 ​ Arm Zena ​ 深度解读 Arm Zena 是 Arm 公司面向智能汽车领域推出的核心计算平台,属于其“平台优先”
    的头像 发表于 05-29 09:51 2087次阅读

    软通智中标韶关公共服务平台项目

    日前,软通动力旗下软通智中标《韶关公共服务平台(一体化
    的头像 发表于 05-22 16:19 722次阅读

    详解Arm Cortex-A320 CPU的特性

    Arm Cortex-A320 CPU 的推出具有重要的里程碑意义。作为首个基于 Armv9 架构的超高能效 CPU,这一突破性的处理器为功耗有限的设备引入了此前仅在尖端移动计算解决方
    的头像 发表于 02-27 17:13 1490次阅读

    GPU租用平台有什么好处

    当今,GPU租用平台为科研机构、企业乃至个人开发者提供了灵活高效的解决方案。下面,AI部落小编带您深入探讨GPU
    的头像 发表于 02-07 10:39 726次阅读

    中心的如何衡量?

    作为当下科技发展的重要基础设施,其的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智中心算衡量的详细阐述:一、
    的头像 发表于 01-16 14:03 4261次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    融合 南京信易达发布全新“智能融合平台

    1月7日,南京信易达发布了旗下最新平台“C-MOM智能融合平台V3.0”,并更新了全新的
    的头像 发表于 01-08 10:56 1276次阅读
    超<b class='flag-5'>算</b>智<b class='flag-5'>算</b>融合 南京信易达发布全新“智能<b class='flag-5'>算</b><b class='flag-5'>力</b>融合<b class='flag-5'>平台</b>”