0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm终端CSS为AI用户体验提供计算平台

Arm社区 来源:Arm社区 2024-05-30 11:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能 (AI) 正在改变消费电子设备,并且革新生产力、创造力和娱乐体验,这将带来更高程度的自动化、沉浸感和个性化,为开发者和最终用户提供海量机会。随着推动移动端系统级芯片 (SoC) 的设备端生成式 AI 的发展,AI 技术正持续演进。

依托于Arm 全面计算解决方案的成功,我们宣布推出面向消费电子设备的全新计算子系统,即 Arm 终端计算子系统 (CSS)。作为 AI 体验的计算基础,它能在最广泛类别的消费电子设备中,实现性能、效率和可扩展性的跨越式提升。

Arm 终端 CSS 囊括最新的 Armv9.2 Cortex CPU 集群和 Arm Immortalis 与 Arm Mali GPU、CoreLink 互连系统 IP,以及知名代工厂采用三纳米工艺生产就绪的 CPU 和 GPU 物理实现。该平台为我们的合作伙伴提供了生产芯片的最快途径。通过物理实现,Arm 的合作伙伴能够利用前沿三纳米工艺的各种优势,同时实现高度灵活、可定制的芯片设计。

深入了解 Arm 终端 CSS

Arm 终端 CSS 采用最新 Armv9.2 CPU 集群,其中集成了 Arm 目前最高性能的 Arm Cortex-X925 CPU、最高效的 Cortex-A725 CPU 和更新后的 Cortex-A520 CPU。这为 AI 和其他实际用例计算工作负载提供出色的性能和效率。

2a53fb56-1e35-11ef-9bf9-92fbcf53809c.jpg

图:Arm 终端 CSS 涵盖哪些要素?

最新的 CoreLink 互连实现了 Arm 终端 CSS 的系统集成和扩展。集成的系统级缓存 (SLC) 通过减少 DRAM 带宽和访问来实现更出色的系统能效。系统内存管理单元 (SMMU) 通过第二阶段转换加强安全性,以便支持如安卓虚拟化框架 (AVF) 等虚拟化安全框架。

凭借基于第五代 GPU 架构、面向旗舰智能手机所设计的 Arm Immortalis-G925,Arm 终端 CSS 实现了惊人的图形和主机级别的游戏性能。通过增强的性能和能效,用户可以在移动设备上享受更长时间、更沉浸式的游戏体验。

Arm 终端 CSS 将成为第一代采用三纳米工艺节点的安卓 SoC 的一部分,从而在芯片中实现出色的功耗、性能和面积 (PPA)。作为终端 CSS 的一部分,Arm 的物理实现能够全面释放三纳米工艺技术的潜力,为高端平台充分发挥 PPA 优势,并为我们的合作伙伴打造芯片创建最快途径。

我们携手领先的代工厂合作伙伴,协同设计并交付 CPU 和 GPU 物理实现,其中包括流片就绪的 Cortex-X925 CPU 以及 Immortalis-G925 三纳米工艺的物理实现。这将有助于我们的合作伙伴在三纳米工艺上取得 PPA 优势,同时通过生产就绪的芯片解决方案来缩短芯片的开发与部署时间。此外,我们的合作伙伴能够灵活地使用 Arm 终端 CSS 来构建特定市场、具差异化特色的 CPU 集群和 GPU。

突破计算和 AI 性能的极限

终端 CSS 是 Arm 目前面向安卓系统速度最快的平台,与 2023 Arm 全面计算解决方案 (TCS23) 平台相比,在关键基准和一般计算用例方面取得了显著改进。其中包括:

通过 Geekbench 6 单核分数测量可知,得益于新的 Cortex-X925,峰值性能提高 36%;

在前十大应用中,五款应用的平均启动时间加快了 33%,不仅提高了生产力,也带来了流畅的移动体验;

通过 Speedometer 2.1 浏览器基准测量时,网页浏览速度加快了 60%;

在包括光线追踪和可变速率着色 (VRS) 基准等七项图形基准中,峰值图形性能平均提高 30%。

2abd1ab4-1e35-11ef-9bf9-92fbcf53809c.jpg

图:Arm 终端 CSS 的部分性能优势

Arm 终端 CSS 平台提供由 AI 驱动的消费电子设备体验。今年早些时候,我们展示了大语言模型 (LLM) 如何在移动设备上的 Arm CPU 进行本地运行。借助终端 CSS,LLM 将得以在 Arm CPU 上更好地运行,带来更快的响应速度。当运行 Llama 3 LLM 和 Phi-3 LLM 时,该平台可将词元 (Token) 首次响应时间分别缩短 42% 以及 46%。

2ace8a1a-1e35-11ef-9bf9-92fbcf53809c.jpg

图:通过 Arm 终端 CSS 在 Arm CPU 上运行 LLM

此外,得益于新 Arm CPU 和 GPU 所取得的技术进展,在广泛的通用 AI 网络上,Arm 终端 CSS 的 AI 推理性能获得了显著的提升。例如,采用 Cortex-X925 时,推理速度加快 59%;采用 Immortalis-G925 时,AI 推理速度加快 36%。此外,通过在终端 CSS 的 CPU 集群配置中利用一颗额外的 Cortex-X925 CPU,我们观察到在 17 个主流网络中,针对 int8 和 fp16 数据类型的 AI 推理性能提高了惊人的 2.7 倍。这些在 AI 推理方面的改进可在一系列 AI 用例中实现无缝顺畅的用户体验。

2b01986a-1e35-11ef-9bf9-92fbcf53809c.jpg

图:Arm 终端 CSS 提升 AI 推理

Arm 终端 CSS 在计算摄影和 AI 摄像头等 AI 用例中的表现尤为优异。要想拍摄出美轮美奂且具有逼真焦外成像效果(让背景模糊并聚焦所选主体)的照片和视频,这并非易事。AI 摄像头的焦外成像管线由深度估计、分割、抠图和混合等多个阶段组成,可生成高质量的影像结果。与 TCS23 相比,通过 CPU 上针对焦外成像工作负载的 AI 处理,终端 CSS 的焦外成像性能提升了 24%。这意味着用户可以在不影响电池续航时间的前提下,在照片和视频上获得更快、更顺畅的焦外成像效果。

2b244bbc-1e35-11ef-9bf9-92fbcf53809c.jpg

图:通过 Arm 终端 CSS 提升 AI 摄像头性能

此外,通过软件和工具的结合,Arm 终端 CSS 的性能与功耗得以获得进一步优化。Arm 新推出的 Kleidi 包含了经高度优化的机器学习 (ML) 软件内核集合 KleidiAI,能让开发者在通过高度优化的生成式 AI 框架运行 AI 工作负载时,全面释放 Arm CPU 的潜力。这意味着开发者能够面向各类设备,基于尽可能高的性能,快速构建 AI 应用。

为了获得更具沉浸感和更长时间的游戏体验,Arm 终端 CSS 实现了两位数的性能和能效提升,其中包括在一系列热门的手游中,平均以每秒 120 帧的速度运行时,在相同功耗下可带来 37% 的平均性能提升,同时 GPU 功耗降低 30%。

可扩展的性能覆盖各类消费电子设备市场

Arm 致力于让每个人都能享有 AI,并通过可应用在各类和各种不同外观设计的消费电子设备的终端 CSS,不断提升性能和效率。

Arm 终端 CSS 可扩展应用至市面上最高性能的消费电子设备,包括新一代 AI PC。其中的 Cortex-X925 与 Cortex-X4 CPU 相比,其 TOPS 提高 50%。终端 CSS 为 PC 市场提供专用的可扩展平台。该平台采用 Cortex-X925 以提供一流的单线程性能,并通过近期更新的 DSU-120(在单个 CPU 集群内提供多达 14 个 CPU 核心)提供最佳的性能可扩展性。除了 SVE2,更多的 Armv9 架构的功能,包括已在移动端生态系统验证的安全性技术,如指针验证 (PAC)、分支目标识别 (BTI)和内存标记扩展 (MTE) 等,也将引入 PC 市场。

通过终端 CSS,Arm 可为消费电子设备市场的各类性能和成本需求提供可获取的 AI 技术。Cortex-A725 是实现高能效 AI 吞吐量的主要处理器,在对成本更敏感的大众消费电子技术市场领域,它是 AI 处理的主力和主要开发者目标。例如,我们曾在一个虚拟助手演示中,展示了在搭载三核 Cortex-A700 系列 CPU 核心的现有安卓智能手机上,运行 Llama2-7B 和 Phi-3-mini (Phi-3 3.8B) LLM 的性能。与此同时,面积经优化的 Cortex-A725 可在广泛的消费电子技术领域中,以高面积效率实现生成式 AI 工作负载的部署。

消费电子技术的 AI 根基

Arm 终端 CSS 是为各类消费电子设备打造新一代 AI 体验的专用平台。终端 CSS 是 Arm 针对安卓系统速度最快的计算平台,这将使得用户能够在其移动设备上获得前所未有的安卓体验。该平台的 PPA 优势通过物理实现得以达成,助力我们的芯片合作伙伴缩短产品上市时间并顺畅部署。终端 CSS 的可扩展性能有助于在各种类型、不同外观设计的设备的所有成本点上释放 AI 性能,使得人人都能享有 AI。

2b6f2f42-1e35-11ef-9bf9-92fbcf53809c.jpg

Arm 终端 CSS 使得我们的生态系统能够实现更多突破,无论是释放更多性能、实现更多 AI 功能和应用体验,还是打造更先进的芯片,Arm 平台是这一切的基础。凭借终端 CSS,Arm 为当前和未来的 AI 体验构建消费电子计算的未来。


审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 摄像头
    +关注

    关注

    61

    文章

    5115

    浏览量

    103488
  • SoC芯片
    +关注

    关注

    2

    文章

    674

    浏览量

    37274
  • 人工智能
    +关注

    关注

    1820

    文章

    50314

    浏览量

    266885
  • 机器学习
    +关注

    关注

    67

    文章

    8562

    浏览量

    137209

原文标题:Arm 终端 CSS 为 AI 用户体验提供计算平台

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm亲自下场!自研首款数据中心AGI CPU发布!

    历程中,Arm 首次推出自己的芯片产品,将 Arm Neoverse 平台从 IP 和计算子系统 (Compute Subsystems, CSS
    的头像 发表于 03-25 08:39 2993次阅读
    <b class='flag-5'>Arm</b>亲自下场!自研首款数据中心AGI CPU发布!

    Arm计算平台助力物理AI与边缘AI落地

    在上周举行的 2026 年国际消费电子展 (CES 2026) 上,一条贯穿全场的脉络迅速显现:人们所见、所触、所体验的大多数技术与产品,均已构建在 Arm 技术之上。基于 Arm 技术的平台正在
    的头像 发表于 01-15 14:02 689次阅读

    西门子EDA与Arm携手合作加速系统设计验证进程与软件启动

    对芯片设计而言,加速产品的上市流程至关重要。为此,西门子EDA与Arm携手合作,Arm的合作伙伴提供了一系列基于Arm Neoverse
    的头像 发表于 12-19 09:06 864次阅读
    西门子EDA与<b class='flag-5'>Arm</b>携手合作加速系统设计验证进程与软件启动

    Arm架构计算平台驱动融合型AI数据中心变革

    的意义远不止于一个统计数字,更重要的是它们构成了融合型人工智能 (AI) 数据中心这一新型基础设施的计算核心。从云原生服务到最具挑战性的 AI 工作负载,超大规模云服务提供商正逐步将基
    的头像 发表于 12-15 14:51 685次阅读

    Arm Lumex平台赋能新一代旗舰智能手机体验升级

    2025 年 9 月,Arm 正式推出 Lumex 平台,这是 Arm 迄今为止最先进的智能手机计算平台,旨在让人工智能 (
    的头像 发表于 12-15 14:27 897次阅读

    Arm Flexible Access方案引入Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台(专为物联网及边缘 AI 工作负载优化)将纳入 Arm Flexible Access 方案,助力
    的头像 发表于 10-29 15:27 1190次阅读

    Arm与Meta深化战略合作

    近日,Arm 与 Meta 宣布一项战略合作项目,双方将围绕人工智能 (AI) 软件与数据中心基础设施两大核心领域,全面提升各计算层面的 AI 效率,
    的头像 发表于 10-24 17:54 1723次阅读

    深入解析Arm Zena CSS计算平台

    在汽车行业中,车辆正变得越来越智能且互联,并由人工智能 (AI) 定义。以往仅部署在高端车型的功能,例如实时驾驶员监控、预测性维护以及调适性车载信息娱乐系统 (IVI) 等,如今正迅速成为新车型
    的头像 发表于 10-15 16:21 683次阅读

    Arm正式取消Cortex命名!CPU向着高算力进发,Lumex CSS平台加持!

    工智能 (AI) 体验的先进计算平台。   CSSArm推出的计算子系统,针对不同的应用领域,
    的头像 发表于 09-17 08:25 3313次阅读
    <b class='flag-5'>Arm</b>正式取消Cortex命名!CPU向着高算力进发,Lumex <b class='flag-5'>CSS</b><b class='flag-5'>平台</b>加持!

    全新Arm Lumex CSS平台实现两位数性能提升

    及下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最
    的头像 发表于 09-10 16:14 1053次阅读
    全新<b class='flag-5'>Arm</b> Lumex <b class='flag-5'>CSS</b><b class='flag-5'>平台</b>实现两位数性能提升

    深入解析面向不同市场的多样化Arm计算子系统

    如果你曾基于 Arm 技术开发过产品,很大机会已经感受到了 Arm 计算子系统 (Arm Compute Subsystems, Arm
    的头像 发表于 09-06 14:09 1113次阅读
    深入解析面向不同市场的多样化<b class='flag-5'>Arm</b><b class='flag-5'>计算</b>子系统

    Arm Zena CSS加速软件和芯片开发进程

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称 Arm)近期宣布推出 Arm Zena 计算子系统 (Compute Subsys
    的头像 发表于 08-25 16:22 2236次阅读

    Arm 与微软合作,基于 Arm 架构的 PC 和移动设备应用提供超强 AI 体验

    ArmKleidiAI与ONNXRuntime的集成,Windows和安卓操作系统带来了显著的AI性能优化,实现高达2.6倍的AI推理速度提升,从而加速应用体验。联合作者:Arm
    的头像 发表于 06-03 16:47 983次阅读
    <b class='flag-5'>Arm</b> 与微软合作,<b class='flag-5'>为</b>基于 <b class='flag-5'>Arm</b> 架构的 PC 和移动设备应用<b class='flag-5'>提供</b>超强 <b class='flag-5'>AI</b> 体验

    Arm 公司面向 PC 市场的 ​Arm Niva​ 深度解读

    面向 PC 市场的 ​ Arm Niva ​ 深度解读 ​ Arm Niva ​ 是 Arm 公司 PC 市场推出的核心计算
    的头像 发表于 05-29 09:56 1867次阅读

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    面向移动端市场的 ​ Arm Lumex ​ 深度解读 ​ Arm Lumex ​ 是 Arm 公司面向移动设备市场推出的新一代计算平台,隶
    的头像 发表于 05-29 09:54 4560次阅读