0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新的Armv9 CPU技术加速AI在移动设备等领域的发展

Arm社区 来源:Arm社区 2024-05-30 11:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当今移动设备上的大多数人工智能 (AI) 工作负载均可在 Arm CPU 上运行。在智能手机领域,基于 Armv9 CPU 技术构建的 AI 旗舰智能手机立于技术前沿,其中包括搭载 MediaTek 天玑 9300 芯片的 vivo X100 和 X100 Pro 智能手机、三星 Galaxy S24 以及 Google Pixel 8,为 AI 创新提供了前所未有的机遇。

随着 AI 工作负载的计算强度及复杂度持续增长,Arm 最新的 Armv9.2 CPU 集群带来更强性能、更高效率,以及更多功能,为新一代 AI 奠定扎实基础。这些优势可扩展到包括旗舰智能手机、AI PC,以及主流移动设备、XR 和可穿戴设备等在内的各类消费电子设备,彰显了我们致力于实现无处不在的 AI 所作的努力。

新增至 Armv9 CPU 组合的新品包括具备超强性能的 Arm Cortex-X925 CPU 和可持续提供出色性能的 Arm Cortex-A725 CPU,而更新后的 Arm Cortex-A520 可为低强度工作负载提供更卓越的能效表现。与此同时,我们也更新了 DynamIQ Shared Unit (DSU-120),从而在 Armv9.2 CPU 集群配置中,降低功耗和缩小面积。这些产品被集成至 Arm 迄今为止针对安卓系统速度最快的计算平台 —— 新的 Arm 终端计算子系统 (CSS)

2f3ad9e6-1e35-11ef-9bf9-92fbcf53809c.jpg

图:Armv9 CPU 系列的新产品及更新

Cortex-X925 实现了最显著的 Cortex-X 性能提升

Cortex-X925(内部代号为 Blackhawk)与此前的 Cortex-X 产品相比,实现了最高的同比性能提升,重新定义了计算性能的发展轨迹。Cortex-X925 的单线程(峰值)性能提高了 36%(与 2023 年高端安卓手机上运行 Geekbench 6.2 相比),并且其 AI 性能提升了 46%(与前代 Cortex-X4 CPU 上的 Phi-3 词元首次响应时间相比)。

2f551d74-1e35-11ef-9bf9-92fbcf53809c.jpg

图:Arm Cortex-X925 性能提升

Cortex-X925 的功耗性能配置意味着它能在关键时刻提供峰值性能。这有助于提高跨应用、生成式 AI 工作负载、网页浏览、摄像头后处理、视频录制和 AAA 游戏的响应能力,进而带来更优异的用户体验。

这些性能提升得益于 Cortex-X925 出众的性能基础及其开创性的新微架构。Cortex-X925 通过经优化的三纳米工艺,辅以卓越的子系统和封装,使得新一代消费电子设备的性能分数可提高 30% 以上。包括高达 3MB 的私有 L2 缓存在内的微架构改进,提供了更强的 CPU 集群可配置性,让各类消费电子设备的创新成为可能。

作为 Arm 终端 CSS的一部分,我们协同设计并交付了 CPU 物理实现。我们携手领先的代工厂合作伙伴,实现了流片就绪的 Cortex-X925 三纳米工艺的物理实现,助力我们的合作伙伴能够在三纳米工艺上充分发挥功耗、性能和面积 (PPA) 优势,同时通过大批量生产就绪的芯片解决方案来缩短芯片的开发与部署进程。

Cortex-A725 持续提供出色性能

Arm Cortex-A700 系列 CPU 的出色性能效率一脉相承,Cortex-A725 也不例外。作为 CPU 工作负载的主力,我们的工程和设计团队就 Cortex-A725 进行了针对性更新,着力于需要持续出色性能的关键 AI 和游戏用例。与 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。

2f7ea982-1e35-11ef-9bf9-92fbcf53809c.jpg

图:Arm Cortex-A725 性能和能效提升

Cortex-A725 的性能效率提升同样得益于其微架构的改进。和 Cortex-X925 一样,通过 Arm 先进的物理实现,我们在三纳米工艺上优化了 Cortex-A725 的实现。我们还可为主流消费技术市场提供面积优化的实现。

Cortex-A520 和 DSU-120 的更新

Cortex-A520 已针对 Arm 终端 CSS进行更新,从而提供更为出色的能效,与 2023 Arm 全面计算解决方案 (TCS23) 中的 Cortex-A520 相比,其效率提升了 15%。Cortex-A520 的更新得益于更新的实现与先进的三纳米物理实现。

2f9b4100-1e35-11ef-9bf9-92fbcf53809c.jpg

图:更新后的 Arm Cortex-A520

作为新的 Arm 终端 CSS 的一部分,DSU-120 已针对新一代用例和消费电子设备体验进行了强化。其中包括新的性能和效率功能、新的低功耗模式和面向主流消费电子设备的强化,并保留了为高性能用例扩展到 14 个核心的选项。得益于此,典型工作负载的功耗显著降低 50%,并且整个 CPU 集群的缓存未命中功耗降低 60%,从而减少漏电并延长设备的电池寿命。新的低功耗模式(例如 half slice power down 和 quick nap)和增强功能支持大量低强度和高强度的 AI 工作负载,包括生物特征识别、语音转文本、AI 智能摄像头、内容创建和基于机器学习 (ML) 的 AAA 游戏。

2fe82470-1e35-11ef-9bf9-92fbcf53809c.jpg

图:DSU-120 更新和提升

Arm 性能最强、效率最高、用途最广泛的 CPU 集群

这些新推出和更新后的 CPU 构成了 Arm CPU 集群配置,为广泛的消费电子设备提供前所未有的性能、效率和广泛用途。概括地说,与采用上一代 Cortex-X4 的 CPU 集群相比,新的 CPU 集群的 AI 性能提高了 46%,能实现了更高的响应性能和持续的吞吐量。与 TCS23 CPU 集群相比,它使关键用户体验指标(结合性能与功耗)提高 30%,进而加快应用访问和网页浏览速度,提升 AAA 游戏体验,并延长电池使用寿命。

最新的 Arm CPU 集群还可为各类的消费电子设备提供出色的扩展能力。例如,它为 PC 和笔记本电脑提供一流的性能,与当前发售的 PC 和笔记本电脑设备相比,性能提高了 25%。同时,与 TCS23 中的 DSU-120 相比,功耗和面积均获得降低,加上通过 Cortex-A725 和 Cortex-A520 带来的面积和功耗优化,为主流设备提供了灵活的 CPU 集群配置组合。这有助于在各类低成本的消费电子设备上提供优异性能和 AI 功能,确保日常设备用户能够获得高级的 AI 体验。

300d1b4a-1e35-11ef-9bf9-92fbcf53809c.jpg

Armv9 CPU 面向新一代 AI 体验

新的 Armv9.2 CPU 集群为安卓智能手机、PC 和笔记本电脑等设备提供出色的性能与用户体验。该集群提供一整套实际用例的改进,集群中各个 CPU 组件均涵盖广泛的实际用例和工作负载。例如,Cortex-X925 可处理应用启动和网页浏览的“突发”工作负载,Cortex-A725 可提供常见 AI 工作负载和 AAA 游戏所需的持续性能,Cortex-A520 的高效率则非常适合轻量型媒体和闲置及后台任务。所有这些增强的实际用例体验都可以扩展到各类消费技术领域,新推出的 Armv9 CPU 为主流设备和日常用户带来了更高的性能和更强大的 AI 功能,从而使关键用户体验指标提高 30%。

随着用户在其设备上花费的时间不断增多,并期望获得更高级的体验,消费者对技术的需求永无止境。无论是更快的网页浏览和应用访问速度,还是增强的 AAA 游戏与生成式 AI 工作负载,新的 Armv9 CPU 通过先进的计算功能提升各类体验,进而定义消费技术的未来。

审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 摄像头
    +关注

    关注

    61

    文章

    5116

    浏览量

    103504
  • 移动设备
    +关注

    关注

    0

    文章

    531

    浏览量

    56047
  • 人工智能
    +关注

    关注

    1820

    文章

    50335

    浏览量

    266976
  • 生成式AI
    +关注

    关注

    0

    文章

    538

    浏览量

    1133

原文标题:新的 Armv9 CPU 加速 AI 在移动设备等领域的发展

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm率先适配腾讯混元HY-1.8B-2Bit模型

    计算平台,Arm 率先完成了对该模型的成功适配。HY-1.8B-2Bit 现已能够搭载启用第二代可伸缩矩阵扩展 (SME2) 技术Armv9 计算平台的移动
    的头像 发表于 02-10 17:29 2073次阅读

    使用NORDIC AI的好处

    <5 KB),可在任何 Nordic SoC/SiP 的主 CPU 上运行,适合加速度计、IMU、PPG、温度、电流时序传感器数据的 AI 任务。[Nordic Edge
    发表于 01-31 23:16

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 嵌入式与 AI 领域落地

    据科技区角报道半导体解决方案提供商 Quintauris 最近宣布和 RISC-V 处理器 IP 领域的头部厂商 SiFive 达成战略合作,目标直接瞄准加速 RISC-V 嵌入式、AI
    发表于 12-18 12:01

    探索RISC-V机器人领域的潜力

    SLAM轻量级算法时表现出了不错的性能,CPU占用率可接受范围内。整个系统响应及时,证明了MUSE Pi Pro完全有能力作为小型移动机器人的“大脑”。 四、 其他功能浅尝 •
    发表于 12-03 14:40

    华为助力中国移动SPN领域取得多项里程碑成果

    一直以来,华为作为中国移动重要战略合作伙伴,助力中国移动联合业界锚定SPN技术体系赋能算力网络,加速行业数智化发展。本次会议为该目标的达成又
    的头像 发表于 11-03 11:26 1107次阅读

    Arm Flexible Access方案引入Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台(专为物联网及边缘 AI 工作负载优化)将纳入 Arm Flexible Access 方案,助力创新者以低成本、便捷的方式,边缘侧获得先进
    的头像 发表于 10-29 15:27 1207次阅读

    【今晚7点半】正点原子 x STM32:智能加速边缘AI应用开发!今晚正点原子B站直播间等你

    【联合直播】正点原子 x STM32:智能加速边缘AI应用开发! 一、直播介绍 随着人工智能技术边缘计算领域的快速
    发表于 09-25 14:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    景嘉微电子、海光信息技术、上海复旦微电子、上海壁仞科技、上海燧原科技、上海天数智芯半导体、墨芯人工智能、沐曦集成电路介绍完这些云端数据中心的AI芯片之后,还为我们介绍了边缘
    发表于 09-12 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    AI芯片:科技探索与AGI愿景》这本书是张臣雄所著,由人民邮电出版社出版,它与《AI芯片:前沿技术与创新未来》一书是姊妹篇,由此可见作者AI
    发表于 09-05 15:10

    AI 芯片浪潮下,职场晋升新契机?

    业绩。 职称评审看重的 AI 芯片相关能力 AI 芯片领域,专业技术能力无疑是职称评审的核心关注点。这不仅包括对芯片架构设计、电路逻辑开
    发表于 08-19 08:58

    Arm神经技术是业界首创 Arm GPU 上增添专用神经加速器的技术移动设备上实现PC级别的AI图形性能

    Arm 神经技术是业界首创 Arm GPU 上增添专用神经加速器的技术,首次移动
    的头像 发表于 08-14 17:59 2932次阅读

    PCIe协议分析仪能测试哪些设备

    /ASIC加速器 测试场景:分析专用AI推理加速器与主系统的PCIe通信,优化数据传输和指令下发效率。 应用价值:提高推理吞吐量,确保加速
    发表于 07-25 14:09

    进迭时空同构融合技术加速大模型AI应用创新

    同构融合技术为了加速AI计算,芯片企业设计了多种专用处理器架构,如GPGPU、NPU、TPU。这些专用处理器架构执行调度代码及应用层代码
    的头像 发表于 06-06 16:55 1261次阅读
    进迭时空同构融合<b class='flag-5'>技术</b><b class='flag-5'>加速</b>大模型<b class='flag-5'>AI</b>应用创新

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    子系统(CSS)​ ​ 移动端的落地形态,Lumex 旨在通过高度集成化的软硬件方案,解决移动设备
    的头像 发表于 05-29 09:54 4565次阅读

    Arm与微软合作加速边缘设备上的AI体验

    随着人工智能 (AI) 成为当今个人电脑 (PC) 和移动设备使用体验(从聊天机器人到生产力提升)中不可或缺的一部分,这些设备CPU
    的头像 发表于 05-28 13:54 932次阅读