0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm TCS23现迄今最快处理器IP组合,前瞻定义旗舰手机SoC性能,为生成式AI而来

花茶晶晶 来源:电子发烧友网 作者:黄晶晶 2023-06-05 16:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近Arm推出2023 全面计算解决方案(TCS23),发布最新CPUGPU IP等产品。没有意外,高通联发科的下一代旗舰手机SoC将采用Arm最新的CPU架构Cortex-X4,并且联发科还将以最新的Arm Immortalis-G720 IP为基础提升手机硬件光追的性能。Arm表示这是迄今最快的CPU和GPU,那么它们究竟有哪些提升呢?

wKgaomR9mmeAOFc6AAQBXXqRv2Q386.png

Cortex-X4相比于 Cortex-X3,性能提高 15%,功耗降 40%

Cortex-X4是第四代X内核,基于全新的Armv9架构。得益于Armv9计算集群,处理器连续三年实现两位数的性能提升,Cortex-X4也同样如此。

与 Cortex-X3 相比,Cortex-X4 的性能提高15%,降低多达40%的功耗,而面积仅增加10%,Arm 中国区业务全球副总裁邹挺表示,这是Cortex-X系列处理器中,在每平方毫米的性能方面最出类拔萃的产品。
wKgaomR9mnCASJ2FAALO9K1yrjA029.png

处理器的性能提升将带来更快速的即时应用响应,更流畅的网页浏览体验,在3A 级游戏、全天候生产力、后台任务等方面带给用户直观感受。

除了Cortex-X4超大核之外,Arm全新的大核处理器 Cortex-A720 和全新小核 Cortex-A520,与其上一代相比在能效方面都提高了20%。Cortex-A720 是业界主流的 CPU IP,主打高性能,可提高持续性能,是新CPU集群的核心主力。而Cortex-A520主打低功耗,是最出众的的高效性能核心。为了完善CPU 集群,Arm还推出了全新DSU-120 ,专门为了满足高要求的多线程用例而设计。
wKgZomR9mnqAHx4RAALUaZdUzm8491.png

GPU——Immortalis-G720 :相比于 Immortalis-G715 ,性能和能效分别提高15%,系统级效率跃升 40%

此次发布的基于第五代架构的 GPU——Immortalis-G720,可带来15%的性能提升,减少多达 40%的内存带宽用量,有助于实现更出色且持久的帧率,最终带来更高质量的图形,实现更扣人心弦的视觉感受。在相同的配置下,相较于前一代产品,Immortalis-G720 的性能提高15%,而面积仅增加2%。而前一代产品已经证实在面积效率方面胜出相近竞品高达 20%。

wKgaomR9moSAE0yFAAOHnZarfFY187.png

邹挺表示,这是 Arm 有史以来效率最高的GPU架构,在设计时还兼顾了CPU和系统。该架构重新定义了部分图形管道,显著减少了内存带宽,从而让总体系统效率与功耗优化高达 14%。延迟顶点着色 (DVS) 的引入重新定义了GPU中的图形数据流,并将成为未来图形和几何复杂工作负载的关键,有助于合作伙伴扩展内核数量,并在未来达到更高的性能水平。

Arm 全新的GPU架构使下一代游戏和实时3D应用成为可能,让游戏体验更顺畅,并让复杂的PC 端和游戏主机体验在移动设备上实现。现在,游戏玩家喜欢的游戏可以通过更高帧率和经优化的高动态范围成像技术 HDR运行,带来更逼真的体验感,此外建筑师可以在现场直接通过建筑物实时 3D 效果图将计算机辅助设计 CAD 规划变为现实。

基于台积电N3E先进工艺,完成业内首个 Cortex-X4 流片

实现芯片的高效能离不开工艺的调优。Arm宣布目前已经在台积电N3E先进工艺上顺利完成了业内首个 Cortex-X4 的流片。邹挺也表示,Arm和台积电共同为 Arm Cortex-X4 内核打造定制 IP,为充分利用制程工艺和处理器带来的PPA 优势做好准备。这项合作为未来奠定了基础,通过设计分区和利用先进的封装技术,一同协作提高系统性能和能效。
wKgaomR9mo2AZpKiAAcy1jZ3VJ4553.png

邹挺谈到随着制程工艺的结合,将达到比上一代多的额外频率。通过提高处理器每时钟指令,来获得15%的性能提升。同时,降低功耗的关键之一是清楚地了解如何利用额外的 IPC,在更低的工作和电压点去运转,从而实现40%的能耗降低。

在系统优化方面,全新第五代 GPU 架构具有 DVS 功能,有助于优化系统级缓存的使用,同时新的 CPU 集群提供更多的 DSU 电源模式,以支持更高效地使用更大的 L3 缓存,并减少外部 DRAM 流量,从而实现性能更佳、效率更高的 SoC。在2023 全面计算解决方案中,在新版 CI-700 中引入了许多创新技术,进一步缩小了芯片面积。并将互连产生的延迟降低了 25%,同时优化了空闲电源,在不影响电池续航时间的前提下,实现了杰出的系统性能表现。


MTE 功能有助内存安全

Arm 的内存标记扩展MTE 功能,支持开发者在应用部署前后,都能检测和避免内存安全漏洞,为用户提供功能安全及信息安全的数字体验。通过 Armv9 架构的 CPU,Arm提供的MTE 功能能够消除占所有软件漏洞中 70% 的内存安全漏洞。

wKgZomR9mpWAQaYNAAmrzXYoMi0884.png

当前,企业和消费者市场都部署了相关解决方案。手机厂商荣耀最近宣布将向开发者提供支持 MTE 的设备。而作为潜心致力于保护隐私和安全的优秀短视频平台,快手也将进一步借助该技术优化改进其开发流程,为 3.6 亿日活用户带来更好的用户体验。


适应生成式AI应用

两周前,Google I/O 大会重点强调考虑把生成式 AI 引入到安卓生态系统,不久前,微软的 Build 开发者大会也在谈到把这些引入 Windows 11,从而让 Windows 的用户体验有进一步的提升。显然,生成式 AI 和大型语言模型是一个新兴领域。

在采访中Arm 高级副总裁兼终端事业部总经理Chris Bergey谈及他对生成式AI发展的看法,他说我们认为大型语言模型将塑造计算的未来,这意味着需要进一步提升AI方面的工作负载,而Arm 在这方面有非常深厚的储备,Arm CPU 和 GPU 的性能提升带动了 AI 处理能力大约每两年便会翻一番。

他进一步表示,Arm 正在通过相关工作以确保 AI 可以很好地在 Arm 架构上运行。我们相信未来将是一个比较混合(hybrid)的环境,大型语言模型在云端运行,但考虑到智能手机或其他计算设备上本地运行 AI 的隐私和能源效率等问题,用户可以更愿意在设备本机上运行较小的模型,如安卓。

wKgaomR9mp2AbCL1AAWtEcaE9HU328.png

Arm将继续推进对开源软件库Arm NN 和 Arm Compute Library 的支持,以便那些以世界上部署最多的平台 (即 Arm) 为目标的开发者能够继续利用类似 Chat GPT 或大型语言模型的应用程序来开发他们的应用。

自今年年初以来,Arm NN 和 Arm Compute Library 已在安卓平台上面向 Google Apps 开放,目前拥有超一亿的日活用户。明年年初,这些 Arm 技术库将通过谷歌移动服务向第三方应用程序的安卓开发者开放访问。将进一步助力开发者优化运行在 Armv9 CPU 和 Arm GPU 的机器学习工作负载,并预计未来的发展速度将会更快。


小结:

联发科已明确表示,Arm的2023 年 IP 极具创新力,Cortex-X4、Cortex-A720以及Immortalis-G720 为下一代天玑旗舰移动芯片奠定了良好的基础,我们将通过突破性的架构设计与技术创新提供令人惊叹的性能和能效。MediaTek 天玑移动芯片将结合 Arm 的先进技术,为用户开启移动新体验,带来更快的多任务处理、更出色的游戏与长续航表现。

wKgZomR9mqWAEm08AASoss67K6A266.png

可以肯定的是,Arm 2023 全面计算解决方案(TCS23)将带来旗舰智能手机性能的极大跃升。同时,Arm也透露正在加大投入下一代核心IP包括Krake GPU 和 Blackhawk CPU等,持续推进Arm全面计算解决方案的演进。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    247035
  • soc
    soc
    +关注

    关注

    38

    文章

    4514

    浏览量

    227578
  • 生成式AI
    +关注

    关注

    0

    文章

    537

    浏览量

    1019
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    手机SoC迈入“百TOPS”时代!苹果、高通和联发科新芯前瞻,谁是真香之选?

    目前的多款智能手机SoC已具备超过40 TOPS的计算能力。这种本地处理能力使得AI任务的执行更加快速和高效。2025年三大国际手机芯片巨头
    的头像 发表于 08-22 08:47 1.1w次阅读
    <b class='flag-5'>手机</b><b class='flag-5'>SoC</b>迈入“百TOPS”时代!苹果、高通和联发科新芯<b class='flag-5'>前瞻</b>,谁是真香之选?

    Alif Semiconductor的Ensemble MCU新增对ExecuTorch Runtime的支持,助力其推动边缘生成AI发展

    · Ensemble E4/E6/E8是业界首个为Transformer网络提供硬件加速的MCU系列,可在边缘设备及终端设备上实现本地生成AI推理 · Alif与Arm合作,在PyT
    的头像 发表于 11-04 11:44 1185次阅读
    Alif Semiconductor的Ensemble MCU新增对ExecuTorch Runtime的支持,助力其推动边缘<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>发展

    AUDIO SoC的解决方案

    SoC(片上系统)是一种系统级集成电路。新唐科技的单芯片音频系统音频 SoC采用皮质-M0/M4内核,并采用Arm 皮质-M系列处理器的基本创新技术,包括∑△ADC、CODEC、OP、
    发表于 09-05 08:26

    MicroBlaze处理器嵌入设计用户指南

    *本指南内容涵盖了在嵌入设计中使用 MicroBlaze 处理器、含存储 IP 核的设计、IP integrator 中的复位和时钟拓扑
    的头像 发表于 07-28 10:43 781次阅读

    ARM集群服务 定义

    ARM集群服务的核心定义可归纳为以下要点: 一、核心定义 ARM集群服务是将‌多个基于
    的头像 发表于 06-25 08:09 518次阅读
    <b class='flag-5'>ARM</b>集群服务<b class='flag-5'>器</b> <b class='flag-5'>定义</b>

    芯来科技新一代RISC-V高性能处理器IP UX1030H 全面支持RVA23

    System Technology)正式发布其新一代高性能处理器IP —— UX1030H。 该产品严格遵循RVA23 Profile规范,全面支持虚拟化及向量计算扩展,并在此基础上
    的头像 发表于 06-24 09:20 2276次阅读
    芯来科技新一代RISC-V高<b class='flag-5'>性能</b><b class='flag-5'>处理器</b><b class='flag-5'>IP</b> UX1030H  全面支持RVA<b class='flag-5'>23</b>

    SoC集群服务ARM架构阵列服务 关系

    。 核心特征‌:芯片级集成、高密度算力、低功耗设计。 ARM架构阵列服务‌ 基于ARM指令集的处理器集群,通过多节点协同工作提升整体性能
    的头像 发表于 04-24 07:49 741次阅读
    <b class='flag-5'>SoC</b>集群服务<b class='flag-5'>器</b> 与 <b class='flag-5'>ARM</b>架构阵列服务<b class='flag-5'>器</b> 关系

    AI SoC # Apollo330 Plus 边缘设备实时AI处理的创新解决方案

    ® 应用处理器和用于低功耗无线电通信的专用 Arm Cortex-M4F 网络处理器,可实现高效和高性能的连接,同时消耗最少的有功功率。 *附件:Apol
    的头像 发表于 03-13 15:14 1952次阅读
    <b class='flag-5'>AI</b> <b class='flag-5'>SoC</b> # Apollo330 Plus 边缘设备实时<b class='flag-5'>AI</b><b class='flag-5'>处理</b>的创新解决方案

    聚云科技获亚马逊云科技生成AI能力认证

    的应用上展现出了卓越的能力。 聚云科技通过整合亚马逊云科技的先进技术,从应用范围确定、模型选择、数据处理、模型调优到应用集成与部署,为企业提供全方位的生成AI应用落地支持。这不仅加速
    的头像 发表于 02-19 10:33 831次阅读

    端侧 AI 音频处理器:集成音频处理AI 计算能力的创新芯片

    对人工智能应用日益增长的需求。   集成音频处理AI 计算能力 端侧 AI 音频处理器的组成结构通常较为复杂,常采用多核异构架构,将不同类型的
    的头像 发表于 02-16 00:13 3047次阅读

    聚云科技荣获亚马逊云科技生成AI能力认证

    Bedrock等技术,从应用范围、模型选择、数据处理、模型调优到应用集成与部署等方面,助力企业加速生成AI应用落地。此外,聚云科技还基于亚马逊云科技打造RAGPro企业知识库、
    的头像 发表于 02-14 16:07 696次阅读

    Arm技术助力Google Axion处理器加速AI工作负载推理

    Arm Neoverse V2 平台赋能的 Google Axion 处理器已在 Google Cloud 上正式上线,其中,C4A 是首款基于 Axion 的云虚拟机,为基于 CPU 的人工智能 (AI) 推理和通用云工作
    的头像 发表于 02-14 14:11 955次阅读
    <b class='flag-5'>Arm</b>技术助力Google Axion<b class='flag-5'>处理器</b>加速<b class='flag-5'>AI</b>工作负载推理

    聚云科技荣获亚马逊云科技生成AI能力认证 助力企业加速生成AI应用落地

    、数据处理、模型调优到应用集成与部署等方面,助力企业加速生成AI应用落地。此外,聚云科技还基于亚马逊云科技打造RAGPro企业知识库、AI
    发表于 02-14 13:41 323次阅读

    OpenAI计划开发可替代手机生成AI专用终端

    近日,据日经报道,人工智能研究公司 OpenAI 的 CEO Sam Altman 在接受采访时透露,OpenAI 计划开发一款可替代手机生成 AI 专用终端。 据了解,OpenA
    的头像 发表于 02-05 14:50 937次阅读

    基于Arm Neoverse平台的处理器革新生成AI体验

    Llama 是一个专为开发者、研究人员和企业打造的开源大语言模型 (LLM) 库,旨在推动生成 AI 的创新、实验及可靠地扩展。
    的头像 发表于 01-03 15:31 1153次阅读
    基于<b class='flag-5'>Arm</b> Neoverse平台的<b class='flag-5'>处理器</b>革新<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>体验