0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

A17 Pro vs 8Gen3,手机旗舰SoC迭代,GPU和NPU成为下一轮发力点

E4Life 来源:电子发烧友网 作者:周凯扬 2023-11-01 09:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)随着2023年步入尾声,无论是苹果还是高通,都已经推出了新一代的旗舰手机SoC,这也昭示着安卓与iOS阵营手机性能的又一次年末大比。然而,对比过去拼通用计算性能和通用图形计算性能的局面,今年两大厂商都已经开始卷向其他的计算负载,比如光追、超分这样的特殊GPU负载,以及终于被积极调动算力的NPU单元。我们就从CPU,GPU和NPU三个手机SoC主力计算单元来分析苹果A17 Pro和高通骁龙8Gen3在设计上新一轮迭代。

CPU,单核多核性能各有千秋

A17 Pro和骁龙8Gen3分别是基于台积电3nm和4nm工艺打造的芯片,在最先进的半导体工艺下,CPU上的提升尤其引人注目,尤其是苹果的A17 Pro还是首发3nm的芯片。然而在各路实机测试的表现中,两者的成绩却是各有胜负。

A17 Pro虽说用上了最先进的3nm工艺,且对微架构进行了一定的改进,最大主频从A16时期的3.46GHz大幅提升至3.78GHz,但A17 Pro依然保持了6核(2性能核+4能效核)的配置,即便是在苹果自己给出的性能指标中,相较上一代也只有10%的性能提升。

而高通的骁龙8Gen3 Kyro CPU,通过升级大核为Cortex-X4、升级中核为Cortex-A720、升级小核为Cortex-A520,并将一个额外的能效核转换成了性能核,从上一代的1:4:3配置,换成了1:5:2配置。正是因为在如此激进的设计改动下,8Gen3的CPU实现了30%的性能提升,20%的能效提升。

wKgZomVBo86AdjFYAAH2yTZXetw144.png
主流手机SoC CPU的Geekbench 6测试 / androidauthority


然而在Geekbench 6的测试中,我们还是能看到一些有意思的对比。根据androidauthority对iPhone15 Pro和骁龙8Gen3参考机的测试可以看出,在单核性能上,A17 Pro还是领先一大截的,而在多核性能上,骁龙8Gen3终于实现了反超。这不免让人期待起未来Snapdragon X Elite的CPU架构下放到手机SoC后,高通CPU的单核性能会有怎样的提升。

GPU,光追和超分辨率技术

至于GPU性能的对比,结果与上一代似乎并没有太大不同,在3D Mark的测试中,A17 Pro的GPU全方位落后于骁龙8Gen3。根据苹果的说法,他们对这一代GPU进行了历史上最大的一次重新设计,但从这个结果来看,重新设计的方向应该主要放在了硬件光追和超分技术上,其相比前代提升的20%GPU性能还是无法与骁龙8Gen3相提并论。

wKgZomVBo9uAMVsSAAGCMpODVko249.png
主流手机SoC GPU的3DMark测试 / androidauthority


今年的手机SoC设计中,硬件光追已经成了标配。苹果称其GPU加入的硬件光追相较基于软件的光追,速度提升了4倍,更适合用于沉浸式AR应用和游戏体验。不过相较从上一代骁龙8Gen2就开始布局硬件光追的高通来说,苹果在硬件光追上的性能水平还是有所不及。从上面的3DMark光追测试成绩可以看出,8Gen3的硬件光追加速性能要高出A17 Pro一大截。

高通在硬件光追的开发上也领先于苹果,相比去年8Gen2仅有实时光追支持,今年的骁龙8Gen3还加入了对虚幻5引擎Lumen全局光照和反射系统的支持,可以实现比普通硬件光追更好的光线表现效果。

除了硬件光追以外,无论是高通还是苹果,都在这一代GPU的设计中加入了超分辨率的技术,比如苹果的MetalFX和高通的Snapdragon Game Super Resolution(GSR)。为了运行性能要求更高的3A游戏大作,仅仅靠堆高GPU性能是远远不够的,受限于智能手机的散热结构,我们需要英伟达DLSS或AMD的FSR这类超分辨率技术进一步降低配置要求和功耗。

去年的WWDC 2022上,苹果正式宣布了MetalFX这一超分技术,利用相对较低分辨率的图像输出更高的分辨率,从而减少渲染负载,提高应用或游戏体验。不过届时该技术主要是为M2系列的处理器开发的,而如今苹果已经打算将这一技术引入手机GPU。

wKgZomVBo-mAIRCgAAcCRLu7QUY953.png
手机超分技术对比 / 高通


而高通则在今年推出了GSR这一超分技术,高通宣称可以提供10bit HDR 144FPS的游戏性能体验。从上述超分技术对比中可以看出,GSR最高可以实现两倍的超分。高通还表示,虽然GSR技术兼容大部分GPU,但只有在骁龙硬件平台上才能发挥出最大性能。

不过在实现方式上,苹果的MetalFX和高通的GSR还是有一些区别的。高通的GSR是一项单通空域超分辨率技术,与AMD开源的FSR 1.0实现方式一样。而苹果的MetalFX,则给到了开发者选择,既可以采用空域超分辨率技术,也可以使用FSR 2.0一样的时域抗锯齿超分辨率技术。

不过,高通选择这一技术路线不是没有原因的,首先空域超分更容易达到较好的性能和图像质量表现,比过去的插值超分在边缘细节上更有优势。而时域超分虽说可以实现更好的图像质量,但其所需的数据输入在手机图形的渲染管线却不常见,只有一部分PC游戏移植到手机上更适合这一方案。

这点从苹果MetaFX的开发文档中也可以看出,如果只选择空域超分的话,开发者只需要输入像素色彩,而选择时域超分则需要提供像素色彩、深度和动态信息,这对游戏开发者来说,就需要在渲染管线上花更多的工夫。所以高通的GSR和苹果MetaFX中的空域超分更容易适配,相信未来即将支持超分的一大批游戏都会选择这一方案。

NPU,设备端生成式AI

自今年生成式AI成为热门应用后,手机SoC厂商以及大模型应用开发者们均看到了手机AI计算单元NPU的另一大功用。尤其是在高通骁龙8Gen 3的产品详情中,高通着重介绍了这一芯片平台在生成式AI上的优势。

骁龙8Gen 3的Hexagon NPU相较上一代有了质的提升,性能提升高达98%,能效比提升高达40%。这也是高通首度在NPU中加入支持多模态生成式AI模型的AI引擎,该引擎支持LLM(大语言模型)、LVM(语言视觉模型)和ASR(自动语音识别)模型,端侧最大支持100亿参数的模型。

在LLM上,以Meta 70亿参数的Llama 2模型为例,骁龙8Gen 3支持到20token每秒的表现。同时NPU也进一步提高了Sensing Hub各大传感器调用用户数据的能力,比如同时支持两个始终感应的摄像头等。

苹果今年似乎并没有着重强调A17 Pro的神经引擎,除了35TOPS的计算性能。不过从M2和M3系列的神经引擎配置来看,苹果或许对于A17 Pro这一智能手机SoC的AI性能有更多的准备。要知道,同为16核的神经引擎,去年的A16和M2芯片其AI算力只有17 TOPS,哪怕是刚公布的M3系列芯片,其AI算力都只有18TOPS。

写在最后

至此,我们看到了高通和苹果两家厂商对于AI计算的重视,只不过两者的侧重点略有不同。比如目前苹果目前更注重于打造“直觉式AI”,着重加强设备端系统级AI和多媒体AI的表现,比如输入法自动更正、个人语音、拍照人像模式、第三方app中的图片降噪/超分等。而高通已经开始拥抱生成式AI,尤其是智能语音助手的AI性能,也给到了第三方AI应用开发者更自由的硬件资源调用。

然而无论是从纸面参数,还是从各大性能测试得出的结果可知,安卓旗舰SoC与苹果SoC的性能代差已经完全消除了,甚至前者在GPU性能上已经实现了反超。由此也可以看出,半导体工艺提升带来的性能收益已经在缩小,反而是芯片微架构和核心配置决定了最终的手机SoC性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134437
  • NPU
    NPU
    +关注

    关注

    2

    文章

    358

    浏览量

    20827
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    正面对决A19 Pro,骁龙8 Elite Gen5杀疯了,谁是2025手机旗舰SoC

    电子发烧友原创 章鹰 9月19日,苹果秋季发布会上iPhone17搭载的A19芯片和iPhone17 Pro搭载的A19
    的头像 发表于 09-29 09:03 1.7w次阅读
    正面对决<b class='flag-5'>A</b>19 <b class='flag-5'>Pro</b>,骁龙<b class='flag-5'>8</b> Elite <b class='flag-5'>Gen</b>5杀疯了,谁是2025<b class='flag-5'>手机</b>真<b class='flag-5'>旗舰</b><b class='flag-5'>SoC</b>?

    手机SoC迈入“百TOPS”时代!苹果、高通和联科新芯前瞻,谁是真香之选?

    目前的多款智能手机SoC已具备超过40 TOPS的计算能力。这种本地处理能力使得AI任务的执行更加快速和高效。2025年三大国际手机芯片巨头下场,手机终端厂商的
    的头像 发表于 08-22 08:47 1.1w次阅读
    <b class='flag-5'>手机</b><b class='flag-5'>SoC</b>迈入“百TOPS”时代!苹果、高通和联<b class='flag-5'>发</b>科新芯前瞻,谁是真香之选?

    SM4算法实现分享()算法原理

    SM4分组加密算法采用的是非线性迭代结构,以字为单位进行加密、解密运算,每次迭代称为一轮变换,每变换包括S盒变换、非线性变换、线性变换、合成变换。加解密算法与密钥扩展都是采用32
    发表于 10-30 08:10

    DES密钥产生模块结构设计

    号,对加解密运算中16迭代运算的子密钥进行控制;十六选选通器以count密钥选择控制信号为选通信号,判断迭代运算轮数进行子密钥输出。
    发表于 10-30 07:13

    AES加解密算法逻辑实现及其在蜂鸟E203SoC上的应用介绍

    ,算法的循环轮数就要增加2。 AES密码算法的内部结构由多个层构成,每层都是对整个处理块16字节进行操作,并且循环多进行处理。在加密运算中,每一轮运算包含四种不同类型的层:密钥
    发表于 10-29 07:29

    穹彻智能完成新一轮融资

    10月17日,穹彻智能通过官方微信公众号宣布,近日已顺利完成新一轮融资。此次融资由阿里巴巴集团领投,多位老股东同步参与追投,融资资金将用于加速技术产品研发、具身应用落地和行业生态拓展。
    的头像 发表于 10-18 14:02 1442次阅读

    80 TOPS NPU算力炸场!全球最快CPU,高通最强AI SoC发布,小米17

    9月25日,在2025高通骁龙峰会的第二日,高通技术公司高级副总裁兼手机业务总经理Chris Patrick宣布,高通推出全球最快的移动SoC——第五代骁龙8至尊版移动平台。天下武功,惟快不破。这次高通
    的头像 发表于 09-27 17:04 1w次阅读
    80 TOPS <b class='flag-5'>NPU</b>算力炸场!全球最快CPU,高通最强AI <b class='flag-5'>SoC</b>发布,小米<b class='flag-5'>17</b>首<b class='flag-5'>发</b>

    今日看点:小米17手机正式发布;国芯科技研发AI PC及机器人用NPU IP核

    小米17手机正式发布 9 月 25 日消息,小米 17 手机今日正式发布,宣称是“小米史上最强小尺寸全能旗舰”。小米
    发表于 09-26 10:52 1136次阅读

    基于米尔瑞芯微RK3576开发板的Qwen2-VL-3B模型NPU多模态部署评测

    、隐私与离线可用性上的优势显著,而 RK3576 凭借 8nm 制程、6TOPS自研NPU及动态稀疏化加速引擎,填补了旗舰与主流方案的市场空白。它针对2B-3B参数级模型专项优化,轻量
    发表于 08-29 18:08

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我直从事的事芯片
    发表于 06-18 19:31

    苹果A20芯片的深度解读

    提升30%。 ​ 技术迭代路径 ​: A17 Pro:初代3nm(N3B) A18
    的头像 发表于 06-06 09:32 2606次阅读

    iTOP-3588S开发板四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    8GB内存,32GBEMMC。 四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。 内置NPU RK3588S内置NP
    发表于 05-15 10:36

    手机芯片进入2nm时代,首发不是苹果?

    积电2nm   根据以往进度,苹果将大概率成为台积电2nm工艺的首家客户,而台积电也会优先将2nm制造产能供应给苹果公司。   此前,iPhone 15 Pro 机型中的A17 Pro
    发表于 03-14 00:14 2292次阅读

    Imagination GPU为瑞萨R-Car Gen 5系列SoC提供强大高效的算力

    宣布,瑞萨在其下一代R-CarGen5SoC集成了IMGB-Series汽车级GPU。瑞萨获得授权使用的IMGBXS图形处理器具备卓越的并行计算能力,能够满足新
    的头像 发表于 03-11 08:31 665次阅读
    Imagination <b class='flag-5'>GPU</b>为瑞萨R-Car <b class='flag-5'>Gen</b> 5系列<b class='flag-5'>SoC</b>提供强大高效的算力

    天玑 8400 “神U再临”,越级旗舰体验太犀利了

    GPU G720,还有旗舰同级的联科第八代AI处理器 NPU 880。这 “配置拉满”的组合,不仅让它在性能、能效方面展现出“同档无
    的头像 发表于 12-24 09:14 1235次阅读
    天玑 8400 “神U再临”,越级<b class='flag-5'>旗舰</b>体验太犀利了