0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解析骁龙888处理器的特性

我快闭嘴 来源:雷锋网 作者:量衡 2021-01-16 09:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

新SoC的发布节点,直接左右旗舰手机的发布周期。刚在12月发布的骁龙888,不但打破了历史规律,还带着CPUGPUAI性能的显著提升,和小米11一起拉开了小米新十年的序幕。

小米11首批35万台之后,已多次连续放量,不少人已经体验到2021年的新旗舰。“一人内测,全民公测”的酷安上,小米11的关键词已霸榜许久。

骁龙888注定会是2021年旗舰手机的标配,在它的身上可以观测到高通对未来的构想,也能预测未来一年移动端的趋势。

暴涨的GPU和单核性能

高通今年从台积电7nm N7P工艺切换到三星5nm LPE工艺。对比三星上一代的7LPP,三星承诺同性能下的功耗降低20%,同功耗下性能提高10%,面积减少20%。

构架方面,骁龙888更新到Kryo 680,超大核是2.84GHz Cortex-X1构架,配备了1MB的L2缓存;大核是3个2.24GHz类A78核心,每核L2缓存翻倍到512KB;而小核仍然是4颗1.8GHz的类A55构架。

Cortex-X1是安卓阵营迎来的第一个公版超大核:6条整数流水线,5解码8发射的前端,有真•PC级的四条带FMA的NEON,是移动端浮点堆料的极致。相应的,X1的芯片面积是A78的2.3倍,峰值性能是A77的1.3倍,机器学习性能提升2倍。

和X1同代的御用搭档A78,IPC比A77提升7%,主要负责“提升能效比、节省芯片面积”,以达到更好的面积和功耗均衡。CPU集群维持4MB的L3缓存,高通官方解释,这是难度和缓存配置之间的平衡。此外,骁龙888支持最高支持4*16bit 3200MHz的满血LPDDR5内存。

我们通过对比小米11(骁龙888)和小米10 Ultra(骁龙865),可以看到骁龙888在GeekBench和RAR的单核测试上,给出了安卓阵营多年没出现过的25%单核性能提升。高通更在乎持续输出,所以在频率设定上相对保守,多核提升在11%-18%之间。

在安卓阵营,单核性能一直没有得到应有的重视。但实际上,在当今的情况下,提升单核性能的效果和“性价比”都明显更高,会更加影响应用加载、切换、超大型游戏的体验。

对比需要深度优化的多核性能,单核性能的影响简单直接。在应对很多(其实是大部分)多线程优化不佳的日常APP和游戏时,单核性能的提升效果远高于多核性能。游戏中大量的游戏画面元素、移动、NPC动作等,都需要CPU运算后再交给GPU。而《原神》等跨平台的大型游戏的出现,让移动端的CPU压力空前绝后。

强大的单核性能,除了降低开发人员的压力,还无需额外优化就能直接提升大部分应用的基础使用体验。但在功耗敏感的移动端,无法像PC端那样提升频率,所以超大核的出现是必然的。

反映到这一代旗舰手机的基础体验,骁龙888单核25%的提升,即便是出厂MIUI 12.0系统,依然让小米11的系统操作出奇地流畅。监控频率可以看到发现,骁龙888的X1调度比较积极。

小米11在微博、贴吧、淘宝这些传统“巨型”APP的流畅度都上了一个台阶。应用开启、应用多开、切换等多种场景的感知,都出乎预料地明显。这时候再回来看,2.3倍的芯片面积,仿佛又显得有“性价比”了。

GPU方面,高通Adreno系列在安卓阵营独孤求败了很多年,在骁龙888上又带来了高通GPU史上最大的性能提升。840MHz的Adreno 660,性能提升35%,能效比提升20%,且性能和能效比的提升能同时实现。

同样使用小米11(骁龙888)和小米10 Ultra(骁龙865)对比参考,低压力场景的提升在27%到35%左右,提升最大的是3D Mark的Wild Life大压力测试,幅度达到53%,Vulkan模式下的GFXBench Aztec场景也有43%的提升。

而骁龙865的Adreno 650,就算超频到905MHz,GFX曼哈顿场景也“只有”110fps(默频骁龙865是90fps)。但骁龙888的Adreno 660,在840MHz就已经有118fps,部分用户都跑到125fps以上了。骁龙888 GPU的同频性能,依然比超频到905MHz Adreno 650高15%以上。

性能之外,骁龙888还有隐藏技能。Adreno 660是首个在移动端引入可变速率阴影(VRS)技术的GPU。VRS是桌面平台刚上的新增特性,能在VR/XR等场景中,降低非注视区域的着色精度,大大降低GPU的压力。在VR/AR还在构建发展的阶段,看到高通积极地提供相关特性,无论是游戏厂商还是用户,大家都是非常欢迎的。

第六代AI引擎:60%的算力提升

和其他芯片厂商不同,在CPU、GPU和调制解调器之外,高通每年都会“花很多笔墨”聊Hexagon DSP。而高通的AI构架,也是各个厂商中最特殊的。从AI部分的提升,能看到高通在方向和策略上的考量,以及未来一年移动AI的发展趋势。

遥想2017年,主流旗舰只有0.6TOPS的AI算力,独立的NPU也才2TOPS不到。但后来从骁龙855的7TOPS,到骁龙865的15TOPS,再到骁龙888的26TOPS,移动端对AI算力的渴求依然见不到尽头。

和常见的独立NPU不同,高通是CPU+GPU+DSP等多部件的异构AI,宣称可以比独立的DSP+机器学习推理引擎方案,提供更高的性能和灵活性。而当中的Hexagon 780,其实是骁龙888上提升最大的部分。

以前Hexagon 600系列中的标量,张量(Hexagon Tensor Accelerator,HTA)和向量(Hexagon Vector eXtensions,HVX)功能,在Hexagon 780被融合在一起,成为一个整体式IP。

融合后,不同执行引擎间的工作负载切换时间也更短,性能和能效都提升巨大,标量执行能力提高了50%,张量执行吞吐量直接翻倍翻。SRAM增加16倍后,狂涨的内存池,能运行更大的机器学习推理模型。

几乎推倒重构的构架,配合X1超大核2倍的机器学习性能和暴涨的浮点性能、AI性能提升43%的Adreno 660,每瓦性能提升3倍的Hexagon 780,让骁龙888可以提供远高于前代的26TOPS算力。

在机器学习基准测试MLPerf中,骁龙888的性能最高提升4倍,远超IP块在执行单元的理论计算吞吐量改进(新内存体系的优势?)

夸张的AI性能,有什么用呢?高通技术公司产品管理副总裁Ziad Asghar提到,AI性能大幅提升的主要来自客户的需求。现在移动AI一大部分应用场景都是图像处理,是近年来手机拍照水平突飞猛进的重要原因之一。

虽然被吹得很玄学,但移动AI可笼统理解为“为各种AI算法设计的硬件加速器”。而这些AI算法,早就应用到拍照(成像处理、拍照辅助、图像识别等)、语音通话降噪、语音识别、翻译、人脸解锁、手写识别、游戏和XR体验支持等大量领域。

高通的异构AI设定,是高通移动平台“关注均衡和功耗的设计思路”的产物。在骁龙865首次集成的传感器中枢,也已经升级到第二代,并集成性能提升5倍,但功耗不到1毫安的专用低功耗AI处理器。后者可以提供低功耗的全天候AI待命能力,并分担Hexagon 780 80%的工作负载。

其在“Ok,Google”侦测算法上,可以降低38%的负载,并为陀螺仪、麦克风等需要全天候实时收集数据的传感器,提供更多的可能性(已被用在汽笛声、婴儿哭声的低功耗监测等场景上)。

计算摄影:AI+拍照

AI是“计算摄影”的基础,小米11发布会重点说的夜景视频拍摄和众多拍照提升,背后是骁龙888全新的三ISP和Hexagon 780。

在小米11上,除了骁龙865时代就有的AI换天功能,现在夜景模式也能用来拍摄视频,大幅提升夜景视频的画面亮度和降噪表现。夜景视频可理解为每秒拍摄超过24张超级夜景照片,是ISP和AI算力暴力提升的直接效果。

在拍照过程中,AI也负责提供非常基础的HDR+硬件加速能力,能进行画面降噪、重新着色、自动校色(让色彩表现更加真实或更加吸引眼球)等操作。像把单摄玩出花的Google,就已经依靠AI,提供了背景虚化、全景、Motion动图(类似iOS平台的Live Photo)、AR实时追踪贴图、超分辨率放大、超级夜景等多种功能。

除了效果提升,也有很多是关于拍照易用性和趣味性的提升。例如骁龙888融合AI的3A算法,能提高对焦速度。虹软基于Spectra 580和第六代高通AI引擎推出“傻瓜相机”功能,可以自动跟踪人物,自动进行画面缩放变焦等。

在高通AI Engine的支持下,骁龙888可以做到4K 30FPS的实时背景抠图,CV-ISP硬件计算视觉加速器也能提供60fps实时景深识别的人像、背景分割和替换,人体追踪、物体识别/追踪的效果。

而相同CMOS、同样是MIUI的小米11和小米10 Pro,是非常适合用来对比ISP和AI对拍照影响的样本。得益于骁龙888的ISP和AI性能,小米11,不论取景框预览画面、1亿像素模式、HDR、夜景等多帧合成场景,画面的高光压制、鬼影、伪像、颜色还原等部分,都有明显提升。

总结:安卓阵营大跨越的一年

这是小米多年来,首次在1年内发布两台数字系列旗舰,骁龙888机型的量产时间远比以前早,为下一代产品留下了充足的准备时间,不禁让人猜想,高通是不是在憋着什么大招。

高通做的是SoC移动平台,在他们眼中,除了绝对性能,均衡也是核心指标。骁龙888在CPU单核性能和GPU性能上的提升,直接抬升了安卓旗舰日常操作的流畅度,以及应对跨平台大型游戏的能力。而AI和DSP的倍数级提升、传感器中枢上的低功耗AI处理器,则成了高通新的护城河。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20389

    浏览量

    255673
  • 高通
    +关注

    关注

    78

    文章

    7764

    浏览量

    200617
  • 手机
    +关注

    关注

    36

    文章

    7010

    浏览量

    161289
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11378

    浏览量

    226477
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深入解析MCF532x ColdFire微处理器特性、设计考量与应用前景

    深入解析MCF532x ColdFire微处理器特性、设计考量与应用前景 在电子工程领域,微处理器宛如“大脑”,主宰着各类电子设备的运行。今天要和大家聊的就是Freescale
    的头像 发表于 04-09 16:55 356次阅读

    深入解析MCF5275集成微处理器家族硬件特性

    深入解析MCF5275集成微处理器家族硬件特性 在当今的电子设计领域,高性能、高集成度的微处理器是众多项目的核心。Freescale Semiconductor的MCF5275集成微
    的头像 发表于 04-09 16:45 260次阅读

    深入解析MCF5271集成微处理器硬件特性与设计要点

    深入解析MCF5271集成微处理器硬件特性与设计要点 在电子工程领域,微处理器是众多系统的核心组件,其性能和特性直接影响着整个系统的表现。今
    的头像 发表于 04-09 16:30 283次阅读

    MPLAB® ICE 2000处理器模块与设备适配器技术详解

    MPLAB® ICE 2000处理器模块与设备适配器技术详解 在嵌入式开发领域,调试工具的性能和功能对项目的成功至关重要。MPLAB ICE 2000作为一款强大的调试工具,其处理器模块和设备适配器
    的头像 发表于 04-07 14:45 389次阅读

    探秘Neuron® 5000处理器:LONWORKS控制网络的新利器

    探秘Neuron® 5000处理器:LONWORKS控制网络的新利器 在电子工程师的世界里,寻找高性能、低成本的解决方案一直是我们不懈追求的目标。今天,就让我们一起深入了解Neuron® 5000
    的头像 发表于 03-28 09:05 355次阅读

    深入剖析ADSP - BF534/ADSP - BF536/ADSP - BF537处理器特性、架构与应用全解析

    深入剖析ADSP - BF534/ADSP - BF536/ADSP - BF537处理器特性、架构与应用全解析 在嵌入式系统的广阔领域中,处理器的性能与
    的头像 发表于 03-23 17:15 1021次阅读

    ADSP-21593/21594/ADSP-SC592/SC594处理器:高性能与多功能的完美融合

    ADSP-21593/21594/ADSP-SC592/SC594处理器:高性能与多功能的完美融合 在当今的电子设计领域,对于高性能、多功能处理器的需求日益增长。ADSP-21593/21594
    的头像 发表于 03-23 16:50 759次阅读

    高性能音频处理利器:ADSP - 21477/ADSP - 21478/ADSP - 21479处理器深度解析

    高性能音频处理利器:ADSP - 21477/ADSP - 21478/ADSP - 21479处理器深度解析 在当今的电子技术领域,高性能音频处理一直是一个备受关注的方向。而ADI公
    的头像 发表于 03-23 16:45 841次阅读

    ADAU1701音频处理器:功能特性与设计应用解析

    ADAU1701音频处理器:功能特性与设计应用解析 在音频处理领域,高性能、多功能的音频处理器是实现高品质音频效果的关键。ADAU1701作
    的头像 发表于 03-23 16:05 462次阅读

    SMJ320C80数字信号处理器:架构、特性与应用全解析

    SMJ320C80数字信号处理器:架构、特性与应用全解析 在当今数字化的时代,数字信号处理器(DSP)在众多领域中发挥着至关重要的作用。SMJ320C80作为一款高性能的单芯片并行
    的头像 发表于 03-06 16:55 1202次阅读

    海光3350处理器能被广泛应用的原因

    集特海光3350工控主板GM7-5601配置了1颗海光3350处理器、8核16线程设计,2根DDR4内存插槽,最大支持64GB、4个千兆网口、板载网络控制、10个USB接口、10个COM接口。支持统信UOS、麒麟、Windows、中科方德等国产操作系统。
    的头像 发表于 01-09 16:22 1115次阅读
    海光3350<b class='flag-5'>处理器</b>能被广泛应用的原因

    Texas Instruments DRA821x Jacinto™ 64位处理器技术解析

    Texas Instruments DRA821x Jacinto™ 64位处理器基于ARM®v8架构,并为带有云连接性的网关系统进行了优化。片上系统 (SoC) 设计通过集成降低了系统级成本
    的头像 发表于 08-28 11:33 1392次阅读
    Texas Instruments DRA821x Jacinto™ 64位<b class='flag-5'>处理器</b>技术<b class='flag-5'>解析</b>

    德州仪器AM68x Jacinto 8处理器技术解析

    Texas Instruments AM68x 64位Jacinto™ 8 TOPS Vision SoC处理器是一款基于Eval Jacinto 7架构的可扩展处理器。该系列面向智能视觉摄像机
    的头像 发表于 08-27 15:08 1487次阅读
    德州仪器AM68x Jacinto 8<b class='flag-5'>处理器</b>技术<b class='flag-5'>解析</b>

    国产信创工业计算机海光3350处理器集特IPC-660工控机

    国产信创新标杆:集特IPC-660工控机搭载海光3350赋能工业自主化在工业4.0与信创国产化双轨并行的时代,海光3350处理器凭借自主可控的x86架构与工业级高性能,正成为关键基础设施的核心算力
    的头像 发表于 06-24 15:32 3430次阅读
    国产信创工业计算机海光3350<b class='flag-5'>处理器</b>集特IPC-660工控机

    搭载兆芯开先KX-7000处理器的华清同创OPS-C计算模块发布

    华清同创公司近日推出新款OPS-C计算模块,产品全面升级,搭载兆芯开先KX-7000处理器,适配国内操作系统,加上支持集显/独显、WiFi、多USB等特性,可为智慧课堂、远程会议等应用带来更加优越的体验和可靠支撑。
    的头像 发表于 06-09 10:07 1497次阅读