0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为7nm麒麟810处理器发布 AI能力强于高通骁龙855

BFv1_robovideo 来源:yxw 2019-06-24 08:50 次阅读

华为近日在武汉召开新品发布会,正式推出次旗舰nova 5系列新品手机。在此次发布会上,华为终端手机产品线总裁何刚公布了全新麒麟芯片:麒麟810。

官方介绍,它采用全新自研华为达芬奇架构NPU,AI跑分高达32280分,超过了高通骁龙855和骁龙730。

不仅如此,麒麟810采用旗舰级A76大核,它由2个高性能大核(Cortex A76)+6个高能效小核组合(Cortex A55),CPU主频2.27GHz,GPU为Mali-G52。

这也是继去年,华为推出达芬奇架构的云端AI芯片昇腾Ascend 910和昇腾Ascend 310后,首次将达芬奇架构落地于终端芯片的NPU。

业界最领先的台积电7nm工艺

麒麟810采用与麒麟980、苹果A12、骁龙855相同的7nm制程半导体工艺,成为世界上第4款基于7nm工艺的手机SoC。

工艺制程即半导体的制造工艺,它直接影响芯片的性能和功耗。先进工艺意味着更高的晶体管密度、更快的速度,同时漏电率更低、能效比更高。

与10nm工艺相比,7nm工艺晶体管密度提升64%、能效提升28%。

与8nm工艺相比,7nm工艺晶体管密度提升50%,能效提升20%。

然而顶级工艺并不便宜,7nm背后是高昂的流片成本。

麒麟810的出现打破了旗舰芯片对先进工艺的垄断,首次在中端市场商用7nm制程,其底气在于华为终端强大的铺货能力。尽管流片成本高,但是芯片越走量,边际成本越低。

如果说麒麟970创造了另类成功,那么麒麟810则已拨云见日。旗舰芯片位于金字塔尖,技术顶尖但出货量少,麒麟810则瞄准中端腰部市场,用海量出货化解7nm带来的额外成本,对于产品上市窗口、价格分区具有里程碑意义。

全新华为达芬奇架构NPU

在手机AI领域,华为手机是第一个吃螃蟹的勇士。早在麒麟970时代,华为对于AI的预判有两点:一是端侧AI应用场景将会越来越多,二是需要AI专用处理单元。

这两点预判成为了现实,如今已落地的AI用例有场景识别、识图购物、AI美体、AI人像留色、主角故事集、卡路里识别等等,并且NPU(神经网络单元)也已成为主流。

事实上所有运算都能由通用处理单元CPU计算,为什么还要有独立的专用处理单元NPU?这是因为不同处理器适用于不同数据类型,性能与效率各不相同,需要对症下药。

1D数据,如指令、逻辑运算,最适合CPU计算;

2D数据,图形渲染,最适合GPU计算;

3D数据,Tensor(张量)运算,最适合NPU计算。

神经网络运算数据为3D格式,需要处理单元的创新。NPU在处理AI任务时,性能和能效远高于CPU和GPU。麒麟810另一大亮点便是首次采用自研达芬奇架构NPU。

达芬奇架构是华为在2018年推出的全新自研AI计算架构,针对AI计算特点进行设计。不同于以往的二维运算模式,达芬奇架构以高性能3D Cube计算引擎为基础,针对矩阵运算进行加速,大幅提高单位功耗下的AI算力,充分激发端侧AI的运算潜能。

麒麟810支持Tensor(张量)、Vector(矢量)、Scalar(标量)三种计算单元,Int8精度保留更高,具有业界最优端侧能效(6Tops/W),支持240+算子。全球已有1600+合作伙伴、570000+开发者加入应用生态。

安卓最高性能A76大核

麒麟810采用与麒麟980、骁龙855相同的CPU核心,包含2颗基于A76定制的高性能大核心、6颗A55高能效小核。创新的“2+6”大小核搭配能够根据不同应用进行灵活的CPU资源调配,达到优化系统能耗的目的。

多任务并发、APP启动时调用全部2颗大核、6颗小核。

重负载游戏、拍照时调用2颗大核、4颗小核。

稍低负载的任务,如电子书、浏览器、在线短视频只调用1颗大核心、若干小核心。

轻量级任务,音乐、视频本地播放、导航、通话则只调用若干小核心。

根据Arm公布的CPU发展线路图,A76是目前已商用的安卓最高性能CPU核心,7nm工艺下A76性能可比肩14nm工艺的Intel i5-7300U。

相比骁龙730,麒麟810在CPU单核、多核性能上双双实现超越。

GPU性能首次超越骁龙730

麒麟810的图形处理单元采用Mali-G52 GPU MP6,在GFX Bench 5.0测试项1080P Manhattan Off-screen ES 3.0中,麒麟810以55fps的成绩超越骁龙730(38fps),达到后者1.44倍性能。这也是麒麟芯片首次在图形性能上超越同期的高通处理器。

Mali-G52基于Bifrost架构的第二款GPU,采用了全新设计的执行引擎,每个执行引擎线程的数量增加了一倍,使所有复杂内容的计算性能提高一倍,但尺寸仅增加了22%。

与上一代Mali-G51相比,Mali-G52性能密度提高30%,能效提高15%,机器学习性能是前者的3.6倍。

麒麟810还支持麒麟Gaming+技术,包括系统级AI调频调度、GPU底层驱动升级及GPU负载优化、HD游戏特效优化。

旗舰级的影像处理能力

麒麟810采用领先的第四代自研ISP,着重优化夜景降噪、景深虚化等场景,令华为nova 5拥有旗舰级拍照品质。

为了解决夜景照片的噪点和过曝问题,麒麟810提升了自研ISP的像素吞吐率,并集成DE降噪模块,通过rawnf和yuvnf分级架构及最新融合技术,增强画面的细节处理能力和降噪效果,让夜景大片触手可及。

在拍摄景物及人像场景下,麒麟810集成DMAP模块,有效提升大光圈虚化效果,让照片主体更加突出,与背景画面分割更加自然。

算法方面,麒麟810的ISP处理能力提升高达100%,在AI物体检测及运动抓拍场景下,抓拍更加精准、清晰,实现“所见即所得”的拍照效果。

总结

“达芬奇计划”从去年曝光以来,一年的时间里,华为已经推出了云端AI芯片昇腾Ascend 910、昇腾Ascend 310以及高端手机AI芯片麒麟810三款。达芬奇架构的芯片产品线也从云端向着终端再下一城,第一次被从云端AI芯片引入了手机AI芯片。

而今天,华为首次发布其中、高、旗舰系列的手机AI芯片,并且宣布了第二款自研7nm芯片麒麟810,使得它成为迄今为止全球唯一一家拥有2枚7nm芯片的手机厂商

麒麟810不仅在CPU、GPU实现对骁龙730的全面超越,7nm工艺制程、自研达芬奇架构NPU、自研第四代ISP更是媲美骁龙855。

麒麟810真正吹响中端芯片崛起的号角,为海量的腰部机型量身定制,并带来越级的用户体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18202

    浏览量

    221926
  • 高通
    +关注

    关注

    76

    文章

    7147

    浏览量

    187787
  • 华为
    +关注

    关注

    215

    文章

    33560

    浏览量

    247027
  • AI
    AI
    +关注

    关注

    87

    文章

    26338

    浏览量

    263943

原文标题:[机器人频道|大事记]华为7nm麒麟810处理器发布 AI能力强于高通骁龙855

文章出处:【微信号:robovideo,微信公众号:机器人频道】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    2024年全球与中国7nm智能座舱芯片行业总体规模、主要企业国内外市场占有率及排名

    7nm智能座舱芯片行业生产模式 图 55:7nm智能座舱芯片行业销售模式分析 ▲资料来源:辰宇信息咨询整理,更多资料请参考辰宇信息咨询发布的《2024-2030全球及中国7nm智能座
    发表于 03-16 14:52

    华为手机麒麟芯片有哪些型号?

    ,主要应用在华为Mate20系列手机上。 麒麟810:全球首款采用台积电第二代7nm工艺的SoC,于2019年6月发布,主要应用在
    的头像 发表于 10-16 14:35 4281次阅读

    华为海思麒麟9000s是处于什么水平的处理器

      华为海思麒麟9000s是一款旗舰级处理器,采用了5nm工艺制程,是目前华为公司最强大的芯片之一。该芯片主要应用于
    发表于 08-31 09:34

    麒麟9000s相当于骁龙多少 和骁龙多少处理器相当

    麒麟9000s相当于骁龙多少呢? 官方宣称,该处理器不仅有着强大的计算能力,而且还具备较高的图像处理和人工智能计算能力。在外观上,
    的头像 发表于 08-30 15:16 5.5w次阅读

    麒麟9000什么时候发布的 和麒麟9000s区别

    华为作为国内品牌,其手机麒麟系列早就有了良好口碑,接下来,我们主要了解一下麒麟9000什么时候发布的和麒麟9000s区别。 首先,就来看一下
    的头像 发表于 08-30 15:04 8044次阅读

    ARM Cortex-M33处理器数据表

    ARM Cortex-M33处理器是第一款ARMv8-M处理器,旨在满足嵌入式和物联网市场,特别是那些需要高效安全或数字信号控制的市场。 ARMv8-M引入了TrustZone,这构成了嵌入式和物
    发表于 08-28 06:12

    Arm Cortex-M55处理器数据集

    能力的Cortex-M处理器,提供增强的、高能效的数字信号处理(DSP)和机器学习(ML)性能。 Cortex-M55处理器实现了标量和向量运算的
    发表于 08-25 07:46

    Arm Cortex-M7处理器产品介绍

    ARM Cortex-M7处理器是Cortex-M系列中性能最高的处理器,可用于设计复杂的MCU和SoC。 Cortex-M7提供业界领先的5.01核心标记/MHz标量性能,同时保持了
    发表于 08-25 06:25

    Arm Cortex-R82处理器技术参考手册

    在本手册中,以下术语指的是下面提供的描述。 核心A核心包括与数据处理单元、存储系统和管理、电源管理以及核心级调试和跟踪逻辑相关的所有逻辑。 在Cortex®-R82处理器环境中,CPU和内核可以互换
    发表于 08-17 08:02

    ARM Cortex-M7处理器参考手册

    Cortex-M7处理器是一款高效、高性能的嵌入式处理器,具有低中断延迟、低成本调试的特点,并具有与现有Cortex-M Profile处理器的向后兼容性。 该
    发表于 08-17 07:55

    Arm Cortex-R82处理器技术参考手册

    Cortex®-R82处理器是一款中等性能的多核有序超标量处理器,适用于实时嵌入式应用。 Cortex®-R82处理器采用ARM®V8-R AArch64架构。 ARM®V8-R AArch64
    发表于 08-17 07:45

    ARM Cortex-M85处理器软件优化指南

    体系结构功能。 该设计侧重于数字信号处理(DSP)和机器学习等计算应用。Cortex®-M85处理器能效,在保持低功耗的同时,实现了标量和矢量运算的计算性能。
    发表于 08-10 07:43

    ARM Cortex-M85处理器技术参考手册

    功能。 设计的重点是计算机应用,如数字信号处理(DSP)和机器学习。Cortex®-M85处理器能效,在标量和向量运算中实现计算性能,同时保持低功耗。
    发表于 08-09 07:28

    GAUDIR HL-2000处理器介绍

    和HL-200 PClecard都包含一个GAUDIR HL-2000处理器,该处理器包含一个由八个完全可编程张量处理核心(TPC 2.0)组成的集群。TPC核心是C可编程的,为用户提供了最大的创新灵活性
    发表于 08-04 07:23

    Cortex-A9处理器技术参考手册

    Cortex-A9处理器是一款高性能、低功耗的ARM宏单元,具有L1缓存子系统,可提供完整的虚拟内存功能。Cortex-A9处理器实现ARMv7-A架构,在Jazelle®状态下运行32位ARM指令、16位和32位Thumb®指
    发表于 08-02 16:29