0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为最强自研NPU问世!麒麟810“抛弃”寒武纪

WpOh_rgznai100 来源:YXQ 2019-06-22 12:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“能效高、算子多、精度高”,华为消费者业务手机产品线总裁何刚用一句话总结了自研达芬奇架构给最新麒麟810芯片带来的变化。

6 月 21 日,在 HUAWEI Nova 5 系列新品发布会上,最大的亮点之一当属华为发布的麒麟 810 全新人工智能手机芯片,这是首款采用华为自研达芬奇架构的手机 AI 芯片。

去年 10 月,华为推出达芬奇架构的云端 AI 芯片昇腾 Ascend 910 和昇腾 Ascend 310 后,首次将达芬奇架构落地至终端芯片的 NPU,同时这也意味着,他们在 NPU 中抛弃了寒武纪 IP。

最新的麒麟 810 了采用业界最先进的 7nm 工艺制程,相比 8nm 工艺,能效提升 20%,晶体管密度提升 50%,这让它成为目前全球第三款采用该尖端工艺的手机 SoC 芯片,也是华为继麒麟980 之后推出的第二款 7nm 手机 SoC 芯片。

近年来,随着端侧AI高速发展,手机厂商对芯片的适配性和灵活性提出更高要求,而华为对此的探索处于一路领跑状态。

2017年,以麒麟 970 为代表的芯片首次采用独立NPU神经网络处理单元,业内也开始探索端侧人工智能应用。2018 年,麒麟 980 采用双核 NPU,进一步提升了端侧 AI 算力,带来 AI 人像留色、卡路里识别等丰富的 AI 应用。

此次,最新麒麟 810 再次领跑业界,首度采用华为自研达芬奇计算架构,再度提升端侧 AI 的性能,并且首次将旗舰级的 AI 性能在中高端手机中落地。

达芬奇架构是华为在 2018 年推出的全新自研AI计算架构,针对 AI 计算特点进行设计。不同于以往的二维运算模式,达芬奇架构以高性能 3D Cube 计算引擎为基础,针对矩阵运算进行加速,大幅提高单位面积下的AI算力,激发端侧 AI 的运算潜能。另外,麒麟 810 芯片具有端侧能效业界最优的 AI 运算单元。

根据 ETH Benchmark 测试,麒麟 810 NPU跑分 32280 分,远超骁龙 710(6556 分)、骁龙730(13908 分)和骁龙 855(25428 分)。

对于麒麟 810 搭载华为自研的达芬奇架构,最直接的受害者是寒武纪,因为麒麟 970 第一代的 NPU 用的是寒武纪架构,但实际上,华为要在手机 AI 芯片搭载自研架构早在意料之中,只是很多人可能没想到落地速度来得如此之快。正如徐直军此前所说,“寒武纪的(IP)也很好,但是它无法支持我们的全场景,我们需要从云、到端、到物联网终端的人工智能设备,因此我们要创造性地打造一款新的架构。而达芬奇架构能够解决极致的功耗与极致的算力需求。”

按照这个势头,麒麟 810 应该只是开始,我们有理由相信,无论是 600 系列还是 900 系列,未来也会很快走向全定制化架构,华为移动计算生态将进一步扩大

以下从 CPUGPU,拍照和通信方面的变化介绍麒麟 810 芯片:

CPU 方面,麒麟 810 采用全新系统级 AI 调频调度技术,2+6 大小核架构,即搭载两个基于Cortex-A76开发商用的大核,针对移动终端的使用场景进行深度优化,以及六个 Cortex-A55 小核实现能效升级。

据华为方面介绍,麒麟 810 全新 2+6 能效架构将提供更加精准的调度层次,让 CPU在 游戏、购物等重载场景,以及社交、浏览网页等轻载场景下灵活适配,大大降低 CPU 在实际应用场景中的功耗,实现更持久的续航和更流畅的操作体验。

GPU 则升级到 Mali-G52 定制,支持 Kirin Gaming+ 技术,游戏实力全面升级,通过系统级 AI 调频调度技术、60fps 高性能及 HD 画质和 GPU 负载优化全面升级游戏体验。

具体而言,AI 调频调度技术能够实时学习帧率、流畅度和触屏输入变化,预测手机任务负载,动态感知手机使用过程中存在的性能瓶颈,及时进行调频调度,预测准确性比传统预测方法提升 30% 以上;GPU 的系列优化技术,可减少重复指令及 GPU 过载,并加快 CPU、GPU 和内存之间的数据传输速度;HD 游戏特效优化可以提升游戏画质、清晰度、明暗对比度等,带给游戏玩家更接近真实世界的游戏体验。

拍照方面,麒麟 810 集成细节增强(DE)模块,支持最新一代自动白平衡算法(AWB)和 AR特征点云计算加速,ISP 性能和算法双提升,这将解决夜景照片出现的噪点和过曝问题,提升画面的细节处理能力和降噪效果。

通信方面,麒麟 810 延续旗舰芯片的通信能力,支持双卡双 VoLTE,让手机的双卡同时保持 4G 在线,将有效防御伪基站的骚扰,有效降低手机信号回落至 2G 网络的风险。

此外,麒麟 810 推出自研中间算子格式,算子数量多达 240+,支持Tensor, Vector, Scalar,更多算子、开源框架的支持以及提供更加完备的工具链将助力开发者快速转换集成基于不同AI框架开发出的模型,大幅增强华为 HiAI 的兼容性,易用性,以加速更多 AI 应用落地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    36312

    浏览量

    263034
  • 麒麟处理器
    +关注

    关注

    2

    文章

    83

    浏览量

    9356

原文标题:华为最强自研NPU问世,麒麟810“抛弃”寒武纪

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里放大招:AI芯片100%国产,不用台积电代工

    电子发烧友网报道(文 / 吴子鹏)8 月 31 日晚间,有消息称阿里云通义千问大模型面临算力缺口,阿里紧急追加寒武纪思元 370 芯片订单至 15 万片。然而,该消息随后不久便被阿里云相关人士辟谣
    的头像 发表于 09-03 09:17 1.2w次阅读

    寒武纪Day 0适配商汤科技日日新SenseNova U1系列大模型

    近日,在商汤科技发布日日新 SenseNova U1 系列原生理解生成统一模型当日,寒武纪已完成对 SenseNova U1 的适配。
    的头像 发表于 05-07 12:38 449次阅读

    业绩大爆发!寒武纪Q1财报发布,国产AI芯片的历史性拐点?

    电子发烧友网综合报道  4月29日晚间,寒武纪发布2026 年一季度财报,业绩迎来历史性爆发——寒武纪发布公告称,2026年第一季度实现营业收入28.85亿元,同比增长159.56%;归属于上市公司
    的头像 发表于 05-06 09:14 2253次阅读

    寒武纪Day 0适配DeepSeek-V4模型

    代码已开源到GitHub社区(点击文末“阅读原文”可直接跳转)。这一成果得益于寒武纪长期积累的 NeuWare 软件生态与芯片设计技术,也是寒武纪对芯片与算法联合创新持续投入的延续
    的头像 发表于 04-29 10:14 499次阅读

    寒武纪2025年报解读:AI芯片的机遇与隐忧 营收64.97亿,同比暴涨453.21%

    寒武纪此前发布的年报数据显示,在2025年寒武纪营业收入达到64.97亿元,同比增长453.21%。寒武纪在年报中表示,报告期内业绩增长,主要系受益于人工智能行业算力需求的持续攀升,凭借产品的优异
    的头像 发表于 04-22 11:49 1965次阅读

    AI芯片企业赚疯了?寒武纪营收暴涨453.21%,沐曦推理GPU销量大增866.02%

    电子发烧友网报道(文/李弯弯)近期,多家AI芯片企业发布2025年年度报告,包括寒武纪、海光信息、沐曦股份、天数智芯等,多家企业实现营业收入大幅增长。如寒武纪营业收入同比激增453.21%;沐曦股份
    的头像 发表于 04-11 07:31 1.2w次阅读

    寒武纪去年营收增长超400% 净利润20.59亿同比扭亏 寒武纪首个盈利年度

    AI芯片厂商寒武纪传来好消息,寒武纪去年营收增长超400% ;据寒武纪2025年年报显示;25年营收达到64.97亿元,同比增加453.21%,净利润20.59亿元,同比扭亏。该公司迎来上市以来首个
    的头像 发表于 03-13 11:49 1811次阅读

    寒武纪实现对GLM-5的Day 0适配

    2026年2月11日,寒武纪已基于 vLLM 推理框架同步实现对智谱最新开源旗舰模型  GLM-5 的适配。寒武纪一直高度重视大模型软件生态建设,借助于成熟的 Neuware 软件
    的头像 发表于 02-12 15:07 1043次阅读

    寒武纪引领AI芯片软件新生态

    寒武纪成立的初衷是为“人工智能的大爆发”提供底层算力支持,不仅要硬件算力强大,更要软件通用、易用。多年来,寒武纪坚持训练推理融合、统一的基础软件平台研发策略,构建从芯片架构到高性能
    的头像 发表于 11-06 11:23 1748次阅读
    <b class='flag-5'>寒武纪</b>引领AI芯片软件新生态

    商汤科技与寒武纪达成战略合作

    近日,商汤科技与中科寒武纪科技股份有限公司(以下简称“寒武纪”)签署面向新发展阶段的战略合作协议,重点推进软硬件的联合优化,并共同构建开放共赢的产业生态。
    的头像 发表于 10-15 17:54 978次阅读

    寒武纪成功适配DeepSeek-V3.2-Exp模型

    2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。代码地址和测试步骤见文末,开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。
    的头像 发表于 10-11 17:14 2011次阅读
    <b class='flag-5'>寒武纪</b>成功适配DeepSeek-V3.2-Exp模型

    寒武纪股价破1200大关创历史新高 DeepSeek适配国产芯片成直接原因

    算力市占率均居第一,这家公司的MLU架构与软件栈深度耦合,奠定了国产替代核心底座,被视作挑战英伟达的唯一本土力量。 除了寒武纪之外,海光信息、中芯国际、盛美上海这些半导体个股今天也出现了不同程度的大幅度上涨。以最终收盘的股价
    的头像 发表于 08-26 13:54 1284次阅读
    <b class='flag-5'>寒武纪</b>股价破1200大关创历史新高 DeepSeek适配国产芯片成直接原因

    寒武纪85后创始人陈天石身价超1500亿

    在3月份胡润研究院发布的《2025胡润全球富豪榜》上,寒武纪创始人陈天石以870亿元人民币身家位列第195位。现在在资本的追逐下,寒武纪85后创始人陈天石身价超1500亿。 近日,在英伟达暂停H20
    的头像 发表于 08-26 10:37 7255次阅读

    商汤大装置算力Mall重磅发布

    近日,商汤科技联合华为、库帕思、海光、寒武纪、曦望Sunrise、壁仞科技、麒麟软件、摩尔线程等十余家国产生态伙伴,共同发布“商汤大装置算力Mall”。
    的头像 发表于 08-05 10:05 1365次阅读

    寒武纪联手阶跃星辰成立模芯生态创新联盟

    近日,阶跃星辰发布了新一代基础大模型Step 3。Step 3兼顾智能与效率,通过模型和系统联合创新,实现了行业前列的推理解码效率,将于7月31日面向全球企业和开发者开源。目前,寒武纪已初步实现对Step 3的支持。
    的头像 发表于 07-31 11:26 1382次阅读