0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为最强自研NPU问世!麒麟810“抛弃”寒武纪

WpOh_rgznai100 来源:YXQ 2019-06-22 12:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“能效高、算子多、精度高”,华为消费者业务手机产品线总裁何刚用一句话总结了自研达芬奇架构给最新麒麟810芯片带来的变化。

6 月 21 日,在 HUAWEI Nova 5 系列新品发布会上,最大的亮点之一当属华为发布的麒麟 810 全新人工智能手机芯片,这是首款采用华为自研达芬奇架构的手机 AI 芯片。

去年 10 月,华为推出达芬奇架构的云端 AI 芯片昇腾 Ascend 910 和昇腾 Ascend 310 后,首次将达芬奇架构落地至终端芯片的 NPU,同时这也意味着,他们在 NPU 中抛弃了寒武纪 IP。

最新的麒麟 810 了采用业界最先进的 7nm 工艺制程,相比 8nm 工艺,能效提升 20%,晶体管密度提升 50%,这让它成为目前全球第三款采用该尖端工艺的手机 SoC 芯片,也是华为继麒麟980 之后推出的第二款 7nm 手机 SoC 芯片。

近年来,随着端侧AI高速发展,手机厂商对芯片的适配性和灵活性提出更高要求,而华为对此的探索处于一路领跑状态。

2017年,以麒麟 970 为代表的芯片首次采用独立NPU神经网络处理单元,业内也开始探索端侧人工智能应用。2018 年,麒麟 980 采用双核 NPU,进一步提升了端侧 AI 算力,带来 AI 人像留色、卡路里识别等丰富的 AI 应用。

此次,最新麒麟 810 再次领跑业界,首度采用华为自研达芬奇计算架构,再度提升端侧 AI 的性能,并且首次将旗舰级的 AI 性能在中高端手机中落地。

达芬奇架构是华为在 2018 年推出的全新自研AI计算架构,针对 AI 计算特点进行设计。不同于以往的二维运算模式,达芬奇架构以高性能 3D Cube 计算引擎为基础,针对矩阵运算进行加速,大幅提高单位面积下的AI算力,激发端侧 AI 的运算潜能。另外,麒麟 810 芯片具有端侧能效业界最优的 AI 运算单元。

根据 ETH Benchmark 测试,麒麟 810 NPU跑分 32280 分,远超骁龙 710(6556 分)、骁龙730(13908 分)和骁龙 855(25428 分)。

对于麒麟 810 搭载华为自研的达芬奇架构,最直接的受害者是寒武纪,因为麒麟 970 第一代的 NPU 用的是寒武纪架构,但实际上,华为要在手机 AI 芯片搭载自研架构早在意料之中,只是很多人可能没想到落地速度来得如此之快。正如徐直军此前所说,“寒武纪的(IP)也很好,但是它无法支持我们的全场景,我们需要从云、到端、到物联网终端的人工智能设备,因此我们要创造性地打造一款新的架构。而达芬奇架构能够解决极致的功耗与极致的算力需求。”

按照这个势头,麒麟 810 应该只是开始,我们有理由相信,无论是 600 系列还是 900 系列,未来也会很快走向全定制化架构,华为移动计算生态将进一步扩大

以下从 CPUGPU,拍照和通信方面的变化介绍麒麟 810 芯片:

CPU 方面,麒麟 810 采用全新系统级 AI 调频调度技术,2+6 大小核架构,即搭载两个基于Cortex-A76开发商用的大核,针对移动终端的使用场景进行深度优化,以及六个 Cortex-A55 小核实现能效升级。

据华为方面介绍,麒麟 810 全新 2+6 能效架构将提供更加精准的调度层次,让 CPU在 游戏、购物等重载场景,以及社交、浏览网页等轻载场景下灵活适配,大大降低 CPU 在实际应用场景中的功耗,实现更持久的续航和更流畅的操作体验。

GPU 则升级到 Mali-G52 定制,支持 Kirin Gaming+ 技术,游戏实力全面升级,通过系统级 AI 调频调度技术、60fps 高性能及 HD 画质和 GPU 负载优化全面升级游戏体验。

具体而言,AI 调频调度技术能够实时学习帧率、流畅度和触屏输入变化,预测手机任务负载,动态感知手机使用过程中存在的性能瓶颈,及时进行调频调度,预测准确性比传统预测方法提升 30% 以上;GPU 的系列优化技术,可减少重复指令及 GPU 过载,并加快 CPU、GPU 和内存之间的数据传输速度;HD 游戏特效优化可以提升游戏画质、清晰度、明暗对比度等,带给游戏玩家更接近真实世界的游戏体验。

拍照方面,麒麟 810 集成细节增强(DE)模块,支持最新一代自动白平衡算法(AWB)和 AR特征点云计算加速,ISP 性能和算法双提升,这将解决夜景照片出现的噪点和过曝问题,提升画面的细节处理能力和降噪效果。

通信方面,麒麟 810 延续旗舰芯片的通信能力,支持双卡双 VoLTE,让手机的双卡同时保持 4G 在线,将有效防御伪基站的骚扰,有效降低手机信号回落至 2G 网络的风险。

此外,麒麟 810 推出自研中间算子格式,算子数量多达 240+,支持Tensor, Vector, Scalar,更多算子、开源框架的支持以及提供更加完备的工具链将助力开发者快速转换集成基于不同AI框架开发出的模型,大幅增强华为 HiAI 的兼容性,易用性,以加速更多 AI 应用落地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35782

    浏览量

    260663
  • 麒麟处理器
    +关注

    关注

    2

    文章

    83

    浏览量

    9271

原文标题:华为最强自研NPU问世,麒麟810“抛弃”寒武纪

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里放大招:AI芯片100%国产,不用台积电代工

    电子发烧友网报道(文 / 吴子鹏)8 月 31 日晚间,有消息称阿里云通义千问大模型面临算力缺口,阿里紧急追加寒武纪思元 370 芯片订单至 15 万片。然而,该消息随后不久便被阿里云相关人士辟谣
    的头像 发表于 09-03 09:17 1w次阅读

    寒武纪“炸裂”财报!一季度营收增长40倍,积极备货应对“爆单”?

    电子发烧友网报道(文/梁浩斌)寒武纪,交出一份炸裂财报!在4月18日,寒武纪公布了2024年年报和2025年一季度报告,其中2024年全年营收11.74亿元,同比增长65.56%;亏损4.52亿元
    的头像 发表于 04-22 09:07 2531次阅读
    <b class='flag-5'>寒武纪</b>“炸裂”财报!一季度营收增长40倍,积极备货应对“爆单”?

    寒武纪3000亿市值与GPU厂商密集IPO,AI芯片正是当打之年

      电子发烧友网报道(文/黄晶晶)就在最近,寒武纪市值冲上3000亿元,创造了半导体企业的市值奇迹。2024年1月10日收盘当天寒武纪股价报729.97元,上涨2.48%,市值3047亿元。盘中最
    的头像 发表于 01-20 08:16 4497次阅读
    <b class='flag-5'>寒武纪</b>3000亿市值与GPU厂商密集IPO,AI芯片正是当打之年

    寒武纪引领AI芯片软件新生态

    寒武纪成立的初衷是为“人工智能的大爆发”提供底层算力支持,不仅要硬件算力强大,更要软件通用、易用。多年来,寒武纪坚持训练推理融合、统一的基础软件平台研发策略,构建从芯片架构到高性能
    的头像 发表于 11-06 11:23 713次阅读
    <b class='flag-5'>寒武纪</b>引领AI芯片软件新生态

    商汤科技与寒武纪达成战略合作

    近日,商汤科技与中科寒武纪科技股份有限公司(以下简称“寒武纪”)签署面向新发展阶段的战略合作协议,重点推进软硬件的联合优化,并共同构建开放共赢的产业生态。
    的头像 发表于 10-15 17:54 521次阅读

    寒武纪成功适配DeepSeek-V3.2-Exp模型

    2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。代码地址和测试步骤见文末,开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。
    的头像 发表于 10-11 17:14 1165次阅读
    <b class='flag-5'>寒武纪</b>成功适配DeepSeek-V3.2-Exp模型

    寒武纪股价破1200大关创历史新高 DeepSeek适配国产芯片成直接原因

    算力市占率均居第一,这家公司的MLU架构与软件栈深度耦合,奠定了国产替代核心底座,被视作挑战英伟达的唯一本土力量。 除了寒武纪之外,海光信息、中芯国际、盛美上海这些半导体个股今天也出现了不同程度的大幅度上涨。以最终收盘的股价
    的头像 发表于 08-26 13:54 737次阅读
    <b class='flag-5'>寒武纪</b>股价破1200大关创历史新高 DeepSeek适配国产芯片成直接原因

    寒武纪85后创始人陈天石身价超1500亿

    在3月份胡润研究院发布的《2025胡润全球富豪榜》上,寒武纪创始人陈天石以870亿元人民币身家位列第195位。现在在资本的追逐下,寒武纪85后创始人陈天石身价超1500亿。 近日,在英伟达暂停H20
    的头像 发表于 08-26 10:37 6109次阅读

    商汤大装置算力Mall重磅发布

    近日,商汤科技联合华为、库帕思、海光、寒武纪、曦望Sunrise、壁仞科技、麒麟软件、摩尔线程等十余家国产生态伙伴,共同发布“商汤大装置算力Mall”。
    的头像 发表于 08-05 10:05 795次阅读

    寒武纪联手阶跃星辰成立模芯生态创新联盟

    近日,阶跃星辰发布了新一代基础大模型Step 3。Step 3兼顾智能与效率,通过模型和系统联合创新,实现了行业前列的推理解码效率,将于7月31日面向全球企业和开发者开源。目前,寒武纪已初步实现对Step 3的支持。
    的头像 发表于 07-31 11:26 940次阅读

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推一体AI加速卡,基于寒武纪全新一代思元370芯片,接口为PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标准PCIe加速卡,适用于业内最新的CPU平台,可轻松搭载于最先进的人工智能服务器,快速实现 AI算力的部署。
    的头像 发表于 04-24 17:57 4018次阅读
    <b class='flag-5'>寒武纪</b>基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    寒武纪思元370芯片参数特性详解

    寒武纪首次采用chiplet技术将2颗AI计算芯粒封装为一颗AI芯片,通过不同芯粒组合规格多样化的产品,为用户提供适用不同场景的高性价比AI芯片。
    的头像 发表于 04-24 17:49 4184次阅读
    <b class='flag-5'>寒武纪</b>思元370芯片参数特性详解

    寒武纪一季度营收大涨4230% 净利润3.55亿 扭亏为盈

    4月18日晚间,国产AI芯片龙头寒武纪发布了财务报告,包括有2025年第一季度财务报告和2024年年度财务报告。 在2025年第一季度,寒武纪营收达到11.11亿,同比增长高达4230.22
    的头像 发表于 04-19 14:15 1559次阅读

    寒武纪增资全资子公司上海寒武纪

    ,对上海寒武纪进行增资。 此次增资是基于募投项目的实施进展而做出的决策。寒武纪作为一家在人工智能芯片领域具有领先地位的企业,一直致力于推动相关技术的研发和应用。为了进一步提升公司的竞争力和市场份额,寒武纪不断投入资金进行
    的头像 发表于 02-05 13:44 1498次阅读

    寒武纪发布2024年度业绩预告

    昨日晚间,国内领先的智能芯片设计企业寒武纪发布了其2024年度的业绩预告。据公告显示,公司预计全年营业收入将在10.7亿元至12亿元之间,与去年同期相比,实现了50.83%至69.16%的显著增长
    的头像 发表于 01-15 10:30 1235次阅读