0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

40+TOPS NPU,AI PC处理器开卷算力

花茶晶晶 来源:电子发烧友 作者:黄晶晶 2024-07-14 01:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶)今年初,微软推出引入Copilot功能的全新个人电脑,Copilot作为AI语音助手被确定为AI PC不可或缺的按键以及功能,它能够在不需要云数据中心的情况下处理本地的人工智能任务。同时,微软还提出,这款全新电脑搭配拥有全新神经处理单元NPU的芯片,可实现每秒超过40万亿次即40+TOPS的运算。那么也就是说,若要符合微软给出的AI PC的定义,NPU的算力至少要达到40 TOPS。

这一定义的抛出,突显了NPU的重要性。半导体大厂们普遍认为CPU+GPU+NPU的组合将是AI PC的算力基座。

《AI PC产业白皮书》中指出AI PC五大特性,包括提供多模态自然语言交互、终端内嵌个人的大模型、标配本地混合AI算力、连接开放的AI应用生态、设备级个人数据和隐私安全保护。尤其是本地混合AI算力,即CPU+GPU+NPU异构混合算力保证了AIPC本地推理的可行性,同时随着端侧算力的快速提升,AIPC可以承载更大的AI模型,执行更加复杂的任务。

在分工上,CPU是计算机的运算核心和控制核心,GPU进行图形处理和大规模并发计算,NPU提供高效能和低功耗的神经网络运算支持,在多种应用场景中实用智能计算。三者的组合发挥各自的优势,协同工作,高效实现端侧AI的能力。

不过,当前来看NPU别说是多少算力的问题,甚至很多设备都还没有NPU。以安卓平台来看,目前70%的第三方 ML/AI 应用运行在CPU上,特别是一些低级别设备很难承担NPU的费用,CPU+GPU+NPU的组合或许要从高端设备开始。

AI PC的演进过程中,《白皮书》指出应分为AIReady阶段和AIOn阶段。在AIReady阶段,AIPC主要表现为芯片计算架构的升级,具备基本的本地混合AI算力,能够为AIPC的软件及服务创新提供基本保障,开启体验创新。

如今,NPU以及高算力NPU的导入已经开始。英特尔AMD、苹果、高通等厂商纷纷推出了带有NPU的处理器产品,不少新产品的NPU算力都达到40 TOPS,高算力应对复杂且众多的本地AI大模型需求,为迎接AI PC的应用爆发做好准备。

wKgaomaRAZCAdSMgAAJR7zgP_9M166.jpg

英特尔

去年12月,英特尔正式发布酷睿Ultra处理器。它是首款基于 Intel 4 制程工艺打造的处理器,代表了40年来英特尔架构最大的革新。采用了先进的Foveros 3D 封装技术,在 CPU、GPU 和神经网络处理单元(NPU)的架构中集成了专属 AI 加速功能,从而成为英特尔历史上 AI 性能最强、能效最佳的客户端处理器。英特尔方面还宣布,将与主流 OEM 伙伴推出 230 余款机型,开启AI PC新纪元。

根据英特尔的酷睿 Ultra 产品路线图,2023年为Meteor Lake,2024年将有Lunar Lake、Arrow Lake,2025年为Panther Lake,2026年Future Products还没有具体架构代号。其中Lunar Lake采用台积电3nm工艺,NPU性能将是上一代的4倍,达到48 TOPS,满足 Copilot+ 需求。

另外,英特尔将于年内发布Arrow Lake处理器。报道称,Arrow Lake涵盖了台式机和笔记本电脑产品的多个细分平台,其中“S”用于台式机并采用LGA 1851插座,“HX”用于发烧级游戏本,算力方面,Arrow Lake-S和Arrow Lake-HX提供AI算力达37 TOPS,其中Arrow Lake-S/HX的GPU在新架构加持下,AI算力从3 TOPS提高到9 TOPS;内置的NPU提供13 TOPS的AI算力。

AMD

AMD于2023年5月推出的锐龙7040系列是全球首款内置XDNA架构NPU的X86处理器,同年12月推出锐龙8040系列移动处理器,提供高达16TOPS的NPU算力和39 TOPS的整体算力,相较上一代带来60%的AI性能提升。

在今年6月的台北电脑展上,AMD重磅发布了Ryzen AI 300 系列处理器,采用Zen 5架构、第三代AMD Ryzen AI,内置XDNA2 NPU,GPU升级为RDNA 3.5。

wKgaomaRAZyAX8DdAACC5X0tLE8368.jpg

作为一款专为AI PC打造的处理器,其NPU算力可达50 TOPS,相较而言上一代Ryzen 8040系列芯片只有16 TOPS。

可以看到,这款处理器的亮点之一就在于NPU算力的大幅提升。AMD表示,XDNA2 NPU的计算能力提供5倍多,多任务并行能力翻一番,能效提升最多2倍。并且,XDNA2首次引入全新的Block FP16浮点精度,传统的8-bit INT8数据类型性能强但准确性低,16-bit FP16数据类型准确性高但性能弱。FP16 NPU可兼顾两者的性能与准确性,目前大多数AI应用都采用了16-bit精度。另外,AMD已经与超过150家AI赋能的ISV合作伙伴达成深度合作,进而为AMD Ryzen AI提供兼容性更好、性能体验更好的各类型AI应用。

苹果

2023年,苹果A17 Pro处理器对整块芯片进行了全方位提升,包括 Apple 有史以来最大规模重新设计的图形处理器。通过微架构和设计上的改进,全新的中央处理器实现了多达 10% 的速度提升,神经网络引擎的速度也提升多达 2 倍。采用台积电3nm工艺制程,其NPU拥有16核心,性能达到35 TOPS。

今年5月,苹果发布的11英寸和13英寸iPad Pro搭载了M4处理器,该处理器基于台积电第二代3nm工艺,拥有280亿个晶体管,NPU算力从18TOPS提升到38 TOPS。

在前不久的苹果全球开发者大会(WWDC)上,苹果宣布了全新的AI系统Apple Intelligence。要提升系统的AI能力,NPU的升级必不可少。今年9月苹果全新一代iPhone 16 Pro将配备最新的A18芯片,据悉台积电启动2nm芯片试产,苹果A18性能或提升30%,而在NPU性能上,有消息称A18有望超越苹果自家的M4处理器,可能达到45TOPS。


高通

此次微软首批Copilot+PC,搭载高通骁龙(Snapdragon)X Elite 芯片。高通于2023年推出为AI PC设计的骁龙 X Elite 处理器,该处理器集成高通定制 Oryon CPU,基于 4nm 工艺打造,采用 12 颗 3.8GHz 大核,全新 Hexagon NPU 最高可提供 45 TOP(每秒万亿次运算)算力,并且可以在设备上以“惊人的速度”运行超过 13B 参数的生成式 AI LLM(大型语言模型)。首批搭载骁龙X Elite 芯片的PC制造商包括荣耀、联想、小米等。

此外,消息称,联发科英伟达联手研发Arm架构AI PC处理器,新款芯片将对标苹果M4,预计2024年第三季度完成设计,第四季度进入验证阶段,将采用台积电3nm工艺制造,并计划2025年发布。

小结:

微软给AI PC划了一条NPU算力的“红线”,基于微软强大的生态号召力,AI PC处理器厂商都十分重视NPU性能的提升,当然这也有利于后续AI PC上端侧AI真正的应用普及。40+ TOPS NPU也许会成为今后用户购买AI PC的一个必选项。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20149

    浏览量

    247167
  • AI
    AI
    +关注

    关注

    89

    文章

    38111

    浏览量

    296657
  • NPU
    NPU
    +关注

    关注

    2

    文章

    358

    浏览量

    20840
  • 算力
    +关注

    关注

    2

    文章

    1385

    浏览量

    16566
  • AI PC
    +关注

    关注

    0

    文章

    140

    浏览量

    692
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MWC Doha 2025|美格智能全新发布60 Tops AI、支持Linux系统的SNM982高AI模组

    11月25日,在MWCDoha展会期间,美格智能全新发布基于高通QCS8650平台研发设计的SNM982高AI模组。搭载Linux5.15系统,AI
    的头像 发表于 11-25 16:34 573次阅读
    MWC Doha 2025|美格智能全新发布60 <b class='flag-5'>Tops</b> <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>、支持Linux系统的SNM982高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>AI</b>模组

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下
    发表于 10-27 13:12

    天玑9500 性能大爆发!NPU AI或达100TOPS

    机芯片中首发落地。而几家终端厂商今天迭代的新机也基于强做了一些AI新奇特的玩法。   据称,天玑9500搭载第九代AI处理器
    的头像 发表于 08-21 11:12 3459次阅读
    天玑9500 性能大爆发!<b class='flag-5'>NPU</b> <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>或达100<b class='flag-5'>TOPS</b>

    多达 48 个计算节点!Firefly 推出 CSC2-N48 AI 服务

    Firefly最新推出CSC2-N48服务,内置48个分布式计算节点,单节点可提供6TOPS-157TOPS
    的头像 发表于 08-20 16:37 1268次阅读
    多达 48 个计算节点!Firefly 推出 CSC2-N48 <b class='flag-5'>AI</b> <b class='flag-5'>算</b><b class='flag-5'>力</b>服务<b class='flag-5'>器</b>

    芯原超低能耗NPU可为移动端大语言模型推理提供超40 TOPS

    芯原股份今日宣布其超低能耗且高性能的神经网络处理器NPU)IP现已支持在移动端进行大语言模型(LLM)推理,AI可扩展至
    的头像 发表于 06-11 10:47 637次阅读

    性能飞跃 慧视8核+32T平台让目标检测帧率提升20倍

    RK3588和大卡开发而成的一款低功耗大AI处理平台。它带有双2.5G网口,采用瑞芯微R
    的头像 发表于 06-10 17:55 1004次阅读
    性能飞跃 慧视8核+32T<b class='flag-5'>算</b><b class='flag-5'>力</b>平台让目标检测帧率提升20倍

    新品 | 26+6TOPS强悍!飞凌嵌入式FCU3501嵌入式控制单元发布

    飞凌嵌入式FCU3501嵌入式控制单元基于瑞芯微RK3588处理器开发设计,4xCortex-A76+4xCortex-A55架构,A76主频高达2.4GHz,A55核主频高达1.8GHz,支持8K编解码,NPU
    的头像 发表于 05-15 11:57 2264次阅读
    新品 | 26+6<b class='flag-5'>TOPS</b>强悍<b class='flag-5'>算</b><b class='flag-5'>力</b>!飞凌嵌入式FCU3501嵌入式控制单元发布

    6TOPSNPU加持!RK3588如何重塑8K显示的边缘计算新边界

    与复杂运算。明远智睿推出的RK3588芯片,以6TOPSNPU为核心,为这一难题提供了突破性的解决方案。 从硬件架构来看,RK3588的NPU
    发表于 04-18 15:32

    迅为iTOP-RK3588S开发板/核心板瑞芯微RK3588S处理器6TOPS内置NPU

    能力6TOPSNPU,赋能各类AI场景。 强大的视频编解码8K编码+8K解码,持 8Kp60 H.264/H.265NVP9 视频解码
    发表于 04-10 11:13

    157 TOPS !AIO-OrinNX 主板助力边缘 AI 应用

    Firefly最新推出NVIDlAJetsonOrin主板,搭载JetsonOrin系列核心模组,最高可达157TOPS,支持大模型私有化部署,为边缘AI应用的开发与部署提供强劲的
    的头像 发表于 04-02 16:33 2722次阅读
    157 <b class='flag-5'>TOPS</b> <b class='flag-5'>算</b><b class='flag-5'>力</b>!AIO-OrinNX 主板助力边缘 <b class='flag-5'>AI</b> 应用

    边缘AI处理开发指南:USB+NPU混合计算与实时视频分析实战‌

    ) ‌ NPU ‌:1.2 TOPS(支持INT8/FP16混合精度,RKNN模型专属加速) ‌ 扩展接口 ‌: ‌ USB 3.0 ×2 ‌:支持同时挂载Coral TPU +
    的头像 发表于 03-27 10:42 679次阅读

    爆款推荐 | 迅为RK3568开发板4核处理器+1TNPU+好用到爆的配套资料和视频!

    爆款推荐 | 迅为RK3568开发板4核处理器+1TNPU+好用到爆的配套资料和视频!
    的头像 发表于 03-19 13:41 1190次阅读
    爆款推荐 | 迅为RK3568开发板4核<b class='flag-5'>处理器</b>+1T<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>NPU</b>+好用到爆的配套资料和视频!

    迅为iTOP-RK3588S开发板/核心板6TOPSNPU视频编解码8K编码+8K解码

    能力6TOPSNPU,赋能各类AI场景。 强大的视频编解码8K编码+8K解码,持 8Kp60 H.264/H.265NVP9 视频解码
    发表于 02-20 14:24

    ThinkPad X1 Carbon Aura:以120TOPS、986克重量打造行业新巅峰!

    方式。联想近期发布的ThinkPad X1 Carbon Aura AI元启版,便是在这一背景下推出的重磅之作。它以120TOPSAI
    的头像 发表于 12-30 15:26 1412次阅读

    迅为瑞芯微RK3562开发板主频2.0内置NPU达1TOPS,核心板扩展更多功能

    。 内置独立NPU, 达 1TOPS,可用于轻量级人工智能应用。 支持几乎全格式的H.264解码,支持1080p@60fps的解码,支持4K@30fps的H.265解码,以及108
    发表于 12-24 15:07