0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

加持Meteor Lake,VPU如何成为AI加速的重要砝码?

科技讯息 来源:科技讯息 作者:科技讯息 2023-05-31 14:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从ChatGPT引发的广泛关注,再到大量的云端AI服务上线,利用人工智能提升效率、优化流程正在变得唾手可得。但在大多数人印象中,AI应用意味着背后庞大的服务器集群夜以继日的运算,需要将自己的信息共享至云端,这与人们关心的隐私与信息安全背道而驰。

就在COMPUTEX 2023期间,英特尔提出了一种全新的可能性,它可以让未来每一台笔记本、台式机或者其他终端设备,在低功耗的前提下也能拥有不错的AI算力,而这个算力模块称为英特尔VPU。

CPUGPU不同,英特尔VPU将更专注于AI加速,特别是稀疏化处理的运算,并且具有低功耗、低延迟的诸多特点,不仅可以轻松处理视频背景虚化、智能语音降噪等判定式AI,加速StableDiffusion这样生成式AI也没有问题。

重点是,英特尔已经确认下一代处理器MeteorLake将集成VPU,这意味着未来的轻薄本也同样具备一定的AI算力,实现不曾想象的AI操作。那么究竟是什么样动力,让英特尔如此积极的驶向终端AI的新赛道?

AI的质变

尽管英特尔以CPU和IDM模式而闻名,但在AI硬件领域英特尔也同样进行了长时间的积累,例如在CPU中添加AI加速的相关指令集,并在架构上针对AI不断进行优化,已经发展到第四代的英特尔至强可扩展处理器就是其中很好的例子,从2017年开始,至强可扩展处理器就不断增加了深度学习加速、矩阵计算扩展AMX等功能。

而今,英特尔在AI领域即拥有负责高端深度学习加速器Gaudi系列的Habana Labs,也拥有可以制造低功耗视觉处理单元的Movidius。在大量的AI经验积累下,英特尔开始尝试让消费产品涉及AI加速功能。也正是从IceLake架构第10代酷睿开始,CPU开始搭载AI加速单元GNA,用于处理神经噪声抑制、背景模糊等功能判定式AI加速,让笔记本开始走向智能化。

同时AI需求在近2年内变化非常明显。以降噪功能为例,2年前降噪计算复杂度与现在相比,相差将近50倍。类似StableDiffusion这样的生成式AI加入,对PC性能需求提升了一个唯独。如何在不插电的笔记本中流畅运行更高负荷的AI应用成了新问题,VPU正是为了填补这个空白而诞生。

wKgZomR275GAYrI6AACnWDuXSlE231.jpg

即将实装MeteorLake的英特尔VPU其实已经进阶到了第三代,这款源自于英特尔全资子公司Movidius的处理模块最早计划应用于无人机、相机、VR设备等基于视觉深度学习和AI加速。在2017年,VPU的前身Myriad X就能实现1TOPS的吞吐量,这无疑让人们对全新的VPU性能表现抱有更多期待。

同时,VPU不是旗舰处理器的独占功能,它将出现在Meteor Lake的所有SKU中。这意味着VPU带来的AI加速功能将是处理器一项基础功能,与集显、Thunderbolt4等一样,成为CPU中不可缺少的一部分。

但VPU的加入不代表着之前集成在CPU上的AI技术会划上句号。恰恰相反,由于AI应用场景的复杂性,英特尔将AI使用场景分成了三个部分,其中CPU负责处理诸如语音降噪、变声这样的轻负载、低延迟、高响应的AI加速,GPU负责重负载且对响应需求不高的AI模型加速。VPU正好介于CPU和GPU之间,即拥有低功耗、快速响应的特点,也可以负责基础的视觉处理,比如流媒体中的手势识别,背景虚化等等。

wKgaomR275GANlM5AAITb_KjPtY419.jpg

在Meteor Lake中,VPU和CPU、GPU将相辅相成,不同的AI应用场景会指派不同的处理单元应对,确保AI加速效率最大化。同时从功耗上来看,VPU则是要求最低的,次之是CPU,再次之是GPU。VPU的加入能给注重续航的笔记本在获得新功能的同时,保证笔记本的续航和体验顺畅。

wKgZomR275GAbs98AAJBvcrIEtU215.jpg

为此英特尔也特意准备了一个DEMO演示。一款只有集显的MeteorLake开发笔记本,在StableDiffusion的文字生成图片模型内,仅使用了20秒就完成了工作。这个过程中,MeteorLake的VPU主要承载了VNET模块的运行,GPU则负责Encoder模块运行,CPU则负责软件运行的其他部分,整个系统被得到充分利用,实现了在当下只有依靠高性能独立显卡PC才能完成的工作。

软硬件相辅相成

生成式AI的快速成长自然也会带来不少问题,比如的AI开发界面,AI库以及AI模型标准化或者统一化上需要时间,不同软件、模型、开源项目之间各自为战,虽然百花齐放,但很难形成统一管理,会影响资源调用的效率。比如时下热门的Stable Diffusion也仅诞生于2022年,作为一个开源项目,还有大量的工作需要适配。

在行业内拥有庞大影响力的英特尔深刻了解软硬件结合的重要性,在宣布VPU进驻MeteorLake的同时,英特尔也已经紧锣密鼓的在软件层面、软件合作伙伴方面展开行动。

从软件层面来看,VPU身后已经具备了整套软件基础,英特尔OpenVINO工具可以帮助VPU在应对不同领域的AI网络模型时,进需要通过统一的软件接口实现。OpenVINO相当于一个包裹,可以帮助应用把底层不同架构之间的异构计算的差异统一封装,以实现更广泛的应用适配。

同时英特尔也提供了对目前主流标准的支持,比如通用的网络视频格式ONNX,W3C允许通过浏览器进行神经网络推理硬件加速的WebNN API,微软基于DirectX12的机器学习底层推理接口DirectML等等。

wKgaomR275KAGaQTAAEeEdl2xSY202.jpg

同时英特尔也已经与软件开发商展开紧密合作,包括Adobe、微软、字节跳动、腾讯在内的100多家软件开发商已经开始进行AI相关方面的合作。

wKgZomR275OADQYTAAEk3peA3ZQ774.jpg

得益于VPU非常省电的特性,使得许多终端可以在仅使用电池续航的状态下,也能拥有高效的表现,原本需要CPU、GPU高功耗合力进行的AI任务,现在仅使用VPU即可完成。比如在执行GPU渲染的过程中接通会议电话,通过VPU介入流畅的实现降噪、背景替换等工作。

再比如Adobe上的自动抠图、滤镜、文字生成图片等最新功能,通过VPU运行也已经可以获得很好的效果。另外,Blender、虚幻引擎等软件也已经对VPU展开了适配。

wKgaomR275OAKVA-AAJFoejyaO0300.jpg

在庞大的安装量推动下,英特尔在产品投向市场之前已经做足了软件层面适配的铺垫。笔记本VPU与CPU、GPU以及其他功能模块一起,成为下一代PC的标准配置,也进而推动了整个AI生态的普及与标准化,从而推动AI应用的持续发展,最终实现了良性循环的局面。

开创AI体验新局面

在过去两年中,英特尔进步非常显著,通过12、13代酷睿的两代高性能混合架构设计,英特尔已经与OEM合作完成了超过700个系统设计,交付了1.2亿个高性能混合架构处理芯片,使之在短时间内快速普及。

wKgZomR275OADmxJAAHkFDyDqG8002.jpg

但对于英特尔而言这还远远不够,按照英特尔CEO帕特·基辛格提出的IDM2.0战略,英特尔还会在四年里跨越5个制程工艺节点,从现在的Intel7迈进MeteorLake开始使用的Intel4,紧接着Intel20A和Intel18A也会相继到来。

不仅如此,英特尔也将使用第三方代工的制造工艺来完善处理器产品,从MeteorLake开始使用的分离式模块架构,让处理器设计不再一体化,而是不同单元会成为不同的独立设计模块、不同的制造工艺和升级策略,实现效率的最大化,英特尔VPU的加入就很好的印证了这一点。

wKgaomR275SAfSoAAAEGGnSKaVU855.jpg

在即将到来的MeteorLake上,英特尔将从另一个维度提升处理器的每瓦性能表现,让处理器获得表现更好的CPU、GPU,并加入独立的VPU单元提升PC整体对AI性能优化,从而带动PC体验的又一轮升级。

在过去几年中,我们经历了Wi-Fi6、处理器混合架构、Thunderbolt4接口的快速普及,均得益于英特尔将新技术无保留的放入主流的处理器设计中。英特尔VPU则成为下一个增长点,凭借着新一轮处理器升级带来的庞大体量,不插电、低功耗环境下使用流畅的AI加速体验,无疑会给现有的AI软件生态、AI标准制定带来全新的变化。英特尔也将再次成为整个PC软硬件生态升级的重要推手。

审核编辑黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179244
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222859
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296319
  • vpu
    vpu
    +关注

    关注

    0

    文章

    15

    浏览量

    12034
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    聚焦2025 Intel® WW LOEM Summit,奏响AI与计算技术创新的最强音

    (NPU)的Meteor Lake芯片,Intel正以硬核技术将“人工智能”从云端真正带入每一台电脑中。 作为英特尔面向全球原始设备制造商(OEM)、原始设计制造商(ODM)及生态伙伴的年度顶级盛会,该峰会已成为全球
    的头像 发表于 11-06 10:32 460次阅读
    聚焦2025 Intel® WW LOEM Summit,奏响<b class='flag-5'>AI</b>与计算技术创新的最强音

    蜂鸟内核VPU模块设计分享

    堵塞) 浮点模块   相关的V型浮点运算结合了V型指令的控制方式FPU中的浮点计算方法。 三、  我们将VPU挂载在CPU内核外,提高整体可重构性。配置了VPU以后,对一些模型有了明显的加速效果。
    发表于 10-23 06:02

    极细同轴线在AI+FPGA视觉加速方案中的应用

    极细同轴线束凭借其高带宽、柔性结构与优异的电气性能,正在成为 AI+FPGA 视觉系统中不可或缺的信号通道。它不仅优化了高速数据传输的稳定性,也为设备的小型化、轻量化提供了重要支持。随着 AI
    的头像 发表于 10-20 15:35 1609次阅读
    极细同轴线在<b class='flag-5'>AI</b>+FPGA视觉<b class='flag-5'>加速</b>方案中的应用

    AIDC如何成为AI发展的关键一棒?

    AI
    脑极体
    发布于 :2025年09月21日 12:21:23

    德承新款工控机P2302系列全面搭载新一代 Intel® Meteor Lake-PS Core™ Ultra 7/5/3 处理器

    P2302 系列是一款针对边缘运算而设计的薄型、高性能嵌入式工控机。在效能上可搭载 Intel® Core™ Ultra 7/5/3 U 系列(Meteor Lake-PS)CPU,拥有 12 核心
    的头像 发表于 08-27 15:02 646次阅读
    德承新款工控机P2302系列全面搭载新一代 Intel® <b class='flag-5'>Meteor</b> <b class='flag-5'>Lake</b>-PS Core™ Ultra 7/5/3 处理器

    想问下怎么查看安卓系统有没有VPU驱动?

    购买了一个CPU是RK3576, android 14 的机顶盒,能通过adb查看有没有VPU驱动么?查看哪些信息来确认过?
    发表于 07-01 09:10

    能在Meteor Lake平台上使用SDK 3.5吗?

    SDK 是 3.6 版,不支持 CYPD6127 部件。 那么,我能在 Meteor Lake 平台上使用 SDK 3.5 吗?
    发表于 05-26 08:01

    中兴通讯加速算力普惠和AI应用普及

    近日,以“数智同兴,共创未来”为主题的2025中兴通讯中国生态合作伙伴大会在福州隆重启幕。中兴通讯执行副总裁、首席运营官谢峻石出席大会并发表题为“AI向实,数智同兴”的主题演讲,系统阐述公司 “成为
    的头像 发表于 05-06 14:10 754次阅读

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、管锴、张心雨。 大模型的普及是近三年来的一件大事,万物皆可大模型已成为趋势。作为大模型开发应用中重要
    发表于 05-02 09:26

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    :Silver Lake接管后,Altera将重点发展AI驱动的新兴市场(如边缘计算、机器人),并整合Agilex品牌下的高中低端产品,以提升市场竞争力。四、未来展望技术演进:预计将加速推进Agilex系列迭代
    发表于 04-25 10:19

    在英特尔酷睿Ultra AI PC上部署多种图像生成模型

    全新英特尔酷睿Ultra 200V系列处理器对比上代Meteor Lake,升级了模块化结构、封装工艺,采用全新性能核与能效核、英特尔硬件线程调度器、Xe2微架构锐炫GPU、第四代NPU等,由此也带来了CPU性能提升18%,GPU性能提升30%,整体功耗降低50%,以及1
    的头像 发表于 04-02 15:47 1125次阅读
    在英特尔酷睿Ultra <b class='flag-5'>AI</b> PC上部署多种图像生成模型

    FakeQuantize不支持VPU插件吗?

    “FakeQuantize”层不受 VPU 插件支持。
    发表于 03-06 07:01

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    的发展,加速创新和降低成本。 总之,FPGA与AI的结合正在重塑芯片生态,推动技术融合、应用拓展和产业变革。未来,FPGA将在AI加速、边缘计算和高性能计算等领域发挥
    发表于 03-03 11:21

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    AI时代,FPGA(现场可编程门阵列)具有极其重要的地位,主要体现在以下几个方面: 1.硬件加速与高效能 • 并行处理能力:FPGA内部由大量可编程逻辑单元组成,能够实现高度并行的数据处理。这种
    发表于 02-19 13:55

    Gupshup加速企业AI应用进程

    Gupshup-Gupshup推出预构建、行业训练有素的多模态AI代理,加速企业AI应用进程 印度尼西亚雅加达2025年2月14日 /美通社/ -- 全球领先的对话式AI平台Gupsh
    的头像 发表于 02-14 16:04 541次阅读