0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新AI时代的“利器”,异构计算将重塑产业格局

7GLE_Intelzhiin 来源:YXQ 2019-04-28 17:38 次阅读

正如约翰·齐曼(J.Ziman)所言:“不同规模、不同层次的各种技术形成相互共生、寄生与竞争的生态关系,使得任何技术的生存与发展不是孤立的事件”。芯片架构的革命也随着IC业浪潮的演进“合成”向前,从32位到64位,从单核到多核,从同构到异构,每一次架构革命都让芯片产生质的飞跃。而在智能互联的AIoT时代,异构计算芯片成为当仁不让的主角。

毕竟,在经历了“数字化、互联网化、移动互联网化”的洗礼之后,“人工智能化”时代的海量计算需求、算法迭代让传统的通用CPU“难堪重任”,应运而生的异构计算芯片“晋级”成为支撑先进和更复杂AIoT应用的必然选择。作为一种将不同指令集和架构的计算单元(如传统的CPU、GPUDSP还有创新的TPU、DLA等)融合在一起、实现高效协同运行的计算技术,业界有人认为,将传统架构的芯片比作汽油引擎的话,那么异构计算芯片就是混合动力甚至新能源引擎。

整装待发

不论是什么样的技术路线图,都必须在关键时间节点上更新。而这一“引擎”的横空出世”其实是市场与技术相互碰撞的结果。

异构计算的显著优势在于实现了性能、成本和功耗均衡的技术,同时也是让最适合的专用硬件去做最适合的事如密集计算或外设管理等,从而达到性能和成本的最优化。这样“各成其就”的异构芯片,理所当然自带光芒。

英特尔中国研究院院长宋继强在上周的英特尔媒体分享会上表示,异构计算不是一个新词,其实上世纪80年代就有了,即超过一种以上的硬件架构设计组合。而这种组合有两种形式,比如将CPU、GPU、FPGA等组成一个一体化设计的SoC,将达到最高的能效比,但需要量大面广,才值得投入;另一种是这些独立的芯片通过板级连接实现异构计算,其优势在于灵活,但板与板之间连接的功耗、带宽都大打折扣。

与之相呼应的是,近几年来不仅众多IP厂商在加强异构芯片IP研发,主流芯片厂商也均加大新一代异构芯片的出新频率,异构芯片开始大行其道,或将迎来新的爆发期。有预计说,在高性能计算、人工智能等应用领域,异构计算芯片市场规模将突破千亿美元。

这一风向标对产业带来的影响或是全方位的,一方面众多芯片厂商加强横向扩展,运用资本力量大肆整合全面出击,构筑异构芯片领域的护城河;另一方面,异构阵营泾渭分明,各大厂商合纵连横,同时一些新生力量亦角逐其中,有望改写产业未来格局。

软硬件挑战

异构计算虽不是全新的概念,但最早的异构融合还基于CPU和GPU,而真正崛起要从2001年用GPU实现通用矩阵计算开始。而且,其“外延”已延伸至CPU、DSP、GPU、ASIC、FPGA等各种计算单元、使用不同类型指令集、不同体系架构的“整合”,让各种核心有效地协同合作。

显然,这激起了“连锁”反应,由于设计难度大、生态系统需重构等挑战,在过去很长一段时间仍处在不断演进当中。毕竟从编程方式、软硬件架构到生态系统,异构计算仍面临着诸多挑战。

其硬件实现就不简单。首先,不同芯片之间的互联布线,要求性能高、速度快,同时功耗要低。其次,要通过混搭方式,将不同种类的、不同技术的芯片封装在一起,支持互联,保持高带宽和高频率,分外复杂。最后,选择大批量生产的工艺,快速验证等等,决定了在硬件上从选择用什么样的基底,到用什么材料实现互联,都需通盘和全面考量。

为了让异构计算发挥最大性能优势,还需要对硬件设计特定的算法以及软件优化,才能够最大化硬件能力,即软硬结合。做到真正的软硬结合,软件环境的优化亦是重中之重,如何打造完善的软硬件体系,让“众选手”各展所长、协同合作,并进而提供良好的生态体系,来支撑异构计算体系的全面应用亦是一大挑战。

可以说,无论是总线及接口、编程工具、存储管理、应用软件技术等,在诸如异构多核架构指令集、微架构、工具链设计等环节仍需投入大量资金和时间。

三大阵营的心机

显然作为新AI时代的“利器”,异构计算将重塑产业格局,各方势力各藏心机,激烈角逐。

目前,全球异构计算领域呈现三足鼎立的态势,分别是以AMD高通ARM三星、北京华夏芯等为主体的全球异构计算系统HSA联盟,以IBM、Google、英伟达为主体的OpenPOWER联盟和英特尔最新提出的超异构计算愿景。

这三大体系均在全力推进:HSA联盟强调生态共建,资源共享,主推OpenCL的异构编程框架。自从2012年成立以来,围绕异构计算发展中最迫切需要解决的编程语言、技术标准、知识产权等问题已经做了大量卓有成效的工作,包括发布了新一代异构计算技术规范、搭建开放的异构计算平台、推出了一系列专用工具和较为完善的面向人工智能的开发环境等等。

而AMD 3A平台、ARM Coretex处理器和Mali图形核心、Imagination PowerVR图形核心、德州仪器OMAP处理器平台等都将成为HSA基金会的基石。

而OpenPower联盟利用Power8等芯片在高性能计算领域的技术优势和IBM产品的应用生态基础,在高性能计算领域占有优势。自2013年IBM在联合Google、NVIDIA、TYAN、Mellanox成立以来,目前已有数百位成员,中国成员除了浪潮、新云东方等硬件供应商外,也有腾讯、阿里、网易这样的互联网巨头。据悉在OpenPower研发平台上,已有10万+应用,以及10万+经过行业认证的产品,包括软件、服务管理和解决方案。特别是其基于CAPI总线的全新加速器解决方案,使Power服务器完全支持CAPI+FPGA,开启了第二代异构计算。

虽然英特尔在以一已之力对抗,但在英特尔转型制定了“以数据为中心”的发展战略之后,一切创新与变革都以此为轴心。而在AI时代风起云涌之际,“全武行”的英特尔也祭出了“超异构计算”的旗帜,在异构计算技术路径发展方面已然自成一派。

超异构计算的“超”

超异构计算的横空出世,缘于英特尔对数据洪流引发的变革,有了更加“系统”的思考,认为在智能联所带来的数据洪流推动下,为应对未来数据的多样化、数据量的爆发式增长以及处理方式的多样性,单纯发展先进工艺或封装或架构改善已不足以满足未来多元化的计算需求。

以AI为例,产业应用对AI计算需求跃升至“无所不能”,涉及多种计算加速、可扩展性、训练速度快、能效比高、开发难度小、可加快上市等,在这一发展态势下,传统的异构计算将失去“用武之地”。宋继强解释说,一体化的SoC虽然体积小、能效比高,但扩展性差,增加功能则需重新设计,再走一整套流片流程,上市时间较慢;而分体式板卡虽然比较灵活,时间也快,但整体价格偏高,能效比也不高。

正所谓不破不立,超异构计算成为解决“左右为难”的利器。宋继强解读超异构计算的三大要素时认为,一是有多种架构、多功能芯片,无论是CPU/GPU,还是FPGA、ASIC、Modem内存等;二是需要多节点+先进封装技术的整合,不论是10nm的高端芯片还是40nm、65nm的芯片都能通过2.5D或3D封装“成全”;在“硬”功能实现之后,三是统一的异构计算软件,英特尔开发了通用的one API,一套API就可让用户方便地开发并承接超异构集成带来的利好。

超异构计算将以制程与封装、架构、内存与存储、互连、安全、软件为六大支柱,互相关联,紧密耦合

具体来看,在制程和封装层面,一方面英特尔10纳米工艺仍继续推动着发展,另一方面先进封装2.5D、3D成为推手。两年前英特尔开发的“嵌入式多芯片互连桥接(EMIB)”2.5D封装技术,成为其异构计算策略的一大关键技术。而英特尔不断精进,在去年年底架构日活动上展示了名为“Foveros”的3D封装技术,开辟了新的先河。2.5D和3D封装解决了传统封装面积大、带宽不足等问题,并可让连接的芯片不只是逻辑芯片和内存,还能把逻辑芯片和逻辑芯片相连,同时实现立体堆叠,让体积减少、功耗降低、带宽提升。

而随着海量的数据推动计算架构快速演进并呈指数级扩展,未来十年架构创新将是创新的主要驱动力。英特尔可提供多样化的计算架构包括标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial),分别应用于CPU、GPU、AI和FPGA。

而英特尔的矩阵战略实现了“端到端”。英特尔有通用CPU集成AI加速,可将深度学习性能提升十倍以上。在专用AI芯片方面,有面向训练的高性能GPU和专门做神经网络加速学习的NNP-L;推理侧也是两路并发,面向边缘端的推理芯片要求功耗更低、性能更强,英特尔有VPU、EYEQ以及嵌入式EYEQ、FPGA等;而数据中心推理的芯片则有GPU、FPGA。如此通过将制程封装和架构设计组合在一起,来有效提升“积木式组合”的稳定度,满足定制化和灵活化的需求。

而在内存与存储、互连、安全、软件层面,英特尔也齐头并进。通过重塑内存层级结构,来破解内存和存储方面的带宽“瓶颈”,提升数据管道的运行速度和系统性能;全面的互连产品包括在祼片间实现互连,从而助力实现大规模的异构计算;在安全至上的数据层面,英特尔着力从端到端全面提升安全性。同时英特尔也深谙“硬件+软件”配合才能给出最好的加速功能,在软件方面创建了统一的OneAPI软件架构,以进一步简化并延伸整个堆栈中的应用开发。

这六大支柱也相当于“六大护法”:以先进制程技术进行设计,颠覆性内存层次结构提供支持,通进先进封装集成到系统中,使高速的互连技术进行超大规模部署,提供统一的软件开发接口以及安全功能。

有了“六大护法”加持,一路狂飙的英特尔释放了超异构计算的最大优势,既可灵活地运用各节点芯片的功能,又解决了内存、连接、功耗以及安全、开发等问题,这些创举远远跳出了以往单纯异构计算的“窠臼”,将为异构计算的下一步发展全面“加速”,亦让“自成体系”英特尔站在了异构计算的“超”起点。

未来对决

万物智联时代作为解决计算能力和功耗瓶颈的有效途径之一,异构计算如今可谓正逢其时。

就异构计算的发展过程来看,异构计算从单纯挖掘并行潜力、到具有加速器的异构计算、再到针对特定应用定制的计算平台、到多种平台的高效融合,在这一过程中,异构计算的演进也伴随着起伏。

而无论谁是异构芯片的“轴心”,首要的仍是封装的“不破不立”。不得不说,英特尔超异构计算的概念,配合制程与封装、架构、内存、互连、安全、软件“六脉神剑”,在伴随着异构计算的“新陈代谢”和发展模式的过程中,破解了总是如影随形的关联制约性,可谓意义重大,使得芯片设计从2D平铺转向3D堆叠,为高性能、高密度和低功耗异构芯片制程奠定了坚实的基础,亦为IC业的发展和突破打开了一扇新的大门,提供了更广泛的灵活性和可塑性。

毫无疑问,在传统芯片架构向异构计算演进、软硬件生态面临颠覆性变革之际,各大阵营的开放、众创、共赢的异构生态体系,将成为异构计算芯片对决的重要衡量。异构计算已走到台前,未来是百家争鸣还是一家独大?让我们等待好戏开场。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26424

    浏览量

    264029
  • 异构计算
    +关注

    关注

    2

    文章

    93

    浏览量

    16159

原文标题:英特尔超异构计算愿景,实现新“超越”

文章出处:【微信号:Intelzhiin,微信公众号:知IN】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    解锁AI时代利器——讯飞AI鼠标AM30助你在AI时代脱颖

    解锁AI时代利器——讯飞AI鼠标AM30助你在AI时代脱颖而出 随着
    的头像 发表于 03-25 13:37 142次阅读
    解锁<b class='flag-5'>AI</b><b class='flag-5'>时代</b>的<b class='flag-5'>利器</b>——讯飞<b class='flag-5'>AI</b>鼠标AM30助你在<b class='flag-5'>AI</b><b class='flag-5'>时代</b>脱颖

    高通NPU和异构计算提升生成式AI性能 

    异构计算的重要性不可忽视。根据生成式AI的独特需求和计算负担,需要配备不同的处理器,如专注于AI工作负载的定制设计的NPU、CPU和GPU。
    的头像 发表于 03-06 14:15 213次阅读

    百度智能云将在三大方面重构云计算服务

    在云基础设施层,移动互联网时代的应用,底层大多依赖CPU算力,而AI应用对GPU或异构计算的需求大幅增加,云市场的底层算力需求将逐渐转向以GPU为主。
    发表于 12-21 15:41 132次阅读
    百度智能云将在三大方面重构云<b class='flag-5'>计算</b>服务

    重塑数字生产力体系,生成式AI将开启云计算未来新十年?

    AI重塑计算底座
    的头像 发表于 12-21 13:58 165次阅读
    <b class='flag-5'>重塑</b>数字生产力体系,生成式<b class='flag-5'>AI</b>将开启云<b class='flag-5'>计算</b>未来新十年?

    异构专用AI芯片的黄金时代

    异构专用AI芯片的黄金时代
    的头像 发表于 12-04 16:42 282次阅读
    <b class='flag-5'>异构</b>专用<b class='flag-5'>AI</b>芯片的黄金<b class='flag-5'>时代</b>

    科学计算与Julia技术研讨会 | 张先轶:从OpenBLAS到异构计算软件栈

    蓬勃发展,新兴科学计算语言不断涌现,Julia以其高性能、动态性成为其中的佼佼者。 12月9日上午1020 ,澎峰科技创始人 张先轶博士 将 在 主论坛:Julia与数字化和AI 上 作 “ 从OpenBLAS到异构计算软件栈”
    的头像 发表于 11-30 19:35 402次阅读
    科学<b class='flag-5'>计算</b>与Julia技术研讨会 | 张先轶:从OpenBLAS到<b class='flag-5'>异构计算</b>软件栈

    什么是异构集成?什么是异构计算异构集成、异构计算的关系?

    异构集成主要指将多个不同工艺节点单独制造的芯片封装到一个封装内部,以增强功能性和提高性能。
    的头像 发表于 11-27 10:22 2906次阅读
    什么是<b class='flag-5'>异构</b>集成?什么是<b class='flag-5'>异构计算</b>?<b class='flag-5'>异构</b>集成、<b class='flag-5'>异构计算</b>的关系?

    异构时代:CPU与GPU的发展演变

    异构计算是指在一个系统中使用不同类型的处理器来执行不同的计算任务,以提高性能,效率和可靠性。随着摩尔定律的放缓,单一类型的处理器已经难以满足日益增长的运算需求。与此同时,不同类型的处理器具有各自
    的头像 发表于 10-24 10:17 557次阅读
    <b class='flag-5'>异构</b><b class='flag-5'>时代</b>:CPU与GPU的发展演变

    高通下一代智能PC计算平台名称确定:骁龙X系列

    骁龙X系列平台基于高通在CPU、GPU和NPU异构计算架构领域的多年经验打造。目前,采用下一代定制高通Oryon CPU的骁龙X系列将实现性能和能效的显著提升,此外其所搭载的NPU将面向生成式AI时代提供加速的终端侧用户体验。
    的头像 发表于 10-11 11:31 416次阅读

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?
    发表于 09-14 08:13

    新一代计算架构超异构计算技术是什么 异构走向超异构案例分析

    异构计算架构是一种将不同类型和规模的硬件资源,包括CPU、GPU、FPGA等,进行异构集成的方法。它通过独特的软件和硬件协同设计,实现了计算资源的灵活调度和优化利用,从而大大提高了计算
    发表于 08-23 09:57 451次阅读
    新一代<b class='flag-5'>计算</b>架构超<b class='flag-5'>异构计算</b>技术是什么 <b class='flag-5'>异构</b>走向超<b class='flag-5'>异构</b>案例分析

    异构计算场景下构建可信执行环境

    异构计算场景下,如何构建可信执行环境呢?分布式机密计算是一种思路,CPU上的技术应用到其他的XPU上是另一种思路,但最关键的问题是怎么用。该问题在AI安全上非常明显,
    发表于 08-15 17:35

    异构计算的初步创新

    更 高,x16带宽(双向)从64 GB/s提 升到了128 GB/s;目前规范制定已迭 代至6.0版本,带宽再翻倍。 异构计算的初步创新:在
    的头像 发表于 06-19 11:26 459次阅读
    <b class='flag-5'>异构计算</b>的初步创新

    PrimeSimSPICE:异构计算模型实现数量级性能突破

    随着对更高计算性能的需求不断增加,HPC 行业正朝着异构计算模型发展,其中 GPU 和 CPU 协同工作以执行通用计算任务。在这种异构计算模型中,GPU 充当 CPU 的加速器,以减轻
    的头像 发表于 05-24 16:53 589次阅读
    PrimeSimSPICE:<b class='flag-5'>异构计算</b>模型实现数量级性能突破

    构建面向异构算力的边缘计算云平台

    数据又消费数据,再慢慢到设备与设备之间的信息互联,万物互联的时代已然到来。 在万物互联时代,需要计算的数据越来越多,需求在不断的变化,异构计算能够充分发挥 CPU/GPU 在通用
    发表于 05-18 17:15 0次下载
    构建面向<b class='flag-5'>异构</b>算力的边缘<b class='flag-5'>计算</b>云平台