0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

硬件架构走向多元化,英特尔要以oneAPI一“统”天下?

张慧娟 来源:电子发烧友网 作者:张慧娟 2019-08-31 07:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


科技界被一个“快”字裹挟很久了。更高的生产效率和毫不妥协的性能,成为任何一家科技公司的追求。

随着迈入以数据为中心的时代,我们看到的不仅是数据量的爆发,更是有数据形态的巨大变化:从传统的文本、图形数据,到现在的视频、音频、社交等非结构化数据,未来还有包括联网汽车数据、神经网络数据、基因数据等更多形态的数据。

这种海量数据的多样性,首先对计算能力提出了巨大的挑战,由此带来了数据处理方式和计算架构的延伸。未来十年我们将看到比过去五十年中多得多的架构

与此同时,软件的重要性被提到了前所未有的高度英特尔曾提出,对于全新硬件架构的每一个数量级的性能提升潜力,软件能带来两个数量级的性能提升。

为了简化编程流程、提升效率,英特尔于去年12月宣布推出oneAPI项目,并将于今年第四季度发布开发者测试版本。日前,<电子发烧友>在英特尔的沟通会上,率先了解了oneAPI的技术细节和战略意义。

oneAPI:跨架构、跨厂商,向全行业开放

在解决计算问题时,过去几代产品的答案几乎一直是晶体管密度,并且摩尔定律发挥主导作用。但随着制程节点发展速度相较于过去几十年呈现出减缓的态势,现代计算又提出更多更新的需求,需要结合晶体管、架构研究、连接性提升、更快速的内存系统和软件等众多因素,共同推动创新。

oneAPI既是英特尔的一种产品,同时又是一种行业规范”, 英特尔架构、图形与软件部副总裁兼计算性能与开发者产品部门总经理Bill Savage介绍,“oneAPI是从软件层面来简化和统一跨SVMS架构的创新。它可以简化并且统一跨不同架构、跨不同厂商之间的编程,是一个鼓励社区和行业支持的一种开放、标准的解决方案。”
英特尔架构、图形与软件部副总裁兼计算性能与开发者产品部门总经理Bill Savage
英特尔产品覆盖的计算架构包括标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial),分别主要应用于CPUGPUAI加速器和FPGA产品。英特尔指出,在接下来五到十年中最重要的现代工作负载,就是这种标量、矢量、矩阵和空间架构的组合,英特尔称之为SVMS架构

为什么底层接口如此重要?Bill Savage表示,数百万的开发者在最上层创造越来越多的应用,他们所使用的大量中间件以及框架来自数万的中间件开发者。oneAPI在最接近硬件的底层,对整个软件堆栈会产生更大的影响,针对硬件使用统一接口,对软件开发者来讲这也是一个很好的价值主张。oneAPI所能发挥的价值在于——通过跨CPU、GPU、AI加速器和FPGA产品架构,统一并简化编程,被广泛的生态系统采用,为开发者带来更高的生产效率和性能。

全新编程语言DPC++专门针对多元化架构

在一个多元化的架构中进行编程的话,很可能需要多种不同工具以及不同语言。这就意味着在软件开发过程中需要多支团队,他们各自要学习很多不同专业的技能,这显然不是一种最高效的软件开发方式

在oneAPI项目中,英特尔携手行业开发了一种叫做Data Parallel C++(DPC++)的全新语言,以支持实现横跨SVMS架构的数据并行编程。这是一种基于标准的开放式跨行业语言,可替代单一架构专有语言。

为什么需要一种全新的语言呢?毕竟这个世界上已经有这么多语言了。英特尔架构、图形与软件部副总裁兼编译器与语言部门总经理Alice Chan指出,现有的众多语言各有局限所在:例如众所周知的C++,它虽然是可移植的,而且底层性能非常好,但是本身缺乏了一些并行语言的特征,很难很好地用于并行架构;MATLAB更多集中在顶层,如果想在底层得到很好的性能较难;英伟达的CUDA能够进行并行架构的编程,也可以把负载转移到加速器,但是它只能用在英伟达自己的硬件上;还有其他语言例如OpenCL也能实现并行编程,但是围绕它的社群和整体行业的活跃度并不高。
英特尔架构、图形与软件部副总裁兼编译器与语言部门总经理Alice Chan
那么,英特尔如何确保DPC++能够如预期一样发挥出最佳性能?70年代Cray就做到了矢量化,90年代的时候超算也做到了单程序多数据(SPMD),2006年英伟达推出CUDA语言的时候就提出了细粒度的SPMD。现在,DPC++语言将上述三种技术思路融会贯通,使用底层虚拟机按照有序的结构进行编译。据了解,英特尔开始这个项目已经有一段时间了,目前试验证明性能至少是优于或者等同于之前的这些技术和方式的,DPC++能够跨结构实现所需的特性和抽象

高性能库如何推动人工智能的发展?

人工智能的发展进一步推动了对算力的渴求,硬件架构的世界已经发生了极大的颠覆,英特尔自身就有SVMS架构,华为、阿里、百度以及非常多的AI初创公司各有自己的芯片战略。

对此,英特尔架构、图形与软件部首席工程师Eric Lin表示,没有软件芯片无法使用,需要大量的开发者去将它表达为用户真正所需。这其中需要非常深厚的经验,英特尔希望将硬件能力抽象出来,把最重要的算法融于oneAPI,使开发者不再需要针对硬件做开发,更容易发挥出硬件的所有潜力。这是英特尔提供计算库的根本原因。
英特尔架构、图形与软件部首席工程师Eric Lin
有了这个计算库之后,能够提供给更多的框架开发者所使用,例如TensorFlow、 PaddlePaddle、MXNet等等。由于框架主要是给数据科学家所使用,他们往往缺少硬件知识,英特尔的策略是将计算库集成到框架中,再提供给数百万数据科学家、算法工程师,达到为开发者屏蔽硬件复杂性的目的。

由此看来,一个计算库服务数万个框架开发者,服务数百万甚至更多的数据科学家,打通了从硬件到应用的道路

oneAPI集成的计算库堪称业内“豪华配置“,包括快速、使用广泛的数学函数库MKL、使用经典机器学习算法的英特尔数据分析加速库DAAL,以及面向深度神经网络的英特尔数学核心函数库MKL-DNN等。

OpenVINO——oneAPI在深度学习方面的“小现实”

对于深度学习来说,数据分析过程基本包括四步:第一,获取数据;第二,建立数学模型,并且用这些数据去训练;第三,根据部署场景有针对性地优化模型;第四是推理,真正地让各种各样的开发者,把他们的服务、产品推向用户。如何让这个工作流程的所有开发者、参与者更有效率,是英特尔当前的重点之一。

去年8月,英特尔面向中国市场推出了专注于加速深度学习的OpenVINO工具包,能够帮助企业在边缘侧快速实现高性能计算机视觉与深度学习的开发。作为为客户解决问题的优化推理引擎,OpenVINO补充了深度学习框架,支持应用程序开发者以统一接口跨SVMS架构进行开发。据Eric介绍:“OpenVINO就是目前的一个商业部署,它所做的事情就是让开发者直接用一个统一的API,帮开发者完成简单的开发、简单的维护、并带来高性能,它展示了oneAPI愿景的现实。”

在没有OpenVINO之前,开发者如何进行部署?以英特尔自己为例,各种各样的库,有针对CPU的、显卡的、计算棒的、FPGA的……每一次开发的时候,各个库API不一样,性能调优不一样,Debug不一样,数据的预处理不一样,开发成本非常高。OpenVINO实现了无论是哪种类型的硬件,让开发者用一个统一API。

根据已公布的应用来看,云从的人脸识别智能设备、中科英泰的智能零售方案、阿里巴巴AliOS 互联网汽车道路感知算法优化方面、宇视科技的全融合智能解决方案UniAI等,都基于OpenVINO工具包。

对标英伟达CUDA?

NVIDIA公司于2007年正式发布的CUDA(Compute Unified Device Architecture,统一计算架构),是第一种不需借助图形学API就可以使用类C语言进行通用计算的开发环境和软件体系,是建立在GPU基础之上的通用计算开发平台。由于在性能、成本和开发时间上较传统的CPU解决方案有显著优势,当时在学术界和产业界引起了热烈反响。现在,CUDA已经在金融、石油、天文学、流体力学、信号处理、电磁仿真、模式识别、图像处理、视频压缩等领域获得广泛应用,并取得了丰硕的成果。

oneAPI的推出,似有异曲同工之妙。对此,Bill Savage表示,oneAPI开放给所有包括英伟达在内的硬件厂商,行业也需要这样一种开放的、对于现有解决方案之外的另一种选择。英特尔致力于向所有的、多样的架构来提供支持,使它们能够很好地一起协作。

英特尔已对DPC++一些开源项目在GitHub上进行托管,但一个显然存在的问题是,GitHub一些开源项目都是基于原有的如英伟达的GPU而实施,如果现在用oneAPI,开发者将会面临重新学习的问题。对此,Bill Savage表示,英特尔在设计DPC++的时候,语言本身已经和CUDA非常接近,对于开发人员来讲学习相对比较容易。至于程序员的迁移问题,英特尔会在年底发布测试版本的时候分享更多工具,来帮助迁移更容易

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179331
  • CUDA
    +关注

    关注

    0

    文章

    125

    浏览量

    14405
  • 英伟达
    +关注

    关注

    23

    文章

    4041

    浏览量

    97688
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123914
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型的第零日(Day 0)部署与性能优化。值得
    的头像 发表于 08-07 14:42 1123次阅读
    <b class='flag-5'>硬件</b>与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大模型

    Zephyr RTOS在英特尔处理器N系列的应用

    ZephyrRTOS是款高度灵活的,专为嵌入式设备设计的轻量级开源实时操作系统,支持包括英特尔 x86在内的多种硬件架构
    的头像 发表于 04-29 09:34 962次阅读
    Zephyr RTOS在<b class='flag-5'>英特尔</b>处理器N系列的应用

    英特尔首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能

    4月23日,在上海车展上,英特尔发布第二代英特尔AI增强软件定义汽车(SDV)SoC,并披露全新合作伙伴关系。第二代英特尔AI增强SDV SoC率先在汽车行业推出基于芯粒架构的设计,进
    的头像 发表于 04-23 21:20 992次阅读
    <b class='flag-5'>英特尔</b>首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能<b class='flag-5'>化</b>

    英特尔首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能

    基于芯粒架构的设计,进步扩展了英特尔在智能座舱领域的创新产品组合。同时,英特尔还宣布与黑芝麻智能、面壁智能、BOS Semiconductors等公司建立合作关系,共同攻克汽车智能
    发表于 04-23 14:26 742次阅读

    盟通科技携手Acontis助力英特尔虚拟驱动工业负载整合

    近期,盟通科技联合合作伙伴Acontis与英特尔针对虚拟驱动工业负载的整合这课题展开了合作。Acontis经过多年技术积累,推出了成熟、可靠且高效的实时虚拟扩展方案,对于这些方案
    的头像 发表于 04-11 10:50 773次阅读
    盟通科技携手Acontis助力<b class='flag-5'>英特尔</b>虚拟<b class='flag-5'>化</b>驱动工业负载整合

    英特尔酷睿Ultra AI PC上部署多种图像生成模型

    全新英特尔酷睿Ultra 200V系列处理器对比上代Meteor Lake,升级了模块结构、封装工艺,采用全新性能核与能效核、英特尔硬件线程调度器、Xe2微
    的头像 发表于 04-02 15:47 1151次阅读
    在<b class='flag-5'>英特尔</b>酷睿Ultra AI PC上部署多种图像生成模型

    中国汽车工业协会行到访英特尔公司

    近日,中国汽车工业协会副秘书长杨中平、技术部总监邹朋、技术部副主任李雅静、技术部业务主任王秋源行到访英特尔公司,在英特尔院士、英特尔公司副总裁、汽车事业部总经理Jack Weast,
    的头像 发表于 04-02 15:30 745次阅读

    英特尔以软硬件优化重构算力效率

    如何与能耗协同、通用架构如何与场景多元化匹配、技术迭代如何与生态步伐协同,构成当前企业应用算力过程中亟待解决的问题。   深耕数据中心领域多年,英特尔始终以技术创新为基石,为行业提供更高效、更灵活、更可持续的解决方案。我
    的头像 发表于 03-08 09:20 809次阅读

    请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容?

    无法在基于 Windows® 10 物联网企业版的目标系统上使用 英特尔® Distribution OpenVINO™ 2021* 版本推断模型。
    发表于 03-05 08:32

    英特尔®独立显卡与OpenVINO™工具套件结合使用时,无法运行推理怎么解决?

    使用英特尔®独立显卡与OpenVINO™工具套件时无法运行推理
    发表于 03-05 06:56

    英特尔任命王稚聪担任中国区副董事长

    英特尔公司宣布,任命王稚聪先生担任新设立的英特尔中国区副董事长职。王稚聪将全面负责管理英特尔中国的业务运营,直接向英特尔公司高级副总裁、
    的头像 发表于 03-03 10:54 882次阅读

    英特尔前Xeon首席架构师加盟高通

    高通公司近日宣布,英特尔前Xeon服务器处理器首席架构师Sailesh Kottapalli已正式加入高通,并担任高级副总裁职。此举被视为高通进军数据中心CPU市场的重要
    的头像 发表于 01-15 15:30 720次阅读

    美企纷纷调整多元化项目,顺应政策转向

    )计划,涉及招聘、培训和供应商挑选等流程。同时,公司首席多元化官也将被调往新职位。Meta表示,此举是因为围绕美国DEI工作的法律及政策环境正在发生变化。 同日,亚马逊也证实正在叫停部分多元化计划,这是对公司数百项举措审查的
    的头像 发表于 01-13 10:32 640次阅读

    英特尔2024产品年鉴:AI与软硬件的融合发展

    在2024年里,英特尔收获了系列软件突破和硬件革新,也收获了生态伙伴的支持与陪伴。通过不断迭代的硬件产品,和持续开放的软件生态,从数据中心和云,到边缘计算和PC的每
    的头像 发表于 12-31 17:28 702次阅读
    <b class='flag-5'>英特尔</b>2024产品年鉴:AI与软<b class='flag-5'>硬件</b>的融合发展

    英特尔带您解锁云上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理器的第四代服务器实例,以打造弹性算力底座的产品实践。同时,英特尔也携手扣子
    的头像 发表于 12-23 14:05 1235次阅读