还未设置个性签名
成为VIP会员 享9项特权: 开通会员

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

试图打破CUDA统治的SYCL

E4Life 来源:电子发烧友原创 作者:Leland 2022-06-28 09:48 次阅读
各式各样的加速器在当下的计算架构中越来越普遍,HPC、数据中心等高端应用开始追求更高的峰值性能,用到了专业GPUAI加速器,而手机、嵌入式系统开始追求更高的能效,也在其SoC、MCU中加入一定的嵌入式加速硬件。但与此同时,这样复杂的多厂商、多架构和多硬件生态,为编程带来了巨大的难题。但CUDA作为只面向英伟达GPU的封闭软件生态,其热度却水涨船高。

提及各大编程语言的论文数量/ 谷歌学术

在软件开发中,一个开放的标准层就是开发者产品方案的接口规范,同样的,处理器开发商们可以使用基于开放标准层的底层软件驱动创造解决方案。如此一来软件开发者们无需捆绑在特定的硬件方案上,硬件开发者的硬件不仅可以兼顾自己维护的软件,还能支持到更多的软件开发人员。而且在普及之后,开发人员的技能更加具有普适性,他们可以方便地使用自己熟悉的开发工具。

对使用开放标准的软硬件公司来说,此举可以加快产品上市时间,减少长期维护工作,而且在软件方案厂商日益剧增的当下,业界已经普遍接受了开放标准,就像RISC-V一样,英特尔AMD甚至是英伟达也都对开放标准的定义做出了贡献,对于一些初创企业来说就更是如此了。

SYCL出世

从市场反馈来看,开发者的需求很明显了,他们想要一个标准的编程模型,拥有标准运算库、对Pytorch、Tensorflow等AI框架的支持、性能分析工具,以及对多个厂商不同硬件架构的支持,而这些需求汇聚在一起,使得开放标准联盟Khronos Group联合旗下成员打造出了SYCL这一编程语言。

SYCL作为跨越CPU、GPU、FPGA和AI加速器等多种架构的一致性编程语言,每个架构能单独或整合编程。SYCL编程语言与其API扩展能用于不同的开发用例,比如负载加速或异构计算应用,将现有的C、C++或其他加速器语言代码转换成SYCL代码。

SYCL的支持情况/ Khronos Group
在不同厂商的支持下,SYCL的实施方式有多种,他们增加了对OpenCL以外不同加速API后端的支持,比如Codeplay的ComputeCpp、英特尔的DPC++、AMD的hipSYCL以及Xilinx的triSYCL等。

英特尔的SYCL之路

英特尔对于SYCL的重视可以说显而易见了,自从宣布转向XPU+oneAPI的路线之后,英特尔就已经与SYCL深度绑定了。不仅微软、谷歌等巨头宣布支持oneAPI,英特尔也和中科院计算所在内的大型研究所、国家实验室和大学合作成立了oneAPI卓越中心,借助他们的oneAPI开源代码,进一步扩展oneAPI产品与规范。

oneAPI的核心则是其编程语言DPC++,英特尔的DPC++可以说是SYCL的超集,不仅包含了SYCL标准,还包含一些功能扩展,比如统一共享内存等,不过目前其中不少扩展也已经并入了SYCL新版规范中。

不过SYCL远不仅是为了方便英特尔建设其跨架构的软件生态,而是为了打破CUDA的统治,打造一个更加开放的软硬件生态,这点从英特尔在oneAPI的开发动向就能看出。

此前英特尔对于CUDA并没有任何动作,反倒是其竞争对手AMD推出了HIP,帮助开发者将CUDA代码移植至AMD平台上,毕竟AMD还得发展GPU生态。但随着英特尔的硬件路线已经不单单是CPU,而是CPU、GPU、FPGA、IPU和AI加速器的多硬件异构生态,这时候打造一个CUDA之外的软件生态是提升其产品竞争力的必经之路了。

为了更好实现对CUDA代码的移植,英特尔推出了DPC++兼容性工具(DPCT),目前版本的DPCT已经可以将90%到95%的CUDA代码转换成SYCL。不过这只是一个理想范围,具体数值还是取决于代码对应的工作负载。对于简单的CUDA程序来说,完成DPC++的移植只需要对CUDA源文件运行这一转换工具即可,相对复杂的CUDA程序还是需要一定的手动编程优化。

今年6月,英特尔公布消息,决定收购Codeplay公司。要说对SYCL的研究,除了英特尔以外,最深入的当属Codeplay了,毕竟就连SYCL工作组的主席也是来自Codeplay的杰出工程师MichaelWong。Codeplay不仅提供了多种处理器上SYCL的支持,也支持将CUDA代码移植为SYCL,同时保证SYCL代码在英伟达GPU上的继续运行,还能调用一些CUDA库。

Codeplay的方案支持覆盖英特尔、AMD、英伟达的处理器,而且他们也开始了对汽车ADAS(瑞萨R-Car)、边缘计算设备(ImaginationPowerVR)与RISC-V处理器(晶心科技NX27V)的支持开发工作。后三者恰好是SYCL当前未曾开拓的市场,但却是英特尔正在发力的三大市场,加上Codeplay本身在HPC、AI上的软件开发实力,如此看来,英特尔收购Codeplay完全符合其战略目标。

结语

尽管SYCL的构想是好的,其发展路线也是倾向于开发者,但这并不代表着就一定能取代CUDA的位置,毕竟SYCL其实也才诞生没多久,与CUDA、OpenCL或OpenMP相比生态发展还没有成熟。再者就是统一各种硬件的编程并没有那么简单,正如英伟达CEO黄仁勋曾经提出的质疑:时间会揭晓一个编程方法是否能兼容七种不同的处理器,至少历史上从未出现过。
  • amd
    amd
    +关注

    关注

    24

    文章

    4456

    浏览量

    125922
  • 英特尔
    +关注

    关注

    56

    文章

    7866

    浏览量

    161692
  • 英伟达
    +关注

    关注

    18

    文章

    1418

    浏览量

    81463
收藏 人收藏

    评论

    相关推荐

    英特尔推出面向移动设备和台式机的锐炫Pro图形显卡

    首批产品包含面向移动设备的英特尔锐炫Pro A30M 图形显卡,和面向小型台式机的英特尔锐炫Pro ....
    发表于 08-12 20:54 68次 阅读

    斯坦福大学和英伟达研究更轻薄的VR全息眼镜

    元宇宙的爆发使得VR头显越加受到关注,我们看到8月10日(当地时间周二),Facebook母公司Me....
    发表于 08-12 19:24 84次 阅读

    英伟达AI技术 助体育运动大数据分析和收集提升内容价值

    人工智能在大数据分析应用的作用越来越大,更多的专业数据分析也开始采用上基于英伟达AI 技术来大幅提升....
    的头像 电子麦克风 发表于 08-12 16:32 484次 阅读
    英伟达AI技术 助体育运动大数据分析和收集提升内容价值

    深化学界产业界融合创新,2022英特尔中国学术峰会召开

    8月10日,2022英特尔中国学术峰会在福建省福州市开幕。本届峰会为期两天,以“聚智同行,共创未来”....
    的头像 话说科技 发表于 08-12 10:09 110次 阅读
    深化学界产业界融合创新,2022英特尔中国学术峰会召开

    英特尔® FPGA AI套件搭配OpenVINO™工具包

    您可以使用英特尔 分发版 OpenVINO 工具包和英特尔 FPGA AI 套件开发推理系统,服务于....
    的头像 英特尔FPGA 发表于 08-11 11:53 76次 阅读

    关于英特尔4处理节点技术详解

    EUV 的使用也对英特尔的产量产生了积极影响。尽管该公司没有提供确切的数字,但步骤数量的减少减少了任....
    发表于 08-11 10:23 69次 阅读
    关于英特尔4处理节点技术详解

    英特尔发布了关于Sapphire Rapids的简短更新

    作为英特尔首款tiled至强处理器,Sapphire Rapids也是英特尔首款提供可选片内HBM内....
    的头像 SSDFans 发表于 08-11 09:21 111次 阅读

    英特尔新的 Loihi 神经形态芯片模仿活体大脑

    英特尔新的 Loihi 芯片的设计方式模仿了活体动物的大脑功能。新的人工大脑内的通信是通过一系列“尖....
    发表于 08-10 16:17 39次 阅读

    使用正确的工具和实践避免安全漏洞

    例如,根据 Barbara Filkins 为 Netscout 撰写的 SANS 调查,一些组织不....
    的头像 母猪会上树 发表于 08-10 11:34 35次 阅读
    使用正确的工具和实践避免安全漏洞

    英特尔形成深度融合匹配的整体解决方案 推动通信产业发展

    身处不断数字化的世界中,我们需要更加高效灵活的计算来处理日益复杂多样的数据,这对半导体技术的创新提出....
    的头像 city_prolove 发表于 08-10 11:28 211次 阅读

    基于EUV技术,制程工艺演进到intel4,激发千倍算力怎么做?英特尔宋继强揭示前沿半导体技术创新路径

    如何突破算力的瓶颈?如何让不同架构的处理器在硬件架构布局上发挥最大协同作用?从终端侧、到边缘再到服务....
    的头像 章鹰观察 发表于 08-09 08:28 873次 阅读
    基于EUV技术,制程工艺演进到intel4,激发千倍算力怎么做?英特尔宋继强揭示前沿半导体技术创新路径

    i9-13900K加速频率5.8GHz,单核心2314分、多核心26464分

    i9-13900K将利用更成熟的工艺架构、各种睿频极速技术,再创频率新高。之前也多次见过i9-139....
    发表于 08-08 17:39 141次 阅读

    锐龙5 7600X测试跑分榜第一,超越12代酷睿处理器

    测试显示,锐龙5 7600X在各种负载下来的成绩是平均数的117%,居然超越了12代酷睿全家。可做参....
    发表于 08-08 17:34 162次 阅读

    从FPGA的角度看AMD收购Xilinx事件

    对于10K器件,FPGA解决方案的成本为300万美元,ASIC的成本为4100万美元。因此,对于10....
    发表于 08-08 15:37 119次 阅读

    AMD锐龙7000系列处理器或将9月上市

    锐龙7000系列首批产品也是有4款型号,分别是锐龙9 7950X、锐龙9 7900X、锐龙7 770....
    发表于 08-08 14:20 167次 阅读

    英伟达 VS 微软,谁将在元宇宙中称霸?

    微软(MSFT)最近在Ignite大会上公布了其元宇宙战略。微软的战略核心是改变工作场所。除此之外,....
    的头像 猛兽财经 发表于 08-07 14:42 76次 阅读
    英伟达 VS 微软,谁将在元宇宙中称霸?

    AMD仍然是数据中心之王

    几周前,AMD发布了其即将推出的服务器路线图的消息,这为我们期待该公司正在酝酿的一些更强大的服务器产....
    的头像 猛兽财经 发表于 08-07 14:41 51次 阅读
    AMD仍然是数据中心之王

    英伟达是一家非常值得长期投资的公司

    随着英伟达(NVDA)的市值逐渐逼近1万亿美元,我们将在本文中讨论一下我们长期投资一家公司时最关注的....
    的头像 猛兽财经 发表于 08-07 14:39 65次 阅读
    英伟达是一家非常值得长期投资的公司

    AMD二季度营收同比增长60%,预计三季度PC业务下滑17%;移动机器人赛道半年吸金数十亿

    内存价格骤降,6月份IC芯片销售出现史无前例下跌情况   近日,据知名半导体分析机构IC Insig....
    发表于 08-06 04:10 538次 阅读
    AMD二季度营收同比增长60%,预计三季度PC业务下滑17%;移动机器人赛道半年吸金数十亿

    亿咖通科技与AMD达成战略合作

    双方将亿咖通科技在汽车数字座舱设计方面的丰富经验,与 AMD 先进的计算能力和出色的视觉图形渲染能力....
    的头像 亿咖通科技 ECARX 发表于 08-05 09:44 186次 阅读

    大联大推出基于英特尔产品的驾驶行为解决方案

    物流运输是一种需要在公路上长时间行驶的行业,因此驾驶安全对于该行业尤为重要。而随着5G及车联网技术的....
    的头像 大联大 发表于 08-05 09:20 1067次 阅读

    5nm工艺的锐龙7000系列处理器将在三季度上市

    对于RX 7000系列显卡,AMD官方确认的只有5nm工艺,RDNA3架构,能效在RDNA2基础上再....
    发表于 08-04 11:53 1065次 阅读

    AMD公布2022年第二季度财报,66亿美元季度营业额创新高

    再创新高!季度营业额为66亿美元,同比大增70%;超过10亿美元创纪录的季度经营现金流。 加利福尼亚....
    的头像 话说科技 发表于 08-04 10:47 275次 阅读

    开源芯片设计将迎来一次更大的升级

    从130nm迈向90nm7月28日,谷歌正式宣布扩展与SkyWater扩展合作关系,预计于今年推出全....
    的头像 电子发烧友网 发表于 08-04 09:27 178次 阅读

    英伟达Orin算法库主要三类算法

    另一种是车企交出部分灵魂,英伟达提供底层的基础算法,这些算法大多基于手工模型,和深度学习没关联。实际....
    的头像 佐思汽车研究 发表于 08-03 14:13 170次 阅读

    英特尔宋继强:坚持半导体底层技术创新,激发算力千倍级提升

    2022 年 7 月 30 日,英特尔研究院副总裁、英特尔中国研究院院长宋继强博士出席了由中国计算机....
    的头像 话说科技 发表于 08-02 09:59 355次 阅读
    英特尔宋继强:坚持半导体底层技术创新,激发算力千倍级提升

    联发科16nm芯片2023年量产 部分芯片由英特尔代工

      最近,英特尔和联发科宣布了一项战略合作伙伴关系,联发科将利用英特尔的16纳米工艺技术生产一系列智....
    的头像 星星科技指导员 发表于 08-01 17:39 510次 阅读

    专家称人工智能重塑半导体行业

    有道理的是,我们会发现很多应用程序,我们可以在其中利用人工智能的力量来改进我们的流程并更快地构建芯片....
    的头像 chunhuahua 发表于 08-01 11:51 189次 阅读

    Intel宣布彻底退出Optane技术相关业务

      英特尔旗下的奥腾子品牌有很多产品,包括傲腾内存、傲腾持久内存和傲腾SSD,但该公司此前已将所有产....
    的头像 星星科技指导员 发表于 08-01 11:51 265次 阅读

    英特尔三十年来首次净亏损,正式结束傲腾存储业务

    近日,英特尔在业绩说明会上公布了该公司2022财年第二季度财报,尽管此前已经有多位分析师预测业绩将下....
    的头像 Simon观察 发表于 07-31 07:22 1382次 阅读
    英特尔三十年来首次净亏损,正式结束傲腾存储业务

    AMD锐龙5 5600处理器实现端到端的设计提升

    如果你想升级PC装备,又纠结如何在有限的预算内选择高性价比的处理器,那么千元左右价位的AMD锐龙5 ....
    发表于 07-30 10:46 240次 阅读

    AMD超威卓越平台笔记本ROG幻14 2022可实现精准识别、操作手感舒适

    如果说有一款兼具轻薄和性能的笔记本,它既能满足办公需要,移动便携,也能日常畅玩游戏,且颜值非常在线,....
    发表于 07-30 10:40 186次 阅读

    AMD EPYC(霄龙)如何获取HCI优势

    当今时代,数字化转型已成为一项持续进行的工作,IT团队需要用更少的钱和更少的人来提高数据中心的性能、....
    的头像 AMD中国 发表于 07-30 10:29 114次 阅读

    英伟达披荆斩棘的逆袭之路回顾

    GeForce 256第一次在显卡中加入了硬件T&L,即transforming&lighting(....
    发表于 07-29 10:23 216次 阅读

    AMD将于AM5主板展上展示新一代AM5主板

      据消息,AMD已正式宣布将于8月5日12点举办AM5主板展,届时将推出华硕、微星、华清等厂商的X....
    的头像 星星科技指导员 发表于 07-28 14:43 186次 阅读

    USB 4 Retimer芯片布局已经开始

    我们从近期发布的M2 Macbook Air和Macbook Pro中可以看到,苹果在这两款机型以及....
    的头像 电子发烧友网 发表于 07-28 09:27 286次 阅读

    为了USB 4,苹果放弃了最后一颗英特尔芯片

    自苹果在Mac系列上从英特尔的x86平台,转向自研的M系列ARM架构芯片后,不只是英特尔,过去负责M....
    的头像 E4Life 发表于 07-28 08:00 884次 阅读
    为了USB 4,苹果放弃了最后一颗英特尔芯片

    NVIDIA LinkX 助力IB网络高速稳定与可靠传输

    InfiniBand(直译为“无限带宽”技术,缩写为IB)是一个用于高性能计算的计算机网络通信标准,....
    的头像 维维为 发表于 07-27 17:41 244次 阅读
    NVIDIA LinkX 助力IB网络高速稳定与可靠传输

    英特尔展示一个严格控制、高度集成的八波长激光器

    想要提高未来I/O接口的能效和工作范围,很有可能是在同一个封装中集成硅电路和光学。研究人员认为,通过....
    的头像 SSDFans 发表于 07-27 11:40 139次 阅读

    在linux里对多个MAC使用同一subnet的方法

    这个问题是Linux Kernel TCP/IP Stack对于同一子网的IP处理方式决定的,严格来....
    发表于 07-27 09:47 109次 阅读

    量子计算的下一步是什么?

    著名科幻作家威廉·吉布森曾说过:“未来已来;只是分布不是很均匀。” 这是英特尔高级研究员、副总裁兼英....
    的头像 剑寒九州 发表于 07-26 16:31 141次 阅读

    三星二代智能SSD硬盘 实现更高系统性能

      该项目由三星和AMD共同开发,将2020年推出的第一代智能固态硬盘的计算性能提高了一倍多,从而实....
    的头像 星星科技指导员 发表于 07-25 17:26 810次 阅读

    或为营收考虑!英特尔微处理器和外设芯片产品即将涨价

    有媒体跟进报道称,英特尔将于今年秋季开始涨价,涉及的产品包括家用电脑和服务器CPU,以及Wi-Fi芯....
    的头像 电子发烧友网 发表于 07-25 16:33 440次 阅读

    AMD Zen4锐龙7000系列能否压倒Raptor Lake 13代酷睿

    AMD Zen4锐龙7000系列到底能带来都大的提升?能否压倒Raptor Lake 13代酷睿?今....
    的头像 硬件世界 发表于 07-25 14:44 358次 阅读

    在微软云机器学习平台Azure ML上利用OpenVINO快速实现AI推理

    众所周知,18世纪60年代人类开始了第一次工业革命,从此进入“蒸汽时代”,接着进入了电气时代和信息时....
    的头像 英特尔中国 发表于 07-25 11:21 167次 阅读

    英特尔推出四款AI参考套件

    开源设计简化了用于医疗、制造、零售和其它行业解决方案的AI开发。
    的头像 英特尔中国 发表于 07-25 11:16 1841次 阅读

    AMD RDNA 3/Navi 3X GPU升级

    但尽管如此,目前单节点跳转本身无法提供50%的单位性能提升(RIP Dennard缩放)。因此,计划....
    的头像 SSDFans 发表于 07-25 09:43 150次 阅读

    Intel 4工艺的物理和性能特征

    Intel 4 工艺对于英特尔来说是一个重要的里程碑,因为它是英特尔第一个集成 EUV 的工艺,也是....
    的头像 智能计算芯世界 发表于 07-21 09:53 204次 阅读

    英特尔FPGA中国创新中心的链接产业与人才 助FPGA人才走向实战

    当前,5G、人工智能、自动驾驶等技术快速发展,应用场景也愈加广泛,这背后,有着灵活高效、高性能、低功....
    发表于 07-20 16:59 351次 阅读

    小白求助AMD跟ARM有什么关系

    据我所知,两者是没什么关系的, 一个是美国的桌面级CPU生产商, 一个是英国移动平台CPU芯片生产商。 但那天在网上看到...
    发表于 06-30 18:02 3863次 阅读

    英特尔重新思考解决芯片短缺的常用基板

    英特尔正在创造性地解决制造业放缓的问题ーー这一次,它把 ABF 基板两侧的电容器增加了一倍 如今,持续的芯片短缺已导致零部...
    发表于 06-20 09:50 3607次 阅读
    英特尔重新思考解决芯片短缺的常用基板

    在AMD CPU的Windows电脑下,启动模拟器失败无法安装GVM怎么解决?

    在AMD CPU的Windows电脑下,启动模拟器失败,提示“Unable to install GVM.”,无法安装GVM。 ...
    发表于 06-07 10:13 676次 阅读

    英伟达DPU的过“芯”之处

    最近几年,经常关注科技圈的朋友们总会发现,每次遇到厂商有重大发布,就总能看到“颠覆”、“极致”、“革命性”等概念出现在发...
    发表于 03-29 14:42 3116次 阅读

    Intel即将推出的GPU将与Arm兼容

    英特尔正在使其GPU多样化,以与x86以外架构的处理器兼容,这可能是使其从芯片制造商成为以代工为首要业务的公司的一步。 英特...
    发表于 03-29 14:41 2836次 阅读

    请问i5 9300h好不好?怎么样?

    请问i5 9300h好不好?怎么样?
    发表于 09-23 09:05 1393次 阅读

    请问一下i7-10700K配什么主板好?

    请问一下i7-10700K配什么主板好?
    发表于 09-23 07:17 1362次 阅读

    请问一下i5 10400F配什么主板?

    请问一下i5 10400F配什么主板?
    发表于 09-23 06:53 1211次 阅读

    AMD RX7000系列显卡核心参数已被曝出!拥有高达15360个流处理器!

    AMD RX7000系列显卡将在明年问世。近日,下一代显卡核心Navi 31、Navi 33在外网被曝出,均采用RDNA 3架构设计,其中分...
    发表于 08-24 17:24 2134次 阅读

    Intel PXA270与AMD Au1200比较分析 精选资料推荐

    Intel公司于2003年第四季度推出了性能卓越的嵌入式处理器PXA270,基于XSCALE架构,最高主频可达624MHz。PXA270最...
    发表于 08-12 06:03 1606次 阅读