各式各样的加速器在当下的计算架构中越来越普遍,HPC、数据中心等高端应用开始追求更高的峰值性能,用到了专业GPU、AI加速器,而手机、嵌入式系统开始追求更高的能效,也在其SoC、MCU中加入一定的嵌入式加速硬件。但与此同时,这样复杂的多厂商、多架构和多硬件生态,为编程带来了巨大的难题。但CUDA作为只面向英伟达GPU的封闭软件生态,其热度却水涨船高。

提及各大编程语言的论文数量/ 谷歌学术
在软件开发中,一个开放的标准层就是开发者产品方案的接口规范,同样的,处理器开发商们可以使用基于开放标准层的底层软件驱动创造解决方案。如此一来软件开发者们无需捆绑在特定的硬件方案上,硬件开发者的硬件不仅可以兼顾自己维护的软件,还能支持到更多的软件开发人员。而且在普及之后,开发人员的技能更加具有普适性,他们可以方便地使用自己熟悉的开发工具。
对使用开放标准的软硬件公司来说,此举可以加快产品上市时间,减少长期维护工作,而且在软件方案厂商日益剧增的当下,业界已经普遍接受了开放标准,就像RISC-V一样,英特尔、AMD甚至是英伟达也都对开放标准的定义做出了贡献,对于一些初创企业来说就更是如此了。
SYCL出世
从市场反馈来看,开发者的需求很明显了,他们想要一个标准的编程模型,拥有标准运算库、对Pytorch、Tensorflow等AI框架的支持、性能分析工具,以及对多个厂商不同硬件架构的支持,而这些需求汇聚在一起,使得开放标准联盟Khronos Group联合旗下成员打造出了SYCL这一编程语言。
SYCL作为跨越CPU、GPU、FPGA和AI加速器等多种架构的一致性编程语言,每个架构能单独或整合编程。SYCL编程语言与其API扩展能用于不同的开发用例,比如负载加速或异构计算应用,将现有的C、C++或其他加速器语言代码转换成SYCL代码。

SYCL的支持情况/ Khronos Group
在不同厂商的支持下,SYCL的实施方式有多种,他们增加了对OpenCL以外不同加速API后端的支持,比如Codeplay的ComputeCpp、英特尔的DPC++、AMD的hipSYCL以及Xilinx的triSYCL等。
英特尔的SYCL之路
英特尔对于SYCL的重视可以说显而易见了,自从宣布转向XPU+oneAPI的路线之后,英特尔就已经与SYCL深度绑定了。不仅微软、谷歌等巨头宣布支持oneAPI,英特尔也和中科院计算所在内的大型研究所、国家实验室和大学合作成立了oneAPI卓越中心,借助他们的oneAPI开源代码,进一步扩展oneAPI产品与规范。
oneAPI的核心则是其编程语言DPC++,英特尔的DPC++可以说是SYCL的超集,不仅包含了SYCL标准,还包含一些功能扩展,比如统一共享内存等,不过目前其中不少扩展也已经并入了SYCL新版规范中。
不过SYCL远不仅是为了方便英特尔建设其跨架构的软件生态,而是为了打破CUDA的统治,打造一个更加开放的软硬件生态,这点从英特尔在oneAPI的开发动向就能看出。
此前英特尔对于CUDA并没有任何动作,反倒是其竞争对手AMD推出了HIP,帮助开发者将CUDA代码移植至AMD平台上,毕竟AMD还得发展GPU生态。但随着英特尔的硬件路线已经不单单是CPU,而是CPU、GPU、FPGA、IPU和AI加速器的多硬件异构生态,这时候打造一个CUDA之外的软件生态是提升其产品竞争力的必经之路了。
为了更好实现对CUDA代码的移植,英特尔推出了DPC++兼容性工具(DPCT),目前版本的DPCT已经可以将90%到95%的CUDA代码转换成SYCL。不过这只是一个理想范围,具体数值还是取决于代码对应的工作负载。对于简单的CUDA程序来说,完成DPC++的移植只需要对CUDA源文件运行这一转换工具即可,相对复杂的CUDA程序还是需要一定的手动编程优化。
今年6月,英特尔公布消息,决定收购Codeplay公司。要说对SYCL的研究,除了英特尔以外,最深入的当属Codeplay了,毕竟就连SYCL工作组的主席也是来自Codeplay的杰出工程师MichaelWong。Codeplay不仅提供了多种处理器上SYCL的支持,也支持将CUDA代码移植为SYCL,同时保证SYCL代码在英伟达GPU上的继续运行,还能调用一些CUDA库。
Codeplay的方案支持覆盖英特尔、AMD、英伟达的处理器,而且他们也开始了对汽车ADAS(瑞萨R-Car)、边缘计算设备(ImaginationPowerVR)与RISC-V处理器(晶心科技NX27V)的支持开发工作。后三者恰好是SYCL当前未曾开拓的市场,但却是英特尔正在发力的三大市场,加上Codeplay本身在HPC、AI上的软件开发实力,如此看来,英特尔收购Codeplay完全符合其战略目标。
结语
尽管SYCL的构想是好的,其发展路线也是倾向于开发者,但这并不代表着就一定能取代CUDA的位置,毕竟SYCL其实也才诞生没多久,与CUDA、OpenCL或OpenMP相比生态发展还没有成熟。再者就是统一各种硬件的编程并没有那么简单,正如英伟达CEO黄仁勋曾经提出的质疑:时间会揭晓一个编程方法是否能兼容七种不同的处理器,至少历史上从未出现过。

提及各大编程语言的论文数量/ 谷歌学术
在软件开发中,一个开放的标准层就是开发者产品方案的接口规范,同样的,处理器开发商们可以使用基于开放标准层的底层软件驱动创造解决方案。如此一来软件开发者们无需捆绑在特定的硬件方案上,硬件开发者的硬件不仅可以兼顾自己维护的软件,还能支持到更多的软件开发人员。而且在普及之后,开发人员的技能更加具有普适性,他们可以方便地使用自己熟悉的开发工具。
对使用开放标准的软硬件公司来说,此举可以加快产品上市时间,减少长期维护工作,而且在软件方案厂商日益剧增的当下,业界已经普遍接受了开放标准,就像RISC-V一样,英特尔、AMD甚至是英伟达也都对开放标准的定义做出了贡献,对于一些初创企业来说就更是如此了。
SYCL出世
从市场反馈来看,开发者的需求很明显了,他们想要一个标准的编程模型,拥有标准运算库、对Pytorch、Tensorflow等AI框架的支持、性能分析工具,以及对多个厂商不同硬件架构的支持,而这些需求汇聚在一起,使得开放标准联盟Khronos Group联合旗下成员打造出了SYCL这一编程语言。
SYCL作为跨越CPU、GPU、FPGA和AI加速器等多种架构的一致性编程语言,每个架构能单独或整合编程。SYCL编程语言与其API扩展能用于不同的开发用例,比如负载加速或异构计算应用,将现有的C、C++或其他加速器语言代码转换成SYCL代码。

SYCL的支持情况/ Khronos Group
英特尔的SYCL之路
英特尔对于SYCL的重视可以说显而易见了,自从宣布转向XPU+oneAPI的路线之后,英特尔就已经与SYCL深度绑定了。不仅微软、谷歌等巨头宣布支持oneAPI,英特尔也和中科院计算所在内的大型研究所、国家实验室和大学合作成立了oneAPI卓越中心,借助他们的oneAPI开源代码,进一步扩展oneAPI产品与规范。
oneAPI的核心则是其编程语言DPC++,英特尔的DPC++可以说是SYCL的超集,不仅包含了SYCL标准,还包含一些功能扩展,比如统一共享内存等,不过目前其中不少扩展也已经并入了SYCL新版规范中。
不过SYCL远不仅是为了方便英特尔建设其跨架构的软件生态,而是为了打破CUDA的统治,打造一个更加开放的软硬件生态,这点从英特尔在oneAPI的开发动向就能看出。
此前英特尔对于CUDA并没有任何动作,反倒是其竞争对手AMD推出了HIP,帮助开发者将CUDA代码移植至AMD平台上,毕竟AMD还得发展GPU生态。但随着英特尔的硬件路线已经不单单是CPU,而是CPU、GPU、FPGA、IPU和AI加速器的多硬件异构生态,这时候打造一个CUDA之外的软件生态是提升其产品竞争力的必经之路了。
为了更好实现对CUDA代码的移植,英特尔推出了DPC++兼容性工具(DPCT),目前版本的DPCT已经可以将90%到95%的CUDA代码转换成SYCL。不过这只是一个理想范围,具体数值还是取决于代码对应的工作负载。对于简单的CUDA程序来说,完成DPC++的移植只需要对CUDA源文件运行这一转换工具即可,相对复杂的CUDA程序还是需要一定的手动编程优化。
今年6月,英特尔公布消息,决定收购Codeplay公司。要说对SYCL的研究,除了英特尔以外,最深入的当属Codeplay了,毕竟就连SYCL工作组的主席也是来自Codeplay的杰出工程师MichaelWong。Codeplay不仅提供了多种处理器上SYCL的支持,也支持将CUDA代码移植为SYCL,同时保证SYCL代码在英伟达GPU上的继续运行,还能调用一些CUDA库。
Codeplay的方案支持覆盖英特尔、AMD、英伟达的处理器,而且他们也开始了对汽车ADAS(瑞萨R-Car)、边缘计算设备(ImaginationPowerVR)与RISC-V处理器(晶心科技NX27V)的支持开发工作。后三者恰好是SYCL当前未曾开拓的市场,但却是英特尔正在发力的三大市场,加上Codeplay本身在HPC、AI上的软件开发实力,如此看来,英特尔收购Codeplay完全符合其战略目标。
结语
尽管SYCL的构想是好的,其发展路线也是倾向于开发者,但这并不代表着就一定能取代CUDA的位置,毕竟SYCL其实也才诞生没多久,与CUDA、OpenCL或OpenMP相比生态发展还没有成熟。再者就是统一各种硬件的编程并没有那么简单,正如英伟达CEO黄仁勋曾经提出的质疑:时间会揭晓一个编程方法是否能兼容七种不同的处理器,至少历史上从未出现过。
-
amd +关注
关注
24文章
4456浏览量
125922 -
英特尔 +关注
关注
56文章
7866浏览量
161692 -
英伟达 +关注
关注
18文章
1418浏览量
81463
发布评论请先 登录
相关推荐
英特尔推出面向移动设备和台式机的锐炫Pro图形显卡
首批产品包含面向移动设备的英特尔锐炫Pro A30M 图形显卡,和面向小型台式机的英特尔锐炫Pro ....
发表于 08-12 20:54 •
68次
阅读
斯坦福大学和英伟达研究更轻薄的VR全息眼镜
元宇宙的爆发使得VR头显越加受到关注,我们看到8月10日(当地时间周二),Facebook母公司Me....
发表于 08-12 19:24 •
84次
阅读
英特尔® FPGA AI套件搭配OpenVINO™工具包
您可以使用英特尔 分发版 OpenVINO 工具包和英特尔 FPGA AI 套件开发推理系统,服务于....
英特尔发布了关于Sapphire Rapids的简短更新
作为英特尔首款tiled至强处理器,Sapphire Rapids也是英特尔首款提供可选片内HBM内....
英特尔新的 Loihi 神经形态芯片模仿活体大脑
英特尔新的 Loihi 芯片的设计方式模仿了活体动物的大脑功能。新的人工大脑内的通信是通过一系列“尖....
发表于 08-10 16:17 •
39次
阅读
英特尔形成深度融合匹配的整体解决方案 推动通信产业发展
身处不断数字化的世界中,我们需要更加高效灵活的计算来处理日益复杂多样的数据,这对半导体技术的创新提出....
基于EUV技术,制程工艺演进到intel4,激发千倍算力怎么做?英特尔宋继强揭示前沿半导体技术创新路径
如何突破算力的瓶颈?如何让不同架构的处理器在硬件架构布局上发挥最大协同作用?从终端侧、到边缘再到服务....

i9-13900K加速频率5.8GHz,单核心2314分、多核心26464分
i9-13900K将利用更成熟的工艺架构、各种睿频极速技术,再创频率新高。之前也多次见过i9-139....
发表于 08-08 17:39 •
141次
阅读
锐龙5 7600X测试跑分榜第一,超越12代酷睿处理器
测试显示,锐龙5 7600X在各种负载下来的成绩是平均数的117%,居然超越了12代酷睿全家。可做参....
发表于 08-08 17:34 •
162次
阅读
从FPGA的角度看AMD收购Xilinx事件
对于10K器件,FPGA解决方案的成本为300万美元,ASIC的成本为4100万美元。因此,对于10....
发表于 08-08 15:37 •
119次
阅读
AMD锐龙7000系列处理器或将9月上市
锐龙7000系列首批产品也是有4款型号,分别是锐龙9 7950X、锐龙9 7900X、锐龙7 770....
发表于 08-08 14:20 •
167次
阅读
AMD二季度营收同比增长60%,预计三季度PC业务下滑17%;移动机器人赛道半年吸金数十亿
内存价格骤降,6月份IC芯片销售出现史无前例下跌情况 近日,据知名半导体分析机构IC Insig....
发表于 08-06 04:10 •
538次
阅读

亿咖通科技与AMD达成战略合作
双方将亿咖通科技在汽车数字座舱设计方面的丰富经验,与 AMD 先进的计算能力和出色的视觉图形渲染能力....
大联大推出基于英特尔产品的驾驶行为解决方案
物流运输是一种需要在公路上长时间行驶的行业,因此驾驶安全对于该行业尤为重要。而随着5G及车联网技术的....
5nm工艺的锐龙7000系列处理器将在三季度上市
对于RX 7000系列显卡,AMD官方确认的只有5nm工艺,RDNA3架构,能效在RDNA2基础上再....
发表于 08-04 11:53 •
1065次
阅读
AMD公布2022年第二季度财报,66亿美元季度营业额创新高
再创新高!季度营业额为66亿美元,同比大增70%;超过10亿美元创纪录的季度经营现金流。 加利福尼亚....
开源芯片设计将迎来一次更大的升级
从130nm迈向90nm7月28日,谷歌正式宣布扩展与SkyWater扩展合作关系,预计于今年推出全....
英伟达Orin算法库主要三类算法
另一种是车企交出部分灵魂,英伟达提供底层的基础算法,这些算法大多基于手工模型,和深度学习没关联。实际....
联发科16nm芯片2023年量产 部分芯片由英特尔代工
最近,英特尔和联发科宣布了一项战略合作伙伴关系,联发科将利用英特尔的16纳米工艺技术生产一系列智....
专家称人工智能重塑半导体行业
有道理的是,我们会发现很多应用程序,我们可以在其中利用人工智能的力量来改进我们的流程并更快地构建芯片....
Intel宣布彻底退出Optane技术相关业务
英特尔旗下的奥腾子品牌有很多产品,包括傲腾内存、傲腾持久内存和傲腾SSD,但该公司此前已将所有产....
AMD锐龙5 5600处理器实现端到端的设计提升
如果你想升级PC装备,又纠结如何在有限的预算内选择高性价比的处理器,那么千元左右价位的AMD锐龙5 ....
发表于 07-30 10:46 •
240次
阅读
AMD超威卓越平台笔记本ROG幻14 2022可实现精准识别、操作手感舒适
如果说有一款兼具轻薄和性能的笔记本,它既能满足办公需要,移动便携,也能日常畅玩游戏,且颜值非常在线,....
发表于 07-30 10:40 •
186次
阅读
AMD EPYC(霄龙)如何获取HCI优势
当今时代,数字化转型已成为一项持续进行的工作,IT团队需要用更少的钱和更少的人来提高数据中心的性能、....
AMD将于AM5主板展上展示新一代AM5主板
据消息,AMD已正式宣布将于8月5日12点举办AM5主板展,届时将推出华硕、微星、华清等厂商的X....
USB 4 Retimer芯片布局已经开始
我们从近期发布的M2 Macbook Air和Macbook Pro中可以看到,苹果在这两款机型以及....
英特尔展示一个严格控制、高度集成的八波长激光器
想要提高未来I/O接口的能效和工作范围,很有可能是在同一个封装中集成硅电路和光学。研究人员认为,通过....
在linux里对多个MAC使用同一subnet的方法
这个问题是Linux Kernel TCP/IP Stack对于同一子网的IP处理方式决定的,严格来....
发表于 07-27 09:47 •
109次
阅读
三星二代智能SSD硬盘 实现更高系统性能
该项目由三星和AMD共同开发,将2020年推出的第一代智能固态硬盘的计算性能提高了一倍多,从而实....
或为营收考虑!英特尔微处理器和外设芯片产品即将涨价
有媒体跟进报道称,英特尔将于今年秋季开始涨价,涉及的产品包括家用电脑和服务器CPU,以及Wi-Fi芯....
AMD Zen4锐龙7000系列能否压倒Raptor Lake 13代酷睿
AMD Zen4锐龙7000系列到底能带来都大的提升?能否压倒Raptor Lake 13代酷睿?今....
在微软云机器学习平台Azure ML上利用OpenVINO快速实现AI推理
众所周知,18世纪60年代人类开始了第一次工业革命,从此进入“蒸汽时代”,接着进入了电气时代和信息时....
AMD RDNA 3/Navi 3X GPU升级
但尽管如此,目前单节点跳转本身无法提供50%的单位性能提升(RIP Dennard缩放)。因此,计划....
Intel 4工艺的物理和性能特征
Intel 4 工艺对于英特尔来说是一个重要的里程碑,因为它是英特尔第一个集成 EUV 的工艺,也是....
英特尔FPGA中国创新中心的链接产业与人才 助FPGA人才走向实战
当前,5G、人工智能、自动驾驶等技术快速发展,应用场景也愈加广泛,这背后,有着灵活高效、高性能、低功....
发表于 07-20 16:59 •
351次
阅读
小白求助AMD跟ARM有什么关系
据我所知,两者是没什么关系的,
一个是美国的桌面级CPU生产商,
一个是英国移动平台CPU芯片生产商。
但那天在网上看到...
发表于 06-30 18:02 •
3863次
阅读
英特尔重新思考解决芯片短缺的常用基板
英特尔正在创造性地解决制造业放缓的问题ーー这一次,它把 ABF 基板两侧的电容器增加了一倍
如今,持续的芯片短缺已导致零部...
发表于 06-20 09:50 •
3607次
阅读

在AMD CPU的Windows电脑下,启动模拟器失败无法安装GVM怎么解决?
在AMD CPU的Windows电脑下,启动模拟器失败,提示“Unable to install GVM.”,无法安装GVM。
...
发表于 06-07 10:13 •
676次
阅读
英伟达DPU的过“芯”之处
最近几年,经常关注科技圈的朋友们总会发现,每次遇到厂商有重大发布,就总能看到“颠覆”、“极致”、“革命性”等概念出现在发...
发表于 03-29 14:42 •
3116次
阅读
Intel即将推出的GPU将与Arm兼容
英特尔正在使其GPU多样化,以与x86以外架构的处理器兼容,这可能是使其从芯片制造商成为以代工为首要业务的公司的一步。
英特...
发表于 03-29 14:41 •
2836次
阅读
AMD RX7000系列显卡核心参数已被曝出!拥有高达15360个流处理器!
AMD RX7000系列显卡将在明年问世。近日,下一代显卡核心Navi 31、Navi 33在外网被曝出,均采用RDNA 3架构设计,其中分...
发表于 08-24 17:24 •
2134次
阅读
Intel PXA270与AMD Au1200比较分析 精选资料推荐
Intel公司于2003年第四季度推出了性能卓越的嵌入式处理器PXA270,基于XSCALE架构,最高主频可达624MHz。PXA270最...
发表于 08-12 06:03 •
1606次
阅读
评论