0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

打破英伟达CUDA壁垒?AMD显卡现在也能无缝适配CUDA了

Hobby观察 来源:电子发烧友 作者:梁浩斌 2024-07-19 00:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/梁浩斌)一直以来,围绕CUDA打造的软件生态,是英伟达GPU领域最大的护城河,尤其是随着目前AI领域的发展加速,市场火爆,英伟达GPU+CUDA的开发生态则更加稳固,AMD英特尔等厂商虽然在努力追赶,但目前还未能看到有威胁英伟达地位的可能。

最近一家英国公司Spectral Compute推出了一款方案,可以为AMD的GPU原生编译CUDA源代码,目前正在RNDA2、RDNA3上进行规模测试。这或许可以打破CUDA与英伟达GPU的生态壁垒?


SCALE编译器

Spectral Compute据称花了7年时间开发SCALE,SCALE不依赖英伟达的代码,而是通过一些开源LLVM组件等,建立了其CUDA兼容的工具链,让SCALE在多个平台之间能高度兼容。

其实在以往也有一些其他GPU硬件兼容CUDA的方式,比如AMD支持的ZLUDA推出的开源移植项目,通过重新编译二进制代码,就能够让CUDA库在AMD自家的ROCm上运行,令AMD GPU适配CUDA生态。

但SCALE的特性在于,可以避免代码移植的步骤,开发人员可以使用单一版本的代码库,因为SCALE本身与CUDA的源代码兼容,这大大提高了可用性。

Spectral Compute的CEO Michael Sondergaard表示:我们相信,只需要编写一次代码,就可以在任何硬件平台上运行它,对于CPU代码来说,这已经实现很多年了,那为什么GPU不行呢?我们着手通过弥合主流的CUDA编程语言和其他GPU硬件供应商之间的兼容性差距,来直接解决这个问题。

Michael 还提到:“应该构建一个围绕GPU的开源生态系统,类似目前CPU所享有的生态环境,同时确保不同平台间的互联互通。”他认为,通过SCALE可以弥合CUDA与其他硬件供应商之间的兼容性鸿沟,从而打破市场上存在的壁垒。

据介绍,SCALE是一种通用并行GPU工具包,其功能与英伟达的CUDA工具包相仿,它能够在编译CUDA代码的同时,为非英伟达 GPU生成相应的二进制文件,这样就彻底避免了对翻译层的依赖。

目前,SCALE已经在多种软件中成功运行,比如Blender、Llama-cpp、XGboost、FAISS、GOMC、STDGPU、Hashcat和NVIDIA Thrust等专业软件,这些软件已经可以在RDNA2和RDNA3的AMD GPU上正常使用CUDA。

不过SCALE本身不是开源的,但用户可以通过免费的软件许可使用这个功能,这或许是为了规避英伟达针对CUDA兼容而出台的EULA条款。

其他厂商兼容CUDA的努力

市场上其实并不缺乏CUDA的挑战者,包括AMD的ROCm,开放标准联盟Khronos Group联合旗下成员打造出的SYCL编程语言等,而英特尔也与SYCL深度绑定,希望打破CUDA的统治。

当然,对于AMD和英特尔这样的巨头而言,他们有资本去尝试构建一个新的生态,但对于更多的初创公司和中小规模公司而言,兼容就是成本最低的路线。

比如国内的GPU初创公司摩尔线程,基于MUSA的统一架构推出了多款GPU产品,并打造了软件开发平台,包括AI开发平台、MUSA SDK、MT Smart Media和MTVerse XR等。

而这套生态架构可以充分兼容现有的软件生态,能借助MUSIFY工具实现代码零成本迁移到MUSA平台,也包括对CUDA生态的兼容。

在2021年的时候,在一个名为Vortex的RISC-V GPU项目上,也实现了对CUDA软件工具包的支持。

在这个项目中,研究人员设计并实现了一条流水线,旨在全面支持从CUDA到增强版RISC-V GPU架构的代码迁移。这条流水线以CUDA源代码为起点,目标是在强化的RISC-V GPU架构上直接运行这些代码。具体而言,流水线分为以下几步:首先将CUDA源代码转换为NVVM中间表示(IR),接着把NVVM IR转化为SPIR-V IR,随后利用POCL将SPIR-V IR转译成针对RISC-V的二进制文件,最终在增强后的RISC-V GPU上执行这些二进制文件。

写在最后

尽管CUDA生态目前是英伟达GPU的最大优势之一,但从这些厂商的努力可以看到,其他GPU硬件也正在有越来越多的方法兼容CUDA,有机会从英伟达手中夺得一些市场份额。但AI领域的龙头效应越来越强,能够挑战英伟达的GPU厂商可能机会越来越小了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5729

    浏览量

    140747
  • 显卡
    +关注

    关注

    17

    文章

    2526

    浏览量

    71853
  • CUDA
    +关注

    关注

    0

    文章

    128

    浏览量

    14591
  • 英伟达
    +关注

    关注

    23

    文章

    4142

    浏览量

    99856
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RV生态又一里程碑:英伟达官宣CUDA将兼容RISC-V架构!

    Frans Sijstermanns宣布一则重磅消息:英伟要将CUDA移植到RISC-V架构上。   英伟
    的头像 发表于 07-19 00:04 6957次阅读
    RV生态又一里程碑:<b class='flag-5'>英伟</b>达官宣<b class='flag-5'>CUDA</b>将兼容RISC-V架构!

    国产GPU再下一城,群起突围英伟+AMD

    上市。   根据Jon Peddie Research的数据,独立GPU市场英伟一家独大,近年来持续维持超80%的市场份额,而AMD公司则占据剩余近20%的市场份额。自人工智能市场爆发式增长以来,
    的头像 发表于 07-07 08:59 7641次阅读
    国产GPU再下一城,群起突围<b class='flag-5'>英伟</b><b class='flag-5'>达</b>+<b class='flag-5'>AMD</b>

    台积电晶圆厂采用英伟CUDA-X 光刻环节效率提升

    之一。计算光刻、晶体管模拟、工艺控制以及晶圆检测等关键环节,均需要海量级的仿真计算与实时优化能力。传统计算架构在支撑先进制程发展方面已逐渐力不从心。 作为英伟加速计算生态的核心基础,CUDA-X是一套全栈式GPU加速计
    的头像 发表于 06-03 11:46 340次阅读

    英伟发布RTX Spark超级芯片

    Blackwell RTX GPU,拥有6144个CUDA核心和第五代Tensor Core,可直接运行微软Arm架构版Windows系统。英伟正式宣告:我不只卖显卡
    的头像 发表于 06-02 10:20 248次阅读

    借助NVIDIA CUDA Tile IR后端推进OpenAI Triton的GPU编程

    NVIDIA CUDA Tile 是基于 GPU 的编程模型,其设计目标是为 NVIDIA Tensor Cores 提供可移植性,从而释放 GPU 的极限性能。CUDA Tile 的一大优势是允许开发者基于其构建自定义的 DSL。
    的头像 发表于 02-10 10:31 671次阅读

    如何在NVIDIA CUDA Tile中编写高性能矩阵乘法

    本博文是系列课程的一部分,旨在帮助开发者学习 NVIDIA CUDA Tile 编程,掌握构建高性能 GPU 内核的方法,并以矩阵乘法作为核心示例。
    的头像 发表于 01-22 16:43 5493次阅读
    如何在NVIDIA <b class='flag-5'>CUDA</b> Tile中编写高性能矩阵乘法

    NVIDIA CUDA Tile的创新之处、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,这是自 2006 年 NVIDIA CUDA 平台发明以来,最大的一次技术进步。这一令人振奋的创新引入了一套面向
    的头像 发表于 12-24 10:17 779次阅读
    NVIDIA <b class='flag-5'>CUDA</b> Tile的创新之处、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的头像 发表于 12-13 10:12 1598次阅读
    在Python中借助NVIDIA <b class='flag-5'>CUDA</b> Tile简化GPU编程

    NVIDIA CUDA 13.1版本的新增功能与改进

    NVIDIA CUDA 13.1 是自 CUDA 二十年前发明以来,规模最大、内容最全面的一次更新。
    的头像 发表于 12-13 10:08 2594次阅读

    首款全国产训推一体AI芯片发布,兼容CUDA生态

    CUDA生态体系。该芯片支持从单机多卡到千卡级集群的灵活扩展,效比3.41 TFLOPS/W——在同等功
    的头像 发表于 11-30 07:20 9960次阅读
    首款全国产训推一体AI芯片发布,兼容<b class='flag-5'>CUDA</b>生态

    打破智能家居生态壁垒,乐鑫一站式Matter解决方案实现无缝互联

    乐鑫科技作为CSA联盟核心成员,提供一站式Matter解决方案,助力打破智能家居生态壁垒。方案覆盖Wi-Fi、Thread等多种连接方式,支持ESP32全系列硬件平台,并配套提供ESP-Matter
    的头像 发表于 11-06 15:19 1588次阅读
    <b class='flag-5'>打破</b>智能家居生态<b class='flag-5'>壁垒</b>,乐鑫一站式Matter解决方案实现<b class='flag-5'>无缝</b>互联

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1,gpu0是集显,训练速度太感人 你只有一块英伟
    发表于 07-25 08:18

    让太阳逆变器“狂飙”的秘诀-耐讯CAN转EtherCAT网关

    导入ESI文件,组态比搭乐高还简单;未来兼容:支持TSN(时间敏感网络),无缝对接智能电网。 总结:耐讯通信技术CAN转EtherCAT网关,堪称新能源界的“协议外交官”。它用技术魔法打破
    发表于 07-18 15:22

    英伟CUDA 已经开始移植到 RISC-V 架构上

    ,着重介绍CUDA 移植到 RISC-V 架构的相关工作和计划,展现对 RISC-V 架构的高度重视与积极布局。   Frans Sijstermanns 首先回顾
    发表于 07-17 16:30 4052次阅读