0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD将于今年秋季在部分RDNA 3 GPU上添加ROCm的支持

AMD中国 来源:AMD中国 2023-07-25 15:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AMD将于今年秋季在部分RDNA 3 GPU上添加ROCm的支持

人工智能是塑造下一代计算的决定性技术。近几个月来,我们都看到了生成式人工智能和大语言模型的爆炸式增长正在彻底改变我们与技术交互的方式,并推动以GPU为中心的数据中心对高性能计算的需求显著增加。

ROCm是一个开放软件平台,允许研究人员利用AMD Instinct加速器的强大功能,促进HPC和AI创新跨平台的可移植性。ROCm 5具有针对AI和HPC工作负载的全面优化套件。其中包括针对大型语言模型精细调整的内核、对新数据类型的支持以及对像OpenAI Triton类编程语言等新技术的支持。

ROCm验证现在包括每晚进行数十万次框架测试,以及跨数千个模型和运算符的验证。这包括对PyTorch、TensorFlow、ONNX和JAX等领先框架的支持,为基于这些框架构建的所有AI模型提供更佳的开箱即用的开发者体验。

我很高兴地宣布ROCm 5.6的最新版本。

ROCm 5.6通过针对大语言(和其他)模型的新型AI软件附加组件增强了功能,包括跨ROCm 库组合的许多性能优化。它还反映了支持人工智能社区的持续改进,包括:

- 将Hugging Face单元测试套件集成到ROCm QA中

- 在PyTorch 2.0感应器模式下对OpenAI Triton的增量支持

- 通过ROCm对PyTorch、TensorFlow和JAX启用OpenXLA支持,从而支持更广泛的社区

ROCm 5.6还引入了对FFT、BLAS和求解器等多个数学库的改进,这些数学库构成了HPC应用程序的基础,并增强了ROCm开发和部署工具,包括安装、ROCgdb(CPU-GPU集成调试器)、ROCm分析器和文档。

随着行业朝着支持广泛加速器的开放生态系统发展,我们将继续努力进一步优化框架和后端编译器,以实现更佳性能,包括MLIR基础设施改进,巩固AMD对OpenAI Triton和OpenXLA编译器的支持。我们还将继续在Hugging Face的AMD hub中添加针对AMD解决方案优化的其他开源AI模型。

对于HPC用户,我们最近在AMD Infinity Hub上发布了许多发布方法,使客户能够构建HPC应用程序容器,未来的ROCm版本将增加AMD Instinct解决方案支持的HPC应用程序数量。

我们还看到开发人员对在Radeon消费级和 Radeon Pro工作站级GPU上运行用于AI和ML的ROCm开放软件平台表现出了极大的兴趣,并听到了社区对不受支持的GPU上的特定驱动程序问题提出的挑战。我可以很高兴地说,我们已经修复了ROCm 5.6中报告的问题,并且我们致力于今后扩大我们的支持。

我们计划将ROCm支持从当前支持的AMD RDNA 2工作站GPU:Radeon Pro v620和w6800 扩展到特定的AMD RDNA 3工作站和消费级GPU。Linux上对基于RDNA 3的GPU的正式支持计划于今年秋季开始推出,首先是48GB Radeon PRO W7900和24GB Radeon RX 7900 XTX,随着时间的推移,还会发布更多卡和扩展功能。

责任编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5705

    浏览量

    140394
  • 人工智能
    +关注

    关注

    1819

    文章

    50298

    浏览量

    266844
  • RDNA
    +关注

    关注

    0

    文章

    22

    浏览量

    2246

原文标题:新的ROCm™ 5.6版本为AI和HPC工作负载带来增强和优化

文章出处:【微信号:AMD中国,微信公众号:AMD中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD获Meta千亿美元芯片大单,AI芯片市场格局生变

    GPUAMD Helios整机柜服务器,预计于今年晚些时候开启交付。 AMD首席执行官苏姿丰称,交易价值每吉瓦达百亿美元级别,协议总金额或超600亿美元,甚至可能达到上千亿美元。双
    的头像 发表于 02-26 09:19 5973次阅读
    <b class='flag-5'>AMD</b>获Meta千亿美元芯片大单,AI芯片市场格局生变

    云知声与AMD ROCm Lab签署战略合作协议

    3月25日,江苏云知声科技有限公司(以下简称“云知声”)与南京超威开源科技有限公司(以下简称“AMD ROCm Lab”)正式签署战略合作协议。江苏云知声副总经理陈大林、AMD
    的头像 发表于 04-01 11:21 807次阅读

    如何在 VisionFive v2 使用外部 GPU

    如果旧的 amd gpu VisionFive V2 运行,我想使用带有开源 amd 驱动程序的
    发表于 03-13 06:38

    解析ISL62776:AMD CPU/GPU核心电源的理想之选

    解析ISL62776:AMD CPU/GPU核心电源的理想之选 如今的电子设备中,CPU和GPU的性能不断提升,对电源管理的要求也越来越高。ISL62776作为一款专为
    的头像 发表于 02-04 16:30 389次阅读

    Robotec.ai与AMD Silo AI的合作实践

    AMD Silo AI 正与领先的机器人应用仿真平台开发商 Robotec.ai 合作,优化和扩展基于 AMD GPUROCm 软件堆栈的下一代汽车和机器人系统的数字孪生和场景重
    的头像 发表于 01-28 16:23 868次阅读

    ROCm部署PP-StructureV3AMD GPU

    作者:AVNET 李鑫杰 我们在上一篇文章中介绍了ROCm+PP-OCRv5,为实现在AMD计算平台上完成复杂文档的端到端智能解析,本文基于ROCm软件栈,提供一套完整的PP-StructureV
    的头像 发表于 11-13 16:56 5690次阅读
    用<b class='flag-5'>ROCm</b>部署PP-StructureV<b class='flag-5'>3</b>到<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b><b class='flag-5'>上</b>

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    是Imagination开发者社区中广受欢迎的图形API,因其提供了低开销、跨平台访问现代GPU的能力,帮助开发者多种设备最大化性能与效率。其对GPU操作的显式控制,以及对
    的头像 发表于 08-14 11:18 2448次阅读
    Imagination <b class='flag-5'>GPU</b> 全面<b class='flag-5'>支持</b> Vulkan 1.4 和 Android 16

    aicube的n卡gpu索引该如何添加

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,全局的py里添加了torch,能够调用gpu,当还是只能看到默认的
    发表于 07-25 08:18

    产品添加架API接口设计指南

    现代电商或库存管理系统中,产品添加架是关键流程。通过API接口实现自动化操作,能显著提升效率。本文将分步解析如何设计和使用“产品添加”与“产品
    的头像 发表于 07-24 14:45 818次阅读
    产品<b class='flag-5'>添加</b>与<b class='flag-5'>上</b>架API接口设计指南

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    AMD7900xtxonSOPHGOSG2044PCLT团队倾注心血,精心完成了将ROCm软件栈适配到SG2044独特架构的复杂工作。这包括:内核级适配:确保ROCm驱动程序和底层组件能够与SG
    的头像 发表于 07-14 17:04 1355次阅读
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    为什么无法GPU使用INT8 和 INT4量化模型获得输出?

    安装OpenVINO™ 2024.0 版本。 使用 optimum-intel 程序包将 whisper-large-v3 模型转换为 int 4 和 int8,并在 GPU 使用 OpenVINO™ 运行推理。 没有可用的
    发表于 06-23 07:11

    三大运营商将于今年下半年全面重启esIM

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2025年06月19日 13:43:10

    英伟达拟再推中国特供GPU今年6月量产!

    。                                                     最新消息显示,英伟达拟新推出一款专门面向中国市场的人工智能芯片,且最早将于今年6月开始量产。这款芯片属于英伟达最新一代基于Blackwell架构的人工智能处理器,但其
    发表于 05-27 00:03 4891次阅读

    如何通过SFL为设备添加Flash编程支持

    SEGGER Flash Loader(SFL)是J-Link设备支持套件(DSK)的一部分,通过SFL,用户可以为自己的新设备添加Flash编程支持
    的头像 发表于 05-19 16:35 1650次阅读
    如何通过SFL为设备<b class='flag-5'>添加</b>Flash编程<b class='flag-5'>支持</b>

    摩尔线程GPU率先支持Qwen3全系列模型

    近日,阿里云正式发布Qwen3系列的8款开源混合推理模型。摩尔线程团队模型发布当天,率先完成了Qwen3全系列模型全功能GPU
    的头像 发表于 05-07 15:24 1128次阅读