0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD ROCm 6.1升级MIPOpen 3.1,引入AI参数预测模型

微云疏影 来源:综合整理 作者:综合整理 2024-02-29 14:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据最新消息,自 AMD 去年 12 月份公布 ROCm 6.0 以来,已经开始积极筹备 6.1 版的发布,以提高与英伟达(NVIDIA)CUDA 竞争的核心实力。

在此期间,AMD 频繁向GitHub公共仓库推送有关 ROCm 6.1 的最新开发进展,透露出不久后有可能正式上线新版本的意图。

据悉,此次 ROCm 6.1 主要的突破在于其升级至全新版本的 MIPOpen 3.1;新增了使用AI进行参数预测的 conv_hip_igemm_group_fwd_xdlops 求解器;解决了当前版本的众多 BUG,以及引入了新的求解器算法

此外,该系列还努力提升了系统性能,尤其是优化了MIGraphX功能,包含但不限于加入对FP8精度的支持,以及增加更多运算符等,同时更新了针对 Whisper / Llama-2 / Stable Diffusion 2.1 的文档示例,以及提供新的ONNX示例,以便更好地适应 GEMM 的BLAS自动调整。

更重要的是,为了改善在Microsoft Windows 环境下运行 MIGraphX的效率,AMD特别推出了全新的“hipother”资源库。

值得一提的是,HIP 技术是AMD专有的C++运行时API和内核语言,适配可移植的AMD/NVIDIA GPU应用程序,而HIPIFY 工具则能协助将CUDA源码便捷地转化成HIP脚本。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    139028
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97674
  • 求解器
    +关注

    关注

    0

    文章

    84

    浏览量

    4896
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ROCm部署PP-StructureV3到AMD GPU上

    作者:AVNET 李鑫杰 我们在上一篇文章中介绍了ROCm+PP-OCRv5,为实现在AMD计算平台上完成复杂文档的端到端智能解析,本文基于ROCm软件栈,提供一套完整的PP-StructureV3
    的头像 发表于 11-13 16:56 5219次阅读
    用<b class='flag-5'>ROCm</b>部署PP-StructureV3到<b class='flag-5'>AMD</b> GPU上

    AMD Vitis AI 5.1测试版发布

    AMD Vitis AI 5.1全新发布——新增了对 AMD Versal AI Edge 系列神经网络处理单元 (NPU) 的支持。Vitis A
    的头像 发表于 10-31 12:46 492次阅读

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    明远智睿RK3568核心板如何助力工业4.0升级

    着工业升级的成效。某汽车工厂引入明远智睿基于瑞芯微RK3568打造的核心板解决方案后,生产效率显著提升30%,这一案例不仅验证了该核心板的卓越性能,更展现了其在推动工业4.0升级过程中的关键作用。深入剖析这一应用案例,我们能清晰
    的头像 发表于 09-04 17:42 642次阅读

    Cognizant加速AI模型企业开发

    -Cognizant推出AI Training Data Services,助力企业AI模型加速开发 Cognizant是数据与AI
    的头像 发表于 07-31 17:25 594次阅读

    讯飞星火X1升级版正式上线

    今天,基于全国产算力训练的深度推理大模型——讯飞星火X1升级版正式上线。
    的头像 发表于 07-30 14:12 1757次阅读
    讯飞星火X1<b class='flag-5'>升级</b>版正式上线

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    AMD7900xtxonSOPHGOSG2044PCLT团队倾注心血,精心完成了将ROCm软件栈适配到SG2044独特架构的复杂工作。这包括:内核适配:确保ROCm驱动程序和底层组
    的头像 发表于 07-14 17:04 1015次阅读
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大<b class='flag-5'>模型</b>部署速率飙升,RISC-V + <b class='flag-5'>AI</b> 新纪元!代码已经开源,一起来试试!

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    ,联发科带来了全面升级的天玑AI开发套件2.0,在模型库规模、架构开放程度、前沿端侧AI技术支持和端侧LoRA训练落地等方面均迎来全面跃迁,为开发者提供了更全面、更开放、更强大的端侧
    发表于 04-13 19:52

    6.12.1升级到6.13老是闪退是什么原因导致的?

    6.12.1升级到6.13老是闪退,回到6.12.1又正常,问一下大家是什么原因导致,有什么解决办法?
    发表于 03-11 08:13

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    ”“大模型圈的大黑马”“硅谷震惊了”“来自中国的学霸AI”…… 从智能手机到自动驾驶,从数据中心到物联网,FPGA 正悄然改变着我们的生活。未来,FPGA 又将如何塑造世界?DeepSeek 带你一起
    发表于 03-03 11:21

    启明智显集成DeepSeek、豆包、OpenAI等全球先进AI模型,助力传统产品AI智能升级

    启明智显借助豆包、Deepseek、OpenAI等全球先进AI模型,助力传统产品实现AI智能升级
    的头像 发表于 02-24 16:12 1377次阅读
    启明智显集成DeepSeek、豆包、OpenAI等全球先进<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>,助力传统产品<b class='flag-5'>AI</b>智能<b class='flag-5'>升级</b>

    AI赋能边缘网关:开启智能时代的新蓝海

    引入彻底改变了这一局面。通过在边缘网关集成AI芯片和算法模型,使其具备了实时数据分析、智能决策和自主控制能力。在工业质检场景中,搭载AI算法的边缘网关能够实时识别产品缺陷,将检测效率
    发表于 02-15 11:41

    渊亭KGAG升级引入“高级策略推理”

    为了突破现有AI技术在决策推理方面的局限,渊亭科技对其知识图谱分析平台KGAG进行了最新升级,创新性地引入了“高级策略推理”模式。这一模式的引入,实现了“大
    的头像 发表于 02-14 15:07 807次阅读

    IBM在watsonx.ai平台推出DeepSeek R1蒸馏模型

    IBM近日宣布了一项重要更新,为其企业AI开发平台watsonx.ai引入了DeepSeek R1的Llama 3.1 8B和Llama
    的头像 发表于 02-14 10:21 875次阅读

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    ,PReLU仍然能够在正输入区域促进稀疏激活,这对模型的学习是有利的。 缺点 增加模型复杂度:由于引入了额外的可学习参数 α,这增加了模型
    发表于 12-19 14:33