0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用ROCm将PP-OCRv5模型部署在AMD显卡上

jf_23871869 来源:AVNET 李鑫杰 作者:AVNET 李鑫杰 2025-09-12 18:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:AVNET 李鑫杰

上文介绍了《一键搞定!PP-OCRv5模型转ONNX格式全攻略》,本文将使用ROCm™在AMD® CPU、独立显卡、集成显卡上优化并部署飞桨PP-OCRv5模型。

一,ROCm™ 工具套件简介

ROCm™(Radeon Open Compute)是 AMD 推出的开源软件栈,旨在为 GPU 加速计算提供全面支持。它包含驱动程序、编译器、开发工具、库函数和 API,覆盖从底层内核开发到上层应用部署的完整开发流程,广泛适用于高性能计算(HPC)、人工智能AI)和机器学习等领域。

ROCm™ 特别针对生成式 AI 和 HPC 工作负载进行了深度优化,具备良好的生态系统兼容性和代码可移植性,能够帮助开发者快速将基于 CUDA 等平台的现有项目迁移至 AMD 平台。无论是以卷积神经网络(CNN)为核心的预测式 AI 模型(Predictive AI),还是以 Transformer 架构为主的生成式 AI 模型(Generative AI),ROCm 均提供了高效的运行支持。

此外,ROCm™ 不仅支持 AMD Radeon 独立显卡(dGPU),还兼容集成在 AMD CPU 中的核显(iGPU),使得开发者能够在多样化的硬件环境中灵活部署 AI 模型,实现本地化高效推理与训练

下表展示PP-OCRv5 Server版模型,经过ROCm™优化后,在AMD HX370上运行的性能。性能测试代码和的图片来自于开源项目:

https://github.com/liebedir/PP-OCRv5-AMD-ROCm

二,搭建ROCm™开发环境

首先,请克隆PP-OCRv5_AMD-ROCm到本地

git clone https://github.com/liebedir/PP-OCRv5-AMD-ROCm
cd PP-OCRv5-AMD-ROCm

接着,安装ROCm™:

wget 
https://repo.radeon.com/amdgpu-install/6.4.3/ubuntu/jammy/amdgpu-install_6.4.60403-1_all.deb

sudo apt install ./amdgpu-install_6.4.60403-1_all.deb

图片

sudo apt update

图片

sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"

图片

sudo apt install amdgpu-dkms

图片

图片

sudo apt install python3-setuptools python3-wheel

图片

sudo usermod -a -G render,video $LOGNAME # Add the current user to the render and video groups

图片

sudo apt install rocm

图片

然后,添加环境变量到~/.bashrc,该环境变量与核显的架构相关,11.0.0适用于RDNA3架构核显,其他架构请参考https://github.com/liebedir/PP-OCRv5-AMD-ROCm:

vi ~/.bashrcexport HSA_OVERRIDE_GFX_VERSION=11.0.0

最后,重启计算机。

完成计算机重启后,创建python虚拟环境并安装onnxruntime-rocm

conda create -n ocr-rocm python==3.10
pip3 install onnxruntime-rocm -f https://repo.radeon.com/rocm/manylinux/rocm-rel-6.4.2/

接着,[下载PP-OCRv5模型并导出为onnx格式。]

至此,模型和环境准备完成!

三,编写PP-OCRv5推理程序

PP-OCRv5-AMD-ROCm项目已将推理程序编写完成,各文件功能如下:

执行演示程序main.py,并指定模型路径和推理硬件设备

python main.py --image_dir images/paddleocr_structure.png  
--det_model_dir ../PP-OCRv5_server_det_infer/inference.onnx
--det_model_device GPU 
--rec_model_dir ../PP-OCRv5_server_rec_infer/inference.onnx
--rec_model_device GPU

运行结果,如下图所示:

四,总结

使用AMD 的开发者可以通过ROCm™软件栈将PP-OCRv5模型部署到AMD的CPU、独立显卡或核显硬件平台上。

如果你有更好的文章,欢迎投稿!

稿件接收邮箱:nami.liu@pasuntech.com

更多精彩内容请关注“ 算力魔方^®^ ”!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AMD显卡
    +关注

    关注

    0

    文章

    32

    浏览量

    11608
  • OCR
    OCR
    +关注

    关注

    0

    文章

    176

    浏览量

    17277
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    润和软件亮相2026开放计算ROCm生态大会

    4月18日,2026开放计算ROCm生态大会在中国(南京)软件谷成功举办。本次大会以“开源共生 智能共赢——构建开放AI新生态”为主题,由AMD ROCm Lab主办,南京市工业和信息化局、中国
    的头像 发表于 04-22 17:20 392次阅读
    润和软件亮相2026开放计算<b class='flag-5'>ROCm</b>生态大会

    云知声与AMD ROCm Lab签署战略合作协议

    3月25日,江苏云知声科技有限公司(以下简称“云知声”)与南京超威开源科技有限公司(以下简称“AMD ROCm Lab”)正式签署战略合作协议。江苏云知声副总经理陈大林、AMD ROCm
    的头像 发表于 04-01 11:21 815次阅读

    【瑞萨AI挑战赛】手写数字识别模型RA8P1 Titan Board部署

    手写数字识别模型RA8P1 Titan Board部署 手写数字识别是计算机视觉领域的经典入门任务,而瑞萨RA8P1 Titan Board开发板凭借其搭载的双内核架构与专用NP
    发表于 03-15 20:42

    如何在ZYNQ本地部署DeepSeek模型

    一个最小号 DeepSeek 模型部署AMD Zynq UltraScale+ MPSoC 处理系统的项目。
    的头像 发表于 12-19 15:43 7812次阅读
    如何在ZYNQ本地<b class='flag-5'>部署</b>DeepSeek<b class='flag-5'>模型</b>

    ROCm部署PP-StructureV3到AMD GPU

    -StructureV3模型部署方案。该方案是对前文PP-OCRv5部署实践的深化与扩展。 一,RapidDoc系统概述 RapidDoc 是一个专精于文档智能解析的轻量级开源框架,集
    的头像 发表于 11-13 16:56 5694次阅读
    用<b class='flag-5'>ROCm</b><b class='flag-5'>部署</b><b class='flag-5'>PP</b>-StructureV3到<b class='flag-5'>AMD</b> GPU<b class='flag-5'>上</b>

    PP-OCRv5 MCP服务器海光主板的部署与实战

    在当今数字化快速发展的时代,OCR(光学字符识别)技术已经成为从图像中提取文本信息的重要工具。无论是自动化办公、智能文档处理还是在内容创作领域,OCR 技术的应用都极大地提高了工作效率和准确性
    的头像 发表于 10-15 17:04 953次阅读
    <b class='flag-5'>PP-OCRv5</b> MCP服务器<b class='flag-5'>在</b>海光主板的<b class='flag-5'>部署</b>与实战

    Immich智能相册树莓派5的高效部署与优化

    海外广受欢迎的开源智能相册项目Immich部署于树莓派5,并通过搭载基于AX650N/AX8850的M.2算力卡,显著提升了系统算力。借助该方案,我们高效
    的头像 发表于 10-14 11:30 1525次阅读
    Immich智能相册<b class='flag-5'>在</b>树莓派<b class='flag-5'>5</b><b class='flag-5'>上</b>的高效<b class='flag-5'>部署</b>与优化

    使用OpenVINOPP-OCRv5模型部署Intel显卡

    是一个用于优化和部署人工智能(AI)模型,提升AI推理性能的开源工具集合,不仅支持以卷积神经网络(CNN)为核心组件的预测式AI模型(Predictive AI),还支持以Transformer为核心组件的生成式AI
    的头像 发表于 09-20 11:17 1403次阅读
    使用OpenVINO<b class='flag-5'>将</b><b class='flag-5'>PP-OCRv5</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b><b class='flag-5'>在</b>Intel<b class='flag-5'>显卡</b><b class='flag-5'>上</b>

    vision board部署模型到openmv的代码导致连接超时怎么解决?

    env终端中勾选了tiflte support后烧录mdk到板子后就开始显示连接不到 无法部署模型
    发表于 09-19 07:59

    一键搞定!PP-OCRv5模型转ONNX格式全攻略,解锁多平台无缝部署

    飞桨技术生态伙伴 算力魔方 | 引言:还在为OCR模型不同硬件部署而头疼吗?百度飞桨的PP-OCRv5重磅升级,准确率提升13%,且一
    的头像 发表于 09-05 16:10 2791次阅读
    一键搞定!<b class='flag-5'>PP-OCRv5</b><b class='flag-5'>模型</b>转ONNX格式全攻略,解锁多平台无缝<b class='flag-5'>部署</b>

    【EASY EAI Orin Nano开发板试用体验】PP-OCRV5文字识别实例搭建与移植

    【EASY EAI Orin Nano开发板试用体验】PP-OCRV5文字识别实例搭建与移植 PP-OCRV5PP-OCR新一代文字识别解决方案, 该方案聚焦于多场景、多文字类型的文字识别。
    发表于 08-18 16:57

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    AMD7900xtxonSOPHGOSG2044PCLT团队倾注心血,精心完成了ROCm软件栈适配到SG2044独特架构的复杂工作。这包括:内核级适配:确保ROCm驱动程序和底层组
    的头像 发表于 07-14 17:04 1358次阅读
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大<b class='flag-5'>模型</b><b class='flag-5'>部署</b>速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    基于算力魔方与PP-OCRv5的OpenVINO智能文档识别方案

    )团队最新推出的PP-OCRv5模型精度和效率实现了显著突破,结合Intel OpenVINO工具套件的硬件加速能力,能够为各类文档处理场景提供更强大的支持。 二,算力魔方简介 算
    的头像 发表于 06-12 21:19 1760次阅读
    基于算力魔方与<b class='flag-5'>PP-OCRv5</b>的OpenVINO智能文档识别方案

    V2板子上部署豆包模型调试指南

    V2板子上部署豆包模型调试指南 准备阶段 首先,可以观看大模型实战(SC171开发套件V3)并下载工程源码,之后我们需要在板子安装这个代
    发表于 05-25 10:17

    如何使用Docker部署模型

    随着深度学习和大模型的快速发展,如何高效地部署这些模型成为了一个重要的挑战。Docker 作为一种轻量级的容器化技术,能够模型及其依赖环境
    的头像 发表于 05-24 16:39 1342次阅读