0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用ROCm部署PP-StructureV3到AMD GPU上

jf_23871869 来源:jf_23871869 作者:jf_23871869 2025-11-13 16:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:AVNET 李鑫杰

我们在上一篇文章中介绍了ROCm+PP-OCRv5,为实现在AMD计算平台上完成复杂文档的端到端智能解析,本文基于ROCm软件栈,提供一套完整的PP-StructureV3模型部署方案。该方案是对前文PP-OCRv5部署实践的深化与扩展。

一,RapidDoc系统概述

RapidDoc 是一个专精于文档智能解析的轻量级开源框架,集成了以下核心功能模块:

  • 光学字符识别(OCR)
  • 文档版面分析
  • 数学公式识别
  • 表格结构还原
  • 阅读顺序恢复

该系统基于 MinerU 架构进行二次开发,在保持高精度解析能力的同时,移除了视觉语言模型(VLM)模块,专注于构建高效稳定的端到端文档解析流水线。即使在纯 CPU 环境中,系统仍能保持流畅的推理性能。

本项目采用的核心模型均来自 PaddleOCR PP-StructureV3 模型系列,包括:

  • OCR 识别模块
  • 版面分析模块
  • 公式识别模块
  • 阅读顺序模块
  • 表格识别模型

所有模型均已完成 ONNX 格式转换,其跨平台特性为后续部署提供了良好基础,这也是选择 ROCm 进行适配的关键前提。

二,ROCm™工具套件简介

ROCm(Radeon Open Compute)是 AMD 推出的开源 GPU 计算平台,提供完整的软件栈支持:

  • 底层驱动与运行时
  • 编译器与工具链
  • 上层应用加速支持

平台特性包括:

  • 支持 CNN(预测式 AI)与 Transformer(生成式 AI)主流架构
  • 兼容 AMD 独立显卡(Radeon Pro/RX 系列)及部分 APU 核显
  • 针对高性能计算与大模型训练优化
  • 对推理场景提供良好支持

项目开源地址:

https://github.com/liebedir/RapidDoc-AMD-ROCm

三,搭建开发环境

在本地搭建开发环境步骤如下:

首先,克隆 PP-StructureV3-RapidDoc-AMD-ROCm 到本地:

git clone https://github.com/liebedir/RapidDoc-AMD-ROCm.gitcd RapidDoc-AMD-ROCm

接着,安装 ROCm:

wget https://repo.radeon.com/amdgpu-install/6.4.3/ubuntu/jammy/amdgpu-install_6.4.60403-1_all.deb

图片

sudo apt install ./amdgpu-install_6.4.60403-1_all.deb

图片

sudo apt update

图片

sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"

图片

sudo apt install amdgpu-dkms

图片

图片

sudo apt install python3-setuptools python3-wheel

图片

sudo usermod -a -G render,video $LOGNAME # Add the current user to the render and video groups

图片

sudo apt install rocm

图片

设置环境变量,编辑 ~/.bashrc。注意该变量与核显架构相关,11.0.0 适用于 RDNA3 架构核显,其他架构请参考 GitHub 项目 liebedir/PP-OCRv5-AMD-ROCm:

vi ~/.bashrcexport HSA_OVERRIDE_GFX_VERSION=11.0.0

图片

完成后重启计算机。

接下来安装 Python 环境与 ROCm-onnxruntime:

conda create -n ocr-rocm python==3.10pip3 install onnxruntime-rocm -f https://repo.radeon.com/rocm/manylinux/rocm-rel-6.4.2/

图片

安装 PyTorch(请根据已安装的 ROCm 版本选择对应的 PyTorch 版本,向下兼容):

pip3 install torch torchvision --index-url https://download.pytorch.org/whl/rocm6.4

图片

安装其他依赖包:

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple

至此,模型与环境已全部准备就绪!

四,编写Demo推理程序

运行以下命令启动推理演示:

python demo.py

运行过程及结果如下图所示。默认使用的 Provider 为 MIGraphXExecutionProvider,这也是 AMD 未来主推的 onnxruntime Provider。你也可以通过修改 Provider_config.py 中的 self.default_provider = self.had_providers[1] 切换为 ROCmExecutionProvider:

图片

测试结果如下:

图片

图片

四,总结

使用 AMD CPU 或 GPU 的用户,可以借助 ROCm 软件栈,将 RapidDoc——这一高速文档解析系统——顺利部署到 GPU 或核显硬件平台上。

如果你有更好的文章,欢迎投稿!

稿件接收邮箱:nami.liu@pasuntech.com

更多精彩内容请关注“ 算力魔方^®^ ”!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5652

    浏览量

    139077
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5110

    浏览量

    134511
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD迎头猛追Intel 全球首发7nm GPU很威风!

    `处理器大厂美商超微(AMD)日前发布全球首款7奈米制程资料中心绘图处理器(GPU),为新世代人工智能(AI)、云端运算与高效能运算挹注动能。AMD Radeon Instinct MI60
    发表于 11-20 11:35

    如何在AMDGPU运行TensorFlow?

    ROCm 即 Radeon 开放生态系统 (Radeon Open Ecosystem),是我们在 Linux 上进行 GPU 计算的开源软件基础。而 TensorFlow 实现则使用了 MIOpen,这是一个适用于深度学习的高度优化
    的头像 发表于 10-04 08:59 2.5w次阅读

    AMD同时推出Instinct MI100和Radeon ROCm 4.0

    4.0(ROCm 4.0)Linux版本。A MD认为MI100是世界最快的HPC GPU加速器,提供超过10TFLOPS的FP64计算能力。MI100额定峰值FP64性能为11.5 TFLOPS
    的头像 发表于 11-17 14:53 1897次阅读

    AMD推出Instinct MI100和Radeon ROCm4.0

    4.0(ROCm 4.0)Linux版本。AMD认为MI100是世界最快的HPC GPU加速器,提供超过10TFLOPS的FP64计算能力。MI100额定峰值FP64性能为11.5
    的头像 发表于 11-17 15:27 2079次阅读

    PyTorch 1.8发布,支持AMD ROCm

    1.8版本中,官方终于加入了对AMD ROCm的支持,可以方便的在原生环境下运行,不用去配置Docker了。 △AMD ROCm只支持Linux操作系统 1.8版本集合了自2020年1
    的头像 发表于 03-08 10:50 3767次阅读

    AMD发布基于CDNA 2架构的Instinct MI210 GPU

    基于AMD CDNA 2架构并由ROCm 5提供支持,AMD Instinct MI210 GPU帮助主流用户加速洞察和发现。
    的头像 发表于 03-26 09:53 2500次阅读

    AMD RDNA 3/Navi 3X GPU升级

    但尽管如此,目前单节点跳转本身无法提供50%的单位性能提升(RIP Dennard缩放)。因此,计划对RDNA 3进行几项架构改进。这包括AMD的下一代片无限缓存,以及AMD所说的优
    的头像 发表于 07-25 09:43 1461次阅读

    Meta开发AITemplate,大幅简化多GPU后端部署

    AITemplate 在 CNN、Transformer 和 Diffusion 模型都能提供接近硬件上限的 TensorCore (NVIDIA GPU) 和 MatrixCore (AMD
    的头像 发表于 11-04 17:14 1506次阅读

    GPU平台生态:英伟达CUDA和AMD ROCm对比分析

    设计架构提供了硬件的直接访问接口,不必依赖图形 API 映射,降低 GPGPU 开发者编译难度,以此实现高粘性的开发者生态。目前主流的开发平台还包括 AMD ROCm 以及 OpenCL。
    的头像 发表于 06-06 14:36 3920次阅读
    <b class='flag-5'>GPU</b>平台生态:英伟达CUDA和<b class='flag-5'>AMD</b> <b class='flag-5'>ROCm</b>对比分析

    AMD将于今年秋季在部分RDNA 3 GPU添加ROCm的支持

      AMD将于今年秋季在部分RDNA 3 GPU添加ROCm的支持   人工智能是塑造下一代计算的决定性技术。近几个月来,我们都看到了生成
    的头像 发表于 07-25 15:40 1362次阅读

    AMD 发布新的AMD ROCm 5.6开放软件平台

             近日,AMD 发布了新的 AMD ROCm 5.6 开放软件平台,AMD AI群组高级副总裁 Vamsi Boppana 在博客中重点介绍了
    的头像 发表于 07-25 16:29 1538次阅读

    AMD ROCm 6.1升级MIPOpen 3.1,引入AI参数预测模型

    在此期间,AMD 频繁向GitHub公共仓库推送有关 ROCm 6.1 的最新开发进展,透露出不久后有可能正式上线新版本的意图。
    的头像 发表于 02-29 14:33 1464次阅读

    英伟达GPU垄断局面下,开源能否成为颠覆市场的关键力量?

    开源是AMD AI软硬件生态系统的一大卖点,虽然ROCm软件自 2016 年推出以来一直是开源的,但是固件的开源也很重要,AMD GPU
    发表于 04-18 14:25 956次阅读
    英伟达<b class='flag-5'>GPU</b>垄断局面下,开源能否成为颠覆市场的关键力量?

    AMD发布ROCm更新,新增RX 8000系列GPU的Navi 44命名

    首款Navi 48芯片以Gfx1201之名现身,而Navi 44则以Gfx1200之名亮相。这两款GPU的出现,至少暗示了AMD正在逐步完善RDNA 4 GPU的研发工作。
    的头像 发表于 05-24 16:11 1130次阅读

    AMD集成DeepSeek-V3模型至Instinct MI300X GPU

    AMD近日宣布了一项重要的技术进展,即将全新的DeepSeek-V3模型成功集成其旗舰级GPU产品——Instinct MI300X。这
    的头像 发表于 02-05 13:58 795次阅读