如何用OpenVINO™部署PP-StructureV3到Intel GPU上-电子发烧友网

一，RapidDoc系统概述

RapidDoc是一个轻量级、专注于文档解析的开源框架，支持OCR、版面分析、公式识别、表格识别和阅读顺序恢复等多种功能。框架基于 Mineru 二次开发，移除 VLM，专注于 Pipeline 产线下的高效文档解析，在 CPU 上也能保持不错的解析速度。本文章所使用的核心模型主要来源于 PaddleOCR 的 PP-StructureV3 系列（OCR、版面分析、公式识别、阅读顺序恢复，以及部分表格识别模型），并已全部转换为 ONNX 格式，支持在 CPU/GPU 上高效推理。

二，开始部署

首先，在命令提示行执行命令下载源文件。

git clone https://github.com/chrisma-2025/RapidDoc-OpenVINO

然后再执行命令，安装python依赖包

pip install torch torchvision --index-url https://download.pytorch.org/whl/cpu
pip install loguru pypdfium2 requests boto3 pydantic pypdf reportlab magika opencv-python tqdm omegaconf colorlog tokenizers rapidocr fast_langdetect scikit-image bs4 pdfminer pdfminer.six pdftext matplotlib
pip install onnxruntime-openvino onnxruntime
pip install --pre openvino --extra-index-url https://storage.openvinotoolkit.org/simple/wheels/nightly

下载OCR模型并使用指令将模型转换为OpenVINO™支持的IR文件

cd RapidDoc-OpenVINO/models
wget https://www.modelscope.cn/models/RapidAI/RapidOCR/resolve/master/onnx/PP-OCRv5/det/ch_PP-OCRv5_server_det.onnx -P ocr
wget https://www.modelscope.cn/models/RapidAI/RapidOCR/resolve/master/onnx/PP-OCRv5/rec/ch_PP-OCRv5_rec_server_infer.onnx -P ocr
wget https://www.modelscope.cn/models/RapidAI/RapidOCR/resolve/master/onnx/PP-OCRv4/cls/ch_ppocr_mobile_v2.0_cls_infer.onnx -P ocr

下载完成后运行：python ir_converter.py

三，运行Demo

执行命令返回文件根目

cd ..

Python demo.py

‍视频链接：https://blog.csdn.net/2401_83179994/article/details/154793207?spm=1011.2415.3001.10575&sharefrom=mp_manage_link

四，总结

本文完整演示了基于RapidDoc 框架的文档解析工具落地流程：先克隆源码、安装 PyTorch/OpenVINO 等依赖，再下载 PP-OCRv5 系列 ONNX 模型并尝试转换为 IR 文件，最后通过demo.py验证部署效果。

实际运行中，Intel GPU（Arc A770、Iris Xe Graphics）可正常调用，稳定完成多页面文档的 OCR、版面分析等任务，此次部署既验证了 RapidDoc 框架在轻量化工单解析场景的实用性，也证实了 OpenVINO™ 对 Inte GPU 的适配性，为后续工业、金融等领域的文档智能解析需求提供了可复用的技术方案。

如果你有更好的文章，欢迎投稿！

稿件接收邮箱：nami.liu@pasuntech.com

更多精彩内容请关注“算力魔方®”！

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉