0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一键搞定!PP-OCRv5模型转ONNX格式全攻略,解锁多平台无缝部署

jf_23871869 来源:jf_23871869 作者:jf_23871869 2025-09-05 16:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

飞桨技术生态伙伴 算力魔方

| 引言:还在为OCR模型在不同硬件上的部署而头疼吗?百度飞桨的PP-OCRv5重磅升级,准确率提升13%,且一个模型同时支持中、英、日等五种文字!本文将手把手教你如何将PP-OCRv5模型转换为通用ONNX格式,让你能在IntelAMD高通、苹果等各类设备上轻松部署,真正实现“一次转换,随处运行”。

图片

在当前多语言混合文档处理需求日益增长的背景下,百度飞桨推出的PP-OCRv5

https://github.com/PaddlePaddle/PaddleOCR

成为了业界瞩目的焦点。这款轻量级光学字符识别(OCR)系统不仅将准确率提升了13%,更强大的是,它实现了单一模型同时识别简体中文、繁体中文、英文、日文和拼音五大文本类型,堪称文档处理领域的“瑞士军刀”。

一,为何需要转换为ONNX格式?

尽管PP-OCRv5本身非常强大,但若想将其部署在Intel、AMD、高通、苹果、瑞芯微等各式各样的AI推理设备上,直接使用原模型可能会面临兼容性挑战。而ONNX(Open Neural Network Exchange) 作为一个开放的模型格式标准,就像是AI世界的“通用翻译官”,能够帮助你的模型在不同的硬件和框架之间自由穿梭。

只需完成一次转换,即可利用ONNX Runtime, TensorRT, OpenVINO, ROCm等众多推理引擎进行高速推理,极大地扩展了应用边界。

二,四步上手:PP-OCRv5模型转换ONNX全流程

1,准备工作:安装所需环境与工具

首先,我们需要一个干净的Python环境来避免库版本冲突。推荐使用Anaconda创建虚拟环境。

# 创建并激活名为 ppocrv5_ov 的虚拟环境
conda create -n ppocrv5_ov python=3.11
conda activate ppocrv5_ov

image.png

接下来,安装必不可少的PaddlePaddle深度学习框架和PaddleOCR库。

# 安装PaddlePaddle和PaddleOCR
pip install paddlepaddle
pip install paddleocr
# 安装高性能推理依赖(CPU版)
paddleocr install_hpi_deps cpu

最后,安装本次转换的“主角”——模型转换工具 paddle2onnx 。

# 安装paddle2onnx转换工具
paddlex --install paddle2onnx

image.png

2,下载预训练模型

我们将官方提供的服务器版高性能模型下载到本地。它们分别是检测(detection)、识别(recognition)和分类(classification) 模型。

# 1. 下载并解压文本检测模型
wget https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-OCRv5_server_det_infer.tar
tar -xvf PP-OCRv5_server_det_infer.tar
# 2. 下载并解压文本识别模型
wget https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-OCRv5_server_rec_infer.tar
tar -xvf PP-OCRv5_server_rec_infer.tar
# 3. 下载并解压文本方向分类模型
wget https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-LCNet_x1_0_doc_ori_infer.tar
tar -xvf PP-LCNet_x1_0_doc_ori_infer.tar

image.png

3,核心步骤:模型转换

现在,我们使用安装好的 paddle2onnx 工具,将三个模型依次转换为ONNX格式。

# 转换检测模型
paddlex --paddle2onnx --paddle_model_dir ./PP-OCRv5_server_det_infer --onnx_model_dir ./PP-OCRv5_server_det_onnx
# 转换识别模型
paddlex --paddle2onnx --paddle_model_dir ./PP-OCRv5_server_rec_infer --onnx_model_dir ./PP-OCRv5_server_rec_onnx
# 转换分类模型
paddlex --paddle2onnx --paddle_model_dir ./PP-LCNet_x1_0_doc_ori_infer --onnx_model_dir ./PP-OCRv5_server_cls_onnx

转换成功后,你将在当前目录看到三个对应的新文件夹(PP-OCRv5_server_det_onnx, PP-OCRv5_server_rec_onnx, PP-OCRv5_server_cls_onnx),里面便是生成的ONNX模型文件。
image.png

4,验证转换结果

理论转完了,实际能用吗?让我们写个脚本测试一下。

首先,下载一张示例图片:

wget https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png

然后,使用PaddleOCR命令,指定我们刚刚转换好的ONNX模型进行推理:

paddleocr ocr -i ./general_ocr_002.png 
              --text_detection_model_name PP-OCRv5_server_det 
              --text_detection_model_dir PP-OCRv5_server_det_onnx 
              --text_recognition_model_name PP-OCRv5_server_rec 
              --text_recognition_model_dir PP-OCRv5_server_rec_onnx/ 
              --enable_hpi True 
              --device cpu

如果终端成功打印出了图片中的文字识别结果,那么恭喜你!这意味着从模型转换到推理的整个流程已全部跑通,ONNX模型工作正常。

image.png

三,结语与展望
通过以上五个步骤,我们成功地将PP-OCRv5模型转换为了ONNX格式,为其在广阔硬件平台上的部署打开了大门。无论是云端服务器还是边缘设备,ONNX都能提供强大的跨平台能力。
审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • OCR
    OCR
    +关注

    关注

    0

    文章

    176

    浏览量

    17298
  • 飞桨
    +关注

    关注

    0

    文章

    37

    浏览量

    2676
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深入解析TPS25961 eFuse:功能特性与应用设计全攻略

    深入解析TPS25961 eFuse:功能特性与应用设计全攻略 在电子工程师的日常设计工作中,电路保护和电源管理是至关重要的环节。今天,我们就来详细探讨下德州仪器(TI)推出的TPS25961
    的头像 发表于 02-27 17:10 710次阅读

    搞定RK平台Wi-Fi/BT调试!从配置到问题解决全攻略

    专用芯片,Wi-Fi/BT 的稳定运行直接影响产品体验。本文从配置、编译、测试到问题排查,手把手带你搞定 RK 平台 Wi-Fi/BT 调试。
    的头像 发表于 02-09 16:57 3154次阅读
    <b class='flag-5'>一</b>文<b class='flag-5'>搞定</b>RK<b class='flag-5'>平台</b>Wi-Fi/BT调试!从配置到问题解决<b class='flag-5'>全攻略</b>

    零碳园区建设全攻略:政策导向+建设路径+技术支撑+实践案例

    零碳园区建设全攻略:政策导向+建设路径+技术支撑+实践案例 安科瑞销售工程师-蔡禹 咨询:18702109681 全球气候变化背景下,“双碳”目标成为中国发展的重要战略指引,园区作为工业碳排放核心
    的头像 发表于 02-06 16:48 1513次阅读
    零碳园区建设<b class='flag-5'>全攻略</b>:政策导向+建设路径+技术支撑+实践案例

    UPS不间断电源是什么?企业如何选型与维护?2026年全攻略

    不间断电源(UPS)。本文将为您深入解析UPS,并提供份贴合当下需求的企业选型与维护全攻略、深度解析:UPS不仅仅是“备用电池”不间断电源(Uninterrupt
    的头像 发表于 01-16 10:46 2089次阅读
    UPS不间断电源是什么?企业如何选型与维护?2026年<b class='flag-5'>全攻略</b>

    迅为驱动开发实战:iTOP-RK3568开发板eDP屏幕移植全攻略

    迅为驱动开发实战:iTOP-RK3568开发板eDP屏幕移植全攻略
    的头像 发表于 12-30 15:42 1408次阅读
    迅为驱动开发实战:iTOP-RK3568开发板eDP屏幕移植<b class='flag-5'>全攻略</b>

    一键配网失败怎么办?机智云热点配网全攻略

    在使用机智云APP进行一键配网时,常见的失败原因之是WiFi频段不匹配。许多机智云入门设备(如ESP8266)仅支持2.4GHz的WiFi,而如果连接的是5GHzWiFi,配网就无法成功。判断
    的头像 发表于 12-11 18:03 1686次阅读
    <b class='flag-5'>一键</b>配网失败怎么办?机智云热点配网<b class='flag-5'>全攻略</b>

    GPS设计全攻略

    电子发烧友网站提供《GPS设计全攻略.pdf》资料免费下载
    发表于 12-01 17:10 0次下载

    医疗电子EMC整改:原理到实战的系统化全攻略策略

    深圳南柯电子|医疗电子EMC整改:原理到实战的系统化全攻略策略
    的头像 发表于 11-27 09:45 1238次阅读

    用ROCm部署PP-StructureV3到AMD GPU上

    -StructureV3模型部署方案。该方案是对前文PP-OCRv5部署实践的深化与扩展。 ,RapidDoc系统概述 RapidDoc
    的头像 发表于 11-13 16:56 5814次阅读
    用ROCm<b class='flag-5'>部署</b><b class='flag-5'>PP</b>-StructureV3到AMD GPU上

    基于DP1323EL的电动车解锁方案:超高速读写,提升电动车一键解锁体验

    靠近车辆时,APP会自动检测信号强度,实现“无感解锁”。例如,用户步行接近电动车5米左右范围内,车辆仪表盘会自动亮起,解锁车锁;上车后,踩下刹车即可一键启动。这种方案通常集成GPS定位
    发表于 11-10 17:45

    工业 / 民用电表排线全攻略:安全合规 + 高效布线,90% 电工都在用的标准化方案

    工业 / 民用电表排线全攻略:安全合规 + 高效布线,90% 电工都在用的标准化方案 电表布线错步,安全隐患埋十年!电工师傅、装修负责人、物业工程人员注意了—— 不合格的电表排线不仅会导致跳闸
    的头像 发表于 11-06 21:17 2147次阅读
    工业 / 民用电表排线<b class='flag-5'>全攻略</b>:安全合规 + 高效布线,90% 电工都在用的标准化方案

    使用OpenVINO将PP-OCRv5模型部署在Intel显卡上

    个用于优化和部署人工智能(AI)模型,提升AI推理性能的开源工具集合,不仅支持以卷积神经网络(CNN)为核心组件的预测式AI模型(Predictive AI),还支持以Transf
    的头像 发表于 09-20 11:17 1497次阅读
    使用OpenVINO将<b class='flag-5'>PP-OCRv5</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>在Intel显卡上

    【EASY EAI Orin Nano开发板试用体验】PP-OCRV5文字识别实例搭建与移植

    【EASY EAI Orin Nano开发板试用体验】PP-OCRV5文字识别实例搭建与移植 PP-OCRV5PP-OCR新代文字识别解决方案, 该方案聚焦于
    发表于 08-18 16:57

    借助电商 API,平台客户评价一键抓取

    出错。借助电商平台的 API(Application Programming Interface),我们可以实现一键抓取平台客户评价,高效自动化这
    的头像 发表于 08-11 14:49 908次阅读

    基于算力魔方与PP-OCRv5的OpenVINO智能文档识别方案

    )团队最新推出的PP-OCRv5模型在精度和效率上实现了显著突破,结合Intel OpenVINO工具套件的硬件加速能力,能够为各类文档处理场景提供更强大的支持。 二,算力魔方简介 算力魔方是款可以DIY的迷你主机,采用了抽屉
    的头像 发表于 06-12 21:19 1816次阅读
    基于算力魔方与<b class='flag-5'>PP-OCRv5</b>的OpenVINO智能文档识别方案