0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用OpenVINO优化并部署飞桨PP-OCRv4模型

jf_23871869 来源:刘力 作者:刘力 2025-04-03 18:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:算力魔方创始人/英特尔创新大使刘力

一,什么是PaddleOCR工具库?

PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库,助力开发者训练出更好的模型,并应用落地。在GitHub上与其它OCR开源库相比,PaddleOCR在近五年发展时间内,拥有最多的星标(46k)、最快的星标增速、最多的贡献者(234)和最活跃的社区支持!

wKgZPGfuXPOAN_UvAAIEoqE99fE421.png

PaddleOCR支持多种 OCR 相关前沿算法,在此基础上打造产业级特色模型系列:PP-OCR、PP-Structure和PP-ChatOCR,打通了模型训练、压缩、部署全流程。

Github Repo: https://github.com/PaddlePaddle/PaddleOCR

二,什么是PP-OCRv4模型?

PP-OCRv4是PaddleOCR工具库的PP-OCR系列模型中,当前性能最优的一个。它在前代模型(PP-OCRv3)的基础上,针对检测模型和识别模型进行了数据、网络结构、训练策略等多个模块的优化,在多个应用场景中,精度均有大幅提升:

中文场景,相对于PP-OCRv3中文模型提升超4%;

英文数字场景,相比于PP-OCRv3英文模型提升6%;

多语言场景(支持韩语、日语、德语、法语等80种语言),平均准确率提升超8%。

PP-OCRv4是一个两阶段的OCR系统,包含检测模型、方向分类模型和识别模型。在检测和识别之间添加方向分类模型,将不同角度的文本检测框修正为水平检测框,方便识别模型完成行文本识别。

wKgZO2fuXPuARKoMAAR-I7xxQis911.png

为了适应服务器和边缘端不同场景的部署需求,PP-OCRv4提供两种推理模型权重版本:

边缘端:中英文超轻量PP-OCRv4模型(16.1M) = 检测模型(4.7M) + 识别模型(10.0M) + 方向分类模型(1.4M)。Hmean:62.24%;ACC:70.1%。

服务器端:中英文高精度PP-OCRv4 server模型(199.4M) = 检测模型(110M) + 识别模型(88M) + 方向分类模型(1.4M)。Hmean:82.69%;ACC:84.04%。

PP-OCRv4模型链接:

https://github.com/PaddlePaddle/PaddleOCR/blob/main/docs/ppocr/blog/PP-OCRv4_introduction.md

PP-OCRv4模型的卓越性能使其在多个领域具有广泛的应用前景,如文档扫描、文字提取、智能表单填写、物流信息追踪、文档自动化处理、智能服务窗口、文献资料整理等等。本文将介绍使用OpenVINO™工具套件在英特尔® CPU、独立显卡、集成显卡和NPU上优化并部署飞桨PP-OCRv4模型。

三,OpenVINO™工具套件简介

OpenVINO™工具套件是一个用于优化和部署人工智能AI)模型,提升AI推理性能的开源工具集合,不仅支持以卷积神经网络(CNN)为核心组件的预测式AI模型(Predictive AI),还支持以Transformer为核心组件的生成式AI模型(Generative AI)。OpenVINO™工具套件支持直接读取并优化PaddlePaddle训练好的模型(*.pdmodel),提升其在英特尔® CPU、独立显卡、集成显卡、NPU等硬件上的AI推理计算性能。

wKgZPGfuXQWAVYwWAAUadbqoIwM145.pngwKgZPGfuXceAGXB-AAPwbrDdSKA605.png

四,搭建开发环境

您可以选择无需搭建开发环境,直接在飞桨AIStudio星河社区上体验范例:

https://aistudio.baidu.com/projectdetail/8770259

或者,在本地搭建开发环境,在算力魔方®上运行。

首先,请克隆PP-OCRv4_OpenVINO到本地:

git clone git clone https://github.com/openvino-book/PP-OCRv4_OpenVINO.git

cd PP-OCRv4_OpenVINO

接着,安装依赖项:

pip install -r requirements.txt

最后,请从

https://paddlepaddle.github.io/PaddleOCR/latest/model/index.html

下载中英文超轻量 PP-OCRv4 模型,包括检测模型、方向分类器和识别模型到PP-OCRv4_OpenVINO文件夹,并解压。

wKgZPGfuXYeAcIE1AAI995XPlok133.png

下载命令:

# 下载并解压PP-OCRv4的检测模型

wget https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_infer.tar && tar -xvf ch_PP-OCRv4_det_infer.tar

# 下载并解压PP-OCRv4的方向分类器

wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar && tar -xvf ch_ppocr_mobile_v2.0_cls_infer.tar

# 下载并解压PP-OCRv4的识别模型

wget https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_infer.tar && tar -xvf ch_PP-OCRv4_rec_infer.tar

下载并解压完毕后,开发环境搭建完成!

五,编写PP-OCRv4推理程序

PP-OCRv4_OpenVINO项目已将推理程序编写完成,各文件功能如下:

执行演示程序main.py,并指定模型路径和推理硬件设备:

python main.py --image_dir images/general_ocr_006.png

--det_model_dir ch_PP-OCRv4_det_infer/inference.pdmodel

--det_model_device CPU

--rec_model_dir ch_PP-OCRv4_rec_infer/inference.pdmodel

--rec_model_device CPU

--cls_model_dir ch_ppocr_mobile_v2.0_cls_infer/inference.pdmodel

--cls_model_device CPU

--use_angle_cls True

运行结果,如下图所示:

wKgZPGfuXduAFgE2AAazGIKn5sk016.png

六,总结

使用OpenVINO™可以直接读入PP-OCRv4模型(无需转换),并能方便快捷的将PP-OCRv4模型部署在含有英特尔® CPU、独立显卡、集成显卡或NPU等硬件的算力魔方®上。

如果你有更好的文章,欢迎投稿!

稿件接收邮箱:nami.liu@pasuntech.com

更多精彩内容请关注“算力魔方®”!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3874

    浏览量

    52341
  • OpenVINO
    +关注

    关注

    0

    文章

    118

    浏览量

    829
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PP-OCRv3优化策略详细解读

    PP-OCR是PaddleOCR团队自研的超轻量OCR系统,面向OCR产业应用,权衡精度与速度。近期,PaddleOCR团队针对PP-OCRv2的检测模块和识别模块,进行共计9个方面的升级,打造出一款全新的、效果更优的超轻量OCR系统:
    的头像 发表于 05-12 09:21 4896次阅读

    基于C#和OpenVINO™在英特尔独立显卡上部署PP-TinyPose模型

    OpenVINO,将 PP-TinyPose 模型部署在英特尔独立显卡上。 1.1 PP-TinyPose
    的头像 发表于 11-18 18:27 3869次阅读

    百度PP-YOLOE ONNX 在LabVIEW中的部署推理(含源码)

    PP-YOLOE是百度基于其之前的PP-YOLOv2所改进的卓越的单阶段Anchor-free模型,超越了多种流行的YOLO模型。如何使用python进行该
    的头像 发表于 05-26 14:01 2532次阅读
    百度<b class='flag-5'>飞</b><b class='flag-5'>桨</b><b class='flag-5'>PP</b>-YOLOE ONNX 在LabVIEW中的<b class='flag-5'>部署</b>推理(含源码)

    使用OpenVINO C# API轻松部署PP-OCRv4模型

    ​ 作者:算力魔方创始人/英特尔创新大使刘力 《超4万6千星的开源OCR黑马登场,PaddleOCR凭什么脱颖而出?》 收到了读者热烈反响,很多读者提出:如何在C#中部署
    的头像 发表于 02-12 10:42 2564次阅读
    使用<b class='flag-5'>OpenVINO</b> C# API轻松<b class='flag-5'>部署</b><b class='flag-5'>飞</b><b class='flag-5'>桨</b><b class='flag-5'>PP-OCRv4</b><b class='flag-5'>模型</b>

    如何在C#中部署PP-OCRv4模型

    《超4万6千星的开源OCR黑马登场,PaddleOCR凭什么脱颖而出?》收到了读者热烈反响c,很多读者提出:如何在C#中部署PP-OCRv4
    的头像 发表于 02-17 10:58 3219次阅读
    如何在C#中<b class='flag-5'>部署</b><b class='flag-5'>飞</b><b class='flag-5'>桨</b><b class='flag-5'>PP-OCRv4</b><b class='flag-5'>模型</b>

    【EASY EAI Orin Nano开发板试用体验】PP-OCRV5文字识别实例搭建与移植

    PP-OCRV5,首先就是要安装PaddlePaddle 3.0()和PaddleOCR 3.0(OCR大
    发表于 08-18 16:57

    使用OpenVINO部署PaddleSeg模型库中的DeepLabV3+模型

          01 概述     本文是OpenVINO 工具套件与百度PaddlePaddle模型转换/部署系列的第二部。这篇文章专注于
    的头像 发表于 11-22 14:58 1.1w次阅读
    使用<b class='flag-5'>OpenVINO</b>™ <b class='flag-5'>部署</b>PaddleSeg<b class='flag-5'>模型</b>库中的DeepLabV3+<b class='flag-5'>模型</b>

    基于OpenVINO™ 的版 PGNet 实现案例

    OpenVINO 工具套件2022.1版于2022年3月22日正式发布,根据官宣OpenVINO 迎来迄今为止最重大更新,2022.1新特性抢先看!,OpenVINO 2022.1将是迄今为止最大变化的版本,并可以直接支持读取
    发表于 08-04 16:25 1320次阅读

    NVIDIA 与团队合作开发基于 ResNet50 的模型示例

    为了让开发者可以快速复现顶尖的精度和超高的性能,NVIDIA 与团队合作开发了基于 ResNet50 的模型示例,并将持续开发更多的
    的头像 发表于 10-18 10:03 2721次阅读

    在C++中使用OpenVINO工具包部署YOLOv5模型

    下载并转换YOLOv5预训练模型的详细步骤,请参考:《基于OpenVINO™2022.2和蝰蛇峡谷优化部署YOLOv5
    的头像 发表于 02-15 16:53 1.2w次阅读

    基于OpenVINO™工具包部署PP-Human的全流程

    PP-Human是目标检测套件PaddleDetection中开源的实时行人分析工具,提供了五大异常行为识别和四大产业级功能:人体属性分析、人流计数、跨镜ReID
    的头像 发表于 02-23 18:03 1893次阅读

    使用OpenVINO优化部署训练好的YOLOv7模型

    在《英特尔锐炫 显卡+ oneAPI 和 OpenVINO 实现英特尔 视频 AI 计算盒训推一体-上篇》一文中,我们详细介绍基于英特尔 独立显卡搭建 YOLOv7 模型的训练环境,完成了 YOLOv7
    的头像 发表于 08-25 11:08 2943次阅读
    使用<b class='flag-5'>OpenVINO</b><b class='flag-5'>优化</b><b class='flag-5'>并</b><b class='flag-5'>部署</b>训练好的YOLOv7<b class='flag-5'>模型</b>

    基于算力魔方与PP-OCRv5的OpenVINO智能文档识别方案

    )团队最新推出的PP-OCRv5模型在精度和效率上实现了显著突破,结合Intel OpenVINO工具套件的硬件加速能力,能够为各类文档处理场景提供更强大的支持。 二,算力魔方简介 算力魔方是一款可以DIY的迷你主机,采用了抽屉
    的头像 发表于 06-12 21:19 1833次阅读
    基于算力魔方与<b class='flag-5'>PP-OCRv</b>5的<b class='flag-5'>OpenVINO</b>智能文档识别方案

    一键搞定!PP-OCRv5模型转ONNX格式全攻略,解锁多平台无缝部署

    技术生态伙伴 算力魔方 | 引言:还在为OCR模型在不同硬件上的部署而头疼吗?百度
    的头像 发表于 09-05 16:10 3001次阅读
    一键搞定!<b class='flag-5'>PP-OCRv</b>5<b class='flag-5'>模型</b>转ONNX格式全攻略,解锁多平台无缝<b class='flag-5'>部署</b>

    瀚博半导体宣布深度参与百度黑客松生态活动

    近日,瀚博半导体正式宣布深度参与百度主办的黑客松生态活动。面向全球开发者开放旗下载天系列加速卡开发环境,支持部署百度文心ERNIE-4.5 系列开源模型
    的头像 发表于 04-11 09:41 804次阅读