0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA与飞桨共同深度适配的NGC飞桨容器在NVIDIA GPU上体验

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-11-01 10:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

PaddleOCR 发版 v2.6,带来全新升级的 PP-StructureV2 智能文档分析系统,实现一键 PDF 转 Word。欢迎广大开发者使用 NVIDIA 与飞桨共同深度适配的 NGC 飞桨容器在 NVIDIA GPU 上体验!

1. PaddleOCR v2.6 版本升级

随着企业数字化进程不断加速,PDF 转 Word 的功能、纸质文本的电子化存储、文件复原与二次编辑、信息检索等应用都有着强烈的企业需求。目前市面上已有一些软件,但普遍需要繁琐的安装注册操作,大多还存在额度限制。此外,最终转换效果也依赖于版面形态,无法做到针对性适配。

针对开发者的需求,飞桨文字识别套件 PaddleOCR 全新发布 PP-StructureV2 智能文档分析系统,支持一行命令实现 PDF 转 Word 功能,文字、表格、标题、图片都可完整恢复,一键实现 PDF 编辑自由!

db0f69ac-5934-11ed-a3b6-dac502259ad0.png

文档分析示例

PP-StructureV2 智能文档分析系统升级点包括以下 2 方面:

系统功能升级:新增图像矫正和版面复原模块,支持标准格式 PDF 和图片格式 PDF 解析!

系统性能优化:

版面分析:发布轻量级版面分析模型,速度提升 11 倍,平均 CPU 耗时仅需 41ms!

表格识别:设计 3 大优化策略,预测耗时不变情况下,模型精度提升 6%。

关键信息抽取:设计视觉无关模型结构,语义实体识别精度提升 2.8%,关系抽取精度提升超过 9.1%。

GitHub 传送门:

https://github.com/PaddlePaddle/PaddleOCR

1.1 PP-StructureV2 智能文档分析系统优化策略概述

PP-StructureV2 系统流程图如下所示,文档图像首先经过图像矫正模块,判断整图方向并完成转正,随后可以完成版面信息分析与关键信息抽取 2 类任务。

db3ed746-5934-11ed-a3b6-dac502259ad0.png

在版面分析任务中,图像首先经过版面分析模型,将图像划分为文本、表格、图像等不同区域,随后对这些区域分别进行识别,如,将表格区域送入表格识别模块进行结构化识别,将文本区域送入 OCR 引擎进行文字识别,最后使用版面恢复模块将其恢复为与原始图像布局一致的 Word 或者 PDF 格式的文件。

在关键信息抽取任务中,首先使用 OCR 引擎提取文本内容,然后由语义实体识别模块获取图像中的语义实体,最后经关系抽取模块获取语义实体之间的对应关系,从而提取需要的关键信息。

算法改进思路来看,对系统中的 3 个关键子模块,共进行了 8 个方面的改进:

版面分析

PP-PicoDet:轻量级版面分析模型

FGD:兼顾全局与局部特征的模型蒸馏算法

表格识别

PP-LCNet: CPU 友好型轻量级骨干网络

CSP-PAN:轻量级高低层特征融合模块

SLAHead:结构与位置信息对齐的特征解码模块

关键信息抽取

VI-LayoutXLM:视觉特征无关的多模态预训练模型结构

TB-YX:考虑阅读顺序的文本行排序逻辑

UDML:联合互学习知识蒸馏策略

最终,与 PP-StructureV1 相比:

版面分析模型参数量减少 95%,推理速度提升 11 倍,精度提升 0.4%;

表格识别预测耗时不变,模型精度提升 6%,端到端 TEDS 提升 2%;

关键信息抽取模型速度提升 2.8 倍,语义实体识别模型精度提升 2.8%;关系抽取模型精度提升 9.1%。

PP-StructureV2 优化详细策略解析三日课回放,可以扫描下方二维码,加入 PaddleOCR 官方交流群获取。除此之外,入群福利还包括:社区开发者基于 PP-StructureV2 开发的 PDF2Word 应用程序、《动手学 OCR》电子书、10 个 OCR 场景应用垂类模型等。

PP-StructureV2 技术报告:

https://arxiv.org/abs/2210.05391v2

2. NGC 飞桨容器介绍

如果您希望体验 PaddleOCRv2.6 的新特性,欢迎使用 NGC 飞桨容器。NVIDIA 与百度飞桨共同开发了 NGC 飞桨容器,将最新版本的飞桨与最新的 NVIDIA 的软件栈(如 CUDA)进行了无缝的集成与性能优化,最大程度的释放飞桨框架在 NVIDIA 最新硬件上的计算能力。这样,用户不仅可以快速开启 AI 应用,专注于创新和应用本身,还能够在 AI 训练和推理任务上获得飞桨+NVIDIA 带来的飞速体验。

最佳的开发环境搭建工具 - 容器技术。

容器其实是一个开箱即用的服务器。极大降低了深度学习开发环境的搭建难度。例如你的开发环境中包含其他依赖进程(redis,MySQL,Ngnix,selenium-hub等等),或者你需要进行跨操作系统级别的迁移。

容器镜像方便了开发者的版本化管理

容器镜像是一种易于复现的开发环境载体

容器技术支持多容器同时运行

最好的 PaddlePaddle 容器

NGC 飞桨容器针对 NVIDIA GPU 加速进行了优化,并包含一组经过验证的库,可启用和优化 NVIDIA GPU 性能。此容器还可能包含对 PaddlePaddle 源代码的修改,以最大限度地提高性能和兼容性。此容器还包含用于加速 ETL (DALI, RAPIDS)、训练(cuDNN, NCCL)和推理 (TensorRT)工作负载的软件。

PaddlePaddle 容器具有以下优点:

适配最新版本的 NVIDIA 软件栈(例如最新版本 CUDA),更多功能,更高性能。

更新的 Ubuntu 操作系统,更好的软件兼容性

按月更新

满足 NVIDIA NGC 开发及验证规范,质量管理

通过飞桨官网快速获取

环境准备

使用 NGC 飞桨容器需要主机系统(Linux)安装以下内容:

Docker 引擎

NVIDIA GPU 驱动程序

NVIDIA 容器工具包

有关支持的版本,请参阅 NVIDIA 框架容器支持矩阵和 NVIDIA 容器工具包文档。

不需要其他安装、编译或依赖管理。无需安装 NVIDIA CUDA Toolkit。

3. 飞桨与 NVIDIA NGC 合作介绍

目前飞桨已拥有超过 470 万的开发者。而在过去五年,飞桨与 NVIDIA 团队紧密合作,双方深度融合,做了大量适配工作。

今年,NVIDIA 在国内也已经设立了专门的工程团队支持,赋能飞桨生态。

而为了让更多的开发者能用上基于 NVIDIA 最新的高性能硬件和软件栈。当前,NVIDIA 团队正在进行全新一代 GPU 的适配工作,以及提高飞桨对 CUDA Operation API 的使用率,让飞桨的开发者拥有优秀的用户体验及极致性能。

以上的各种适配,仅仅是让飞桨的开发者拥有高性能的推理训练成为可能。但是,这些离行业开发者还很远,门槛还很高,难度还很大。

为此,我们将刚刚这些集成和优化工作,整合到三大产品线中。其中 NGC 飞桨容器最为闪亮。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110095
  • 存储
    +关注

    关注

    13

    文章

    4881

    浏览量

    90251
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5258

    浏览量

    136039
  • 飞桨
    +关注

    关注

    0

    文章

    37

    浏览量

    2666

原文标题:在 NVIDIA NGC 上体验一键 PDF 转 Word

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瀚博半导体宣布深度参与百度黑客松生态活动

    近日,瀚博半导体正式宣布深度参与百度主办的黑客松生态活动。面向全球开发者开放旗下载天系列加速卡开发环境,支持部署百度文心ERNIE-4.5 系列开源模型与PP-OCRv4 文档理解模型,打造
    的头像 发表于 04-11 09:41 577次阅读

    沐曦股份与百度黑客松硬核赛题来袭

    沐曦股份作为黑客松第十期文心合作伙伴赛道核心出题方之一,携专属赛题「优化 PaddleOCR-VL-1.5+MetaX GPU」重磅来袭,邀全球开发者共探深度学习框架与国产
    的头像 发表于 04-02 09:20 371次阅读
    沐曦股份与百度<b class='flag-5'>飞</b><b class='flag-5'>桨</b>黑客松硬核赛题来袭

    NVIDIA向Kubernetes社区捐赠动态资源分配GPU驱动程序

    此外,NVIDIA KubeCon Europe 大会上宣布推出适用于 GPU 加速工作负载的机密容器解决方案、NVIDIA KAI S
    的头像 发表于 04-01 09:10 677次阅读

    沐曦曦索GPU产品赋能AI4S重塑材料研发新范式

    2026年1月29日,“AI4Science 前沿:材料研发计算新范式——国产算力×深度学习框架技术沙龙·上海站”张江百度人工智能产业赋能中心举办。
    的头像 发表于 02-10 14:28 642次阅读

    超擎数智为您深度解析NVIDIA Quantum-X800 InfiniBand平台

    NVIDIA
    专精特新
    发布于 :2026年01月08日 19:47:03

    NVIDIA RTX PRO 5000 Blackwell GPU深度评测

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升级迭代产品,其各项核心指标均针对 GPU 加速工作流的高性能
    的头像 发表于 01-06 09:51 3847次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的<b class='flag-5'>深度</b>评测

    NVIDIA RTX PRO 4000 Blackwell GPU性能测试

    Generation 的全面超越。那么,这款划时代的专业 GPU 真实应用场景中的表现究竟如何?今天,我们将通过深度实测,为您揭晓 NVIDIA RTX PRO 4000 Blac
    的头像 发表于 12-29 15:30 1803次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能测试

    Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GPU tile kernels,可以用
    的头像 发表于 12-13 10:12 1385次阅读
    <b class='flag-5'>在</b>Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile简化<b class='flag-5'>GPU</b>编程

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    Blackwell 架构 GPU 中的中端专业图形卡,高度仅为全高 GPU 的二分之一。如果您需要的是一块半高显卡,能适配小机箱,功耗不高,还要具备 AI 及光线追踪性能的话,那么 RTX PRO 2000 是很好的选择。
    的头像 发表于 11-28 09:39 6929次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能测试

    智能变:基于DSP与CPLD协同处理的高动态飞行器主电动变距伺服控制系统

    电动式变距伺服控制系统是一种通过电动执行机构来调整飞行器主距角的高精度控制系统。其核心原理是通过改变桨叶迎风面与纵向旋转轴的夹角,即距角,来优化桨叶
    的头像 发表于 11-22 15:06 1801次阅读
    智能变<b class='flag-5'>桨</b>:基于DSP与CPLD协同处理的高动态飞行器主<b class='flag-5'>桨</b>电动变<b class='flag-5'>桨</b>距伺服控制系统

    PaddleMaterials完成与沐曦AI芯片深度适配

    材料科学的发展历程中,研究范式经历了实验观测→理论建模→计算机模拟→大数据挖掘的演进,每一次迭代都加速了新型功能材料的预测与发现。如今,随着AI时代的到来,科研人员正不断探索如何借助大语言模型
    的头像 发表于 10-22 17:31 1421次阅读
    <b class='flag-5'>飞</b><b class='flag-5'>桨</b>PaddleMaterials完成与沐曦AI芯片<b class='flag-5'>深度</b><b class='flag-5'>适配</b>

    沐曦与百度PaddleScience实现全面深度适配

    近日,WAVE SUMMIT深度学习开发者大会2025硬件分论坛北京·望京凯悦酒店二层成功举办。本次论坛以“软硬协同 模力无限”为主题,汇聚中国信息通信研究院、英特尔、安谋科技、沐曦、天数智芯
    的头像 发表于 09-29 11:41 1429次阅读

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 4320次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 1622次阅读

    NVIDIA NVLink 深度解析

    引言 NVIDIA NVLink 是一种关键的高速互连技术,专为加速计算而设计,尤其是GPU 系统以及 GPU 和支持 CPU 之间 ^1^。NVLink 的出现标志着传统互连瓶
    的头像 发表于 05-06 18:14 5682次阅读