0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA与飞桨共同深度适配的NGC飞桨容器在NVIDIA GPU上体验

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-11-01 10:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

PaddleOCR 发版 v2.6,带来全新升级的 PP-StructureV2 智能文档分析系统,实现一键 PDF 转 Word。欢迎广大开发者使用 NVIDIA 与飞桨共同深度适配的 NGC 飞桨容器在 NVIDIA GPU 上体验!

1. PaddleOCR v2.6 版本升级

随着企业数字化进程不断加速,PDF 转 Word 的功能、纸质文本的电子化存储、文件复原与二次编辑、信息检索等应用都有着强烈的企业需求。目前市面上已有一些软件,但普遍需要繁琐的安装注册操作,大多还存在额度限制。此外,最终转换效果也依赖于版面形态,无法做到针对性适配。

针对开发者的需求,飞桨文字识别套件 PaddleOCR 全新发布 PP-StructureV2 智能文档分析系统,支持一行命令实现 PDF 转 Word 功能,文字、表格、标题、图片都可完整恢复,一键实现 PDF 编辑自由!

db0f69ac-5934-11ed-a3b6-dac502259ad0.png

文档分析示例

PP-StructureV2 智能文档分析系统升级点包括以下 2 方面:

系统功能升级:新增图像矫正和版面复原模块,支持标准格式 PDF 和图片格式 PDF 解析!

系统性能优化:

版面分析:发布轻量级版面分析模型,速度提升 11 倍,平均 CPU 耗时仅需 41ms!

表格识别:设计 3 大优化策略,预测耗时不变情况下,模型精度提升 6%。

关键信息抽取:设计视觉无关模型结构,语义实体识别精度提升 2.8%,关系抽取精度提升超过 9.1%。

GitHub 传送门:

https://github.com/PaddlePaddle/PaddleOCR

1.1 PP-StructureV2 智能文档分析系统优化策略概述

PP-StructureV2 系统流程图如下所示,文档图像首先经过图像矫正模块,判断整图方向并完成转正,随后可以完成版面信息分析与关键信息抽取 2 类任务。

db3ed746-5934-11ed-a3b6-dac502259ad0.png

在版面分析任务中,图像首先经过版面分析模型,将图像划分为文本、表格、图像等不同区域,随后对这些区域分别进行识别,如,将表格区域送入表格识别模块进行结构化识别,将文本区域送入 OCR 引擎进行文字识别,最后使用版面恢复模块将其恢复为与原始图像布局一致的 Word 或者 PDF 格式的文件。

在关键信息抽取任务中,首先使用 OCR 引擎提取文本内容,然后由语义实体识别模块获取图像中的语义实体,最后经关系抽取模块获取语义实体之间的对应关系,从而提取需要的关键信息。

算法改进思路来看,对系统中的 3 个关键子模块,共进行了 8 个方面的改进:

版面分析

PP-PicoDet:轻量级版面分析模型

FGD:兼顾全局与局部特征的模型蒸馏算法

表格识别

PP-LCNet: CPU 友好型轻量级骨干网络

CSP-PAN:轻量级高低层特征融合模块

SLAHead:结构与位置信息对齐的特征解码模块

关键信息抽取

VI-LayoutXLM:视觉特征无关的多模态预训练模型结构

TB-YX:考虑阅读顺序的文本行排序逻辑

UDML:联合互学习知识蒸馏策略

最终,与 PP-StructureV1 相比:

版面分析模型参数量减少 95%,推理速度提升 11 倍,精度提升 0.4%;

表格识别预测耗时不变,模型精度提升 6%,端到端 TEDS 提升 2%;

关键信息抽取模型速度提升 2.8 倍,语义实体识别模型精度提升 2.8%;关系抽取模型精度提升 9.1%。

PP-StructureV2 优化详细策略解析三日课回放,可以扫描下方二维码,加入 PaddleOCR 官方交流群获取。除此之外,入群福利还包括:社区开发者基于 PP-StructureV2 开发的 PDF2Word 应用程序、《动手学 OCR》电子书、10 个 OCR 场景应用垂类模型等。

PP-StructureV2 技术报告:

https://arxiv.org/abs/2210.05391v2

2. NGC 飞桨容器介绍

如果您希望体验 PaddleOCRv2.6 的新特性,欢迎使用 NGC 飞桨容器。NVIDIA 与百度飞桨共同开发了 NGC 飞桨容器,将最新版本的飞桨与最新的 NVIDIA 的软件栈(如 CUDA)进行了无缝的集成与性能优化,最大程度的释放飞桨框架在 NVIDIA 最新硬件上的计算能力。这样,用户不仅可以快速开启 AI 应用,专注于创新和应用本身,还能够在 AI 训练和推理任务上获得飞桨+NVIDIA 带来的飞速体验。

最佳的开发环境搭建工具 - 容器技术。

容器其实是一个开箱即用的服务器。极大降低了深度学习开发环境的搭建难度。例如你的开发环境中包含其他依赖进程(redis,MySQL,Ngnix,selenium-hub等等),或者你需要进行跨操作系统级别的迁移。

容器镜像方便了开发者的版本化管理

容器镜像是一种易于复现的开发环境载体

容器技术支持多容器同时运行

最好的 PaddlePaddle 容器

NGC 飞桨容器针对 NVIDIA GPU 加速进行了优化,并包含一组经过验证的库,可启用和优化 NVIDIA GPU 性能。此容器还可能包含对 PaddlePaddle 源代码的修改,以最大限度地提高性能和兼容性。此容器还包含用于加速 ETL (DALI, RAPIDS)、训练(cuDNN, NCCL)和推理 (TensorRT)工作负载的软件。

PaddlePaddle 容器具有以下优点:

适配最新版本的 NVIDIA 软件栈(例如最新版本 CUDA),更多功能,更高性能。

更新的 Ubuntu 操作系统,更好的软件兼容性

按月更新

满足 NVIDIA NGC 开发及验证规范,质量管理

通过飞桨官网快速获取

环境准备

使用 NGC 飞桨容器需要主机系统(Linux)安装以下内容:

Docker 引擎

NVIDIA GPU 驱动程序

NVIDIA 容器工具包

有关支持的版本,请参阅 NVIDIA 框架容器支持矩阵和 NVIDIA 容器工具包文档。

不需要其他安装、编译或依赖管理。无需安装 NVIDIA CUDA Toolkit。

3. 飞桨与 NVIDIA NGC 合作介绍

目前飞桨已拥有超过 470 万的开发者。而在过去五年,飞桨与 NVIDIA 团队紧密合作,双方深度融合,做了大量适配工作。

今年,NVIDIA 在国内也已经设立了专门的工程团队支持,赋能飞桨生态。

而为了让更多的开发者能用上基于 NVIDIA 最新的高性能硬件和软件栈。当前,NVIDIA 团队正在进行全新一代 GPU 的适配工作,以及提高飞桨对 CUDA Operation API 的使用率,让飞桨的开发者拥有优秀的用户体验及极致性能。

以上的各种适配,仅仅是让飞桨的开发者拥有高性能的推理训练成为可能。但是,这些离行业开发者还很远,门槛还很高,难度还很大。

为此,我们将刚刚这些集成和优化工作,整合到三大产品线中。其中 NGC 飞桨容器最为闪亮。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109102
  • 存储
    +关注

    关注

    13

    文章

    4696

    浏览量

    89576
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134471
  • 飞桨
    +关注

    关注

    0

    文章

    37

    浏览量

    2617

原文标题:在 NVIDIA NGC 上体验一键 PDF 转 Word

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    Blackwell 架构 GPU 中的中端专业图形卡,高度仅为全高 GPU 的二分之一。如果您需要的是一块半高显卡,能适配小机箱,功耗不高,还要具备 AI 及光线追踪性能的话,那么 RTX PRO 2000 是很好的选择。
    的头像 发表于 11-28 09:39 3717次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能测试

    智能变:基于DSP与CPLD协同处理的高动态飞行器主电动变距伺服控制系统

    电动式变距伺服控制系统是一种通过电动执行机构来调整飞行器主距角的高精度控制系统。其核心原理是通过改变桨叶迎风面与纵向旋转轴的夹角,即距角,来优化桨叶
    的头像 发表于 11-22 15:06 1010次阅读
    智能变<b class='flag-5'>桨</b>:基于DSP与CPLD协同处理的高动态飞行器主<b class='flag-5'>桨</b>电动变<b class='flag-5'>桨</b>距伺服控制系统

    PaddleMaterials完成与沐曦AI芯片深度适配

    材料科学的发展历程中,研究范式经历了实验观测→理论建模→计算机模拟→大数据挖掘的演进,每一次迭代都加速了新型功能材料的预测与发现。如今,随着AI时代的到来,科研人员正不断探索如何借助大语言模型
    的头像 发表于 10-22 17:31 1069次阅读
    <b class='flag-5'>飞</b><b class='flag-5'>桨</b>PaddleMaterials完成与沐曦AI芯片<b class='flag-5'>深度</b><b class='flag-5'>适配</b>

    沐曦与百度PaddleScience实现全面深度适配

    近日,WAVE SUMMIT深度学习开发者大会2025硬件分论坛北京·望京凯悦酒店二层成功举办。本次论坛以“软硬协同 模力无限”为主题,汇聚中国信息通信研究院、英特尔、安谋科技、沐曦、天数智芯
    的头像 发表于 09-29 11:41 996次阅读

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 2877次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 998次阅读

    NVIDIA NVLink 深度解析

    引言 NVIDIA NVLink 是一种关键的高速互连技术,专为加速计算而设计,尤其是GPU 系统以及 GPU 和支持 CPU 之间 ^1^。NVLink 的出现标志着传统互连瓶
    的头像 发表于 05-06 18:14 4109次阅读

    燧原科技正式纳入例行版本发布体系

    燧原科技与经过长时间的适配合作和持续集成(CI)建设,对合⼊的每⼀行代码都在燧原硬件上进⾏了验证。如今,燧原正式纳入
    的头像 发表于 04-11 11:31 826次阅读
    燧原科技正式纳入<b class='flag-5'>飞</b><b class='flag-5'>桨</b>例行版本发布体系

    百度框架3.0正式版发布

    、推理等任务都离不开深度学习框架的优化与支撑。 框架3.0,从设计理念上实现了从底层硬件适配到顶层开发体验的全面进化,训练效率、性能、
    的头像 发表于 04-02 19:03 1041次阅读
    百度<b class='flag-5'>飞</b><b class='flag-5'>桨</b>框架3.0正式版发布

    沐曦曦云C500通用计算GPU与百度完成Ⅱ级兼容性测试

    近日,沐曦曦云C500通用计算GPU与百度已完成Ⅱ级兼容性测试。测试结果显示,双方兼容性表现良好,整体运行稳定。这是沐曦加入“硬件生
    的头像 发表于 03-31 14:22 1483次阅读

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI开发

    NVIDIA GTC 推出新一代专业级 GPU 和 AI 赋能的开发者工具—同时,ChatRTX 更新现已支持 NVIDIA NIM,RTX Remix 正式结束测试阶段,本月的 NVIDIA
    的头像 发表于 03-28 09:59 1080次阅读

    NVIDIA GPU助力科研人员探索外星世界

    NVIDIA GPU 驱动的深度学习短短几秒内解读出了卡西尼号土星探测器多年来收集的海量数据,为科研人员探索外星世界提供了更加智能的方式。
    的头像 发表于 02-27 10:37 849次阅读

    如何在C#中部署PP-OCRv4模型

    《超4万6千星的开源OCR黑马登场,PaddleOCR凭什么脱颖而出?》收到了读者热烈反响c,很多读者提出:如何在C#中部署PP-OCRv4模型?本文从零开始详细介绍整个过程。
    的头像 发表于 02-17 10:58 2653次阅读
    如何在C#中部署<b class='flag-5'>飞</b><b class='flag-5'>桨</b>PP-OCRv4模型

    NVIDIA和GeForce RTX GPU专为AI时代打造

    NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。
    的头像 发表于 01-06 10:45 1259次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 - NVIDIA
    发表于 12-16 14:25