0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用NVIDIA产品技术组合提升用户体验

NVIDIA英伟达 来源:NVIDIA英伟达 2024-01-17 09:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

案例简介

本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型,并借助NVIDIA Triton推理服务器在NVIDIA V100 GPU上进行高效部署,帮助必优科技的文档智能体 UTalk-Doc 将用户指令识别服务吞吐量提升了 5 倍,单个请求响应时间缩减了三分之一,大幅提升服务运行效率,提升资源利用率。Triton 模型分析能力还协助必优科技,将寻找最佳推理配置所需的时间从数周减少到数小时。

智能体迭代和

用户增长的并发压力

必优科技旗下 UTalk-Doc 是新一代协助用户进行表达的办公产品。其中“用户指令识别”能力是产品组成中十分重要的一环。目前该能力主要由底层指令识别深度学习模型提供服务支持。

深度学习模型在运行过程中需要较大的计算量,在用 Pytorch 进行模型的推理时,一方面时延特别大,导致用户体验受损;另一方面,显存占用很大,导致推理请求的并发数上不去,请求失败的概率太高,只能通过增加机器的方式来提高并发能力,业务部署成本较高;再次,使用的模型经常变化,而业务需要更换后的模型能够快速地加速和上线部署。NVIDIA GPU 硬件和软件框架的强大性能帮助企业解决了海量计算需求,满足了必优科技多模态 office 智能体的迭代和用户几何倍增长的并发压力。

利用 NVIDIA产品技术组合

提升用户体验

基于以上挑战,必优科技选择了采用 NVIDIA 的 TensorRT-LLM SDK 对模型进行推理加速,并利用 NVIDIA Triton推理服务器在 V100 GPU 上进行在线部署,在提升用户体验的同时,大幅降低了服务成本。

通过使用 TensorRT-LLM 对指令识别深度学习模型进行加速,在都使用 FP32 的情况下,与 Pytorch 相对,时延降低 50% 左右。

使用 TensorRT-LLM 结合 NVIDIA V100 GPU 的 FP16 Tensor Core,在保证精度的同时,模型推理的时延进一步降低了 40%。

Triton 的 dynamic batch 及多实例特性,在满足时延要求的同时,提高了系统整体的并发能力。

TensorRT-LLM 可以对模型进行快速地加速,Triton 则可以对加速后的模型进行快速地部署,满足了业务对修改后的模型进行快速部署的需求,同时也大大减少了工程人员的工作量。

NVIDIA 赋能文档智能体

在 NVIDIA 技术和初创加速生态的加持中,必优科技旗下应用产品 ChatPPT(UTalk-Doc)在短短几个月内自然注册用户破 100 万,同时通过内容表达场景(如 PPT 演示),赋能了如金融、教育、医疗等垂直行业领域客户,并且在硬件生态合作等方面也做了更多的探索,共同推进整个 AI 行业的快速发展。

“NVIDIA 提供的 GPU 解决方案,解决了深度学习和机器学习的技术难题,是我们公司在人工智能道路上一路狂飙所不可或缺的一环。”必优科技创始人兼 CTO 陈润天博士表示。

必优科技成立于 2020 年,是国内较早期就专注于人工智能领域的智能内容生成技术的科技型公司,公司目前主要围绕智慧办公场景做相关业务开发服务,如 2023 年 3 月上线的 Chatppt(AI 生成 PPT)6 个月用户过百万;全新下一代产品 UTalk-Doc——不拘泥于格式、自由切换文档格式的产品,将彻底颠覆、改变和引领下一代 office 产品,帮助用户更好地进行表达。

NVIDIA 初创加速计划

必优科技是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。NVIDIA 初创加速计划为免费会员制,旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构,创业孵化器,创业加速器,行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣,技术支持,市场宣传,融资对接,业务推荐等一系列服务,加速创业公司的发展。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109119
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5102

    浏览量

    134487
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123926

原文标题:NVIDIA GPU 解决方案加速必优科技新一代文档智能体

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用NVIDIA DOCA GPUNetIO技术提升MoE模型推理性能

    在第三届 NVIDIA DPU 中国黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。
    的头像 发表于 09-23 15:25 707次阅读

    使用NVIDIA NVLink Fusion技术提升AI推理性能

    本文详细阐述了 NVIDIA NVLink Fusion 如何借助高效可扩展的 NVIDIA NVLink scale-up 架构技术,满足日益复杂的 AI 模型不断增长的需求。
    的头像 发表于 09-23 14:45 608次阅读
    使用<b class='flag-5'>NVIDIA</b> NVLink Fusion<b class='flag-5'>技术</b><b class='flag-5'>提升</b>AI推理性能

    NVIDIA推出Spectrum-XGS以太网技术

    NVIDIA 今日宣布推出 NVIDIA Spectrum-XGS 以太网。这项跨区域扩展(scale-across)技术可将多个分布式数据中心组合成一个十亿瓦级 AI 超级工厂。
    的头像 发表于 08-27 12:51 1135次阅读

    MS39549电机驱动:提升消费类产品卓越用户体验的秘密武器

    在消费类产品日新月异的今天,用户对于产品的体验要求越来越高。从智能手机的流畅操作到智能家电的便捷使用,每一个细节都影响着用户产品的满意度。
    的头像 发表于 07-24 16:47 493次阅读

    利用API提升电商用户体验:个性化推荐系统

    的推荐算法,实时为用户提供精准的购物建议。本文将逐步解析如何利用API构建个性化推荐系统,提升用户体验。 1. 个性化推荐系统概述 个性化推荐系统通过分析
    的头像 发表于 07-14 14:45 393次阅读
    <b class='flag-5'>利用</b>API<b class='flag-5'>提升</b>电商<b class='flag-5'>用户</b>体验:个性化推荐系统

    51Sim利用NVIDIA Cosmos提升辅助驾驶合成数据场景的泛化性

    51Sim 利用 NVIDIA Cosmos 的生成式世界基础模型,对现有的合成数据进行大规模泛化,在确保物理真实性的前提下,大幅提升了数据的丰富度。同时依托 NVIDIA Issac
    的头像 发表于 06-26 09:09 1084次阅读

    全球各大品牌利用NVIDIA AI技术提升运营效率

    欧莱雅、LVMH 集团和雀巢利用 NVIDIA 加速的智能体 AI 和物理 AI,大幅提升产品设计、营销及物流等方面的运营效率。
    的头像 发表于 06-19 14:36 974次阅读

    利用NVIDIA技术构建从数据中心到边缘的智慧医院解决方案

    全球领先的电子制造商正在利用 NVIDIA 技术,构建从数据中心到边缘的智慧医院解决方案。
    的头像 发表于 05-22 09:50 749次阅读

    交流充电桩负载能效提升技术

    冲损耗,降低无效能耗5%~10%。 谷值充电与分时电价协同 通过内置能源管理算法,在电网负荷低谷期(如夜间)自动提高充电功率,利用低价电降低用户成本,同时平衡电网负载,提升能源利用率。
    发表于 05-21 14:38

    5G网络中,信令测试仪如何帮助提升用户体验?

    。 这有助于运营商顺利部署新技术提升网络的整体性能和用户体验。 四、提升用户体验的具体案例 优化视频流传输: 信令测试仪可以模拟
    发表于 03-21 14:33

    NVIDIA Blackwell数据手册与NVIDIA Blackwell架构技术解析

    NVIDIA Blackwell数据手册与NVIDIA Blackwell 架构技术解析
    的头像 发表于 03-20 17:19 1764次阅读

    小程序开发必须知道的5个技巧:提升效率与用户体验的权威指南

    提升1秒加载速度可降低7%的用户流失。 交互流畅性:利用微信小程序的setData合并更新机制,减少频繁渲染导致的卡顿,并通过加载动画缓解等待焦虑。 二、 80%的用户仅使用小程序20
    发表于 03-14 14:51

    NVIDIA技术助力Pantheon Lab数字人实时交互解决方案

    NVIDIA Triton,Pantheon Lab 训练速度提高 10 倍、推理延迟降低 50%,以及用户参与度提升 30%。这些进步使对话式 AI 能够提供实时且真实的互动,使 Pantheon Lab 在数字人
    的头像 发表于 01-14 11:19 934次阅读

    戴尔科技集团推出全新PC产品组合,驱动行业创新

    戴尔科技集团,凭借数十年的PC创新经验,近日推出了全新设计的PC产品组合,旨在大幅提升终端用户的创造力和生产力。 此次推出的产品组合,采用了简化的设计理念,搭载了前沿的设备端AI
    的头像 发表于 01-10 14:41 964次阅读

    借助NVIDIA GPU提升鲁班系统CAE软件计算效率

    本案例中鲁班系统高性能 CAE 软件利用 NVIDIA 高性能 GPU,实现复杂产品的快速仿真,加速产品开发和设计迭代,缩短开发周期,提升
    的头像 发表于 12-27 16:24 1172次阅读