电子发烧友App

硬声App

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

电子发烧友网>人工智能>NVIDIA推出一款突破性的推理软件 可以实现会话式AI应用

NVIDIA推出一款突破性的推理软件 可以实现会话式AI应用

收藏

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论

查看更多

相关推荐

NVIDIA GPU再创壮举,距真正会话AI又进一步!

NVIDIA宣布重大突破:BERT训练时间实现创纪录的53分钟,推理时间缩短至2毫秒,并构建了迄今为止同类型中最大的语言模型,使得实时会话 AI与用户进行互动时更为自然。
2019-08-15 07:55:005099

NVIDIA 如何应对会话式AI带来的推理挑战?

NVIDIA Turing GPU和Xavier 芯片系统在首个独立AI推理基准测试 ——MLPerf Inference 0.5中取得第一名。
2019-11-08 16:53:295054

NVIDIA全新Ampere数据中心GPU全面投产

A100采用了NVIDIA Ampere架构的突破性设计,该设计为NVIDIA第八代GPU提供了迄今为止最大的性能飞跃,集AI训练和推理于一身,并且其性能相比于前代产品提升了高达20倍。
2020-05-15 11:48:182488

NVIDIA打破AI推理性能记录

 NVIDIA凭借A100进一步扩大了在MLPerf基准测试中的领先优势,实现了比CPU快237倍的AI推理性能,助力企业将AI研究转化为生产力。
2020-10-22 14:07:58714

2018全球十大突破性技术发布

3月25日,科技之巅·麻省理工科技评论全球十大突破性技术峰会在北京召开,该峰会是全球最为著名的技术榜单之,峰会围绕十大突破性技术在中国落地最强,并对目前最受关注的领域进行深入解读。2018年
2018-03-27 16:07:53

AI芯片界的领头羊进军机器人行业

Jetson Xavier近日,英伟达正式发布了一款全新AI芯片—Jetson Xavier,Jetson Xavier作NVIDIA Isaac平台的核心,是全球首专为机器人设计的计算机。该公司CEO黄仁
2018-06-11 08:20:23

NVIDIA Grid K2会话冻结

的Windows 7 VDI系统使用的是3.62.56 Windows 7 NVIDIA驱动程序。有时会话冻结蓝色(Windows 7)欢迎屏幕,然后我们必须在XenCenter中重新启动此VDI VM以解决此
2018-09-14 10:23:56

NVIDIA Jetson TK1 开发板

的融合,将令人叹为观止的视觉性能与突破性的节能融合在起。[size=13.3333px]NVIDIA 4-加-1 (4-Plus-1™) 四核 ARM® Cortex™-A15 CPU
2016-05-09 15:44:19

NVIDIA Jetson介绍

首发极术社区如对Arm相关技术感兴趣,欢迎私信 aijishu20加入技术微信群。分享内容NVIDIA Jetson是嵌入计算平台,具有低功耗、高性能和小体积等特点,可加速各行业的AI应用落地
2021-12-14 08:05:01

NVIDIA Jetson的相关资料分享

Jetson概述爆炸增长的AI模型的复杂专为自主机器开发人员设计的AI计算板加快AI处理的SDK“JetPack”概述NVIDIA Jetson是NVIDIA公司嵌入单板计算机的
2021-11-09 08:26:45

NVIDIA 在首个AI推理基准测试中大放异彩

的BERT、GNMT 和Jasper 等AI模型开源优化帮助开发者实现顶尖推理性能。NVIDIA的客户和合作伙伴中包括有会话式AI领域的流公司,比如Kensho、微软、Nuance、Optum等。最后要
2019-11-08 19:44:51

Nvidia Tegra芯片将运用于手机

将在年底发布一款Tegra芯片的手机。具体是哪家手机制造商,我们不得而知,并且目前这款芯片与Windows CE、Windows Mobile和Android三个操作系统的兼容较好,而Android操作系统
2009-07-02 08:52:17

一款基于Linux的嵌入网络打印服务器设计

打印机,无法做到通用。很多文献,如参考文献[1]、[2]中提到的设计方案不够具体。基于这些情况,设计并实现一款基于Linux的嵌入网络打印服务器,硬件设计简单,软件完全开源,只要有Linux下的打印驱动,就可以支持。
2019-07-25 07:43:13

一款类似树莓派的嵌入电脑Jetson Nano

树莓派时下非常火爆,很多嵌入开发者都喜欢使用。最近,英伟达也发布了一款类似树莓派的产品,目标是帮助机器人开发者引入AI计算能力。3月19日,NVIDIA在硅谷召开了GT...
2021-12-21 06:14:22

突破性布线技术:拓朴布线

  印刷电路板设计解决方案供货商明导国际(Mentor Graphics),宣布推出突破性布线技术,这种业界首创的拓朴布线(topology router)技术,能把工程师知识、电路板设计人
2018-08-31 11:53:50

AD7981是如何在极端温度下实现突破性能和可靠的?

AD7981是什么?AD7981有什么特性?AD7981有哪些应用实例?AD7981是如何在极端温度下实现突破性能和可靠的?
2021-05-17 07:17:52

ADI为工业应用推出突破性MEMS传感器

研究船只目标搜寻船只残骸;此外,GPS还可以引导农场主确定在哪里安置设备,从而确保其庄稼种植量达到最大。作为全球流的高性能半导体供应商,美国模拟器件公司(Analog Devices, Inc.)推出
2018-12-03 10:41:59

Arm Neoverse NVIDIA Grace CPU 超级芯片:为人工智能的未来设定步伐

也是第一款专为 AI、HPC 和超大规模工作负载设计的基于 Arm Neoverse 的设备,展示了通过 Neoverse CPU 以及高性能加速器和内存系统的紧​​密耦合实现的可能。Grace
2022-03-29 14:40:21

Banana Pi为何选择rk3588开发与Jetson Nano引脚兼容的嵌入产品

与Jetson Nano引脚的兼容。 背景: Jetson Nano是NVIDIA公司推出一款优秀的嵌入计算平台,它在机器学习、人工智能和计算视觉等领域表现出色。然而,随着技术的不断演进,市场对更多
2023-11-02 12:30:06

Dllite_micro (轻量级的 AI 推理框架)

DLLite-Micro 是个轻量级的 AI 推理框架,可以为 OpenHarmony OS 的轻量设备和小型设备提供深度模型的推理能力DLLite-Micro 向开发者提供清晰、易上手的北向接口
2021-08-05 11:40:11

EdgeBoard FZ5 边缘AI计算盒及计算卡

作为人工智能项目落地的硬件平台,也可以将EdgeBoard计算卡嵌入终端设备,使设备具备AI推理能力。 继7月份发布第一款 EdgeBoard FZ3计算卡新品之后,受到了业界的诸多好评。本次,米尔
2020-08-31 14:12:48

HarmonyOS:使用MindSpore Lite引擎进行模型推理

场景介绍 MindSpore Lite 是一款 AI 引擎,它提供了面向不同硬件设备 AI 模型推理的功能,目前已经在图像分类、目标识别、人脸识别、文字识别等应用中广泛使用。 本文介绍
2023-12-14 11:41:13

ISE 12设计套件对FPGA有哪些影响?

赛灵思公司(Xilinx)最新推出的ISE 12软件设计套件,实现了具有更高设计生产力的功耗和成本的突破性优化。ISE 设计套件首次利用“智能”时钟门控技术,将动态功耗降低多达 30%。
2019-11-08 08:27:56

ISE 12设计套件对FPGA生产力有什么影响?

赛灵思公司(Xilinx)最新推出的ISE 12软件设计套件,实现了具有更高设计生产力的功耗和成本的突破性优化。ISE 设计套件首次利用“智能”时钟门控技术,将动态功耗降低多达 30%。
2019-08-20 08:33:19

MIT Technology Review 2020年“十大突破性技术”解读 【中国科学基金】2020年第3期发布 精选资料分享

来源:国家自然科学基金委员会MIT Technology Review2020年“十大突破性技术”解读[编者按] 2020年2月26日,MIT Technology Review年...
2021-07-26 08:09:34

PC级画质 NVIDIA研发Tegra 5芯片平板

  泡泡网平板电脑频道8月9日 最新消息,有传闻说NVIDIA正在开发一款或两平板电脑,明年发布,而比较让我们关注的是,其中一款平板电脑将会采用NVIDIA的高端Soc—Tegra5。Tegra
2013-08-10 15:54:40

armsom:为何选择rk3588开发与Jetson Nano引脚兼容的嵌入产品

Rockchip RK3588芯片来开发一款与Jetson Nano引脚兼容的产品,将为嵌入计算领域带来新的机会和优势。本文将介绍我们选择RK3588的原因以及如何实现与Jetson Nano引脚的兼容。背景
2023-10-18 17:35:18

【赛元】5分钟调好一款触控产品

Touch自适应触控调试软件Touchkey Tool,能轻松实现5分钟调好一款机。 触控从未如此有趣!来体验5分钟完成一款触控产品的畅快淋漓; 来体验AI Touch的自适应技术带给你的安心踏实!开发板
2019-11-15 09:48:56

【赛元】5分钟调好一款触控产品!

Touch自适应触控调试软件Touchkey Tool,能轻松实现5分钟调好一款机。触控从未如此有趣!来体验5分钟完成一款触控产品的畅快淋漓;来体验AI Touch的自适应技术带给你的安心踏实!开发板
2019-12-03 14:15:43

仅用7个月就设计出了一款基于RISC-V指令集的AI芯片

中国最早做RISC-V的公司选择了落户深圳,并且仅用7个月就设计出了一款基于RISC-V指令集的AI芯片,能耗和面积明显优于同级别Arm架构芯片,更让行业吃惊的是该款芯片一次性流片成功。这是否意味着
2020-08-02 11:59:27

介绍一下一款简单易用的嵌入AI方案

公司玩了大半年的嵌入AI平台,现在产品进入量产模式,也接触了很多嵌入方案,有了些心得体会,本人不才,在这里介绍一下一款简单易用的嵌入AI方案——Movidius Myriad 2 VPU(MA2450) 和 Myriad X VPU(MA2485)。...
2021-10-27 06:02:31

你所需要的一款突破性布线工具

标示。  图 2a:设计师在另层上粗略绘制出条直线路径,如橙色所标示。  图 2b:草图布线器按照设计师的意图对从通孔到焊盘的直线走线进行布线。  虽然草图布线对于如上所示的低密度区域来说是一款
2018-09-18 15:30:22

嘉楠勘智K510开发板简介——高精度AI边缘推理芯片及应用

。K510是嘉楠公司推出的第二代AI加速芯片,它采用双核RISC-V CPU@800Mhz,内置DSP协处理器和强大的AI运算单元KPU,支持 BF16浮点数据格式,可在边缘端进行高精度推理,是国内少有
2022-11-22 15:52:15

基于NVIDIA Jetson Xavier NX设计,飞凌 AI边缘计算终端FCU3001来了

。此时,一款成熟稳定的硬件设备,无疑为专注算法和应用程序开发的用户带来了巨大帮助。飞凌嵌入AI边缘计算终端FCU3001应运而生。人工智能和边缘计算的理想硬件飞凌嵌入推出AI边缘计算终端
2021-11-30 10:52:31

基于SRAM的方法可以加速AI推理

基于SRAM的方法可加速AI推理
2020-12-30 07:28:28

好奇~!谷歌的 Edge TPU 专用 ASIC 旨在将机器学习推理能力引入边缘设备

。这部署阶段,或者称“推理”阶段,正是 Edge TPU 以及两新硬件的表现舞台。由于能够在更靠近数据的“边缘”位置运行这些训练完成的网络,开发人员终于可以在智能设备上实现“智能”,而非始终依赖于
2019-03-05 21:20:23

如何在RK3399上搭建Tengine AI推理框架呢

Tengine是什么?如何在RK3399这 Arm64 平台上搭建 Tengine AI 推理框架,并运行图像识别相关应用?
2022-03-07 07:53:43

嵌入软件保护芯片FS8836有什么特点?

福华先进微电子股份有公司推出一款用于认证及保护嵌入系统软件版权的芯片产品—FS8836,该芯片具有较大的存储空间,良好的安全性能以及简单高速的传输方式,极大的提高了系统的防破解能力以及嵌入软件的安全和适用
2019-09-02 06:32:34

嵌入边缘AI应用开发指南

如果在没有嵌入处理器供应商提供的合适工具和软件的支持下,既想设计高能效的边缘人工智能(AI)系统,同时又要加快产品上市时间,这项工作难免会冗长乏味。面临的系列挑战包括选择恰当的深度学习模型
2022-11-03 06:53:28

怎么设计一款基于渗透测试的Web漏洞扫描系统?

Web漏洞扫描原理是什么?怎么设计一款基于渗透测试的Web漏洞扫描系统?
2021-05-10 06:07:04

怎样挑选一款MCU平台进行嵌入系统开发

般都有相应的周边器件、集成开发环境与操作系统来辅助支持。因此,工程师在选择一款MCU平台进行嵌入系统开发时,不仅要考虑MCU芯片自身的性能,还要考虑该MCU平台是否能方便地实现代码的移植和软件的兼容,硬件
2021-11-03 08:42:14

无人机突破性的电池管理设计

针对无人机突破性的电池管理:2S1P电池管理系统(BMS)参考设计将无人机电池组转换为智能诊断黑匣子记录仪。这款智能诊断黑匣子记录仪可精确监视剩余电量,并在整个电池使用期全程保护锂离子电池。设计人
2018-06-26 09:42:10

一款Cadence的高级可制造设计解决方案

一款Cadence的高级可制造设计解决方案
2021-04-26 06:25:07

一款wifi解码软件

请求哪位大侠贡献一款wifi解密软件啊!网上下的都解不了啊!
2013-09-18 01:38:07

一款基于Murphypinyin的嵌入键盘设计

本文根据手持终端的特点,设计出一款矩阵键盘,并在Linux平台下开发出键盘的驱动程序。采用Qt/Embedded构建图形界面,通过对Qt/Embedded自带输入法的分析,结合Murphpinyin中文输入法软件包,构建了一款可输入数字、中/英文的嵌入键盘。
2021-04-28 06:50:39

一款基于PXI的便携测控系统

什么是PXI?求一款基于PXI的便携测控系统
2021-05-14 06:47:40

一款针对音频的通道切换的芯片

`求一款针对音频通道切换的芯片,要求进两出,可切换芯片,可以通过软件实现输出通道选择。`
2019-05-10 14:57:12

深度剖析OpenHarmony AI调度管理与推理接口

1 简介AI任务管理与统推理能力提供了接口的统标准系统上CPU提供了AI任务调度管理的能力,对AI的能力进行了开放的推理推理,同时,提供了个不同的生命周期框架层级的应用程序。推理接口
2022-03-25 11:15:36

深度学习推理和计算-通用AI核心

商业发行之前就已经过时了。算法明天需要对架构、内存/数据进行彻底改革资源和能力。推理的梦幻建筑重新定义重写在计算和交付突破性的人工智能加速和灵活的计算能力超越了服务器级CPU和比GPU/ASIC通用
2020-11-01 09:28:57

电源突破性的新技术

在半导体技术中,与数字技术随着摩尔定律延续神奇般快速更新迭代不同,模拟技术的进步显得缓慢,其中电源半导体技术尤其波澜不惊,在十年前开关电源就已经达到90+%的效率下,似乎关键指标难以有大的突破,永远离不开的性能“老三篇”——效率、尺寸、EMI/噪声,少有见到突破性的新技术面市。
2019-07-16 06:06:05

电的计算 一款电工使用小软件

电的计算 一款电工使用小软件
2021-09-26 22:46:42

能介绍一款电路仿真软件

现在有什么电路仿真软件比较不错的,能不能介绍一款
2019-01-21 09:30:43

资料下载:MIT发布2018年10大突破性技术,3项与嵌入工程师相关!

作为全球最为著名的技术榜单之,《麻省理工科技评论》全球十大突破性技术具备极大的全球影响力和权威,至今已经举办了18年。每年上榜的技术突破,有的已经在现实中得以应用,有...
2021-07-05 07:25:43

资料下载:MIT发布2018年全球10大突破性技术!

来源: 数字化企业作为全球最为著名的技术榜单之,《麻省理工科技评论》全球十大突破性技术具备极大的全球影响力和权威,至今已经举办了18年。每年上榜的技术突破,有的已经在...
2021-07-05 07:35:37

键盘按钮坏了 可以更改另个键代替 的一款软件

键盘按钮坏了 可以更改另个键代替 的一款软件
2021-09-26 22:51:14

雷达波形对雷达探测性能的影响该如何体现,能否推荐一款软件可以很好的演示?

雷达波形对雷达探测性能的影响该如何体现,能否推荐一款软件可以很好的演示。
2018-03-22 15:22:05

ADS42B49IRGCT:突破性能边界的高速模数转换器

推出的ADS42B49IRGCT就是这样一款突破性能边界的高速ADC,为各种高端应用提供了强大的支持。、卓越的性能参数ADS42B49IRGCT以其出色的性能
2024-02-16 16:49:18

CSR推出采用SiRFaware技术的突破性SIRFstar

CSR推出采用SiRFaware技术的突破性SIRFstarIV定位架构 CSR推出突破性SiRFstarIV 定位架构,结合了独特的自助式SiRFaware及微电源GPS技术,使消费设备在没有消耗电池和网络辅助
2009-08-05 09:26:34612

ADI 推出用于4G 蜂窝基站的突破性射频电路

ADI 推出用于4G 蜂窝基站的突破性射频电路   -- 新型高集成度 RF 混频器和调制器可实现高密度射频卡,提升 LTE 和 4G 基站的
2009-10-15 11:07:29503

突破性照明级LED将取代低效灯泡

突破性照明级LED将取代低效灯泡  cree 司日前宣布推出一款新的突破性照明级 LED,可彻底淘汰低能效灯泡。XLamp MPL EasyWhite LED 具有高性能、色彩一致和流明密度大等
2010-02-25 10:22:53412

Cree公司推出一款新的突破性照明级LED

Cree公司推出一款新的突破性照明级LED Cree 公司日前宣布推出一款新的突破性照明级 LED,可彻底淘汰低能效灯泡。XLamp® MPL EasyWhite LED 具有高性能、色彩一致和流明
2010-02-26 10:49:17703

硅芯光电推出突破性LED面板技术

领先的半导体技术供应商硅芯光电科技有限公司(Silicon Core Technology)推出用于室内应用的突破性1.9mm点距LED显示面板技术。
2011-12-22 10:03:41656

科锐推出突破性的XLamp XB-D LED

科锐公司(Nasdaq: CREE)日前宣布推出突破性的XLamp XB-D LED,加速推动新一代主流LED照明的普及。XLamp XB-D LED是第一款采用最新科锐创新技术平台的LED,将照明级LED带入性价比的新纪元。
2012-01-16 09:24:071730

助推阿里巴巴业务突破,GPU算力为AI应用赋能

作为NVIDIA在中国重要的合作伙伴,阿里巴巴正在将GPU大规模的应用于诸多业务的AI推理应用中,借助GPU带来的强大算力为AI应用赋能,助力多个业务实现突破
2018-10-04 08:41:003066

大陆集团和采埃孚宣布推出基于NVIDIA DRIVE的L2+自动驾驶解决方案

拉斯维加斯—CES—2019年1月7日—NVIDIA今日宣布推出全球首款商用L2+自动驾驶系统NVIDIA DRIVE AutoPilot,其集成多项突破性AI技术,将助力监督式自动驾驶汽车明年投产。
2019-01-08 16:24:131753

NVIDIA推出全球首款商用L2级自动驾驶系统

拉斯维加斯—CES—2019年1月7日—NVIDIA今日宣布推出全球首款商用L2+自动驾驶系统NVIDIA DRIVE™ AutoPilot,其集成多项突破性AI技术,将助力监督式自动驾驶汽车明年投产。
2019-01-10 09:59:373113

NVIDIA在最新AI推理基准测试中大获成功

MLPerf Inference 0.5是业内首个独立AI推理基准套件,其测试结果证明了NVIDIA Turing数据中心GPU以及 NVIDIA Xavier 边缘计算芯片系统的性能。
2019-11-29 14:45:022696

英伟达发布一款推理软件 助力实现会话式AI应用

英伟达发布了一款突破性推理软件,借助于这款软件,全球各地的开发者都可以实现会话式AI应用,大幅减少推理延迟。而此前,巨大的推理延迟一直都是实现真正交互式互动的一大阻碍。
2020-02-03 15:51:48520

NVIDIA推出A100 80GB GPU,助力实现新一轮AI和科学技术突破

NVIDIA于今日发布NVIDIA A100 80GB GPU,这一创新将支持NVIDIA HGX AI超级计算平台。该GPU内存比上一代提升一倍,能够为研究人员和工程师们提供空前的速度和性能,助力实现新一轮AI和科学技术突破
2020-11-17 09:59:522211

会话式机器阅读理解概述

1 会话式机器阅读理解是什么? 如何在会话式阅读理解里面能够建模它的implicative reasoning,即如何去学习会话与阅读理解篇章之间的蕴含关系。 在这篇文章中,讲者概述了两种常见阅读
2020-11-25 16:07:112048

开源NeMo:基于PyTorch,允许快速创建会话式人工智能模型

会话式人工智能正在改变我们与计算机的交互方式。它包括三个令人兴奋的人工智能研究领域:自动语言识别(Automatic Speech Recognition...
2020-12-14 23:25:12282

NVIDIA携手阿斯利康和佛罗里达大学健康学院实现AI药物探索突破

NVIDIA 携手生物制药公司阿斯利康( AstraZeneca )和佛罗里达大学的学术健康中心和佛罗里达大学健康学院,利用突破性的Transformer神经网络开展新的 AI 研究项目。
2021-04-15 09:15:174553

NVIDIA推理方面取得突破,从云端到边缘实现更智能、更具互动性的对话式AI

NVIDIA于今日发布公司第八代AI软件TensorRT™ 8。该软件将语言查询推理时间缩短了一半,使开发者能够从云端到边缘构建全球最佳性能的搜索引擎、广告推荐和聊天机器人。
2021-07-21 15:07:573208

NVIDIA宣布其AI推理平台的重大更新

软件的新功能,该软件为所有AI模型和框架提供跨平台推理;同时也包含对NVIDIA TensorRT的更新,该软件优化AI模型并为NVIDIA GPU上的高性能推理提供运行时优化。 NVIDIA推出NVIDIA A2 Tensor Core GPU,这是一款用于边
2021-11-12 14:42:531684

NVIDIA Triton开源推理服务软件三大功能推动效率提升

Microsoft Teams借助AI生成的实时字幕和转录功能,帮助全球学生和职场人士顺利进行在线会议。用于训练的NVIDIA AI计算技术和用于推理语音识别模型的NVIDIA Triton推理服务器进一步提升了这两个功能。
2022-01-04 14:20:111407

GTC2022大会黄仁勋:NVIDIA H100的5项突破性创新

GTC2022大会黄仁勋:NVIDIA H100的5项突破性创新,拥有强大的性能,新的Tensor处理格式:FP8等,是首个实现性能扩展至700瓦的GPU。
2022-03-23 17:37:181967

Microsoft使用NVIDIA Triton加速AI Transformer模型应用

Microsoft 的目标是,通过结合使用 Azure 与 NVIDIA GPU 和 Triton 推理软件,率先将一系列强大的 AI Transformer 模型投入生产用途。
2022-04-02 13:04:211456

NVIDIA推理平台和全栈方法提供最佳性能

现在,您和开发人员社区的其他成员都可以使用这些成果,主要是以开源软件的形式。此外, TensorRT 和 Triton 推理服务器可从 NVIDIA NGC 免费获得,以及预训练模型、深度学习框架
2022-04-08 16:31:31931

NVIDIA TensorRT助力打造AI计算机视觉算法推理平台

“在使用 NVIDIA TensorRT和NVIDIA T4 GPU对平台赋能后,“极星”推理平台的算法推理效率得到了进一步的提升,更好地支持速接入各类算法、数据及智能设备,实现AI自闭环能力,并通过应用服务和标准化接口,帮助终端客户低成本实现AI与业务的结合,快速构建智能应用。
2022-04-13 14:49:19862

使用NVIDIA Triton推理服务器简化边缘AI模型部署

  NVIDIA Triton 有助于在每个数据中心、云和嵌入式设备中实现标准化的可扩展生产 AI 。它支持多个框架,在 GPU 和 DLA 等多个计算引擎上运行模型,处理不同类型的推理查询。通过与 NVIDIA JetPack 的集成, NVIDIA Triton 可用于嵌入式应用。
2022-04-18 15:40:022306

通过NVIDIA超级芯片和软件实现性能突破

超级计算机、仪器和不断扩展的量子计算生态系统将通过 NVIDIA 超级芯片和软件实现性能突破
2022-06-01 10:46:381045

基于NVIDIA Triton的AI模型高效部署实践

NVIDIA Triton 推理服务器(以前称为 TensorRT 推理服务器)是一款开源软件,可简化深度学习模型在生产环境中的部署。借助 Triton 推理服务器,Devops 和 MLops
2022-06-28 15:49:471293

NVIDIA Triton的概念、特性及主要功能

NVIDIA Triton 推理服务器是 NVIDIA AI 平台的一部分,它是一款开源推理服务软件,可助力标准化模型的部署和执行,并在生产环境中提供快速且可扩展的 AI
2022-07-18 10:11:262525

腾讯云与NVIDIA仍持续为AI推理加速进行合作

Kit 不仅大大提升了 GPU 集群上多机多卡分布式训练的效率,对于 GPU 上的模型推理也通过集成 NVIDIA TensorRT 带来了显著加速。双方团队就 GPU 推理加速这一话题将进行持续深入的合作,推出定制化的优化方案,为业界客户带来显著的性能收益。
2022-08-31 09:24:071235

蚂蚁链AIoT团队与NVIDIA合作加速AI推理

蚂蚁链 AIoT 团队与 NVIDIA 合作,将量化感知训练(QAT)技术应用于深度学习模型性能优化中,并通过 NVIDIA TensorRT 高性能推理 SDK 进行高效率部署, 通过 INT8 推理, 吞吐量提升了 3 倍, 助力蚂蚁链版权 AI 平台中的模型推理服务大幅降本增效。
2022-09-09 09:53:52872

NVIDIA推出用于大型语言模型和生成式AI工作负载的推理平台

日 – NVIDIA于今日推出四款推理平台。这些平台针对各种快速兴起的生成式AI应用进行了优化,能够帮助开发人员快速构建用于提供新服务和洞察的AI驱动的专业应用。   这些平台将NVIDIA的全栈推理
2023-03-22 14:48:39256

GTC 2023:NVIDIA cuLitho将加速计算引入计算光刻技术领域的突破性成果

GTC 大会:NVIDIA cuLitho将加速计算引入计算光刻技术领域的突破性成果 在摩尔定律接近物理极限之际,半导体行业要怎么做?借助AI? 现在半导体开始采用NVIDIA在计算光刻技术领域
2023-03-22 19:29:3110235

GTC23 | NVIDIA 推出用于大型语言模型和生成式 AI 工作负载的推理平台

日 – NVIDIA 于今日推出四款推理平台。这些平台针对各种快速兴起的生成式 AI 应用进行了优化,能够帮助开发人员快速构建用于提供新服务和洞察的 AI 驱动的专业应用。 这些平台将 NVIDIA
2023-03-23 06:55:02654

NVIDIA 为 1 亿台 Windows RTX PC 和工作站提供全新生成式 AI 功能与突破性性能

搭载 Tensor Core 的 NVIDIA RTX GPU 正在加速生成式 AI 模型的开发与部署;即将推出的 Max-Q 低功耗 AI 推理将提高能效比。 生成式 AI 正在迅速开创一个计算
2023-05-31 03:50:02344

生成式AI时代要来了吗 NVIDIA生成式AI获新突破

这些性能强大的新系统将利用 NVIDIA Omniverse 平台加速高计算密集度的复杂应用,包括 AI 训练和推理、3D 设计和可视化、视频处理、工业数字化等。
2023-08-23 14:20:18224

NVIDIA Grace Hopper 超级芯片横扫 MLPerf 推理基准测试

平台无论是在云端还是网络边缘均展现出卓越的性能和通用性。 此外,NVIDIA 宣布推出全新推理软件,该软件将为用户带来性能、能效和总体拥有成本的大幅提升。 GH200 超级芯片在
2023-09-12 20:40:04249

NVIDIA Grace Hopper超级芯片横扫MLPerf推理基准测试

平台无论是在云端还是网络边缘均展现出卓越的性能和通用性。   此外,NVIDIA宣布推出全新推理软件,该软件将为用户带来性能、能效和总体拥有成本的大幅提升。   GH200 超级芯
2023-09-13 09:45:40139

NVIDIA AI 现已在 Oracle Cloud Marketplace 推出

AI 超级计算平台 和 NVIDIA AI Enterprise 软件现已在 Oracle Cloud Marketplace 推出。Oracle Cloud Infrastructure 客户
2023-10-24 10:30:02206

周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

由 CSDN 举办的 NVIDIA AI Inference Day - 大模型推理线上研讨会,将帮助您了解 NVIDIA 开源大型语言模型(LLM)推理加速库 TensorRT-LLM  及其功能
2023-10-26 09:05:02174

基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

网络平台上快速创建应用程序和服务,并启用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的强大功能,提供突破性的网络、安全和存储性能。
2024-02-23 10:02:13142

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
2024-02-29 14:04:40162

已全部加载完成