0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达TensorRT 7新平台推出,兼容ARM处理器

牵手一起梦 来源:C114通信网 作者:南山 2019-12-20 16:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在日前举办的英伟达 GTC China 2019大会上,“教主”黄仁勋发布了一系列新品,其中TensorRT 的最新版本TensorRT 7令人瞩目,相比去年发布的TensorRT 5,TensorRT 7 可支持各种类型的 RNN、transformer、CNN,能够融合水平与垂直方向的运算,支持 1000 多种不同的计算变换和优化。黄仁勋举例,有了 TensorRT 7 的支持,在 GPU 上编译会话模型只需要0.3秒。

TensorRT 7的典型应用,是支持交互式会话AI,为实现更加智能的AI人机交互打开了新大门。在大会期间,英伟达加速计算产品管理总监Paresh Kharya等人接受采访,对TensorRT 7新平台、兼容ARM等热门话题进行了解读。

支撑会话式AI全流程

Paresh Kharya介绍,AI技术正在取得长足进展,最新的应用包括会话式AI和推荐系统。其中,会话式AI是一个非常复杂的任务,需要AI理解语音、文本、语言,整个过程分为三个部分:识别你所说的,将你所说的话转化为文字,理解这些文字并转化成语言再说出来。随着英伟达不断发布新版本,TensorRT 7可以完成三个流程计算,从语音识别到语义理解再到语音输出。

“要想把会话式AI做得有用,需要符合两个条件,要在300毫秒内将整个三部分完成,而且要完成的非常智能。在这个过程当中,有非常多的复杂模型需要计算,Tensor RT也在不断完善。” Paresh Kharya表示。

“推荐系统也是至关重要的一环,甚至已成为了互联网最重要的引擎。” Paresh Kharya强调,用户面临的选择越来越多,网络的信息量呈现爆炸式增长,包括商品、视频,以及各类选择的参数的数量都在爆炸式增长。“商品达到数十亿级别,网络视频百万量级增长,新闻每天都在产生海量数据。阿里巴巴、百度,都使用了英伟达的平台支持他们的推荐系统。”

这些信息在实时、动态的变化过程中,只有不断对模型进行训练,才可以有效地推荐。训练模型需要大量算力,英伟达提供了不断更新的各类工具和软件,比如最新的软件Tensor RT 7,支持各类模型在各种情景下的部署,支持上百万的用户在每秒内做数十亿次的搜索。

例如,阿里的边缘系统如果在英伟达的GPU上跑,每秒可以做780次查询;但是如果用CPU,每秒只能做3次查询。

与ARM合作,给客户更多选择

本次大会上,英伟达还宣布ARM处理器可以使用其GPU加速技术、NVIDIA Magnum IO套件,以及在Microsoft Azure上使用的新型云加速GPU超级计算机等。换句话说,英伟达将全方位扩展高性能计算领域。

Paresh Kharya指出,ARM是被业界广泛使用的架构,服务全球1500亿台设备。其成功的一个重要原因是开放平台,各家公司都能够在ARM架构上进行创新,ARM也能够提供互联、内存、CPU内核、计算能力等各种功能。英伟达将通过CUDA平台和ARM架构进行兼容,在高性能计算领域,给客户更多选择。

“加速计算和过去以CPU为基础的计算很不一样,性能提升是20、30甚至是100倍的。原因不仅是在架构上进行了设计,更重要的是通过软件优化和支撑。比如我们有各种各样的平台,像应用在医疗领域的Clara平台,应用在自动驾驶领域的Drive以及Isaac,做到了硬件和软件的结合。” Paresh Kharya表示。

当前,对于GPU,业界既用于图像处理,也有一些特别的客户会剥离图像处理能力,专注于加速技术应用。Paresh Kharya认为,英伟达丰富的产品线,能够满足客户的差异化需求,例如应用于数据中心的GPU就没有图像处理部分,通过Tensor Core做AI加速计算。一些新品如RTX6000、RTX8000,则图像处理和AI加速功能兼具。“我们的优势是统一的架构应用于各种工作负载当中实现加速计算,这意味着在各个行业中、各种各样的商业机会。”

业界人士云集GTC China 2019

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    247121
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9499

    浏览量

    388698
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97665
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    力旺电子荣获台积公司2025年度开放创新平台合作伙伴奖

    力旺电子今年再度荣获台积公司开放创新平台(OIP)年度合作伙伴奖,这也是力旺连续第16年获得此一殊荣。该奖肯定了力旺电子在嵌入式内存硅智财的持续创新与杰出表现、对台积公司长期稳健的技术支持,及能随市场需求变化提供可靠服务的承诺。
    的头像 发表于 10-31 10:28 199次阅读

    NVIDIA新闻:英伟10亿美元入股诺基亚 英伟推出全新量子设备

    研发并推出相关产品。 英伟CEO黄仁勋出现在美国华盛顿的GTC DC大会上的演讲中表示;“今天我们宣布与诺基亚建立了合作关系,诺基亚是世界第二大电信制造商,这是一个价值3万亿美元的产业。”黄仁勋说,全世界有数百万个基站,双方合
    的头像 发表于 10-29 17:12 1292次阅读

    英伟发布 NVQLink 开放系统架构;国内首个汽车芯片标准验证平台投入使用

    英伟发布 NVQLink 开放系统架构 在华盛顿特区举行的英伟全球技术大会上,英伟(NVI
    发表于 10-29 10:33 994次阅读

    英伟:CUDA 已经开始移植到 RISC-V 架构上

    7 月 17 日,在第五届(2025)RISC-V 中国峰会主论坛上,英伟副总裁 Frans Sijstermanns 分享了题为《在英伟
    发表于 07-17 16:30 3836次阅读

    英伟获美批准恢复H20在华销售,同步推出全新兼容GPU

    7月15日上午,央广财经记者从英伟方面确认,英伟已经获得美国批准,将恢复 H20 在中国的销售,并
    的头像 发表于 07-16 17:49 668次阅读

    龙芯处理器支持WINDOWS吗?

    )。 Windows的适配:微软官方仅支持x86/x64和ARM架构的处理器,未推出针对LoongArch或MIPS的Windows版本。 技术限制 指令集不兼容:Windows系统的
    发表于 06-05 14:24

    英伟拟再推中国特供GPU,今年6月量产!

    。                                                     最新消息显示,英伟拟新推出一款专门面向中国市场的人工智能芯片,且最早将于今年6月开始量产。这款芯片属于
    发表于 05-27 00:03 4599次阅读

    IBM携手英伟AI数据平台推动企业级AI创新

    英伟平台与 IBM 的 AI 和数据平台 watsonx 的集成。此外,IBM 还将与英伟
    发表于 03-24 19:20 414次阅读

    Microchip推出SAMA7D65系列微处理器

    Microchip Technology Inc.(微芯科技公司)今日宣布推出基于Arm Cortex-A7内核的SAMA7D65系列微处理器
    的头像 发表于 02-28 10:08 1306次阅读

    英伟减持Arm Holdings股份,增持文远知行

    英伟在最新一季的财报中披露,其在第四季度对英国芯片巨头Arm Holdings的股份进行了大幅减持,减持幅度高达约44%。这一动作引发了业界的广泛关注。同时,英伟
    的头像 发表于 02-17 14:05 981次阅读

    英伟发布DeepSeek R1于NIM平台

    英伟近日宣布,其DeepSeek R1 671b版本已正式上线英伟NIM(NVIDIA Inference Microservices)平台
    的头像 发表于 02-05 14:48 913次阅读

    16通道AD采集方案,基于复旦微ARM + FPGA国产SoC处理器平台

    测试数据汇总 表 1 本文带来的是基于复旦微FMQL20S400M四核ARM Cortex-A7(PS端) + FPGA可编程逻辑资源(PL端)异构多核SoC处理器设计的全国产工业评估板的AD采集
    的头像 发表于 01-23 10:39 979次阅读
    16通道AD采集方案,基于复旦微<b class='flag-5'>ARM</b> + FPGA国产SoC<b class='flag-5'>处理器</b><b class='flag-5'>平台</b>

    蓝鹏测控数据采集新平台适配机型 再添一款双轴测径仪

    蓝鹏测控新平台适配机型再添一款双轴测径仪,这一消息标志着蓝鹏测控在跨行业应用和技术创新方面取得了新的进展。 蓝鹏测控新一代的测控平台LP-SCADA集成了先进的测量、测试和控制技术,具有高速度
    发表于 01-14 14:39

    英伟将推Steam Deck原生GeForce Now应用,拓展至多平台

    分辨率、60帧的HDR画面(电视输出),让用户随时随地享受极致画质的游戏乐趣。 不仅如此,英伟还计划将GeForce Now云游戏应用拓展至更多平台。通过与苹果、Meta和字节跳动等科技巨头的合作
    的头像 发表于 01-08 14:47 823次阅读

    玻色量子助力南京量子计算产业创新平台发布

    近日,由南京市玄武区人民政府、北京电子城高科技集团股份有限公司(以下简称“电子城高科”)主办,北京玻色量子科技有限公司(以下简称“玻色量子”)等支持的“量子计算产业创新平台发布暨玄武区未来产业创新交流会”在南京盛大召开。
    的头像 发表于 12-20 16:51 1292次阅读