0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTC中国大会:NVIDIA首席科学家介绍AI研究的最新进展

Carol Li 来源:电子发烧友网 作者:李弯弯 2020-12-15 18:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2020年12月15日,在GTC中国大会上,NVIDIA首席科学家,NVIDIA研究院高级副总裁BillDally分享了团队正在研发的技术。

Ampere技术在高性能计算方面有着卓越成效

“我们打造了性能非凡的高性能计算设备,致力于解决世界上极为苛刻的计算问题,所有这一切的基础都是硬件。”Bill Dally说。

图:NVIDIA首席科学家,NVIDIA研究院高级副总裁Bill Dally

Bill Dally首先介绍了Ampere,他说:“AmpereA100SXM模块具有处理海量计算的性能,借助这一模块,可以扩展Ampere的功能,从而解决非常苛刻的计算问题。”

并且如果用户还想扩展,可以取8个这样的是Ampere,将其放入DGX机箱中,Bill Dally说:“我们可以在机架中安装多个DGX机箱与Mellanox交换机,打造世界上性能最强大的计算机。”

硬件本身并不能解决世界上的难题,还需要借助软件来集中这种强大的计算能力应对苛刻的问题,BillDally表示,为了实现这一目标,NVIDIA投入了大量的精力来开发软件套件。

NVIDIA很早推出了CUDA,自2006年以来,人们一直使用CUDA来充分利用GPU的功能,为了方便人们在CUDA上构建应用程序,NVIDIA还提供了一整套开发库。

NVIDIA有大量的软件可以用来支持人工智能,包括用于自然语音处理和推荐系统的软件。

在医疗健康领域,NVIDIA推出了Clare软件包,它应用广泛,从Parabricks基因组测序分析到图像分析,再到挖掘医学论文数据库等,都可以使用。NVIDIA还提供了应用于智能视频分析的软件包,可以用来获取视频流,并根据所见得出结论。此外,NVIDIA还有一个适用于自动驾驶汽车的完整软件包,从在数据中心内组织数据集训练到车辆中进行自主部署。

NVIDIA A100采用7nm芯片,具有540亿个晶体管,而且还具有许多创新功能,相比上一代产品,它的功能更加强大。Bill Dally说:“这是NVIDIA第3代TensorCore,我们将这款特殊硬件集成到GPU中,以加速深度学习,在这一代核心中,我们增加了对新数据类型的支持TensorFLOAT32,解决了曾经在BFLOAT16和FP16之间进行数据类型选择的问题。”

Ampere的详细信息

NVIDIA A100的性能能达到1.5倍,在深度学习架构中,这是一个巨大飞跃,Bill Dally表示:我们使用这些A100,并将8个A100与大量SSD存储、大量RAM和9个Mellanox ConnectX-6 NIC组装在一起构建一台设备,这将组成一个性能出众的计算平台,该平台的性能将是其中一个GPU的8倍。

Ampere技术不仅在于其在深度学习方面表现出色,还在于它在高性能计算方面也有着卓著成效,而且还简化了AI与科学应用的结合。

NVIDIA研究院正在研究的项目

接着,Bill Dally通过NVIDIA研究院正在研究的项目,阐述了自己带领的200人的研究团队如何成功实现“黄氏定律(Huang’s Law)”。

这则定律以NVIDIA首席执行官黄仁勋(Jensen Huang)名字命名,预测GPU将推动AI性能实现逐年翻倍。Bill Dally说:“如果我们真想提高计算机性能,黄氏定律就是一项重要指标,且在可预见的未来都将一直适用。”

NVIDIA助力AI推理性能每年提升一倍以上

为实现这一突破,NVIDIA研究人员专门开发了一种名为MAGNet的工具,其生成的AI推理加速器在模拟测试中,能够达到每瓦100teraops的推理能力,比目前的商用芯片高出一个数量级。

MAGNet采用了一系列新技术来协调并控制通过设备的信息流,最大限度地减少数据传输,而数据传输正是当今芯片中最耗能的环节。这一研究原型以模组化实现,因此能够灵活扩展。

另外,研究团队还开展了一项研究,旨在以更快速的光链路取代现有系统内的电气链路。

Bill Dally拥有120多项专利,在2009年加入NVIDIA之前,曾任斯坦福大学计算机科学系主任。Bill Dally表示:“我们可以将连接GPU的NVLink速度提高一倍,也许还会再翻番,但电子信号最终会消耗殆尽。”

该团队正在与哥伦比亚大学的研究人员密切合作,探讨如何利用电信供应商在其核心网络中所采用的技术,通过一条光纤来传输数十路信号

这种名为“密集波分复用”的技术,有望在仅一毫米大小的芯片上实现Tb/s级数据的传输,是如今互连密度的十倍以上。

除了更大的吞吐量,光链路也有助于打造更为密集型的系统。Dally举例展示了一个未来将搭载160多个GPU的NVIDIA DGX系统模型。

工程师借助光链路,在单一系统中可搭载160多个GPU

软件方面,NVIDIA的研究人员开发了全新编程系统原型Legate。开发者借助Legate,即可在任何规模的系统上,运行针对单一GPU编写的程序——甚至适用于诸如Selene等搭载数千个GPU的巨型超级计算机。

Legate将一种新的编程速记融入了加速软件库和高级运行时环境Legion,目前它正在美国国家实验室接受测试。

中国市场对NVIDIA至关重要

在探讨“NVIDIA科技助推中国产业创新”这个话题的时候,NVIDIA全球业务运营执行副总裁JAY PURI谈到,中国应用AI为行业提供竞争优势的能力一直处于最前沿,世界上一些极为重要的AI研究人员都在中国,创业生态系统充满活力,NVIDIA在中国进行了大量投资,中国市场对NVIDIA至关重要。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5696

    浏览量

    110130
  • gtc
    gtc
    +关注

    关注

    0

    文章

    75

    浏览量

    4775
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA与Google探讨AI模型的演进方向

    GTC 会场,观众座无虚席,两位计算领域最具影响力的领导人物,NVIDIA 首席科学家 Bill Dally,以及 Google DeepMind 与 Google Researc
    的头像 发表于 04-03 10:03 504次阅读

    NVIDIA NVQLink推动量子计算迎来转折点

    GTC 上,NVIDIA 通过名为 cudaq-realtime 的全新应用程序接口(API)正式公开 NVQLink,并展示了多项推动量子纠错领域最新进展的演示成果。
    的头像 发表于 04-01 09:19 804次阅读

    NVIDIA全新开放物理AI模型和框架加速人形机器人开发

    本文是洞悉 Omniverse 系列文章。“洞悉 Omniverse”重点介绍开发者、3D 从业者与企业如何使用 OpenUSD 和 NVIDIA Omniverse 的最新进展从根本上变革他们的工作流程。
    的头像 发表于 02-06 15:36 806次阅读

    使用OpenUSD与NVIDIA Halos构建安全物理AI系统

    如何使用 OpenUSD 和 NVIDIA Omniverse 的最新进展深入改变他们的工作流。 物理 AI 正从研究实验室走向现实世界,为智能机器人和智能汽车 (如无人驾驶出租车)
    的头像 发表于 12-24 10:22 987次阅读

    上海光机所在脉冲累计效应影响光丝荧光研究中取得新进展

    中国科学院上海光学精密机械研究所超强激光科学与技术全国重点实验室研究团队在脉冲累计效应影响飞秒激光成丝荧光发射研究中取得
    的头像 发表于 12-22 06:53 256次阅读
    上海光机所在脉冲累计效应影响光丝荧光<b class='flag-5'>研究</b>中取得<b class='flag-5'>新进展</b>

    从协议到实践——EtherNet/IP与NetStaX的最新进展

    从协议到实践——EtherNet/IP与NetStaX的最新进展
    的头像 发表于 12-19 15:26 1722次阅读
    从协议到实践——EtherNet/IP与NetStaX的<b class='flag-5'>最新进展</b>

    中兴通讯崔丽受邀出席2025腾冲科学家论坛

    近日,“2025腾冲科学家论坛”在云南启幕。本届论坛以“科学·AI改变世界”为主题,汇聚包括诺贝尔奖、图灵奖、菲尔兹奖得主在内的国际顶尖科学家,以及百余位两院院士、高校校长、科技精英与
    的头像 发表于 12-09 11:36 785次阅读

    NVIDIA DGX Spark助力构建自己的AI模型

    作为个人 AI 超级计算机,为世界各地的 AI 研究人员、数据科学家和学生提供 NVIDIA Grace Blackwell 平台的强大功
    的头像 发表于 11-21 09:25 1570次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark助力构建自己的<b class='flag-5'>AI</b>模型

    芯科科技分享在物联网领域的最新进展

    Labs(芯科科技)亚太区业务副总裁王禄铭、中国大陆区总经理周巍及台湾区总经理宝陆格就公司技术路线、产品策略及市场趋势回答了媒体提问。三位高管围绕安全认证、无线连接、边缘计算等议题,介绍了公司在物联网领域的最新进展
    的头像 发表于 11-13 10:48 1990次阅读

    NVIDIA推出Omniverse DSX Blueprint

    在华盛顿特区 NVIDIA GTC 大会的主题演讲中,NVIDIA 创始人兼首席执行官黄仁勋介绍
    的头像 发表于 11-03 15:08 1104次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动
    发表于 09-17 11:45

    上海光机所在激光驱动离子加速方面取得新进展

    图1 实验原理示意图 近期,中国科学院上海光学精密机械研究所超强激光科学与技术全国重点实验室宾建辉研究员团队在激光驱动离子加速方面取得新进展
    的头像 发表于 08-06 09:36 745次阅读
    上海光机所在激光驱动离子加速方面取得<b class='flag-5'>新进展</b>

    NVIDIA AI助力科学研究领域持续突破

    随着 AI 技术的广泛应用,AI 正在成为科学研究的引擎。NVIDIA 作为重要的技术推手,持续驱动着 AI 系统解锁更多领域的
    的头像 发表于 08-05 16:30 1332次阅读

    使用NVIDIA Cosmos模型提高未来智能汽车安全性

    本文是洞悉 Omniverse 系列文章。“洞悉 Omniverse” 重点介绍开发者、3D 从业者与企业如何使用 OpenUSD 和 NVIDIA Omniverse 的最新进展深入改变他们的工作流。
    的头像 发表于 07-14 11:46 1331次阅读

    英特尔持续推进核心制程和先进封装技术创新,分享最新进展

    近日,在2025英特尔代工大会上,英特尔展示了多代核心制程和先进封装技术的最新进展,这些突破不仅体现了英特尔在技术开发领域的持续创新,也面向客户需求提供了更高效、更灵活的解决方案。 在制程技术方面
    的头像 发表于 05-09 11:42 996次阅读
    英特尔持续推进核心制程和先进封装技术创新,分享<b class='flag-5'>最新进展</b>