0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

聚焦黄氏定律:NVIDIA 首席科学家 Bill Dally 介绍推动 GPU 性能提升的关键因素

NVIDIA英伟达 来源:未知 2023-10-12 19:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在近期举行的处理器和系统工程师年度盛会Hot Chips上,NVIDIA 首席科学家 Bill Dally 发表了主题演讲。在演讲中,其描述了后摩尔定律时代计算机性能正在发生结构性的变化。

点击观看 Bill Dally 在 Hot Chips 主题演讲完整视频

他表示,每一款新处理器都具备独创性,需要经过不懈的努力,发明并验证新的电子元件。这与上一代产品的开发截然不同,当时的工程师主要依赖于芯片更小、更快的物理特性。

Dally 在 NVIDIA Research 领导着一支 300 多人的团队,过去十年间他们将单个 GPUAI 推理性能提高了 1000 倍(详见下图)。

wKgaomUt2zaAUzc7AADX7XjyyqQ650.jpg

IEEE Spectrum 最先以 NVIDIA 创始人兼首席执行官黄仁勋的名字将这一惊人的性能提升命名为 "黄氏定律(Huang’s Law) ",后来《华尔街日报》的一篇专栏文章又让该定律广为流传。

这样的飙升速度是对以同样惊人的速度崛起的大语言模型的回应,该模型用于生成式 AI,并且每年都以数量级的速度增长。

Dally 说:"这为硬件行业的发展设定了步调,因为我们必须满足这种需求。”

在演讲中,Dally 详细介绍了推动性能提升 1000 倍的要素。

其中,提升幅度最大的一次达到了 16 倍,这源于人们找到了更简单的方法来表示计算机运算使用的数字。

新的运算方法

最新的 NVIDIA Hopper 架构及其 Transformer 引擎采用 8 位和 16 位浮点与整数运算的动态组合。这种运算方法专为满足当今生成式 AI 模型的需求而量身定制。Dally 详细介绍了该运算方法带来的性能提升和节能效果。

Dally 领导的团队通过编写高级指令,指导 GPU 组织工作,实现了 12.5 倍的性能提升。这些复杂的指令有助于以更低的能耗做更多的工作。

因此,计算机就可以像“专用加速器一样高效,同时保留 GPU 的所有可编程性”,Dally 介绍道。

此外,NVIDIA Ampere 架构还增加了结构化稀疏功能,这种创新方法可以在不影响模型精度的前提下简化了 AI 模型的权重。Dally 表示,这项技术将性能提高了两倍,并且未来有望实现更大的性能提升。

Dally 还介绍了可实现 GPU 之间高速互联的 NVLink 以及用于系统间的 NVIDIA 网络如何使单个 GPU 的性能提高 1000 倍。

进步之路不止步

Dally 指出,尽管 NVIDIA 在过去十年里将 GPU 的半导体节点从 28 纳米推进到 5 纳米,但这种技术仅仅贡献了性能提升总量的 2.5 倍。

与摩尔定律下的前一代计算机设计相比,这是巨大的转变。摩尔定律认为,随着芯片变得越来越小、越来越快,处理器的性能每隔两年翻一倍。

登纳德缩放比例定律(Dennard scaling)在某种程度上对此进行了描述。该定律由 IBM 科学家 Robert Denard 在 1974 年与人合著的一篇论文中提出。但遗憾的是,物理微缩遇到了自然限制,例如更小、更快的器件所能承受的热量。

前景乐观

Dally 表示,尽管摩尔定律提出的性能提升在放缓,但黄氏定律仍将继续存在,他对此充满信心。

例如,他概括介绍了未来的几个机会,包括进一步简化数字表示方式、在 AI 模型中创建更多稀疏性以及设计更优的内存和通信电路。

因为每一代新的芯片和系统都需要新的创新,所以这是属于计算机工程师的美好时代,Dally 补充说。

Dally 相信,计算机设计领域的新动态为 NVIDIA 工程师们提供了他们最渴望的三个机会:成为致胜团队的一员、与聪明人共事以及从事有影响力的设计。

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,关注更多会议及活动信息。

wKgaomUt2zaAC-fDAAFtccdApf0108.jpg


原文标题:聚焦黄氏定律:NVIDIA 首席科学家 Bill Dally 介绍推动 GPU 性能提升的关键因素

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4116

    浏览量

    99635

原文标题:聚焦黄氏定律:NVIDIA 首席科学家 Bill Dally 介绍推动 GPU 性能提升的关键因素

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技首席科学家林达华荣获第四届中银香港科技创新奖

    近日,商汤科技联合创始人兼首席科学家林达华教授,荣获第四届中银香港科技创新奖(人工智能及机器人领域),以表彰其于科研创新及成果转化方面的卓越贡献。
    的头像 发表于 04-24 16:48 364次阅读

    NVIDIA与Google探讨AI模型的演进方向

    在 GTC 会场,观众座无虚席,两位计算领域最具影响力的领导人物,NVIDIA 首席科学家 Bill Dally,以及 Google Dee
    的头像 发表于 04-03 10:03 497次阅读

    线圈精度影响因素解析

    共同作用的结果。今天就结合实际使用场景,拆解那些影响罗线圈精度的关键因素,帮大家避开误差陷阱。 不同于普通电流测量设备,罗线圈的精度是一个综合性指标,从自身设计到外部安装,从配套电路到环境干扰,每一个环节
    的头像 发表于 03-24 08:56 481次阅读
    罗<b class='flag-5'>氏</b>线圈精度影响<b class='flag-5'>因素</b>解析

    SMT效率卡壳?别瞎忙了!这几个关键因素才是提效核心!

    23年PCBA一站式行业经验PCBA加工厂家今天为大家讲讲提升SMT贴片设备生产效率有哪些措施?提升SMT贴片设备生产效率的关键因素与改进措施。提升SMT(表面贴装技术)设备生产效率是
    的头像 发表于 03-16 17:13 525次阅读

    思必驰首席科学家俞凯教授当选2026年度IEEE Fellow

    日前,全球最大的专业技术组织国际电气电子工程师协会(The Institute of Electrical and Electronics Engineers, IEEE)公布了2026年度IEEE Fellow(会士)名单,上海交通大学特聘教授、思必驰联合创始人、首席科学家
    的头像 发表于 12-12 11:36 1000次阅读

    中兴通讯崔丽受邀出席2025腾冲科学家论坛

    近日,“2025腾冲科学家论坛”在云南启幕。本届论坛以“科学·AI改变世界”为主题,汇聚包括诺贝尔奖、图灵奖、菲尔兹奖得主在内的国际顶尖科学家,以及百余位两院院士、高校校长、科技精英与产业领袖,共话
    的头像 发表于 12-09 11:36 781次阅读

    国际类脑计算科学家Yulia Sandamirskaya教授加盟时识科技

    近日,国际类脑计算与神经形态机器人领域知名科学家Yulia Sandamirskaya 教授,作为科学家顾问正式加入时识科技(SynSense)。
    的头像 发表于 10-13 13:50 949次阅读

    喜报|ZYNALOG徴格半导体首席模拟设计科学家乔纳森·史卓德被授予2025年度“钱江友谊使者”称号

    9月28日上午,2025杭州国际人才交流与项目合作大会在杭州国际博览中心隆重开幕。在开幕式上,徴格半导体(杭州)有限公司的首席模拟设计科学家乔纳森·史卓德被授予2025杭州市外国专家"钱江
    的头像 发表于 09-30 14:06 1188次阅读
    喜报|ZYNALOG徴格半导体<b class='flag-5'>首席</b>模拟设计<b class='flag-5'>科学家</b>乔纳森·史卓德被授予2025年度“钱江友谊使者”称号

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    灵感的过程中发挥关键作用。五、用AI实现诺贝尔奖级别的科学发现 这想法这能够大胆的。 1、AI科学家的构建 全自主科学实验室需要哪些部分: ①自动实验设备 ②流程管理系统 ③数据处理和
    发表于 09-17 11:45

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 4378次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    聚焦离子束(FIB)技术介绍

    聚焦离子束(FIB)技术因液态金属离子源突破而飞速发展。1970年初期,多国科学家研发多种液态金属离子源。1978年,美国加州休斯研究所搭建首台Ga+基FIB加工系统,推动技术实用化。80至90年代
    的头像 发表于 08-19 21:35 1306次阅读
    <b class='flag-5'>聚焦</b>离子束(FIB)技术<b class='flag-5'>介绍</b>

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 1649次阅读

    UPS电源—决定UPS电源性能关键因素

    在工业自动化、数据中心及众多关键领域,UPS(不间断电源)的性能直接关系到电力供应的稳定性和可靠性。然而,UPS电源的性能并非一成不变,而是受到多种因素的影响。下面对影响UPS电源
    的头像 发表于 08-07 10:21 1013次阅读
    UPS电源—决定UPS电源<b class='flag-5'>性能</b>的<b class='flag-5'>关键因素</b>

    影响图像采集卡性能关键因素

    关键因素,对于选择合适的采集卡、优化系统配置、提高应用效率具有重要意义。本文将从分辨率与帧率、接口类型与带宽、信号处理能力、触发与同步机制、软件支持与兼容性、噪
    的头像 发表于 07-03 15:20 872次阅读
    影响图像采集卡<b class='flag-5'>性能</b>的<b class='flag-5'>关键因素</b>

    选择适合微机消谐器的关键因素

    选择适合的微机消谐器是保障电力系统(尤其是中性点非有效接地系统)安全稳定运行的重要环节。以下是关键因素的详细分条列举: 选择适合微机消谐器的关键因素: 1.  系统基本参数匹配性:      额定
    的头像 发表于 06-13 16:27 655次阅读