0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA研究人员创建可以疏通计算机网络拥堵的AI模型

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-07-03 10:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 研究人员创建了可以疏通计算机网络拥堵的 AI 模型,该模型很快就会出现在大众附近的数据中心

Gal Dalal 希望为居家办公或在办公室工作的人缓解网络压力。

这位 NVIDIA 高级研究科学家是以色列一所 10 人实验室的成员,他正在使用 AI 减少计算机网络的拥堵。

对于笔记本电脑用户来说,如果看到屏幕上出现不停转动的圈圈,甚至无法移动光标,那就像在高速路上遇到一片红海那样糟糕。如同在交通高峰期,大批旅客想要快速到达某地,他们在途中互相拥挤,有时还会发生碰撞。

站在交叉路口的 AI

网络使用拥塞控制来管理数字通信业务量。拥塞控制本质上是嵌入到网络适配器和交换机中的规则,但随着网络上用户数量的增加,用户之间的冲突可能变得过于复杂而难以预测。

AI 可以发现模式的发展过程并作出响应,因此有望成为更好的“交警”。这就是为什么 Dalal 与世界各地的许多研究人员一起寻找通过强化学习使网络变得更加智能的方法。强化学习是当模型找到好的解决方案时,会对它们进行奖励的 AI。

但直到现在,出于种种原因,还没有人能够想出实用的方法。

与时间赛跑

网络需要既高效又公平,这样才不会有忽略任何请求。这种平衡很难达成,因为在数字“道路”上,没有任何“司机”可以看到其他“司机”不断变化的轨迹和预定目的地。

这也是与时间赛跑的比赛。为了发挥作用,网络需要在大约一微秒(即百万分之一秒)的时间内对情况做出反应。

为了使网络交通变得顺畅,NVIDIA 团队受到先进计算机游戏 AI 的启发,创造了新的强化学习技术并将其应用于网络问题。

NVIDIA 在 2021 年的论文中描述了他们的突破性进展,包括提出使用算法和相应的奖励函数来创造平衡的网络,单个网络流可用的本地信息是此网络的唯一基础。凭借该算法,团队在其 NVIDIA DGX 系统上创建、训练并运行了 AI 模型。

效果惊人

Dalal 回忆道,在那次会议上,来自 NVIDIA 的 Chen Tessler 用图表展示了该模型在模拟的 InfiniBand 数据中心网络上的运行结果。

Dalal 表示:“我们当时觉得效果十分显著。”他曾在以色列著名的技术大学,以色列理工学院(Technion)写过关于强化学习的博士论文。

他还认为:“特别惊喜的在于我们只在 32 个网络流上训练模型,它很好地概括了所学,以管理 8000 多个包含各种复杂情况的网络流,因此这个机器比预先制定的规则更有效。”

在 NVIDIA 的测试中,强化学习(紫色)的表现优于所有基于规则的拥塞控制算法

事实上,与最好的基于规则的技术相比,该算法的吞吐量至少提高了 1.5 倍,延迟降低了 4 倍。

自该论文发布以来,这项工作由于展现了强化学习在现实世界中的应用潜力而赢得了赞誉。

在网络中处理 AI

下一个重要的步骤仍然是正在进行中的工作——设计 AI 模型版本,它可以使用网络中有限的算力和内存资源以微秒级速度运行。Dalal 描绘了两个前进方向。

Dalal 的团队正在与设计 NVIDIA BlueField DPU 的工程师一起优化用于未来硬件的 AI 模型。BlueField DPU 的目标是在网络内运行不断扩展的通信作业,从负担过重的 CPU 上卸载任务。

另外, Dalal 的团队正在将 AI 模型的精髓提炼成名为提升树的机器学习技术。提升树由一系列“是”与“否”的决策组成,它同样十分智能,但运行起来更简单。该团队的目标是在今年晚些时候以能够立即用来缓解网络流量的形式展示其工作。

及时的“交通”解决方案

目前,Dalal 已经将强化学习应用于从自动驾驶汽车到数据中心冷却和芯片设计等各个领域。当 NVIDIA 于 2020 年 4 月 NVIDIA 收购 Mellanox 时,这位 NVIDIA 以色列研究员开始与附近网络组的新同事进行合作。

Dalal 表示:“将 AI 算法应用于 NVIDIA 拥堵控制团队的工作十分有意义。两年后的今天,这项研究变得更加成熟了。”

而时机也已经成熟。最近的报道显示,从疫情爆发前到现在,以色列路上的汽车数量出现了两位数增长,这可能会鼓励更多的人在家办公,网络会变得更加拥堵。

幸运的是,AI “交警”正在赶赴岗位。

原文标题:数据中心里的交警: AI 疏通数字流量拥堵

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110095
  • 数据中心
    +关注

    关注

    18

    文章

    5754

    浏览量

    75195
  • AI
    AI
    +关注

    关注

    91

    文章

    40922

    浏览量

    302511

原文标题:数据中心里的交警: AI 疏通数字流量拥堵

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA 发布 Ising,全球首个开放量子 AI 模型加速实用量子计算机进程

    NVIDIA Ising 在量子校准和纠错领域实现突破性性能提升,赋能研究人员和企业构建可扩展的高性能量子系统 新闻摘要: · NVIDIA Ising 开放模型系列提供了全球最先进的
    的头像 发表于 04-16 15:06 6062次阅读
    <b class='flag-5'>NVIDIA</b> 发布 Ising,全球首个开放量子 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>加速实用量子<b class='flag-5'>计算机</b>进程

    计算机专业408考研科目

    模型。 在这个阶段,不要急于背诵数据结构的代码或操作系统的算法,而是要理解计算机是如何“思考”的。你需要将数据结构视为信息的组织方式,将组成原理视为信息的物理载体,将操作系统视为资源的管理者,将网络视为
    发表于 04-11 16:44

    socket是什么

    于在不同计算机之间传输数据。Socket技术可以用于实现各种网络应用,例如客户端-服务器应用,点对点应用等。 在计算机网络中,Socket技术通常用于
    发表于 12-03 08:27

    NVIDIA DGX Spark助力构建自己的AI模型

    作为个人 AI 超级计算机,为世界各地的 AI 研究人员、数据科学家和学生提供 NVIDIA Grace Blackwell 平台的强大功
    的头像 发表于 11-21 09:25 1493次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark助力构建自己的<b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    NVIDIA DGX Spark桌面AI计算机开启预订

    DGX Spark 现已开启预订!丽台科技作为 NVIDIA 授权分销商,提供从产品到服务的一站式解决方案,助力轻松部署桌面 AI 计算机
    的头像 发表于 09-23 17:20 1504次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark桌面<b class='flag-5'>AI</b><b class='flag-5'>计算机</b>开启预订

    什么是NIC(网络接口卡)?

    网络接口卡(NIC)是一种基本的硬件组件,它使计算机或设备能够连接到网络。它可以集成到主板中,也可以作为扩展卡安装在
    的头像 发表于 09-22 14:54 1470次阅读
    什么是NIC(<b class='flag-5'>网络</b>接口卡)?

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    生物化学计算机,它通过离子、分子间的相互作用来进行复杂的并行计算。因而未来可期的前景是AI硬件将走向AI湿件。 根据研究,估算出大脑的功率是
    发表于 09-06 19:12

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 ExaFLOPS,不仅是英国最快的系统,同时也
    的头像 发表于 07-28 15:07 1411次阅读

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    研究人员用个人电脑构建了强大的集群,甚至改造游戏显卡,把它们用于科学研究。 当今的高性能计算系统专为高速计算而设计,其中许多都采用了 NVIDIA
    的头像 发表于 06-26 19:39 1404次阅读
    <b class='flag-5'>NVIDIA</b>驱动的现代超级<b class='flag-5'>计算机</b>如何突破速度极限并推动科学发展

    NVIDIA携手诺和诺德借助AI加速药物研发

    NVIDIA 宣布与诺和诺德开展合作,借助创新 AI 应用加速药物研发。此次合作也将支持诺和诺德与丹麦 AI 创新中心 (DCAI) 关于使用 Gefion AI 超级
    的头像 发表于 06-12 15:49 1461次阅读

    Blue Lion超级计算机将在NVIDIA Vera Rubin上运行

    德国莱布尼茨超算中心(LRZ)将迎来全新超级计算机 Blue Lion,其算力比该中心现有的 SuperMUC-NG 高性能计算机提升了约 30 倍。这台新的超级计算机将在 NVIDIA
    的头像 发表于 06-12 15:39 1336次阅读

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC 和 AI
    的头像 发表于 06-12 15:33 1628次阅读

    NVIDIA助力全球最大量子研究超级计算机

    NVIDIA 宣布将开设量子-AI 技术商业应用全球研发中心(G-QuAT),该中心部署了全球最大量子计算研究专用超级计算机 ABCI-Q。
    的头像 发表于 05-22 09:44 1066次阅读

    研究人员开发出基于NVIDIA技术的AI模型用于检测疟疾

    疟疾曾一度在委内瑞拉销声匿迹,但如今正卷土重来。研究人员已经训练出一个模型来帮助检测这种传染病。
    的头像 发表于 04-25 09:58 1184次阅读

    计算机网络入门指南

    计算机网络是指将地理位置不同且具有独立功能的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统、网络管理软件及网络通信协议的管理和
    的头像 发表于 04-22 14:29 2464次阅读
    <b class='flag-5'>计算机网络</b>入门指南