0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA研究人员创建可以疏通计算机网络拥堵的AI模型

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-07-03 10:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 研究人员创建了可以疏通计算机网络拥堵的 AI 模型,该模型很快就会出现在大众附近的数据中心

Gal Dalal 希望为居家办公或在办公室工作的人缓解网络压力。

这位 NVIDIA 高级研究科学家是以色列一所 10 人实验室的成员,他正在使用 AI 减少计算机网络的拥堵。

对于笔记本电脑用户来说,如果看到屏幕上出现不停转动的圈圈,甚至无法移动光标,那就像在高速路上遇到一片红海那样糟糕。如同在交通高峰期,大批旅客想要快速到达某地,他们在途中互相拥挤,有时还会发生碰撞。

站在交叉路口的 AI

网络使用拥塞控制来管理数字通信业务量。拥塞控制本质上是嵌入到网络适配器和交换机中的规则,但随着网络上用户数量的增加,用户之间的冲突可能变得过于复杂而难以预测。

AI 可以发现模式的发展过程并作出响应,因此有望成为更好的“交警”。这就是为什么 Dalal 与世界各地的许多研究人员一起寻找通过强化学习使网络变得更加智能的方法。强化学习是当模型找到好的解决方案时,会对它们进行奖励的 AI。

但直到现在,出于种种原因,还没有人能够想出实用的方法。

与时间赛跑

网络需要既高效又公平,这样才不会有忽略任何请求。这种平衡很难达成,因为在数字“道路”上,没有任何“司机”可以看到其他“司机”不断变化的轨迹和预定目的地。

这也是与时间赛跑的比赛。为了发挥作用,网络需要在大约一微秒(即百万分之一秒)的时间内对情况做出反应。

为了使网络交通变得顺畅,NVIDIA 团队受到先进计算机游戏 AI 的启发,创造了新的强化学习技术并将其应用于网络问题。

NVIDIA 在 2021 年的论文中描述了他们的突破性进展,包括提出使用算法和相应的奖励函数来创造平衡的网络,单个网络流可用的本地信息是此网络的唯一基础。凭借该算法,团队在其 NVIDIA DGX 系统上创建、训练并运行了 AI 模型。

效果惊人

Dalal 回忆道,在那次会议上,来自 NVIDIA 的 Chen Tessler 用图表展示了该模型在模拟的 InfiniBand 数据中心网络上的运行结果。

Dalal 表示:“我们当时觉得效果十分显著。”他曾在以色列著名的技术大学,以色列理工学院(Technion)写过关于强化学习的博士论文。

他还认为:“特别惊喜的在于我们只在 32 个网络流上训练模型,它很好地概括了所学,以管理 8000 多个包含各种复杂情况的网络流,因此这个机器比预先制定的规则更有效。”

在 NVIDIA 的测试中,强化学习(紫色)的表现优于所有基于规则的拥塞控制算法

事实上,与最好的基于规则的技术相比,该算法的吞吐量至少提高了 1.5 倍,延迟降低了 4 倍。

自该论文发布以来,这项工作由于展现了强化学习在现实世界中的应用潜力而赢得了赞誉。

在网络中处理 AI

下一个重要的步骤仍然是正在进行中的工作——设计 AI 模型版本,它可以使用网络中有限的算力和内存资源以微秒级速度运行。Dalal 描绘了两个前进方向。

Dalal 的团队正在与设计 NVIDIA BlueField DPU 的工程师一起优化用于未来硬件的 AI 模型。BlueField DPU 的目标是在网络内运行不断扩展的通信作业,从负担过重的 CPU 上卸载任务。

另外, Dalal 的团队正在将 AI 模型的精髓提炼成名为提升树的机器学习技术。提升树由一系列“是”与“否”的决策组成,它同样十分智能,但运行起来更简单。该团队的目标是在今年晚些时候以能够立即用来缓解网络流量的形式展示其工作。

及时的“交通”解决方案

目前,Dalal 已经将强化学习应用于从自动驾驶汽车到数据中心冷却和芯片设计等各个领域。当 NVIDIA 于 2020 年 4 月 NVIDIA 收购 Mellanox 时,这位 NVIDIA 以色列研究员开始与附近网络组的新同事进行合作。

Dalal 表示:“将 AI 算法应用于 NVIDIA 拥堵控制团队的工作十分有意义。两年后的今天,这项研究变得更加成熟了。”

而时机也已经成熟。最近的报道显示,从疫情爆发前到现在,以色列路上的汽车数量出现了两位数增长,这可能会鼓励更多的人在家办公,网络会变得更加拥堵。

幸运的是,AI “交警”正在赶赴岗位。

原文标题:数据中心里的交警: AI 疏通数字流量拥堵

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109069
  • 数据中心
    +关注

    关注

    16

    文章

    5515

    浏览量

    74642
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296432

原文标题:数据中心里的交警: AI 疏通数字流量拥堵

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    socket是什么

    于在不同计算机之间传输数据。Socket技术可以用于实现各种网络应用,例如客户端-服务器应用,点对点应用等。 在计算机网络中,Socket技术通常用于
    发表于 12-03 08:27

    NVIDIA DGX Spark助力构建自己的AI模型

    作为个人 AI 超级计算机,为世界各地的 AI 研究人员、数据科学家和学生提供 NVIDIA Grace Blackwell 平台的强大功
    的头像 发表于 11-21 09:25 530次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark助力构建自己的<b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    NVIDIA DGX Spark桌面AI计算机开启预订

    DGX Spark 现已开启预订!丽台科技作为 NVIDIA 授权分销商,提供从产品到服务的一站式解决方案,助力轻松部署桌面 AI 计算机
    的头像 发表于 09-23 17:20 905次阅读
    <b class='flag-5'>NVIDIA</b> DGX Spark桌面<b class='flag-5'>AI</b><b class='flag-5'>计算机</b>开启预订

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    生物化学计算机,它通过离子、分子间的相互作用来进行复杂的并行计算。因而未来可期的前景是AI硬件将走向AI湿件。 根据研究,估算出大脑的功率是
    发表于 09-06 19:12

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    研究人员用个人电脑构建了强大的集群,甚至改造游戏显卡,把它们用于科学研究。 当今的高性能计算系统专为高速计算而设计,其中许多都采用了 NVIDIA
    的头像 发表于 06-26 19:39 966次阅读
    <b class='flag-5'>NVIDIA</b>驱动的现代超级<b class='flag-5'>计算机</b>如何突破速度极限并推动科学发展

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC 和 AI
    的头像 发表于 06-12 15:33 1035次阅读

    NVIDIA助力全球最大量子研究超级计算机

    NVIDIA 宣布将开设量子-AI 技术商业应用全球研发中心(G-QuAT),该中心部署了全球最大量子计算研究专用超级计算机 ABCI-Q。
    的头像 发表于 05-22 09:44 670次阅读

    研究人员开发出基于NVIDIA技术的AI模型用于检测疟疾

    疟疾曾一度在委内瑞拉销声匿迹,但如今正卷土重来。研究人员已经训练出一个模型来帮助检测这种传染病。
    的头像 发表于 04-25 09:58 727次阅读

    计算机网络入门指南

    计算机网络是指将地理位置不同且具有独立功能的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统、网络管理软件及网络通信协议的管理和
    的头像 发表于 04-22 14:29 1858次阅读
    <b class='flag-5'>计算机网络</b>入门指南

    计算机网络协议介绍

    通信的不同方面被分解为多层次结构,每一层只与紧挨着的上层或者下层进行交互,将网络分层,这样就可以修改,甚至替换某一层的软件,只要层与层之间的接口保持不变,就不会影响到其他层。 1.2.1 OSI( Open System Interconnection Reference
    的头像 发表于 04-08 11:26 1228次阅读
    <b class='flag-5'>计算机网络</b>协议介绍

    NVIDIA GTC2025 亮点 NVIDIA推出 DGX Spark个人AI计算机

    台式超级计算机NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机
    的头像 发表于 03-20 18:59 1265次阅读
    <b class='flag-5'>NVIDIA</b> GTC2025 亮点  <b class='flag-5'>NVIDIA</b>推出 DGX Spark个人<b class='flag-5'>AI</b><b class='flag-5'>计算机</b>

    NVIDIA 宣布推出 DGX Spark 个人 AI 计算机

    台式超级计算机NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机
    发表于 03-19 09:59 504次阅读
       <b class='flag-5'>NVIDIA</b> 宣布推出 DGX Spark 个人 <b class='flag-5'>AI</b> <b class='flag-5'>计算机</b>

    计算机网络架构的演进

    计算机网络架构的演进见证了信息技术的飞速发展。早期的总线型网络架构,通过一条共享的通信线路连接各个节点,结构简单且成本较低,但存在单点故障和传输效率不高的问题。随着技术的发展,星型网络架构逐渐
    的头像 发表于 01-21 11:11 775次阅读

    NVIDIA推出个人AI超级计算机Project DIGITS

    NVIDIA 推出个人 AI 超级计算机 NVIDIA Project DIGITS,全球的 AI 研究
    的头像 发表于 01-08 11:03 1159次阅读

    NVIDIA 推出高性价比的生成式 AI 超级计算机

    计算机,具有更高的性价比,通过软件升级即可实现性能提升。   全新 NVIDIA Jetson Orin Nano Super 开发者套件只有手掌大小,能够为商业 AI 开发者、科技爱好者和学生等各类
    发表于 12-18 17:01 948次阅读
    <b class='flag-5'>NVIDIA</b> 推出高性价比的生成式 <b class='flag-5'>AI</b> 超级<b class='flag-5'>计算机</b>