0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA研究人员创建可以疏通计算机网络拥堵的AI模型

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-07-03 10:04 次阅读

NVIDIA 研究人员创建了可以疏通计算机网络拥堵的 AI 模型,该模型很快就会出现在大众附近的数据中心

Gal Dalal 希望为居家办公或在办公室工作的人缓解网络压力。

这位 NVIDIA 高级研究科学家是以色列一所 10 人实验室的成员,他正在使用 AI 减少计算机网络的拥堵。

对于笔记本电脑用户来说,如果看到屏幕上出现不停转动的圈圈,甚至无法移动光标,那就像在高速路上遇到一片红海那样糟糕。如同在交通高峰期,大批旅客想要快速到达某地,他们在途中互相拥挤,有时还会发生碰撞。

站在交叉路口的 AI

网络使用拥塞控制来管理数字通信业务量。拥塞控制本质上是嵌入到网络适配器和交换机中的规则,但随着网络上用户数量的增加,用户之间的冲突可能变得过于复杂而难以预测。

AI 可以发现模式的发展过程并作出响应,因此有望成为更好的“交警”。这就是为什么 Dalal 与世界各地的许多研究人员一起寻找通过强化学习使网络变得更加智能的方法。强化学习是当模型找到好的解决方案时,会对它们进行奖励的 AI。

但直到现在,出于种种原因,还没有人能够想出实用的方法。

与时间赛跑

网络需要既高效又公平,这样才不会有忽略任何请求。这种平衡很难达成,因为在数字“道路”上,没有任何“司机”可以看到其他“司机”不断变化的轨迹和预定目的地。

这也是与时间赛跑的比赛。为了发挥作用,网络需要在大约一微秒(即百万分之一秒)的时间内对情况做出反应。

为了使网络交通变得顺畅,NVIDIA 团队受到先进计算机游戏 AI 的启发,创造了新的强化学习技术并将其应用于网络问题。

NVIDIA 在 2021 年的论文中描述了他们的突破性进展,包括提出使用算法和相应的奖励函数来创造平衡的网络,单个网络流可用的本地信息是此网络的唯一基础。凭借该算法,团队在其 NVIDIA DGX 系统上创建、训练并运行了 AI 模型。

效果惊人

Dalal 回忆道,在那次会议上,来自 NVIDIA 的 Chen Tessler 用图表展示了该模型在模拟的 InfiniBand 数据中心网络上的运行结果。

Dalal 表示:“我们当时觉得效果十分显著。”他曾在以色列著名的技术大学,以色列理工学院(Technion)写过关于强化学习的博士论文。

他还认为:“特别惊喜的在于我们只在 32 个网络流上训练模型,它很好地概括了所学,以管理 8000 多个包含各种复杂情况的网络流,因此这个机器比预先制定的规则更有效。”

在 NVIDIA 的测试中,强化学习(紫色)的表现优于所有基于规则的拥塞控制算法

事实上,与最好的基于规则的技术相比,该算法的吞吐量至少提高了 1.5 倍,延迟降低了 4 倍。

自该论文发布以来,这项工作由于展现了强化学习在现实世界中的应用潜力而赢得了赞誉。

在网络中处理 AI

下一个重要的步骤仍然是正在进行中的工作——设计 AI 模型版本,它可以使用网络中有限的算力和内存资源以微秒级速度运行。Dalal 描绘了两个前进方向。

Dalal 的团队正在与设计 NVIDIA BlueField DPU 的工程师一起优化用于未来硬件的 AI 模型。BlueField DPU 的目标是在网络内运行不断扩展的通信作业,从负担过重的 CPU 上卸载任务。

另外, Dalal 的团队正在将 AI 模型的精髓提炼成名为提升树的机器学习技术。提升树由一系列“是”与“否”的决策组成,它同样十分智能,但运行起来更简单。该团队的目标是在今年晚些时候以能够立即用来缓解网络流量的形式展示其工作。

及时的“交通”解决方案

目前,Dalal 已经将强化学习应用于从自动驾驶汽车到数据中心冷却和芯片设计等各个领域。当 NVIDIA 于 2020 年 4 月 NVIDIA 收购 Mellanox 时,这位 NVIDIA 以色列研究员开始与附近网络组的新同事进行合作。

Dalal 表示:“将 AI 算法应用于 NVIDIA 拥堵控制团队的工作十分有意义。两年后的今天,这项研究变得更加成熟了。”

而时机也已经成熟。最近的报道显示,从疫情爆发前到现在,以色列路上的汽车数量出现了两位数增长,这可能会鼓励更多的人在家办公,网络会变得更加拥堵。

幸运的是,AI “交警”正在赶赴岗位。

原文标题:数据中心里的交警: AI 疏通数字流量拥堵

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4576

    浏览量

    101635
  • 数据中心
    +关注

    关注

    15

    文章

    4165

    浏览量

    69815
  • AI
    AI
    +关注

    关注

    87

    文章

    26338

    浏览量

    263943

原文标题:数据中心里的交警: AI 疏通数字流量拥堵

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    计算机网络中速率和带宽的区别

    bps。也就是说单位时间内线路中允许通过的比特的最大值。 两者的区别: 参考了韩立刚老师计算机网络的课程以及CSDN的计算机网络中速率(date rate)和带宽的区别,给出自己的理解: 可以将数字信道
    发表于 11-27 16:29

    计算机网络中速率和带宽的区别

    bps。也就是说单位时间内线路中允许通过的比特的最大值。 两者的区别: 参考了韩立刚老师计算机网络的课程以及CSDN的计算机网络中速率(date rate)和带宽的区别,给出自己的理解: 可以将数字信道
    发表于 11-01 15:04

    常见的计算机网络协议汇总

    本篇博客将对基于 计算机网络五层模型 中的常见协议做以总结 ,目的通过这些具体的协议更深刻的认识整体网络的传输流程及相关网络原理
    的头像 发表于 07-28 11:49 1693次阅读
    常见的<b class='flag-5'>计算机网络</b>协议汇总

    NVIDIA Cambridge-1 AI 超级计算机通过云让更多研究人员能够访问

    继成功打造 Cambridge-1 之后,NVIDIA 将该超级计算机连入 NVIDIA DGX Cloud,实现更多领域、更广泛的访问。 科学研究人员需要海量
    的头像 发表于 06-19 19:05 294次阅读

    计算机网络的层次结构

    TCP/IP四层模型与OSI体系结构对比: 1.3 层次结构设计的基本原则 各层之间是相互独立的; 每一层需要有足够的灵活性; 各层之间完全解耦。 1.4 计算机网络的性能指标 速率:bps=bit/s 时延:发送时延、传播时延、排队时延、处理时延 往返时间RTT:数据
    的头像 发表于 05-29 09:54 5449次阅读
    <b class='flag-5'>计算机网络</b>的层次结构

    计算机网络硬件的组成

    之前我们学习了计算机网络的分类,本节课我们学习一下计算机网络硬件都有哪些元素组成。首先我们来看一下计算机网络的传输介质,分为有线和无线两种。有线传输介质包括:
    的头像 发表于 05-18 16:21 1590次阅读

    计算机网络的功能及分类

    本节课我们来学习计算机网络及其分类,那我们是计算机网络呢?我们先看一下计算机网络的概念。计算机网络是由地理位置分散的、具有独立功能的多台计算机
    的头像 发表于 05-18 15:56 3150次阅读
    <b class='flag-5'>计算机网络</b>的功能及分类

    计算机网络的 89 个基本概念

    计算机网络中的概念也是非常庞杂,理解起来比较困难,所以这里,我给大家汇总了计算机网络中 89 个常见的概念,希望对你有所帮助。 1. `主机
    的头像 发表于 05-18 15:53 642次阅读
    <b class='flag-5'>计算机网络</b>的 89 个基本概念

    计算机网络知识点全面汇总(下)

    计算机网络的分类 按照网络的作用范围:广域网(WAN)、城域网(MAN)、局域网(LAN); 按照网络使用者:公用网络、专用网络
    的头像 发表于 05-18 15:52 444次阅读
    <b class='flag-5'>计算机网络</b>知识点全面汇总(下)

    计算机网络知识点全面汇总(上)

    计算机网络的分类 按照网络的作用范围:广域网(WAN)、城域网(MAN)、局域网(LAN); 按照网络使用者:公用网络、专用网络
    的头像 发表于 05-18 15:44 597次阅读
    <b class='flag-5'>计算机网络</b>知识点全面汇总(上)

    计算机网络入门之网络安全

    安全的计算机网络 1. 保密性 只有信息的发送方和接收方才能懂得所发送信息的内容,而信息的截获者则看不懂所截获的信息。 2. 端点鉴别 安全的计算机网络必须能够鉴别信息的发送方和接收方的真实
    的头像 发表于 05-18 15:35 562次阅读
    <b class='flag-5'>计算机网络</b>入门之<b class='flag-5'>网络</b>安全

    什么是计算机网络

    计算机网络是一组互相连接的计算机和其他网络设备,通过通信线路和交换机等设备相互通信和传递数据的系统。
    的头像 发表于 05-16 09:04 7703次阅读
    什么是<b class='flag-5'>计算机网络</b>?

    计算机网络的分类

    计算机网络的分类与一般的事物分类方法一样,可以按事物所具有的不同性质特点(即事物的属性)分类。计算机网络通俗地讲就是由多台计算机(或其它计算机网络
    发表于 05-10 16:30 1450次阅读

    计算机网络的定义

    计算机网络是指将多台计算机通过通信线路互相连接起来,实现信息交换和资源共享的系统。计算机网络可以包括局域网、广域网、互联网等不同范围和规模的网络
    发表于 05-10 16:25 1030次阅读

    计算机网络功能

    计算机网络的功能主要目的是实现计算机之间的资源共享、网络通信和对计算机的集中管理。计算机网络是指将多台
    发表于 05-10 16:21 924次阅读