0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达CTO谈DPU:这是我们的重中之重

北京芯沐源科技有限公司 来源: 北京芯沐源科技有限公司 作者: 北京芯沐源科技有 2022-08-19 11:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2019年,Michael Kagan在Mellanox Technologies 担任首席技术官,领导加速网络技术的开发 ,这是他和八位同事在 20 年前创立的一家公司。然后在 2020 年 4 月,英伟达以 70 亿美元的价格收购了该公司,Kagan接任了这家科技巨头的首席技术官——这是他梦寐以求的工作。

英伟达总部位于加州圣克拉拉,但Kagan在公司位于以色列的办公室工作。

在位于以色列 Yokneam Illit 的 Mellanox,Kagan 监督了用于云数据中心计算和存储的高性能网络的开发。该公司生产适配器、电缆和高性能交换机等网络设备,以及新型处理器 DPU。Kagan 说,该公司的高速 InfiniBand产品可以在世界上大多数最快的超级计算机中找到,其高速以太网产品也可以在大多数云数据中心中找到。

IEEE 高级成员现在的工作重点是整合丰富的 Nvidia 技术来构建加速计算平台,其基础是三个芯片:GPUCPU 和 DPU,或数据处理单元。DPU 可以支持卸载、加速和隔离数据中心工作负载,从而减少 CPU 和 GPU 工作负载。

“在 Mellanox,我们致力于数据中心互连,但在 Nvidia,我们将最先进的计算连接成一个单一的计算单元:数据中心,”Kagan 说。互连用于连接多个服务器并将整个数据中心组合成一个巨大的计算单元。

“我可以访问并打开 Nvidia 技术的大门,”他说。“这就是让我的生活令人兴奋和有趣的原因。我们正在构建未来的计算。”

英特尔到 Mellanox

Kagan出生在俄罗斯的圣彼得堡——当时被称为列宁格勒。1975 年高中毕业后,他的家人搬到了以色列。与许多崭露头角的工程师一样,他的好奇心使他分解和重新组装东西以弄清楚它们是如何工作的。而且,由于家里有很多工程师,他说,从事工程职业是一个容易的决定。

他就读于以色列理工学院Technion,因为“它是世界上最好的工程大学之一,”他说。“我选择电气工程的原因是因为它被认为是 Technion 最好的专业。”

Kagan 于 1980 年毕业,获得电气工程学士学位。他于1983年加入位于以色列海法的英特尔,担任设计工程师,并最终搬到位于俄勒冈州希尔斯伯勒的公司办公室,在那里他从事 80387 浮点协处理器的工作。一年后,回到以色列后,Kagan 担任 i8060XP 矢量处理器的架构师,然后领导和管理 Pentium MMX 微处理器的设计。

在英特尔工作的 16 年中,他一路晋升为首席架构师。1999 年,他准备举家迁往加利福尼亚,在那里他将领导公司的一个备受瞩目的项目。然后,英特尔的前同事 Eyal Waldman 邀请 Kagan 加入他和其他五个熟人的行列,组建了 Mellanox。

他回忆说,Kagan几乎每周都拒绝加入初创公司的提议,但 Mellanox 及其联合创始人团队和远见吸引了他。他说,他认为这是一次“引人入胜的冒险,一个建立公司的机会基于我成长的核心价值观的文化:卓越、团队合作和承诺。”

他说,在他在那里的 21 年里,他没有后悔。

“这是我做过的最伟大的决定之一,”他说。“它最终使我生活的方方面面受益:专业、经济和所有的一切。”

Kagan 说,这家初创公司的突破性产品 InfiniBand 专为今天的云计算而设计。

“我们采用了 InfiniBand 的优点并将它们固定在标准以太网之上,”他说。“因此,我们成为了最先进的高性能计算网络供应商。500 强计算机公司中超过一半的机器使用 Mellanox 互连,现在是 Nvidia 互连。

“大多数云提供商,如 Facebook、Azure和阿里巴巴,都使用 Nvidia 的网络和计算技术。无论你在互联网上做什么,你最有可能通过我们设计的芯片运行。”

Kagan 表示,Mellanox 和 Nvidia 之间的合作是“自然的”,因为两家公司已经合作了近十年。

“我们作为独立公司提供了很多创新解决方案,”他说。

BlueField 和 Omniverse 超级计算机

过去两年,作为 Nvidia 的 CTO,Kagan 已经将他的关注点从单纯的网络转移到集成多种 Nvidia 技术,包括构建 BlueField数据处理单元和Omniverse实时图形协作平台。

他表示,英伟达对未来数据中心的愿景基于其三款芯片:CPU、DPU 和 GPU。

“这三个支柱与最初在 Mellanox 开发并在 Nvidia 进一步开发的非常高效和高性能的网络相连,”他说。

BlueField DPU 的开发现在是 Nvidia 的重中之重。它是一种芯片上的数据中心基础设施,针对高性能计算进行了优化。它还卸载、加速和隔离各种网络、存储和安全服务。

“在数据中心,你无法控制你的客户是谁,”Kagan说。“客户很可能是一个坏人,想要侵入他的邻居或你的基础设施。你最好通过让一个隔离的或不同的计算平台运行操作系统来将你自己和其他客户彼此隔离开来,这基本上是基础设施管理、资源管理和供应。”

Kagan 对 Omniverse 感到特别兴奋,这是一种新的 Nvidia 产品,它使用皮克斯的通用场景描述软件来创建虚拟世界——这就是众所周知的元宇宙。Kagan 将 3D 平台描述为“通过收集数据和对世界进行物理上准确的模拟来创造一个世界”。

汽车制造商正在使用 Omniverse 来试驾自动驾驶汽车。无需在各种条件下在不同类型的道路上实际驾驶汽车,而是可以生成有关虚拟世界的数据来训练 AI 模型。

“你可以创造汽车必须在现实世界中处理但你不希望它在现实世界中遇到的情况,比如车祸,”Kagan说。“你不想让汽车撞车来训练模型,但你确实需要让模型能够处理道路上的危险情况。”

Omniverse 平台可以生成数百万公里的合成驾驶数据,速度比实际驾驶汽车快几个数量级。

Kagan说,英伟达正在大力投资自动驾驶汽车技术。

该公司还在建造它所谓的最强大的气候科学人工智能超级计算机:Earth-2,地球的数字双胞胎。Earth-2 旨在持续运行模型以预测区域和全球层面的气候和天气事件。

Kagan说,气候建模技术将使人们能够尝试减缓全球变暖的技术,并了解它们在 50 年后可能产生的影响。

该公司还与医疗保健行业密切合作,开发基于人工智能的技术。它的超级计算机通过生成合成数据来帮助识别癌症,使研究人员能够训练他们的模型以更好地识别肿瘤。Kagan说,它的人工智能和加速计算产品还有助于药物发现和基因组研究。

“我们实际上正在以相当不错的速度前进,”他说。“但问题是,你总是需要重新改造自己,更快更好地完成新事物,并且基本上以你拥有的东西取胜,而不是寻找无限的资源。这就是承诺的意义。

声明:本文版权归原作者所有,转发仅为更大范围传播,若有异议请联系我们修改或删除

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54662

    浏览量

    471072
  • DPU
    DPU
    +关注

    关注

    0

    文章

    419

    浏览量

    27191
  • 英伟达
    +关注

    关注

    23

    文章

    4129

    浏览量

    99785
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vera rubin平台即将交付,英伟800VDC电源方案进展如何?

    电子发烧友网报道(文/梁浩斌)在刚刚结束的‌GTC 2026上,英伟推出了Vera Rubin POD,这是一套极致的软硬件协同设计的多机架系统组成的集群,也是一台AI超级计算机。   具体来说
    的头像 发表于 03-23 00:44 8216次阅读
    Vera rubin平台即将交付,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>800VDC电源方案进展如何?

    施耐德电气与英伟深化合作以构建高效吉瓦级AI工厂

    施耐德电气携手英伟联合发布全新Vera Rubin参考设计,为英伟最新机架级系统提供经过验证的供配电与冷却方案。
    的头像 发表于 03-20 13:52 603次阅读

    新思科技与英伟多项硬核科技成果亮相GTC 2026

    新思科技(Synopsys, Inc.,纳斯达克股票代码:SNPS)在英伟 GTC 2026 大会(NVIDIA GTC 2026)上,展示了其与英伟战略合作的最新成果,携手重塑千
    的头像 发表于 03-18 17:36 1167次阅读

    麦格纳宣布扩大与英伟的战略合作

    麦格纳宣布扩大与英伟的战略合作,为整车厂基于英伟DRIVE Hyperion平台的项目落地提供支持。
    的头像 发表于 01-09 12:59 609次阅读

    英伟重磅出手!AI 推理存储全面觉醒

    电子发烧友网报道(文/黄晶晶)近日,有消息称,英伟将以大约200亿美元收购人工智能芯片初创公司Groq,这将是英伟迄今为止规模最大的一笔收购。但
    的头像 发表于 12-26 08:44 1.2w次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>重磅出手!AI 推理存储全面觉醒

    黄仁勋:英伟AI芯片订单排到2026年 英伟上季营收加速增长62%再超预期

    AI芯片总龙头英伟的财报终于带来了惊喜;英伟公司发布财报数据显示,上季营收加速增长62%;再超华尔街预期。业界都比较振奋,英伟
    的头像 发表于 11-20 11:36 1581次阅读

    NVIDIA新闻:英伟10亿美元入股诺基亚 英伟推出全新量子设备

    研发并推出相关产品。 英伟CEO黄仁勋出现在美国华盛顿的GTC DC大会上的演讲中表示;“今天我们宣布与诺基亚建立了合作关系,诺基亚是世界第二大电信制造商,这是一个价值3万亿美元的产
    的头像 发表于 10-29 17:12 2579次阅读

    英伟自研HBM基础裸片

    电子发烧友网综合报道,据台媒消息,传闻英伟已开始开发自己的HBM基础裸片,预计英伟的自研HBM基础裸片采用3nm工艺制造,计划在2027年下半年进行小批量试产。并且这一时间点大致对
    的头像 发表于 08-21 08:16 3118次阅读

    英伟深夜发声:我们的芯片不存在后门,如何自证呢?

    电子发烧友网综合报道 8 月 6 日凌晨,英伟在其官方微信公众号发文称,为降低误用风险,一些专家和政策制定者提出需在硬件中设置 “终止开关” 或内置控件,以便在用户不知情且未经同意的情况下远程禁用
    的头像 发表于 08-07 09:51 9546次阅读

    国家网信办约谈英伟

    近日,英伟算力芯片被曝出存在严重安全问题。此前,美议员呼吁要求美出口的先进芯片必须配备“追踪定位”功能。美人工智能领域专家透露,英伟算力芯片“追踪定位”“远程关闭”技术已成熟。为维
    的头像 发表于 07-31 13:56 2922次阅读
    国家网信办约谈<b class='flag-5'>英伟</b><b class='flag-5'>达</b>

    央视专访英伟创始人黄仁勋 黄仁勋:总感觉公司快倒闭了

    伟大的公司都会有自己独到的地方;在央视专访英伟创始人黄仁勋让我们看到黄仁勋客观评价,也看到英伟的危机意识。黄仁勋有一句警示语:“
    的头像 发表于 07-21 11:24 1648次阅读

    英伟:CUDA 已经开始移植到 RISC-V 架构上

    的渊源。他提到,2017 年,上海交通大学与英伟联合举办了 RISC-V 工作坊,这是北美地区以外的首个 RISC-V 工作坊,对英伟
    发表于 07-17 16:30 4043次阅读

    英伟一夜大涨1.2万亿元,市值重回全球第一!

    美元,市值达到3.77万亿美元,超越微软(3.66万亿美元)重回全球市值第一。这是继2024年6月和2025年1月之后,英伟第三次登顶全球市值榜首。此次市值飙升
    的头像 发表于 06-26 17:35 3972次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>一夜大涨1.2万亿元,市值重回全球第一!

    施耐德电气与英伟深化合作

    近日,施耐德电气宣布与英伟深化合作,旨在满足市场对可持续、AI就绪基础设施日益增长的需求。
    的头像 发表于 06-24 15:02 1675次阅读