0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达CTO谈DPU:这是我们的重中之重

北京芯沐源科技有限公司 来源: 北京芯沐源科技有限公司 作者: 北京芯沐源科技有 2022-08-19 11:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2019年,Michael Kagan在Mellanox Technologies 担任首席技术官,领导加速网络技术的开发 ,这是他和八位同事在 20 年前创立的一家公司。然后在 2020 年 4 月,英伟达以 70 亿美元的价格收购了该公司,Kagan接任了这家科技巨头的首席技术官——这是他梦寐以求的工作。

英伟达总部位于加州圣克拉拉,但Kagan在公司位于以色列的办公室工作。

在位于以色列 Yokneam Illit 的 Mellanox,Kagan 监督了用于云数据中心计算和存储的高性能网络的开发。该公司生产适配器、电缆和高性能交换机等网络设备,以及新型处理器 DPU。Kagan 说,该公司的高速 InfiniBand产品可以在世界上大多数最快的超级计算机中找到,其高速以太网产品也可以在大多数云数据中心中找到。

IEEE 高级成员现在的工作重点是整合丰富的 Nvidia 技术来构建加速计算平台,其基础是三个芯片:GPUCPU 和 DPU,或数据处理单元。DPU 可以支持卸载、加速和隔离数据中心工作负载,从而减少 CPU 和 GPU 工作负载。

“在 Mellanox,我们致力于数据中心互连,但在 Nvidia,我们将最先进的计算连接成一个单一的计算单元:数据中心,”Kagan 说。互连用于连接多个服务器并将整个数据中心组合成一个巨大的计算单元。

“我可以访问并打开 Nvidia 技术的大门,”他说。“这就是让我的生活令人兴奋和有趣的原因。我们正在构建未来的计算。”

英特尔到 Mellanox

Kagan出生在俄罗斯的圣彼得堡——当时被称为列宁格勒。1975 年高中毕业后,他的家人搬到了以色列。与许多崭露头角的工程师一样,他的好奇心使他分解和重新组装东西以弄清楚它们是如何工作的。而且,由于家里有很多工程师,他说,从事工程职业是一个容易的决定。

他就读于以色列理工学院Technion,因为“它是世界上最好的工程大学之一,”他说。“我选择电气工程的原因是因为它被认为是 Technion 最好的专业。”

Kagan 于 1980 年毕业,获得电气工程学士学位。他于1983年加入位于以色列海法的英特尔,担任设计工程师,并最终搬到位于俄勒冈州希尔斯伯勒的公司办公室,在那里他从事 80387 浮点协处理器的工作。一年后,回到以色列后,Kagan 担任 i8060XP 矢量处理器的架构师,然后领导和管理 Pentium MMX 微处理器的设计。

在英特尔工作的 16 年中,他一路晋升为首席架构师。1999 年,他准备举家迁往加利福尼亚,在那里他将领导公司的一个备受瞩目的项目。然后,英特尔的前同事 Eyal Waldman 邀请 Kagan 加入他和其他五个熟人的行列,组建了 Mellanox。

他回忆说,Kagan几乎每周都拒绝加入初创公司的提议,但 Mellanox 及其联合创始人团队和远见吸引了他。他说,他认为这是一次“引人入胜的冒险,一个建立公司的机会基于我成长的核心价值观的文化:卓越、团队合作和承诺。”

他说,在他在那里的 21 年里,他没有后悔。

“这是我做过的最伟大的决定之一,”他说。“它最终使我生活的方方面面受益:专业、经济和所有的一切。”

Kagan 说,这家初创公司的突破性产品 InfiniBand 专为今天的云计算而设计。

“我们采用了 InfiniBand 的优点并将它们固定在标准以太网之上,”他说。“因此,我们成为了最先进的高性能计算网络供应商。500 强计算机公司中超过一半的机器使用 Mellanox 互连,现在是 Nvidia 互连。

“大多数云提供商,如 Facebook、Azure和阿里巴巴,都使用 Nvidia 的网络和计算技术。无论你在互联网上做什么,你最有可能通过我们设计的芯片运行。”

Kagan 表示,Mellanox 和 Nvidia 之间的合作是“自然的”,因为两家公司已经合作了近十年。

“我们作为独立公司提供了很多创新解决方案,”他说。

BlueField 和 Omniverse 超级计算机

过去两年,作为 Nvidia 的 CTO,Kagan 已经将他的关注点从单纯的网络转移到集成多种 Nvidia 技术,包括构建 BlueField数据处理单元和Omniverse实时图形协作平台。

他表示,英伟达对未来数据中心的愿景基于其三款芯片:CPU、DPU 和 GPU。

“这三个支柱与最初在 Mellanox 开发并在 Nvidia 进一步开发的非常高效和高性能的网络相连,”他说。

BlueField DPU 的开发现在是 Nvidia 的重中之重。它是一种芯片上的数据中心基础设施,针对高性能计算进行了优化。它还卸载、加速和隔离各种网络、存储和安全服务。

“在数据中心,你无法控制你的客户是谁,”Kagan说。“客户很可能是一个坏人,想要侵入他的邻居或你的基础设施。你最好通过让一个隔离的或不同的计算平台运行操作系统来将你自己和其他客户彼此隔离开来,这基本上是基础设施管理、资源管理和供应。”

Kagan 对 Omniverse 感到特别兴奋,这是一种新的 Nvidia 产品,它使用皮克斯的通用场景描述软件来创建虚拟世界——这就是众所周知的元宇宙。Kagan 将 3D 平台描述为“通过收集数据和对世界进行物理上准确的模拟来创造一个世界”。

汽车制造商正在使用 Omniverse 来试驾自动驾驶汽车。无需在各种条件下在不同类型的道路上实际驾驶汽车,而是可以生成有关虚拟世界的数据来训练 AI 模型。

“你可以创造汽车必须在现实世界中处理但你不希望它在现实世界中遇到的情况,比如车祸,”Kagan说。“你不想让汽车撞车来训练模型,但你确实需要让模型能够处理道路上的危险情况。”

Omniverse 平台可以生成数百万公里的合成驾驶数据,速度比实际驾驶汽车快几个数量级。

Kagan说,英伟达正在大力投资自动驾驶汽车技术。

该公司还在建造它所谓的最强大的气候科学人工智能超级计算机:Earth-2,地球的数字双胞胎。Earth-2 旨在持续运行模型以预测区域和全球层面的气候和天气事件。

Kagan说,气候建模技术将使人们能够尝试减缓全球变暖的技术,并了解它们在 50 年后可能产生的影响。

该公司还与医疗保健行业密切合作,开发基于人工智能的技术。它的超级计算机通过生成合成数据来帮助识别癌症,使研究人员能够训练他们的模型以更好地识别肿瘤。Kagan说,它的人工智能和加速计算产品还有助于药物发现和基因组研究。

“我们实际上正在以相当不错的速度前进,”他说。“但问题是,你总是需要重新改造自己,更快更好地完成新事物,并且基本上以你拥有的东西取胜,而不是寻找无限的资源。这就是承诺的意义。

声明:本文版权归原作者所有,转发仅为更大范围传播,若有异议请联系我们修改或删除

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53537

    浏览量

    459149
  • DPU
    DPU
    +关注

    关注

    0

    文章

    407

    浏览量

    26205
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97672
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA新闻:英伟10亿美元入股诺基亚 英伟推出全新量子设备

    研发并推出相关产品。 英伟CEO黄仁勋出现在美国华盛顿的GTC DC大会上的演讲中表示;“今天我们宣布与诺基亚建立了合作关系,诺基亚是世界第二大电信制造商,这是一个价值3万亿美元的产
    的头像 发表于 10-29 17:12 1295次阅读

    英伟自研HBM基础裸片

    电子发烧友网综合报道,据台媒消息,传闻英伟已开始开发自己的HBM基础裸片,预计英伟的自研HBM基础裸片采用3nm工艺制造,计划在2027年下半年进行小批量试产。并且这一时间点大致对
    的头像 发表于 08-21 08:16 2531次阅读

    英伟深夜发声:我们的芯片不存在后门,如何自证呢?

    电子发烧友网综合报道 8 月 6 日凌晨,英伟在其官方微信公众号发文称,为降低误用风险,一些专家和政策制定者提出需在硬件中设置 “终止开关” 或内置控件,以便在用户不知情且未经同意的情况下远程禁用
    的头像 发表于 08-07 09:51 9048次阅读

    国家网信办约谈英伟

    近日,英伟算力芯片被曝出存在严重安全问题。此前,美议员呼吁要求美出口的先进芯片必须配备“追踪定位”功能。美人工智能领域专家透露,英伟算力芯片“追踪定位”“远程关闭”技术已成熟。为维
    的头像 发表于 07-31 13:56 2538次阅读
    国家网信办约谈<b class='flag-5'>英伟</b><b class='flag-5'>达</b>

    英伟:CUDA 已经开始移植到 RISC-V 架构上

    的渊源。他提到,2017 年,上海交通大学与英伟联合举办了 RISC-V 工作坊,这是北美地区以外的首个 RISC-V 工作坊,对英伟
    发表于 07-17 16:30 3839次阅读

    英伟一夜大涨1.2万亿元,市值重回全球第一!

    美元,市值达到3.77万亿美元,超越微软(3.66万亿美元)重回全球市值第一。这是继2024年6月和2025年1月之后,英伟第三次登顶全球市值榜首。此次市值飙升
    的头像 发表于 06-26 17:35 2329次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>一夜大涨1.2万亿元,市值重回全球第一!

    特朗普要叫停英伟对华特供版 英伟H20出口限制 或损失55亿美元

    据外媒报道,英伟公司发布了一项通知称,美国政府于9日告知英伟公司;特供版的H20芯片出口到中国需要许可证,紧接着在14日又告知英伟
    的头像 发表于 04-16 16:59 1889次阅读

    英伟市值一夜蒸发近2万亿 英伟股价下跌超8%

    在美东时间周一,美股三大指数集体收跌,截至收盘,英伟股价下跌超8%,英伟市值一夜蒸发2650亿美元(换算下来约合人民币19345亿元);目前英伟
    的头像 发表于 03-04 10:19 989次阅读

    英伟发布DeepSeek R1于NIM平台

    英伟近日宣布,其DeepSeek R1 671b版本已正式上线英伟NIM(NVIDIA Inference Microservices)平台,并以预览版的形式在build.nvid
    的头像 发表于 02-05 14:48 919次阅读

    看点:ArmCEO英伟芯片活动 武汉阿里巴巴总部即将亮相 AI基建计划遭马斯克“拆台”

    给大家带来一些行业资讯: ArmCEO英伟芯片活动 据外媒报道,Arm CEO Rene Haas透露:在英伟参与美国“星际之门”(S
    的头像 发表于 01-24 16:13 3116次阅读

    英伟携手Illumina与Mayo Clinic推动医疗健康创新

    近日,英伟宣布了一项重大合作计划,旨在与Illumina公司、Mayo Clinic以及其他医疗保健组织携手,共同推动医疗健康行业的创新发展。这一合作被视为英伟鼓励该行业积极采用
    的头像 发表于 01-16 10:40 909次阅读

    英伟78%员工已成百万富翁

    近日,一则关于英伟员工的财富消息引起了广泛关注。据最新数据显示,英伟已有78%的员工成为了百万(美元)富翁,这一数字令人咋舌。然而,在这财富奇迹的背后,却隐藏着高强度的工作文化和“
    的头像 发表于 01-13 13:51 873次阅读

    英伟GB300订单配置初步敲定

    近日,据报道,英伟公司已经初步确定了其下一代GB300 AI服务器产品线的订单配置。预计英伟将在明年的3月GTC大会上正式揭晓这一全新产品线。 据悉,为了GB300的研发设计阶段,
    的头像 发表于 12-24 10:09 1705次阅读

    刚刚!英伟最新回应!

    12月10日消息,据报道,英伟市值一夜蒸发掉了889亿美元(约合人民币6460亿元)。 据此前媒体报道,近日英伟公司因涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制
    的头像 发表于 12-10 18:13 1182次阅读

    英伟被立案调查 英伟回应反垄断调查

    英伟被立案调查! 国家市场监督管理总局在12 月 9 日晚宣布,英伟公司涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制性条件批准
    的头像 发表于 12-10 15:03 816次阅读