0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-02-23 10:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为专为 NVIDIA BlueField 网络平台而设计的数据中心基础设施软件框架,NVIDIA DOCA 使广大开发者能够利用其行业标准 API 在 NVIDIA BlueField 网络平台上快速创建应用程序和服务,并启用 NVIDIA BlueField DPU 和 NVIDIA BlueField SuperNIC 的强大功能,提供突破性的网络、安全和存储性能。

近日发布的 NVIDIA DOCA 2.6 引入了 NVIDIA BlueField 网络平台的新增功能和增强功能,可实现高性能和安全的 AI 云,从而大规模加速数据中心工作负载和 AI 应用。借助可编程拥塞控制(PCC)和数据路径加速(DPA),更新的 DOCA SDK 也为开发者提供了广泛的开发框架,并提供新增功能和增强功能。

专为 AI 云而设计的网络平台

NVIDIA Spectrum-X 是适用于 AI 云“东西向”流量的以太网参考架构,其中主要包括 NVIDIA BlueField-3 SuperNIC 和 Spectrum-4 交换机。Spectrum-X 通过创新的高性能网络为 AI 云提供峰值性能,从而有效满足 AI 工作负载对 AI 云基础设施的性能需求。

最新的 DOCA 2.6 版本支持 Spectrum-X 参考架构 1.0,优化了 Spectrum-4 交换机和 BlueField-3 SuperNIC 的性能协同,不但为 AI 工作负载提供优化的无损 RoCEv2 和动态路由功能,而且支持零接触 RoCE 拥塞控制(ZTR-CC)和可编程的 DOCA-PCC,从而显著提高 AI 云的性能,并为租户提供确定和隔离的性能。

开发硬件加速的网络应用程序

DOCA Flow 是用于卸载和加速网络转向(Network Steering)的开发库,可以在软件定义网络(SDN)的服务中提供可编程的快速流水线(Pipeline),并通过采用 DOCA-CT 管道(Pipe)来加速连接跟踪和管理会话状态。

在 DOCA 2.6 版本中,DOCA-CT 通过简化流水线来提升效率,并支持 NAT64 来实现 IPv6 和 IPv4 之间的地址转换,从而使连接跟踪与 NAT 流水线相结合来获得更好的性能。同时,DOCA Flow 可以通过修改可选字段来扩展 Geneve 隧道,且通过启用 Geneve 来替代如 MPLS 等其他隧道方案。DOCA Flow 还支持将硬件哈希计算公开给软件,对于复杂的流水线可以对齐软硬件的哈希结果。

DOCA 服务新增功能

基于 BlueField 的分布式路由和 EVPN 服务

DOCA 基于主机的网络(HBN)服务 2.1 版本支持 EVPN 增强功能,可为大规模裸金属云构建无控制器的虚拟私有云(VPC)网络。同时,它支持 L3 EVPN 来实现对称的 VXLAN 路由,从而实现 L3 的多租户安全;支持本地 VRF 路由泄露(测试版),从而隔离租户以安全访问互联网和共享服务;支持多跳 eBGP 对等互连,从而适用于大规模 VXLAN EVPN 的部署;支持用于有状态访问控制列表(ACL)的 L3 接口绑定,从而实现对 L3 流量的过滤;支持其它面向 DPU 的接口,以便与其他服务进行集成。

计时即服务解决方案

DOCA Firefly 服务利用 BlueField SuperNIC 和 DPU 来加速时间同步。在 DOCA 2.6 版本中,它增加了时钟跳转时的时间检查功能,从而可以对伺服计时算法进行修复。DOCA Firefly 服务可以广泛的应用于电信、传媒娱乐、金融服务等行业,比如电信行业在 5G 移动通信部署的基于网络的时间同步,传媒娱乐行业基于虚幻引擎(Unreal Engine)的虚拟制作,以及金融服务行业满足 MiFID II 合规性的高频交易(HFT)。

更多其他更新

BlueField 平台增强功能

平台安全 – UEFI 密码策略

平台管理 – BMC 健壮性

BlueField 安装包简化升级 – 增加 BMC 和 eROT 固件





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 控制器
    +关注

    关注

    114

    文章

    17877

    浏览量

    195140
  • NVIDIA
    +关注

    关注

    14

    文章

    5687

    浏览量

    110117
  • AI设计
    +关注

    关注

    0

    文章

    5

    浏览量

    1290
  • VxLAN
    +关注

    关注

    0

    文章

    24

    浏览量

    4169

原文标题:基于 NVIDIA DOCA 2.6 实现高性能和安全的 AI 云

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Kimi K2.6模型发布当天上线华为

    4月20日, Kimi K2.6模型正式发布并开源,带来行业领先的代码、长程任务执行和Agent集群能力。当前,华为完成适配并实现针对性优化。华为MaaS模型即服务平台已为开发者提
    的头像 发表于 04-23 15:10 299次阅读
    Kimi K<b class='flag-5'>2.6</b>模型发布当天上线华为<b class='flag-5'>云</b>

    自主AI智能体如何通过NVIDIA OpenShell实现原生安全

    NVIDIA OpenShell 提供了在可信基础设施策略层中管理自主智能体的工具——在环境中添加安全机制,而不是在模型或应用层。
    的头像 发表于 04-03 10:00 1279次阅读

    如何在NVIDIA CUDA Tile中编写高性能矩阵乘法

    本博文是系列课程的一部分,旨在帮助开发者学习 NVIDIA CUDA Tile 编程,掌握构建高性能 GPU 内核的方法,并以矩阵乘法作为核心示例。
    的头像 发表于 01-22 16:43 5298次阅读
    如何在<b class='flag-5'>NVIDIA</b> CUDA Tile中编写<b class='flag-5'>高性能</b>矩阵乘法

    使用OpenUSD与NVIDIA Halos构建安全物理AI系统

    全新 NVIDIA 安全框架与技术正在推进开发者构建安全物理 AI 的方式。 本文是洞悉 Omniverse 系列文章。“洞悉 Omniverse”重点介绍开发者、3D 从业者与企业
    的头像 发表于 12-24 10:22 965次阅读

    亚马逊科技推出全新的Amazon AI Factories 将客户现有基础设施转化为高性能AI环境

    亚马逊科技在2025 re:Invent全球大会上,宣布推出全新的Amazon AI Factories,助力企业将现有基础设施转化为高性能AI环境。
    的头像 发表于 12-13 13:44 857次阅读

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025构建高性能AI应用

    搜索和调用外部 AI 模型的 SQL 原生 API。NVIDIA 与微软共同将 SQL Server 2025 与 NVIDIA Nemotron RAG 开放模型集合无缝连接,这使您能够在云端或本地环境中基于自己的数据构建
    的头像 发表于 12-01 09:31 1041次阅读
    使用<b class='flag-5'>NVIDIA</b> Nemotron RAG和Microsoft SQL Server 2025构建<b class='flag-5'>高性能</b><b class='flag-5'>AI</b>应用

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服务为
    的头像 发表于 11-03 14:48 1220次阅读

    利用NVIDIA DOCA GPUNetIO技术提升MoE模型推理性能

    在第三届 NVIDIA DPU 中国黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全
    的头像 发表于 09-23 15:25 1210次阅读

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    合作案例,成为AI数据中心升级的关键推动者。 一、技术实力:AI光模块的研发与量产先锋 睿海光电作为全球AI光模块的领先品牌,专注于为数据中心、超算中心及智算中心提供高性能网络互联方案
    发表于 08-13 19:01

    NVIDIA助力CoreWeave平台性能升级

    AI 变革正在重塑数据中心格局,亟需能够提供更灵活、高性价比的计算和数据能力的平台。为了满足这些需求,作为推动 AI 变革的超大规模服务提供商,CoreWeave 致力于开发一种用于加速计算工作负载的
    的头像 发表于 07-23 10:49 1495次阅读
    <b class='flag-5'>NVIDIA</b>助力CoreWeave<b class='flag-5'>云</b>平台<b class='flag-5'>性能</b>升级

    NVIDIA DOCA 3.0版本的亮点解析

    NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,每
    的头像 发表于 07-04 14:27 1392次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> 3.0版本的亮点解析

    ESP32-P4—具备丰富IO连接、HMI和出色安全特性的高性能SoC

    ESP32-P4搭载双核RISC-V处理器,拥有 AI指令扩展、先进的内存子系统,并集成高速外设。ESP32-P4专为高性能和高安全的应用设计,充分满足下一代嵌入式应用对人机界面支持、边缘计算能力
    发表于 06-30 11:01

    NVIDIA计划打造全球首个工业AI平台

    NVIDIA 宣布,其正在为欧洲制造商构建全球首个工业 AI 。这家总部位于德国的 AI 工厂将配备 1 万个 GPU,包括通过 NVIDIA
    的头像 发表于 06-16 14:17 1620次阅读

    第三届NVIDIA DPU黑客松开启报名

    碰撞的绝佳机会。本次竞赛采用开放式主题,参与者将通过 NVIDIA DOCA 软件框架构建创新的加速应用程序,充分挖掘 NVIDIA BlueField DPU 在 AI、网络、存储和
    的头像 发表于 05-27 10:16 1014次阅读

    NVIDIA将为每家AI工厂提供网络安全

    NVIDIA DOCA Argus 框架可检测 AI 工作负载中的威胁并对之做出响应,同时与企业安全系统无缝集成,从而提供实时洞察。
    的头像 发表于 05-07 15:11 1130次阅读
    <b class='flag-5'>NVIDIA</b>将为每家<b class='flag-5'>AI</b>工厂提供网络<b class='flag-5'>安全</b>