还未设置个性签名
成为VIP会员 享9项特权: 开通会员

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

首届NVIDIA DPU中国黑客松圆满收官

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-06-27 14:44 次阅读

“我们酷爱黑客松,创新由代码实现。”

2022 年 4 月 17 日,首届 NVIDIA DPU 中国黑客松圆满收官。本次比赛有 4 只队伍脱颖而出,成为黑马,一举拿下大奖!由于疫情的缘故,他们的奖品刚刚到手,对此进行了展示和分享。

冠军:PDSL 团队

“能获得本次 NVIDIA DPU 黑客松大赛的一等奖我们非常开心。感谢赛方为我们提供这一机会,和众多优秀的人一起交流切磋,让我们学到了很多。我们团队从认识 DPU 起,便对它产生了浓厚的兴趣:DPU 就像 GPU 一样插在服务器的 PCIe 插槽上,它们允许服务器将网络和存储功能从 CPU 卸载到 DPU 上,从而使 CPU 专注于运行操作系统和系统应用程序。这一特性非常适合应用在新型的存算分离架构中,这也是我们参赛项目的出发点。最后,希望以后有更多的机会参与到相关竞赛和活动中。”

—— PDSL 队长杨豪迈

PDSL 团队比赛现场和他们的奖品

亚军:瑞奇网络团队 | Riccinet

“非常感谢 NVIDIA 组织的 DPU 中国黑客松,我们团队在一天一夜的紧张开发中通过 mentor 们的指导充分了解了 DPU 的硬件特性,而 DOCA 良好的可编程性让我们能够快速实现并验证我们的创新想法,希望 DPU 能早日在数据中心普及开来。”

—— 瑞奇网络队长贾成君

瑞奇网络团队比赛现场和他们的奖品

季军:奈文摩尔团队 | Nevermore

“很荣幸参加 NVIDIA DPU 中国黑客松首届竞赛,参加训练营对我们帮助很大,后续我们会继续密切关注 DPU 相关动态,并争取更多地将底层技术红利释放到企业产品中,提升效率与体验。”

—— 奈文摩尔队长丁国强

奈文摩尔团队比赛现场和他们的奖品

季军:焦糖味坚果团队 | Caramel Flavored Nuts

“感谢 NVIDIA 给了我们团队这次探索、研究 DPU 无限潜能的机会,我们在参与黑客松的过程中,不仅感受到了 DPU 的强大性能,还对 DPU 未来的前景充满期待。”

—— 焦糖味坚果队长詹晓宁

焦糖味坚果团队和他们的奖品

不断创新,砥砺前行,是每个黑客松爱好者的座右铭。本次比赛中,每个团队队员共同努力,发挥了黑客松竞赛创新和应用的价值,并帮助了开发者通过 NVIDIA DOCA 软件框架构建创新的数据中心加速应用程序。

DPU 中国黑客松竞赛是开发者学习并实践使用 DOCA 软件开发套件来开发 DPU 加速的数据中心基础设施应用程序难得的机会,能帮助开发者利用 DOCA 驱动、 DOCA 库和工具构建和优化 DPU 加速的应用程序开发。

创新由代码实现,青春在这里发光发热。看到这里的你,是否对下次黑客松竞赛充满了期待?截止目前,全球有 2000 多名 DOCA 早期开发者,其中一半来自中国 。本次竞赛也涌现出十分具有创意和价值的项目,欢迎更多的开发者加入我们,继续用创新创造价值。

原文标题:用 DOCA 创造价值 —— NVIDIA DPU 中国参赛队感言

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

  • cpu
    cpu
    +关注

    关注

    68

    文章

    7034

    浏览量

    196208
  • NVIDIA
    +关注

    关注

    14

    文章

    2705

    浏览量

    95801
  • DPU
    DPU
    +关注

    关注

    0

    文章

    122

    浏览量

    21593
收藏 人收藏

    评论

    相关推荐

    容器进程调度时是该优先考虑CPU资源还是内存资源

    当然实际中 k8s 的调度策略不是这么简单的,系统默认的 kube-scheduler 调度器外还有....
    的头像 冬至配饺子 发表于 08-16 18:20 98次 阅读

    记录在ubuntu上安装deepstream5.1的方法

    解压,将 TensorRT 库放到系统环境,然后安装 TensorRT python 接口。
    的头像 冬至配饺子 发表于 08-16 18:12 83次 阅读
    记录在ubuntu上安装deepstream5.1的方法

    NVIDIA GTC:黄仁勋将发布全新AI和元宇宙技术,大会将提供200多场由顶级技术专家和业务高管带来的会议、培训

    深度学习领域大咖 Yoshua Bengio 、 Geoff Hinton 和 Yann LeCun....
    发表于 08-16 16:31 42次 阅读
    NVIDIA GTC:黄仁勋将发布全新AI和元宇宙技术,大会将提供200多场由顶级技术专家和业务高管带来的会议、培训

    RT-Thread系统实战之在系统调试利器

    前言 得力于 msh 我们可以在 rt-thread 运行的时候执行一些内置命令,查看系统运行状态。 但是对于一个嵌入式开发工程师,有这...
    发表于 08-16 15:15 1024次 阅读

    导致微控制器中断延迟的原因

    RTOS 还需要暂时禁用可以调用 API 函数的中断。一些 RTOS 禁用所有中断,有效地恶化了所有....
    发表于 08-16 14:13 38次 阅读
    导致微控制器中断延迟的原因

    AVR32 MCU上的ABDAC外设音频播放设计

    ABDAC 可以连接到设备上的 DMA 控制器。在将数据从 RAM 中的缓冲区传输到 ABDAC 时....
    发表于 08-16 11:36 73次 阅读
    AVR32 MCU上的ABDAC外设音频播放设计

    通过RX MCU和CPU相结合提高电机控制效率

    RX600 内核具有符合 IEE-754 标准的单精度 32 位浮点单元。FPU 紧密连接到共享相同....
    发表于 08-16 10:41 48次 阅读
    通过RX MCU和CPU相结合提高电机控制效率

    8点PyTorch提速技巧总结

    CPU的话尽量看主频比较高的,缓存比较大的,核心数也是比较重要的参数。显卡尽可能选现存比较大的,这样....
    发表于 08-16 09:50 37次 阅读

    NVIDIA助力Telexistence在全家便利店部署补货机器人

    总部位于东京的初创企业 Telexistence 宣布将在日本数百家全家(FamilyMart)便利....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-16 09:26 106次 阅读

    NVIDIA BlueField-2 DPU为裸金属服务提供飞跃式性能提升

    UCloud 采用 NVIDIA BlueField-2 DPU 在公有云中提供裸金属服务,提供极致....
    的头像 NVIDIA英伟达 发表于 08-16 09:23 30次 阅读

    模型有助于实现最大的运营效率

      为了推动行动或结果,非结构化数据通过 DeepStream 等处理模型运行,从而产生结构化数据。....
    的头像 星星科技指导员 发表于 08-16 09:16 30次 阅读

    使用NVIDIA Modulus的Omniverse扩展可视化交互仿真

      NVIDIA Modulus 是一个物理机器学习平台,它将物理的力量与数据相结合,构建高保真、参....
    的头像 星星科技指导员 发表于 08-15 17:52 205次 阅读
    使用NVIDIA Modulus的Omniverse扩展可视化交互仿真

    边缘人工智能正在推动一个更安全、更智能的世界

      “有了 NVIDIA Fleet Command ,我们可以将我们的视觉应用程序从 POC 中的....
    的头像 星星科技指导员 发表于 08-15 17:35 243次 阅读

    使用加速WEKA加速机器学习模型

    最后,我们使用了 HIGGS 数据集 ,其中包含有关原子加速器运动学特性的数据。希格斯数据集的前 5....
    的头像 星星科技指导员 发表于 08-15 17:27 164次 阅读
    使用加速WEKA加速机器学习模型

    为NVIDIA MLPerf Training v2.0性能提供动力的全堆栈优化

      NVIDIA MLPerf v2.0 提交基于经验证的 A100 Tensor Core GPU....
    的头像 星星科技指导员 发表于 08-15 16:43 107次 阅读
    为NVIDIA MLPerf Training v2.0性能提供动力的全堆栈优化

    改进企业IT欺诈预防

      提供支持欺诈预防和人工智能驱动的企业解决方案的企业级 IT 基础设施也是一项挑战。正确的产品组合....
    的头像 星星科技指导员 发表于 08-15 16:38 105次 阅读
    改进企业IT欺诈预防

    使用NVIDIA Merlin库构建基于会话的建议

      推荐系统可以帮助您发现新产品并做出明智的决策。然而,在许多依赖于推荐的领域,如电子商务、新闻和流....
    的头像 星星科技指导员 发表于 08-15 16:33 152次 阅读
    使用NVIDIA Merlin库构建基于会话的建议

    通过GPU内存访问调整提高应用程序性能

    在本文的所有代码示例中,大写变量都是编译时常量。 BLOCKDIMX 采用预定义变量 blockDi....
    的头像 星星科技指导员 发表于 08-15 16:24 100次 阅读

    MCU如何实现高效BLDC电机控制

    带传感器的 PMSM(FOC、正弦调制、三个分流电阻器):PMS(永磁同步)电机的结构类似于 BLD....
    发表于 08-15 16:12 66次 阅读
    MCU如何实现高效BLDC电机控制

    通过NVIDIA Spectrum Ethernet的自适应路由加速网络

      将此技术与 NVIDIA ConnectX NIC 提供的 RoCE 无序支持相结合,应用程序对....
    的头像 星星科技指导员 发表于 08-15 16:00 68次 阅读
    通过NVIDIA Spectrum Ethernet的自适应路由加速网络

    使用Omniverse Replicator构建自定义合成数据生成管道

      在 NVIDIA, ISAAC Sim DRIVE Sim 团队利用 Omniverse Rep....
    的头像 星星科技指导员 发表于 08-15 15:53 40次 阅读
    使用Omniverse Replicator构建自定义合成数据生成管道

    加速计算是药物研发大众化的关键

      今天, GPU 正在加速计算机辅助药物发现工作流程的每一步,从目标阐明到 FDA 批准,在所有方....
    的头像 星星科技指导员 发表于 08-15 15:47 39次 阅读

    RL78/G13系列MCU中可用的低功耗模式解析

    在使功耗尽可能低的 STOP 模式下,高速系统时钟振荡器和内部高速振荡器被禁用,从而停止整个系统。3....
    发表于 08-15 15:44 58次 阅读
    RL78/G13系列MCU中可用的低功耗模式解析

    如何在基于Arm的设备上运行游戏AI呢

    在本系列的第 2 部分中,我们展示了游戏 AI 代理是如何设计的。我们还展示了为 Dr Arm 的 Boss Battle 演示生成的神经网络...
    发表于 08-15 15:43 605次 阅读

    汽车领域嵌入式微控制器 (MCU) 的解决方案

    存储器直接存储器访问控制器(MDMA)和外围直接存储器访问控制器(PDCA)控制器可以分别在存储器位....
    发表于 08-15 15:35 118次 阅读
    汽车领域嵌入式微控制器 (MCU) 的解决方案

    使用NVIDIA Flare 2.1测试新型分布式应用程序

    NVIDIA FLARE v2.1 提供了一套强大的工具,使研究人员或开发人员能够将联合学习概念引入....
    的头像 星星科技指导员 发表于 08-15 15:27 56次 阅读
    使用NVIDIA Flare 2.1测试新型分布式应用程序

    使用NetDevOps实现网络现代化

      本系列介绍了优化数据中心网络的方法。第一种方法是通过 网络体系结构协议的现代化 。第二篇文章侧重....
    的头像 星星科技指导员 发表于 08-15 14:56 51次 阅读

    AI正在改变企业管理边缘应用程序的方式

      为了帮助企业快速起步,我们创建了 NVIDIA LaunchPad ,这是一个免费的程序,提供对....
    发表于 08-15 14:52 73次 阅读
    AI正在改变企业管理边缘应用程序的方式

    基于Arria 10 SoC的控制模块设计和开发注意事项

      具有硬化浮点 DSP 模块的 FPGA 在中端 Arria 10 构建模块中提供 160 到 1....
    的头像 星星科技指导员 发表于 08-15 11:34 118次 阅读

    基于Arria 10 SoC的控制模块设计和开发事项

      各种考虑因素在设计过程中发挥了特殊作用:指定 FPGA 的 I/O 接口、识别不同的时钟域、定义....
    发表于 08-15 11:23 37次 阅读

    OB FC FB块如何使用

    在学习和使用博途软件时常常使用到OB FC FB块那么这样块如何使用,今天就给大家带来FC块的使用,....
    的头像 工控论坛 发表于 08-15 10:44 100次 阅读

    RTOS调试中的优先级倒置

      通常,尽可能避免阻塞共享资源。例如,如果您的任务将数据写入消息队列(可能已满),您可以改为使用足....
    发表于 08-15 10:43 19次 阅读
    RTOS调试中的优先级倒置

    CXL 3.0面世,服务器开放互联标准之争落下帷幕

    电子发烧友网报道(文/周凯扬)从这几年发布的服务器硬件来看,无论是CPU、GPU还是新兴的DPU,大....
    的头像 E4Life 发表于 08-15 07:26 728次 阅读
    CXL 3.0面世,服务器开放互联标准之争落下帷幕

    大禹智芯正式加入欧拉开源社区 共同探索行业发展新模式

    近日,北京大禹智芯科技有限公司(以下简称“大禹智芯”)签署 CLA(Contributor Lice....
    的头像 openEuler 发表于 08-14 15:10 142次 阅读

    海光信息成功登陆科创板 收入增速高达247.60%

    海光信息原募资91.48亿元,实际募资却超108亿元,用于新一代海光通用处理器、协处理器研发项目等。
    的头像 电子发烧友网 发表于 08-14 14:53 270次 阅读

    Linux环境下的应急响应流程

    Linux环境下处理应急响应事件往往会更加的棘手,因为相比于Windows,Linux没有像Auto....
    发表于 08-14 11:45 41次 阅读

    NVIDIA Isaac ROS GEM的功能特性

    NVIDIA Isaac ROS GEM 是一款基于硬件加速的软件包,可以让 ROS 开发者更轻松地....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 11:12 137次 阅读

    3D设计协作和世界仿真平台NVIDIA Omniverse的更新内容

    在全球最大的计算机图形盛会 SIGGRAPH 上,NVIDIA 宣布要为使用实时 3D 设计协作和世....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 11:00 220次 阅读

    通过NVIDIA DeepSearch工具提升天空制作效果

    知名工作室利用 Omniverse AI 助力的搜索工具筛选庞大的 3D 场景数据库。
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 11:00 177次 阅读

    NVIDIA发布NeuralVDB 可将内存占用量减少高达100倍

    NeuralVDB 可将烟雾、云和其他稀疏体积数据的内存占用量减少多达 100 倍。
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 10:58 246次 阅读

    NVIDIA将全面开源材质定义语言(MDL)

    NVIDIA 在 SIGGRAPH 2022 大会上宣布,为了进一步扩大 MDL 生态系统,将全面开....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 10:51 131次 阅读

    使用NVIDIA Omniverse开展数字孪生教学

    Donald Greenberg 在康奈尔大学的办公室里度过了 54 年的计算职业生涯,他在这间办公....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 10:51 129次 阅读

    NVIDIA通过Vid2Vid Cameo演示表演捕捉技术

    Derivative、Notch 和 Pixotope 等公司使用 NVIDIA Vid2Vid C....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 10:49 176次 阅读

    NVIDIA CloudXR赋能全云端实时渲染解决方案

    根号叁•企业空间号是企业对外三维展示的全新载体。根号叁自主搭建的商业元宇宙平台 Starverse,....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-14 10:46 143次 阅读

    量子处理单元(QPU)的定义及工作原理

    量子处理单元(QPU)是量子计算机的“大脑”。它利用电子或光子等粒子的行为来进行特定类型的计算,其速....
    发表于 08-14 10:33 51次 阅读

    NVIDIA Studio技术如何加速创意工作流

    编辑注:本文是 NVIDIA Studio 创意加速系列的一部分,该系列旨在介绍一些特邀艺术家、提供....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:21 168次 阅读

    NVIDIA SIGGRAPH的最新发布与重要更新

    在今年的 SIGGRAPH 2022 上,NVIDIA 宣布,为基于通用场景描述(USD)连接和构建....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:14 130次 阅读

    NVIDIA谈引发图形革命的三大驱动力

    AI、虚拟世界和数字人正在推动视觉设计进入更宽广的轨道。
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:12 146次 阅读

    NVIDIA Instant NeRF赢得SIGGRAPH最佳论文

    世界各地的开发者和创作者下载了来自 NVIDIA Research 的最新代码,以使用 2D 图像创....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:10 178次 阅读

    全新NVIDIA神经图形SDK助力3D内容创建

    新发布的 NeuralVDB 和 Kaolin Wisp 等十几款工具和程序使数百万设计师和创作者能....
    的头像 NVIDIA英伟达企业解决方案 发表于 08-12 11:07 144次 阅读

    分析ARM cortex-A7大小核切换的代码

    8核CPU或者是更多核的处理器,这些CPU有可能不完全对称。有的是4个A15和4个A7,或者是4个A57和4个A53,甚至像海思麒麟...
    发表于 08-11 15:36 1587次 阅读

    请教一下大神stm32f4 fpu与cpu可以同时工作吗?

    请教一下大神stm32f4 fpu与cpu可以同时工作吗? ...
    发表于 08-05 14:09 1318次 阅读

    如何去获取Arm Spinlock的公平性呢

    根据不同的arm CPU构架,可以用不同的方式来实现spinlock. 基于load-exclusive/store-exclusive(也是load linked, store co...
    发表于 08-04 14:46 1472次 阅读

    ARM CPU集成了BIOS了吗

    ARM CPU集成了BIOS了吗?reboot 又是什么意思?它包含BIOS自检程式吗?! ...
    发表于 08-03 14:20 1470次 阅读

    一文搞懂C++多线程rknn_ssd例程

    1、C++多线程rknn_ssd例程简析 本例程修改自rk官方提供的rknn_sdd.cpp,处理的数据流来自usb-camera,帧率在25fps 添加本地视...
    发表于 08-01 17:53 2955次 阅读

    RK3399扫描不到wifi信号的原因可能有哪些呢

    请教下wifi调试问题,开启wifi后使用wpa_cli工具scan提示CTRL-EVENT-NETWORK-NOT-FOUND,扫描不到任何w...
    发表于 08-01 16:28 2465次 阅读

    介绍一款ARM指令集仿真工具fastmodel

    arm公司,有一款arm指令集仿真工具,名叫fastmodel。该model,可以用来仿真arm的程序,并且打印程序的执行流。不过该工具是收费的...
    发表于 08-01 14:37 1127次 阅读

    如何可靠识别ARM SOC内所使用的ARM CPU内核IP型号呢

    请问下:对市面上的ARM SOC芯片,如何可靠识别ARM SOC内所使用的ARM CPU内核IP型号? 1、对市面上的ARM...
    发表于 08-01 14:14 1589次 阅读

    TMS320VC5501 定点数字信号处理器

    TMS320VC5501(5501)定点数字信号处理器(DSP)基于TMS320C55x™DSP生成CPU处理器内核。 C55x™DSP架构通过增加并行性和全面关注降低功耗来实现高性能和低功耗。 CPU支持内部总线结构,该结构由一个程序总线,三个数据读总线,两个数据写总线以及专用于外设和DMA活动的附加总线组成。这些总线能够在一个周期内执行最多三次数据读取和两次数据写入。并行,DMA控制器可以独立于CPU活动执行数据传输。 C55x™CPU提供两个乘法累加(MAC)单元,每个单元能够进行17位×17位乘法运算。单循环。额外的16位ALU支持中央40位算术/逻辑单元(ALU)。 ALU的使用受指令集控制,提供优化并行活动和功耗的能力。这些资源在C55x CPU的地址单元(AU)和数据单元(DU)中进行管理。 C55x DSP代支持可变字节宽度指令集,以提高代码密度。指令单元(IU)从内部或外部存储器执行32位程序提取,并为程序单元(PU)排队指令。程序单元解码指令,将任务指向AU和DU资源,并管理完全受保护的管道。预测分支功能可避免执行条件指令时的管道刷新。 5501外设...
    发表于 10-09 14:55 542次 阅读
    TMS320VC5501 定点数字信号处理器