0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开发者活动 | 2023 NVIDIA & 创乐博 CUDA 线上训练营火热报名中

NVIDIA英伟达企业解决方案 来源:未知 2023-07-13 21:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 作为一家全栈式 AI 计算平台的赋能者,致力于推动全球性的人工智能和科学计算的发展,通过推广高性能技术应用为社会发展做出积极贡献。尤其在国内高等教育领域,十多年来 NVIDIA 一直努力为众多高校提供培养下一代加速计算技术人才的 CUDA 教学相关资源。CUDA 编程技术人员现在已经成为业界在高性能计算及 AI 开发及应用领域内的主流技术支撑。

为了能够让与加速计算相关的高校学生能够及时了解最新的 CUDA 编程技术的发展与变化,我们发起了 CUDA 线上训练营公益活动,以增加学生学习及体验最新技术的机会,同时拉近教学与市场应用的距离。几年来的活动实施效果得到了业界的肯定与认可,CUDA 线上训练营的教材被应用到了高校的教材里面,甚至被采纳作为教学实验课。

2023 NVIDIA &创乐博 CUDA 线上训练营由 NVIDIA 发起,由创乐博冠名赞助,旨在帮助初学者学习如何在 GPU 上快速加速代码,掌握 CUDA 编程的基本概念和技能。

NVIDIA 工程师将通过为期 5 天的时间,系统性地介绍 ARM 嵌入式平台的特色,以及在该平台上如何实现 CUDA 并行加速计算。通过四大模块的学习,并搭配丰富的线上实验环节,让学生们掌握基于Arm 的 Jetson 开发环境和 GPU 异构计算原理,了解 CUDA 编程模型,包括线程组织和 CUDA 存储单元,以及如何利用共享存储单元优化应用等。每次课程介绍完,会提供相应的编程实例,让学生在实际操作中理解概念。

训练营的最终目标是帮助学习者建立对 GPU 编程的信心,为此,还将建立专门的 CUDA 学习线上微信群。邀请 CUDA 编程专家在线回答同学们的问题,辅导同学们进行线上实验。

高效学习 GPU 编程

职业生涯快人一步!

aa05753c-217e-11ee-962d-dac502259ad0.png  

报名须知

报名时间:日起– 7月23日

训练营时间:7月24日– 7月28日

线上结业考试时间:7月29日09:00 AM – 12:00 AM

报名链接:识别海报二维码或点击阅读原文。

报名后请添加微信号【社区助教】:gpusupport,确认报名费缴纳事宜;同时助教会拉您进入相应的微信群。

aa1dc10a-217e-11ee-962d-dac502259ad0.jpg

aa05753c-217e-11ee-962d-dac502259ad0.png  

招生要求

本课程需要学员具备一定的 C/C++ 程序设计基础。

收费班:

主办方提供 Jetson 云平台,参加者无需准备开发环境,只需要通过自己普通电脑的浏览器远程访问 Jetson 计算平台进行学习。为了确保学习效果,将对每位参加者收取 100 元的报名费。完成了每日的学习打卡任务,将原路退回 100 元。

此班级只针对在校学生。

人数限制 100 名。

旁听班:自己准备 GPU 电脑,自行安装 CUDA 环境。

此班级面向所有开发者

人数无上限。

两个班级都会安排上机考试,通过考试,可以获得结业证书。

aa05753c-217e-11ee-962d-dac502259ad0.png  

课程亮点

介绍高性能计算基础编程模型 CUDA 的基本编程原理。在结合 Arm CPU 和 GPU 的实验平台上完成动手实践。内容和应用相结合,将介绍如何利用 CUDA 完成光影渲染、信号处理、深度学习的网络搭建等热门案例。6次实验课, 几千行实验代码, 让学生在动手实验的过程中了解GPU加速的原理和方法。完成课程结业测试,NVIDIA 企业开发者社区将颁发结业证书纪念徽章aa05753c-217e-11ee-962d-dac502259ad0.png  

指导老师

aa6e917a-217e-11ee-962d-dac502259ad0.jpg

何琨(Ken He)

NVIDIA 企业级开发者社区高级经理,拥有多年的 GPU 和人工智能开发经验。自 2017 年加入 NVIDIA 开发者社区以来,完成过上百场培训,帮助上万个开发者了解人工智能和 GPU 编程开发。在计算机视觉,高性能计算领域完成过多个独立项目。并且,在机器人无人机领域,有过丰富的研发经验。对于图像识别,目标的检测与跟踪完成过多种解决方案。曾经参与 GPU 版气象模式 GRAPES,是其主要研发者。

aa9ae5b8-217e-11ee-962d-dac502259ad0.jpg

李奕澎

NVIDIA 企业开发者社区经理,拥有 4 年数据分析建模开发经验,3 年人工智能自然语言处理开发经验。在自动语音识别、自然语言处理、自然语言理解等技术有着丰富的实战经验与见解。

aa05753c-217e-11ee-962d-dac502259ad0.png  

训练营日程安排

aac3f2fa-217e-11ee-962d-dac502259ad0.png

Day1 - 7月24日

910 开营

NVIDIAGPU 应用市场总监侯宇涛致辞

创乐博 介绍

1.Jetson 开发环境介绍,Linux 系统简介(1.1 理论课+实验课)

介绍实验平台,介绍 Linux 编译的基本技巧,介绍基本的开发环境

实验课Makefile 文件编写规范


2. GPU 架构及异构计算

绍 GPU 架构以及异构计算的基本原理

介绍 GPU 硬件平台

介绍基于 Jetson的嵌入式平台 GPU 架构和编程模型之间的关系

最新的 GPU 应用领域,GPU 在现代计算机科学中的通用性


3. CUDA 编程模型 — 初识 CUDA

CUDA 程序的编译

GPU 线程的调用

GPU和 CPU 的通讯

使用多个线程的核函数

使用线程索引

多维网络

网格与线程块

利用 NVProf 查看程序执行情况

实验课内容:编写程序 HelloCUDA,并且利用 NVCC 编译。编写 VectorAdd 多线程程序,和多维网络线程程序,并用 nvprof 来测试不同设置情况下运行速度。

aac3f2fa-217e-11ee-962d-dac502259ad0.png

Day2- 7月25日

930(1100 午休)

4. CUDA 编程模型 — CUDA 存储单元的使用与错误检测

设备初始化

GPU 的存储单元

GPU 存储单元的分配与释放

数据的传输

数据与线程之间的对应关系

CUDA 应用程序运行时的错误检测

CUDA 中的事件

利用事件进行计时

实验课内容:编写 MatrixMul 程序,体验线程和数据的对应关系

留课后作业


5. 多种 CUDA 储存单元详解

CUDA 中的存储单元种类

CUDA 中的各种存储单元的使用方法

CUDA中的各种存储单元的适用条件


6. 利用共享存储单元优化应用

共享存储单元详解

共享内存的 Bankconflict

利用共享存储单元进行矩阵转置和矩阵乘积

实验课内容:编写 Shared Memory 优化过的矩阵乘法

介绍 sharedmemory 原理,介绍利用 sharedmemory优化的多种案例

矩阵转置

aac3f2fa-217e-11ee-962d-dac502259ad0.png

Day3- 7月26日

930(1100 午休)

7. CUDA 编程模型 — 原子操作

CUDA 中的原子操作

原子操作的适用场景

利用原子操作优化程序

规越算法的实验


8. 基于 ARM 平台的 Jetson Nano存储单元调用

基于 ARM 平台的 Jetson Nano 的存储单元特点

统一内存的基本概念

如何更有效的利用 Jetson 的存储单元

实验课内容:编写 MatrixMul 程序,体验统一内存的使用方法

介绍基于 Jetson 平台的共享存储单元的特点,介绍 Jetson 平台 SoC DRAM memory 的应用

ab0aed86-217e-11ee-962d-dac502259ad0.png

Day4- 7月27日

930(1100 午休)

9. CUDAstream

CUDA 流的基本概念

默认流与非默认流

利用 CUDA 流重叠计算和数据传输

实验课内容:体验利用流来减少运行时间

介绍 CUDAstream,介绍利用 stream 分割处理的加速方案,介绍利用 stream 处理超大数据的加速方案


10. CUDA 加速库介绍:Thrust,cuBLAS,cuFFT,CV-CUDA

cuBLAS 介绍

cuFFT 介绍

Thrust 介绍

CV-CUDA 介绍

完成多种库(开源项目)的实例应用


ab0aed86-217e-11ee-962d-dac502259ad0.png

Day5 - 7月28日:线上答疑

ab0aed86-217e-11ee-962d-dac502259ad0.png

Day6 - 7月29日:线上课程结业考试

ab499022-217e-11ee-962d-dac502259ad0.png  

关于考核

1. 完成所有的理论和上机实验,并完成小程序打卡。

2. 完成课后线上答题。

3. 所有课程结束后完成三个考题,每个考题为完成一段程序,由易到难。

三组都完成的视为合格

考试时间:7月29日 09:00 Am—12:00 Am

aa05753c-217e-11ee-962d-dac502259ad0.png  

教材资源

训练营教材:CUDA ON ARM PLATFORM训练营》自编教材

参考书目:樊哲勇《 CUDA 编程:基础与实践》清华大学出版社出版时间:2020-10-01

NVIDIA 官方文档:CUDA C++ Best Practices Guide

(https://docs.nvidia.com/cuda/cuda-c-best-practices-guide/index.html#abstract)

NVIDIA 官方文档:CUDA Programming Guide(https://docs.nvidia.com/cuda/#programming-guides)

立即扫描下方二维码报名,学生报名仅限 100 席,先到先得!

ab87e9da-217e-11ee-962d-dac502259ad0.png


原文标题:开发者活动 | 2023 NVIDIA & 创乐博 CUDA 线上训练营火热报名中

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4115

    浏览量

    99612

原文标题:开发者活动 | 2023 NVIDIA & 创乐博 CUDA 线上训练营火热报名中

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    借助NVIDIA CUDA Tile IR后端推进OpenAI Triton的GPU编程

    NVIDIA CUDA Tile 是基于 GPU 的编程模型,其设计目标是为 NVIDIA Tensor Cores 提供可移植性,从而释放 GPU 的极限性能。CUDA Tile 的
    的头像 发表于 02-10 10:31 517次阅读

    如何在NVIDIA CUDA Tile编写高性能矩阵乘法

    文是系列课程的一部分,旨在帮助开发者学习 NVIDIA CUDA Tile 编程,掌握构建高性能 GPU 内核的方法,并以矩阵乘法作为核心示例。
    的头像 发表于 01-22 16:43 5280次阅读
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile<b class='flag-5'>中</b>编写高性能矩阵乘法

    「开源旅行团,中奖名单揭晓!」RT-Thread 20 周年暨开发者大会火热报名

    “RT-Thread二十周年庆典暨开发者大会”定档2026年1月17日于上海临港举办的消息发布以来吸引了各界朋友的关注与支持,伴随「开源旅行团,组队报名赢大奖」活动的启动,我们已经收到了无数热情
    的头像 发表于 01-05 19:59 388次阅读
    「开源旅行团,中奖名单揭晓!」RT-Thread 20 周年暨<b class='flag-5'>开发者</b>大会<b class='flag-5'>火热</b><b class='flag-5'>报名</b><b class='flag-5'>中</b>

    2025华为开发者大赛暨开发者年度会议成功举办

    开发者大赛总决赛、CEO圆桌、主论坛大咖分享、分论坛技术演讲、开发者展区&amp;CodeLabs等多元议题,推动云开发工具链、智能体开发
    的头像 发表于 12-31 13:32 1015次阅读

    NVIDIA CUDA Tile的创新之处、工作原理以及使用方法

    Tile-based 并行编程的虚拟指令集,使开发者能够在更高层级编写算法,而无需关心底层专用硬件(如 Tensor Cores)的复杂细节。
    的头像 发表于 12-24 10:17 642次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile的创新之处、工作原理以及使用方法

    在Python借助NVIDIA CUDA Tile简化GPU编程

    兼容未来的 GPU 架构。借助 NVIDIA cuTile Python,开发者可以直接用 Python 编写 tile kernels。
    的头像 发表于 12-13 10:12 1418次阅读
    在Python<b class='flag-5'>中</b>借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile简化GPU编程

    2025鑫科技全球开发者大会圆满落幕

    2025 年 11 月 25–26 日,第四届鑫全球开发者大会圆满落幕。两天时间里,围绕 “从云到端的智能创新”,鑫科技 (688018.SH) 携手全球生态伙伴,在线上
    的头像 发表于 12-05 10:35 1069次阅读

    2025 NVIDIA中国开发者日圆满落幕

    11 月 14 日,NVIDIA 中国开发者日 2025 在苏州圆满落幕。这场专为开发者打造的年度科技盛会,汇聚了来自全国的 AI 科研人员、工程师、高校学生及科技爱好,共同探索 A
    的头像 发表于 11-19 16:43 1164次阅读

    【开源FPGA硬件】硬件黑客集结:开源FPGA开发板测评活动全网火热招募......

    布以来,得到了众多开发者的关注,涉及工业、通信、车载等多个行业的100+位工程师报名参与设计,并分为:硬件组、FPGA组、Linux组。 其中硬件组率先开始启动项目,经过和所有报名硬件组的工程师沟通,最终
    发表于 10-29 11:37

    NVIDIA DRIVE AGX Thor开发者套件重磅发布

    这款由 NVIDIA DriveOS 7 驱动的开发者套件能够帮助开发者们打造出更安全的智能汽车和交通解决方案。
    的头像 发表于 09-04 11:20 1593次阅读

    的K230烧录固件失败,怎么解决啊?

    的K230烧录固件失败
    发表于 08-13 07:58

    迅龙软件参加昇腾 AI 开发者享日・广东站,为开发者打造沉浸式实操体验

    7月18日,线下顶尖人才汇聚的开发者盛会——昇腾AI开发者享日・广东站在广州举行。活动以“未来享非凡”为主题,聚焦广东本地产业特点,分享
    的头像 发表于 07-23 17:18 1423次阅读
    迅龙软件参加昇腾 AI <b class='flag-5'>开发者</b><b class='flag-5'>创</b>享日・广东站,为<b class='flag-5'>开发者</b>打造沉浸式实操体验

    OpenHarmony2025年度竞赛训练营重磅开启

    ,吸引更多的高校师生参与到OpenHarmony的开发和应用。本次OpenHarmony竞赛训练营聚焦OpenHarmony固定赛题和开放型OpenHarmony颁奖时间: 9月下旬(联动2025
    的头像 发表于 07-16 11:51 1050次阅读

    NVIDIA Isaac Sim和Isaac Lab现已推出早期开发者预览版

    NVIDIA 发布了机器人仿真参考应用 Isaac Sim 和机器人学习框架 Isaac Lab 的开发者预览版。开发者现在可以通过 GitHub 访问早期版本,抢先体验先进功能,用于在基于物理的仿真环境
    的头像 发表于 07-04 14:23 2027次阅读

    鸿利智汇AI赋能多维提升训练营活动圆满落幕

    近日,鸿利智汇“AI赋能・多维提升”训练营在广州总部园区举行。本次活动以“强化商务素养,赋能数字技能”为核心,通过四大精品课程的系统教学,吸引了集团及分子公司员工线上线下近150人参与,有效提升了员工综合能力,为企业高质量发展注
    的头像 发表于 05-27 18:00 1058次阅读