0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA深度学习加速数据科学教材套满足教学需求

星星科技指导员 来源:NVIDIAn 作者:Joe Bungo 2022-04-20 14:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 深度学习培训中心( DLI )发布了加速数据科学教材套,该研究所与佐治亚理工学院的 Polo Chau 教授和 Prairie View A & M 大学的董锡双教授共同开发。

综合教材涵盖数据收集和预处理、加速数据科学 RAPIDS、可扩展和分布式计算 GPU – 加速机器学习、数据可视化和图形分析等基础和高级主题,并满足了高等教育和研究机构对学生教授数据科学技能的日益增长的需求。

加速数据科学教学包包括以下重点模块:

数据科学与技术导论 RAPIDS

数据收集和预处理( ETL )

数据集中的数据伦理和偏见

数据集成和分析

数据可视化

使用 Hadoop 、 Hive 、 Spark 、 HBase 和 RAPIDS 的可扩展计算

基于 Dask 和 UCX 的可扩展计算

机器学习:分类

机器学习:聚类和降维

神经网络

图形分析

流数据

基因组学

文本分析

CPU vs GPU – 加速数据科学

数据科学团队、代码备份和版本控制

团队项目(假新闻检测)

该工具包还涵盖了公平性和数据偏见等文化敏感话题,以及来自代表性不足群体的挑战和重要人物。

讲座幻灯片和讲稿、动手实验室、 Jupyter 笔记本、解决方案(以私人回购形式持有)、样本数据集、测验/考试问题/答案、 GPU 通过免费 AWS 云学分提供的计算资源,以及免费 DLI 在线课程/证书都包括在内。讲座视频计划在下一版本中发布。

RAPIDS 数据科学框架是 GPU 加速的库集合,用于在 GPU 上完全执行端到端数据科学管道。使用 RAPIDS 的主要目标是加速典型数据科学工作流的各个部分,从而加速数据准备和机器学习中完整的端到端工作流。

第一个基于 Jupyter 笔记本电脑的实验室之一让学生使用 pandas 和 cuDF 直接进入 RAPIDS 。 pandas 是一个建立在 Python 编程语言之上的数据分析和操作工具,用于执行各种任务(例如:加载、加入、聚合、, cuDF 是一个基于 RAPIDS 的 GPU 数据帧库,有助于通过 GPU 加速执行类似功能。

学生们首先要理解如何在 cuDF 中创建数据帧对象,为这些对象分配值,然后调用方法并对值应用用户定义的函数。一旦学生掌握了如何使用 cuDF 数据帧,他们的任务就是从 Kaggle 的Netflix 电影数据集中创建一个数据帧。

poYBAGJfrPGAKvyEAAE-Gy9Cf2I069.png

图 1 。教学包模块 1 的快照: RAPIDS 实验室简介。

从那里,学生们学习如何操作和查询数据,从删除缺失的列和值、查询和查找唯一值,到对数据进行排序、计数和分组。学生将感受到使用 RAPIDS 和 GPU 与教学包中也包含的传统方法相比是多么快速和简单。作为实验室的一项额外任务,最后要求学生使用 cuDF 一个热编码将数据集的电影和电视节目标题转换为 0 和 1 的向量,以提高分析数据的准确性。

周教授说:“数据科学揭示了数据在解决社会挑战和大规模复杂问题方面的巨大潜力,几乎涵盖了商业、技术、科学、工程、医疗保健、政府等各个领域。”随着数据在数量、速度和复杂性方面的不断增长,对数据科学人才和技能的需求不断增加,以帮助设计最佳解决方案。”

关于作者

Joe Bungo 是 NVIDIA 的深度学习培训中心( DLI )项目经理,在那里他能够在大学中使用深度学习和 GPU 加速计算技术,包括课程和教材开发、 DLI 大学大使/讲师认证、促进学术生态系统和实践研讨会。此前,他在 ARM 公司管理大学项目,并担任应用工程师。乔获得了得克萨斯大学奥斯汀分校计算机科学学位。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5683

    浏览量

    110111
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5268

    浏览量

    136058
  • 深度学习
    +关注

    关注

    73

    文章

    5604

    浏览量

    124615
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA DLI推出全新OpenUSD教学套件

    GTC 期间,NVIDIA 深度学习培训中心(DLI)推出了面向教育工作者的全新 OpenUSD 教学套件,持续为高校提供体系化 AI 教学
    的头像 发表于 04-16 11:42 369次阅读

    Oracle和NVIDIA合作加速向量搜索和企业数据处理

    Oracle 和 NVIDIA 正在与客户合作,将 GPU 加速的向量索引构建应用于实际工作负载。Oracle Private AI Services Container 初期支持 CPU 执行,现
    的头像 发表于 03-23 15:26 419次阅读

    NVIDIA携手微软加速机器人和物理AI的发展

    在 GTC 大会上,微软宣布了其代理式和物理 AI 系统统一平台的更新,加速从实验到生产落地的进程。将 Microsoft Foundry 与 NVIDIA 开放模型和加速计算相结合,创建了统一的软件栈,在
    的头像 发表于 03-23 15:21 945次阅读

    生命科学领先企业采用 NVIDIA BioNeMo 平台加速 AI 驱动的药物研发

    新闻摘要: l 礼来与 NVIDIA 宣布成立 AI 联合创新实验室以应对药物研发挑战。 l NVIDIA 携手赛默飞打造自主实验室基础设施,加速可规模化的科学发现。 l Chai
    的头像 发表于 01-14 11:40 656次阅读
    生命<b class='flag-5'>科学</b>领先企业采用 <b class='flag-5'>NVIDIA</b> BioNeMo 平台<b class='flag-5'>加速</b> AI 驱动的药物研发

    机器学习深度学习中需避免的 7 个常见错误与局限性

    ,并验证输出结果,就能不断提升专业技能,养成优秀数据科学家的工作习惯。需避免的机器学习深度学习数据
    的头像 发表于 01-07 15:37 345次阅读
    机器<b class='flag-5'>学习</b>和<b class='flag-5'>深度</b><b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    、GPU加速训练(可选) 双轨教学:传统视觉算法+深度学习方案全覆盖 轻量化部署:8.6M超轻OCR模型,适合嵌入式设备集成 无监督学习:无
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课程(11大系列课程,共5000+分钟)

    、GPU加速训练(可选) 双轨教学:传统视觉算法+深度学习方案全覆盖 轻量化部署:8.6M超轻OCR模型,适合嵌入式设备集成 无监督学习:无
    发表于 12-03 13:50

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVID
    的头像 发表于 12-01 09:25 1412次阅读

    面向科学仿真的开放模型系列NVIDIA Apollo正式发布

    用于加速工业和计算工程的开放模型系列 NVIDIA Apollo 于近日举行的 SC25 大会上正式发布。
    的头像 发表于 11-25 11:15 7.4w次阅读

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保护科学

    从中获得有意义的信息。而这正是深度学习改变游戏规则的地方。 深度学习模型和人工智能加速硬件释放了PAM真正的可扩展潜力,使
    发表于 10-27 09:18

    NVIDIA AI助力科学研究领域持续突破

    随着 AI 技术的广泛应用,AI 正在成为科学研究的引擎。NVIDIA 作为重要的技术推手,持续驱动着 AI 系统解锁更多领域的科学突破。
    的头像 发表于 08-05 16:30 1316次阅读

    广凌智慧教室场景应用:适配多元教学需求的定制化配置解析

    在教育信息化2.0时代,智慧教室的建设已从单一功能升级转向场景化、个性化、生态化的深度融合。广凌科技基于多年技术积累与实践验证,提出覆盖“常态化教学、研讨协作、精品录播、远程互动”等场景的定制化解决方案,通过“硬件+平台+数据
    的头像 发表于 07-18 10:00 644次阅读
    广凌智慧教室场景应用:适配多元<b class='flag-5'>教学</b><b class='flag-5'>需求</b>的定制化配置解析

    NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isaac Lab 的更新,以
    的头像 发表于 05-28 10:06 2375次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展。NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 AI 应用的发展。
    的头像 发表于 05-27 14:03 1217次阅读

    NVIDIA NVLink 深度解析

    了现代计算工作负载日益增长的需求。与通用性 PCIe 相比,NVLink 专为满足高性能计算和人工智能领域中紧密耦合的 GPU 所需的大规模数据交换而设计。这项技术对于充分发挥百亿亿次级计算的潜力以及
    的头像 发表于 05-06 18:14 5725次阅读