0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTC 2023看点:深度学习系统Colossal-AI试图解决什么问题

西西 来源:GTC 2023直播 作者:GTC 2023直播 2023-03-23 16:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在GTC 2023 | NVIDIA开发者大会上,加州伯克利数学与计算机科学的教授向我们介绍了关于深度学习系统Colossal-AI的相关内容。

深度学习系统Colossal-AI使用户能够以大幅降低成本的方式最大限度地提高AI训练和推理的效率。它集成了高效的多维并行、异构内存管理、自适应任务调度等先进技术。

Colossal-AI将更好地了解大型模型训练和推理背后的并行性和内存优化技术,学习深度学习系统的实际应用(包括自然语言处理、计算机视觉、生物信息学等),并能够为未来的大型 AI 模型时代做出贡献。

Colossal-AI系统试图解决什么问题呢?

pYYBAGQcCh-AK0ObAAJWHKaquW4641.png

主流AI模型大小增长的图表,它显示了AI模型在短短几年内增长的速度,每18个月增长40倍,这超过了摩尔定律在其具盛时期的最佳表现。

小型和中型企业( SMEs )在尽可能地在采用它们,Colossal-Al系统在2026年时可以帮你节省的成本的估计训练175B参数GPT-3模型,利用所有这些硬件特性和变化,估计训练成本从300降至73000美元,约为41倍。

强调大规模并行是必不可少的,使用单个A 100 GPU训练具有540B参数的Pal M语言模型的时间和成本,需要300年并且花费920万美元。

随着新数据的不断出现,他们需要反复的新训练以避免像2019年的GPT-2一样无法识别COVID-19等概念。

训练完成之后,仅使用模型进行推理也是项挑战,因为模型的大小需要并行技术,单个服务器的内存可能无法容纳大模型。除了设备成本之外,还有人力成本支付需要解决所有这些问题的专家团队,这就限制了一些公司特别是无法承受这些团队的中小企业使用这些大型模型。

因此Colossal-AI的作用出现了:

对特定底层硬件架构进行优化,左侧(硬件层)可以是CPU、 GPU、TPU或FPGAl,右侧是你的用于AI模型编写的框架,如TensorFlow、 Py Torch或其他框架。Colossal-AI可以高效地将大模型部署到目标架构,实现底部显示的所有目标,最小化运行时间,最小化通信(移动数据)在当前架构是最昂贵的操作,最小化用户需要改动代码的数量,即重构。使模型能够动态地适应机器的规模变化,并减少内存占用,一边能运行大模型。

Colossal-AI提供了三个层次:

高效的内存系统,可最大程度利用可用内存。

多维并行,即如何最好地将复杂的模型映射到可用的硬件上,以最大程度地使并行处理并最小化通信。

大规模优化,也就是如何自动调整影响准确度收敛的众多超参数,因为这些值通常取决子如何进行并行处理。

因此Colossal-AI的目标是将复杂且相互作用的决策从用户角度隐藏起来,并自动完成所有操作。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4115

    浏览量

    99604
  • 深度学习
    +关注

    关注

    73

    文章

    5604

    浏览量

    124615
  • gtc
    gtc
    +关注

    关注

    0

    文章

    75

    浏览量

    4775
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA GTC 2026展示推动物理AI时代的虚拟世界

    NVIDIA GTC 大会标志着物理 AI 迎来了一个重要转折点:机器人、车辆和工厂正从单一的用例与孤立的部署,扩展为跨行业的复杂企业级工作负载。
    的头像 发表于 04-03 10:07 538次阅读

    【智能检测】基于AI深度学习与飞拍技术的影像测量系统:实现高效精准的全自动光学检测与智能制造数据闭环

    内容概要:文档内容介绍了中图仪器(Chotest)影像测量仪融合人工智能深度学习与飞拍技术的自动化检测解决方案。系统通过AI深度
    发表于 03-31 17:11

    达索系统于NVIDIA GTC 2026展示AI驱动的虚拟孪生

    达索系统继日前在面向设计和工程社区的年度盛会3DEXPERIENCE World上宣布与NVIDIA达成长期战略合作后,于3月16日至19日正式亮相在美国加利福尼亚州圣何塞举行的NVIDIA GTC 2026大会,全面展示双方携手打造工业
    的头像 发表于 03-26 12:48 342次阅读

    安森美重磅亮相NVIDIA GTC 2026

    在NVIDIA GTC 2026 上,AI 的演进路径愈发清晰:AI 不再仅仅存在于虚拟世界中,它正通过更敏锐的感知和更高的能源效率,深度接入物理世界。作为英伟达的合作伙伴,安森美(o
    的头像 发表于 03-19 15:16 597次阅读
    安森美重磅亮相NVIDIA <b class='flag-5'>GTC</b> 2026

    研华科技受邀亮相NVIDIA GTC 2026

    研华科技受邀亮相NVIDIA GTC 2026,展示与 NVIDIA 生态系的深度合作成果,通过整合硬件平台、软件框架与产业应用解决方案,加速 Physical AI 在各产业的应用落地。
    的头像 发表于 03-18 15:00 628次阅读

    益登科技携手生态伙伴亮相NVIDIA GTC 2026

    今年,益登科技是第三度参与NVIDIA GTC,这次以“From AI to Action: Physical AI in Motion”为主题,携手生态系伙伴展示AI运算平台、关键元
    的头像 发表于 03-17 17:04 904次阅读
    益登科技携手生态伙伴亮相NVIDIA <b class='flag-5'>GTC</b> 2026

    益登科技邀您相约NVIDIA GTC 2026

    益登科技(EDOM Technology)将于GTC展会中展示多项结合Physical AI与边缘运算的创新应用。随着NVIDIA Jetson Thor系列模块推出AI推理与控制架构得以整合于单一
    的头像 发表于 03-13 16:20 822次阅读

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    ,这对于构建私有知识库问答系统至关重要。 三、接口的深度解析:不止是“有”,更是“专业” 相比于普通PC,开发者更关注接口背后的协议与潜力。OrangePi AI Station的接口配置展现了其面向
    发表于 03-10 14:19

    融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件

    *附件:ai study.zip*附件:融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件.pdf 基于开源鸿蒙编写的ai
    发表于 11-12 15:38

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    、Transformer 模型的后继者 二、用创新方法实现深度学习AI芯片 1、基于开源RISC-V的AI加速器 RISC-V是一种开源、模块化的指令集架构(ISA)。优势如下: ①模
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    ,其中第一章是概论,主要介绍大模型浪潮下AI芯片的需求与挑战。第二章和第三章分别介绍实现深度学习AI芯片的创新方法和架构。以及一些新型的算法和思路。第四章是全面介绍半导体芯产业的前沿技
    发表于 09-05 15:10

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    1. 项目概述 本项目旨在开发并部署一个高精度的深度学习模型,用于自动鉴别一张图片是由AI生成(如Stable Diffusion, DALL-E, Midjourney等工具生成)还是真实的画家
    发表于 08-21 13:59

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    模态的技术特性,DeepSeek正加速推动AI在金融、政务、科研及网络智能化等关键领域的深度应用。 信而泰:AI推理引擎赋能网络智能诊断新范式信而泰深度整合DeepSeek-R1大模型
    发表于 07-16 15:29

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    在神经网络的计算中广泛应用,理解矩阵乘法、特征值和特征向量等概念有助于深入掌握深度学习模型的工作原理。 掌握编程语言,如Python和R。Python有丰富的AI库,如NumPy、Pandas用于数据处理
    发表于 07-08 17:44

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、管锴、张心雨。 大模型的普及是近三年来的一件大事,万物皆可大模型已成为趋势。作为大模型开发应用中重要组成部分,提示词
    发表于 05-02 09:26