0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTC 2023看点:深度学习系统Colossal-AI试图解决什么问题

西西 来源:GTC 2023直播 作者:GTC 2023直播 2023-03-23 16:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在GTC 2023 | NVIDIA开发者大会上,加州伯克利数学与计算机科学的教授向我们介绍了关于深度学习系统Colossal-AI的相关内容。

深度学习系统Colossal-AI使用户能够以大幅降低成本的方式最大限度地提高AI训练和推理的效率。它集成了高效的多维并行、异构内存管理、自适应任务调度等先进技术。

Colossal-AI将更好地了解大型模型训练和推理背后的并行性和内存优化技术,学习深度学习系统的实际应用(包括自然语言处理、计算机视觉、生物信息学等),并能够为未来的大型 AI 模型时代做出贡献。

Colossal-AI系统试图解决什么问题呢?

pYYBAGQcCh-AK0ObAAJWHKaquW4641.png

主流AI模型大小增长的图表,它显示了AI模型在短短几年内增长的速度,每18个月增长40倍,这超过了摩尔定律在其具盛时期的最佳表现。

小型和中型企业( SMEs )在尽可能地在采用它们,Colossal-Al系统在2026年时可以帮你节省的成本的估计训练175B参数GPT-3模型,利用所有这些硬件特性和变化,估计训练成本从300降至73000美元,约为41倍。

强调大规模并行是必不可少的,使用单个A 100 GPU训练具有540B参数的Pal M语言模型的时间和成本,需要300年并且花费920万美元。

随着新数据的不断出现,他们需要反复的新训练以避免像2019年的GPT-2一样无法识别COVID-19等概念。

训练完成之后,仅使用模型进行推理也是项挑战,因为模型的大小需要并行技术,单个服务器的内存可能无法容纳大模型。除了设备成本之外,还有人力成本支付需要解决所有这些问题的专家团队,这就限制了一些公司特别是无法承受这些团队的中小企业使用这些大型模型。

因此Colossal-AI的作用出现了:

对特定底层硬件架构进行优化,左侧(硬件层)可以是CPU、 GPU、TPU或FPGAl,右侧是你的用于AI模型编写的框架,如TensorFlow、 Py Torch或其他框架。Colossal-AI可以高效地将大模型部署到目标架构,实现底部显示的所有目标,最小化运行时间,最小化通信(移动数据)在当前架构是最昂贵的操作,最小化用户需要改动代码的数量,即重构。使模型能够动态地适应机器的规模变化,并减少内存占用,一边能运行大模型。

Colossal-AI提供了三个层次:

高效的内存系统,可最大程度利用可用内存。

多维并行,即如何最好地将复杂的模型映射到可用的硬件上,以最大程度地使并行处理并最小化通信。

大规模优化,也就是如何自动调整影响准确度收敛的众多超参数,因为这些值通常取决子如何进行并行处理。

因此Colossal-AI的目标是将复杂且相互作用的决策从用户角度隐藏起来,并自动完成所有操作。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4041

    浏览量

    97698
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123921
  • gtc
    gtc
    +关注

    关注

    0

    文章

    73

    浏览量

    4721
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件

    *附件:ai study.zip*附件:融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件.pdf 基于开源鸿蒙编写的ai
    发表于 11-12 15:38

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    、Transformer 模型的后继者 二、用创新方法实现深度学习AI芯片 1、基于开源RISC-V的AI加速器 RISC-V是一种开源、模块化的指令集架构(ISA)。优势如下: ①模
    发表于 09-12 17:30

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    1. 项目概述 本项目旨在开发并部署一个高精度的深度学习模型,用于自动鉴别一张图片是由AI生成(如Stable Diffusion, DALL-E, Midjourney等工具生成)还是真实的画家
    发表于 08-21 13:59

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    模态的技术特性,DeepSeek正加速推动AI在金融、政务、科研及网络智能化等关键领域的深度应用。 信而泰:AI推理引擎赋能网络智能诊断新范式信而泰深度整合DeepSeek-R1大模型
    发表于 07-16 15:29

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    在神经网络的计算中广泛应用,理解矩阵乘法、特征值和特征向量等概念有助于深入掌握深度学习模型的工作原理。 掌握编程语言,如Python和R。Python有丰富的AI库,如NumPy、Pandas用于数据处理
    发表于 07-08 17:44

    深度学习赋能:正面吊车载箱号识别系统的核心技术

    在现代物流与智慧港口建设中,集装箱的高效精准识别是提升作业效率的关键环节。基于OCR+AI深度学习技术的正面吊车载箱号识别系统,凭借99%以上的识别率和毫秒级响应速度,正成为港口自动化
    的头像 发表于 05-07 10:10 437次阅读

    立讯技术亮相英伟达GTC 2025大会

    日前,英伟达年度技术盛会GTC 2025在美国加州圣何塞拉开帷幕。作为全球AI与计算领域的顶级峰会,GTC 2025汇聚了全球数千名开发者、企业领袖及学术专家,共同探讨AI与加速计算的
    的头像 发表于 03-28 09:16 1107次阅读
    立讯技术亮相英伟达<b class='flag-5'>GTC</b> 2025大会

    可智能深度学习AI摄像机模组方案

    、方案优势 500/800万像素CMOS传感器。 专业级海思Hi3519DV500、 Hi3403/3402、星宸SSC338G。 可内嵌智能深度学习人脸算法,机动车识别、车牌识别、非机动车识别算法
    发表于 03-21 11:28

    英伟达GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代

    英伟达GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代
    的头像 发表于 03-20 15:35 1226次阅读

    NVIDIA GTC 2025精华一文读完 黄仁勋在GTC上的主题演讲

    来自 NVIDIA 年度最大活动 GTC 的精华新闻,内容涵盖最新服务和硬件、技术演示以及 AI 的未来发展趋势。 GTC 2025 将揭示 AI 的最新发展趋势。这里不仅有最新技术,
    的头像 发表于 03-20 14:54 1733次阅读
    NVIDIA <b class='flag-5'>GTC</b> 2025精华一文读完 黄仁勋在<b class='flag-5'>GTC</b>上的主题演讲

    行业首创:基于深度学习视觉平台的AI驱动轮胎检测自动化

    全球领先的轮胎制造商 NEXEN TIRE 在其轮胎生产检测过程中使用了基于友思特伙伴Neurocle开发的AI深度学习视觉平台,实现缺陷检测率高达99.96%,是该行业首个使用AI
    的头像 发表于 03-19 16:51 789次阅读
    行业首创:基于<b class='flag-5'>深度</b><b class='flag-5'>学习</b>视觉平台的<b class='flag-5'>AI</b>驱动轮胎检测自动化

    NVIDIA GTC 2025大会即将启幕

    NVIDIA 宣布,全球顶尖的 AI 盛会 GTC 2025 将于 3 月 17 至 21 日重返美国加州圣何塞,届时 AI 领域的精英人士将齐聚 GTC,展示当前物理
    的头像 发表于 03-10 17:19 1805次阅读

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发一个视频应用。AI Agent是一种智能应用,能够根据用户需求和环境变化做出相应响应。通常基于
    发表于 03-05 19:52

    AI智能质检系统 工业AI视觉检测

    AI质检系统通过结合机器学习深度学习、计算机视觉等先进技术,能够比较准确的、地完成产品质量检测任务。本文将从多个角度详细探讨
    的头像 发表于 02-26 17:36 1217次阅读
    <b class='flag-5'>AI</b>智能质检<b class='flag-5'>系统</b> 工业<b class='flag-5'>AI</b>视觉检测

    AI自动化生产:深度学习在质量控制中的应用

    随着科技的飞速发展,人工智能(AI)与深度学习技术正逐步渗透到各个行业,特别是在自动化生产中,其潜力与价值愈发凸显。深度学习软件不仅使人工和
    的头像 发表于 01-17 16:35 1221次阅读
    <b class='flag-5'>AI</b>自动化生产:<b class='flag-5'>深度</b><b class='flag-5'>学习</b>在质量控制中的应用