0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA GPU加速潞晨科技Colossal-AI大模型开发进程

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-10-19 09:39 次阅读

通过 NVIDIA GPU 加速平台,Colossal-AI 实现了通过高效多维并行、异构内存管理、大规模优化库、自适应任务调度等方式,更高效快速部署 AI 大模型训练与推理。

AI 大模型的高门槛成为研发一大难题

近年来,AI 模型已从 AlexNet、ResNet、AlphaGo 发展到 BERT、GPT、MoE…随着深度学习的兴起及大模型横扫各大性能榜单,AI 能力不断提升的一个显著特征是模型参数的爆发式增长,这也使得训练模型的成本急剧上升。目前最大的 AI 模型智源悟道 2.0 参数量达到 1.75 万亿,前沿 AI 模型的大小在短短几年内便已增大万倍,远超硬件数倍的缓慢增长,模型大小也远超单个 GPU 的容纳能力。

由于单台机器的能力已远远无法满足日益增长的 AI 训练需求,即便是超级计算机,也面临着当硬件堆砌到达一定数量后,效率无法进一步提升的瓶颈,浪费了大量计算资源。而分布式并行也与单机情况差异巨大,通常需要计算机系统和体系结构相关的专业人员,这进一步提高了训练和部署成本。

此外,PyTorch、TensorFlow 等现有深度学习框架也难以有效处理超大模型,通常需要专业的 AI 系统工程师针对具体模型做适配和优化。更重要的是,不是每一个研发团队都具备 “钞” 能力,能够随时调用大规模 GPU 集群来使用大模型,更不用提仅有一张显卡的个人开发者。因此,尽管大模型已经吸引了大量关注,高昂的上手门槛却令大众 “望尘莫及”。

NVIDIA GPU 加速

潞晨科技 Colossal-AI 大模型开发进程

Colossal-AI 基于 NVIDIA GPU A30,为 AI 大模型的普适化做出了一系列贡献:

1、提升 AI 大规模并行效率

对于 GPT-3 等超大 AI 模型,仅需一半资源启动训练,或通过高效并行加速,降低训练成本超百万美元。在训练 ViT 模型时,可以扩大 14 倍的 batch size,加快 5 倍的训练速度;对于 GPT-2 模型,我们可以降低 11 倍的内存消耗和超线性扩展,训练加速 3 倍,模型大小可扩展至 24 倍;对于 BERT 模型,可训练加速可达两倍以上。

2、扩大硬件 AI 模型容量

在单个 GPU 上对于训练任务,可提升模型容量十余倍,将 GPU 训练 GPT-2 和 PaLM 等前沿模型的参数容量提升数十倍。

3、丰富 AI 大模型行业落地

产品发布的数个月内,潞晨科技已与数十家行业标杆企业建立深度合作,客户涵盖中、美、英、新等全球市场,涉及云计算芯片设计、生物医药、自动驾驶智能零售等领域。例如,潞晨方案将 GPU 优化和大规模并行技术引入 AlphaFold 的训练和推理,成功将 AlphaFold 总体训练时间从 11 天减少到 67 小时,且总成本更低,在长序列推理中也实现 9.3 ∼ 11.6 倍提升。Colossal-AI 团队还助力百图生科开源全球最快的复合物结构预测模型,可同时支持蛋白质单体与复合物结构预测,将原有推理速度提升约 11 倍。

目前,在 NVIDIA GPU 出色的 AI 加速性能加持下,Colossal-AI 已成功应用在诸多领域,显著缩短 AI 大模型开发和部署流程,降低 AI 大模型落地成本。

NVIDIA GPU 产品助力

潞晨科技 Colossal-AI 大模型落地与推广

NVIDIA GPU 产品与 Colossal-AI 的合作,极大地提升了 AI 大模型的训练与推理流程,显著提升了用户体验,为 AI 大模型的落地与推广做出了重要贡献。

借助 Colossal-AI 与 NVIDIA GPU 产品,对于企业用户,可将现有项目便捷扩展到大规模计算集群,使用高效并行技术,以低成本快速完成 AI 大模型的开发部署。对于计算资源有限的普通用户,也能训练百亿参数的大模型,相比现有主流方案,可提升参数容量十余倍,降低了 AI 大模型微调和推理等下游任务和应用部署的门槛。

潞晨科技致力于将软件系统设计与硬件架构深度融合,实现一体化、智能化、自动化的人工智能计算服务。NVIDIA 初创加速计划为我们提供了技术支持、市场宣传、业务对接等一列的支持。潞晨科技也参加了 2022 NVIDIA 初创企业展示活动,并进入了最终展示,借此获得了更多生态关注。

NVIDIA GPU 产品作为 Colossal-AI 算力基础,本次双方的深化合作将促进潞晨科技与 NVIDIA 共同探索 GPU 如何更有效地应用在训练和推理 AI 大模型中,为 GPU 硬件与 Colossal-AI 软件系统的共同进步打下良好基础。双方将共同努力推动 AI 大模型的普世化进程,不断解放和发展 AI 生产力。

——潞晨科技创始人尤洋博士

关于潞晨科技

潞晨科技主营业务包括分布式软件系统,大规模人工智能平台和企业级云计算解决方案。公司旨在帮助企业最大化人工智能部署效率的同时最小化部署成本。其核心产品面向大模型时代的通用深度学习系统 Colossal-AI,涵盖高效多维自动并行、异构内存管理、大规模优化库、自适应任务调度等自研技术,可高效快速部署 AI 大模型训练和推理,兼容低端设备,显著缩短 AI 大模型训练和推理时间、降低训练和推理成本,减少学习和部署的人力成本。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4592

    浏览量

    101719
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126705
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264059
  • 大模型
    +关注

    关注

    2

    文章

    1516

    浏览量

    1105

原文标题:NVIDIA GPU加速AI落地,潞晨科技Colossal-AI助力大模型普适化

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    软银追加1500亿日元,加速AI模型开发进程

    据了解,软银目前已经在生成式AI算力基础设施方面投资了200亿日元(约合9.36亿元人民币),预计将进一步加大投入,力求在本年度内打造出参数达到390B的最新模型,同时在来年制定万亿参数级别的日语大模型研发计划。
    的头像 发表于 04-23 16:09 144次阅读

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热
    的头像 发表于 04-20 09:39 161次阅读

    NVIDIA数字人技术加速部署生成式AI驱动的游戏角色

    NVIDIA 在 GDC 2024 大会上宣布,Inworld AI 等领先的 AI 应用程序开发者,正在使用 NVIDIA 数字人技术
    的头像 发表于 04-09 10:08 214次阅读
    <b class='flag-5'>NVIDIA</b>数字人技术<b class='flag-5'>加速</b>部署生成式<b class='flag-5'>AI</b>驱动的游戏角色

    潞晨科技Colossal-AI与浪潮信息AIStation完成兼容性互认证

    近日,潞晨科技的Colossal-AI模型开发工具和浪潮信息的AIStation智能业务创新生产平台成功完成了兼容性互认证。这一合作意味着用户可以在AIStation平台上便捷地部署与调度C
    的头像 发表于 03-06 10:18 265次阅读

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型开发效率提升10倍

    北京2024年2月29日 /美通社/ -- 近日,潞晨科技Colossal-AI模型开发工具与浪潮信息AIStation智能业务创新生产平台完成兼容性互认证。基于AIStation平台部署与调度
    的头像 发表于 03-01 09:43 239次阅读
    潞晨科技<b class='flag-5'>Colossal-AI</b> + 浪潮信息AIStation,大<b class='flag-5'>模型</b><b class='flag-5'>开发</b>效率提升10倍

    周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

    由 CSDN 举办的 NVIDIA AI Inference Day - 大模型推理线上研讨会,将帮助您了解 NVIDIA 开源大型语言模型
    的头像 发表于 10-26 09:05 193次阅读

    【KV260视觉入门套件试用体验】Vitis AI 构建开发环境,并使用inspector检查模型

    FFT运算(Vivado) 四、硬件加速之—使用PL加速矩阵乘法运算(Vitis HLS) 五、Vitis AI 构建开发环境,并使用inspector检查
    发表于 10-14 15:34

    Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

    生成式 AI 和大语言模型(LLM)不断推动突破性创新,训练和推理对算力的需求也随之急剧上升。 这些现代生成式 AI 应用需要全栈加速计算,首先要有能够快速、准确处理大量工作负载的先进
    的头像 发表于 09-25 20:40 288次阅读
    Oracle 云基础设施提供新的 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b>计算实例

    NVIDIA 与 Hugging Face 将连接数百万开发者与生成式 AI 超级计算

    年 8 月 8 日 — NVIDIA 与 Hugging Face 宣布建立合作伙伴关系,为数百万开发者提供生成式 AI 超级计算服务,帮助他们构建大语言模型(LLM)和其他高级
    发表于 08-09 11:41 108次阅读
    <b class='flag-5'>NVIDIA</b> 与 Hugging Face 将连接数百万<b class='flag-5'>开发</b>者与生成式 <b class='flag-5'>AI</b> 超级计算

    使用 NVIDIA TAO Toolkit 5.0 体验最新的视觉 AI 模型开发工作流程

    NVIDIA TAO 工具套件 提供了一个低代码 AI 框架,无论是新手还是数据科学专家都可以使用这个平台加速视觉 AI 模型
    的头像 发表于 07-31 20:45 413次阅读
    使用 <b class='flag-5'>NVIDIA</b> TAO Toolkit 5.0 体验最新的视觉 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b><b class='flag-5'>开发</b>工作流程

    NVIDIA DLI 实战培训 | 加速大语言模型开发的核心技能

    实战开发技能 | 实时讲师授课 实验用 GPU 环境 | 实名 NVIDIA 证书 大语言模型的发展宛如一场风潮席卷全球,激发了企业、学术界和科研机构的无限热情。其庞大且复杂的规模和计
    的头像 发表于 07-14 19:40 270次阅读
    <b class='flag-5'>NVIDIA</b> DLI 实战培训 | <b class='flag-5'>加速</b>大语言<b class='flag-5'>模型</b><b class='flag-5'>开发</b>的核心技能

    NVIDIA 邀您参加 —— AI 软硬件协同开发技术交流与人才发展分享会

    模型时代,NVIDIA 渴望携志同者一起前进,与道合者一起奔跑,共同创造更多可能!NVIDIA GPU 计算专家团队(DevTech)与 GPU
    的头像 发表于 06-26 19:35 262次阅读
    <b class='flag-5'>NVIDIA</b> 邀您参加 —— <b class='flag-5'>AI</b> 软硬件协同<b class='flag-5'>开发</b>技术交流与人才发展分享会

    AI爱克斯开发板上使用OpenVINO加速YOLOv8目标检测模型

    《在AI爱克斯开发板上用OpenVINO加速YOLOv8分类模型》介绍了在AI爱克斯开发板上使用
    的头像 发表于 05-26 11:03 718次阅读
    <b class='flag-5'>AI</b>爱克斯<b class='flag-5'>开发</b>板上使用OpenVINO<b class='flag-5'>加速</b>YOLOv8目标检测<b class='flag-5'>模型</b>

    NVIDIA 与微软合作加速企业就绪的生成式 AI

    NVIDIA AI Enterprise 与 Azure 机器学习集成,提供端到端云平台,供开发者构建、部署和管理大型语言模型AI 应用
    的头像 发表于 05-25 09:15 377次阅读
    <b class='flag-5'>NVIDIA</b> 与微软合作<b class='flag-5'>加速</b>企业就绪的生成式 <b class='flag-5'>AI</b>

    AI爱克斯开发板上用OpenVINO™加速YOLOv8目标检测模型

    《在 AI 爱克斯开发板上用 OpenVINO 加速 YOLOv8 分类模型》介绍了在 AI 爱克斯开发
    的头像 发表于 05-12 09:08 845次阅读
    在<b class='flag-5'>AI</b>爱克斯<b class='flag-5'>开发</b>板上用OpenVINO™<b class='flag-5'>加速</b>YOLOv8目标检测<b class='flag-5'>模型</b>