0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

异构混训整合不同架构芯片资源,提高算力利用率

Carol Li 来源:电子发烧友 作者:李弯弯 2024-07-18 00:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)随着AI技术的飞速发展,大模型的训练和推理任务对算力的需求日益增长。然而,单一品牌的芯片往往难以满足所有需求,且可能存在供应链风险。因此,异构芯片混训成为了一种重要的解决方案。通过混合使用多种异构芯片,可以充分利用不同芯片的优势,提高算力利用率,降低算力成本,并推动AI技术的广泛应用。

异构混训能够整合不同架构芯片资源

在2024年世界人工智能大会AI基础设施论坛上,无问芯穹联合创始人兼CEO夏立雪发布了全球首个千卡规模异构芯片混训平台,千卡异构混合训练集群算力利用率最高达到了97.6%。

同时,无问芯穹Infini-AI云平台已集成大模型异构千卡混训能力,是全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性,支持包括AMD、华为昇腾、天数智芯、沐曦、摩尔线程、NVIDIA六种异构芯片在内的大模型混合训练。通过Infini-AI云平台,用户可以在异构算力资源上实现高效的模型训练和推理,从而加速AI应用的开发和部署。

据称,已有智谱AI、月之暗面、生数科技等大模型公司客户在Infini-AI上稳定使用异构算力,还有20余家AI Native应用创业公司在Infini-AI上持续调用各种预置模型。

异构混训平台具有多样化算力资源、高效算力分配、灵活性与可扩展性、降低总体拥有成本(TCO)、推动技术创新和生态整合等特点。

具体来看,异构混训平台能够整合来自不同厂商、不同架构的芯片资源,这些芯片在各自擅长的领域具有不同的性能优势。通过智能的调度算法和任务分发机制,异构混训平台能够根据任务的特性和需求,将最适合的算力资源分配给相应的芯片,从而实现算力资源的最大化利用。

异构混训平台支持多种芯片和算法的组合使用,能够灵活应对不同规模、不同复杂度的训练任务。同时,它也具备较高的可扩展性,能够根据实际需求进行算力资源的动态扩展。通过整合不同架构的芯片资源,避免对单一硬件平台的过度依赖,异构混训平台能够降低供应链风险,并通过提高算力利用率和训练效率来降低总体拥有成本。

异构混训平台为AI技术创新提供了更加广阔的舞台,通过整合不同芯片和算法的优势资源,可以激发更多的创新灵感和技术突破。同时,它也有助于打破不同硬件生态系统之间的壁垒,促进生态整合与协同发展。

异构混训在AI领域的需求日益凸显

近年来,随着人工智能技术的不断发展,大模型的参数量急剧增加,从十亿、百亿到千亿甚至万亿级别。以ChatGPT、LLama等为代表的大模型技术正持续推动社会变革,引发新一轮人工智能热潮。这些大模型具有数千亿甚至上万亿参数规模,单个计算节点无法满足训练需求,训练过程耗时巨大。

面对如此庞大的模型,传统的同构算力集群已经无法满足训练需求。即使采用分布式训练框架,也需要充分整合可调动的算力资源进行分布式并行加速。然而,由于不同厂商的智算芯片之间存在计算架构、缓存资源、互联方式等诸多差异,以及AI计算框架与各厂商基础软件栈深度绑定,导致多种智算芯片难以协同工作,限制了算力资源的充分利用。

异构芯片混训成了解决算力限制的重要方式,目前已经有诸多应用案例。如,医疗机构采用异构芯片混训平台,将NVIDIA GPUIntel CPU以及华为昇腾AI处理器等多种芯片混合使用。通过平台的高效调度和算力分配,实现了对医学影像数据的快速处理和分析。

异构芯片混训平台能够显著提高了医疗影像分析系统的处理速度和精度,为医生提供了更加准确和及时的诊断支持。

自动驾驶汽车研发公司采用异构芯片混训平台,将AMD GPU、NVIDIA GPU以及专用AI加速器等多种芯片混合使用。通过平台的异构并行训练能力,实现了对自动驾驶算法模型的高效训练和优化。

异构芯片混训平台能显著提高自动驾驶算法模型的训练速度和精度,为自动驾驶汽车的研发提供了有力支持。同时,通过降低算力成本和提高资源利用率,也可以帮助公司加快自动驾驶技术的商业化进程。

写在最后

当然,在异构芯片混训过程中,可能会面临一些技术挑战,如不同芯片间的通信问题、性能差异等。为了解决这些问题,可以采取相应的措施,如建立通用的集合通信库,实现不同种芯片的高效通信,兼容多种硬件;提出基于流水线并行的非均匀拆分方案,解决不同硬件效率不一样的问题,针对自身情况分配最适合的任务等。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296509
  • 算力
    +关注

    关注

    2

    文章

    1385

    浏览量

    16560
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4963
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为发布AI容器技术Flex:ai,平均利用率提升30%

    决方案。   当前,AI产业正处于高速发展的黄金时期,海量需求如潮水般涌来。然而,资源利用率
    的头像 发表于 11-26 08:31 7111次阅读

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    从CPU、GPU到NPU,美格智能持续优化异构计算效能

    前言AI已成为数字经济时代的核心生产,但全球AI产业正面临“供给不足、成本高企、生态待建”三重挑战。据行业统计,行业
    的头像 发表于 11-21 16:05 704次阅读
    从CPU、GPU到NPU,美格智能持续优化<b class='flag-5'>异构</b><b class='flag-5'>算</b><b class='flag-5'>力</b>计算效能

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练和推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种密度下,散热怎么解决?而且昇腾的生态适配速度能
    发表于 10-27 13:12

    中科曙光超智融合方案助力国产中心建设

    近期,位于鲁中南地区的某大型中心正式启动建设,标志着国产技术在该区域数字经济中的重要突破。该中心采用中科曙光“超智融合”方案,实现
    的头像 发表于 07-31 17:13 1306次阅读

    立讯技术解读ETH-X超节点高速互连技术的现状与未来

    当前,人工智能技术驱动全球数据中心向智中心加速演进,传统架构在承载AI大模型训练时暴露出显著瓶颈--资源调度碎片化、异构
    的头像 发表于 07-03 09:44 1981次阅读
    立讯技术解读ETH-X超节点高速互连技术的现状与未来

    海光DCU率先展开文心系列模型的深度技术合作 FLOPs利用率(MFU)达47%

    列模型的深度技术适配,预训练模型FLOPs利用率(MFU)达到47%,在多个文本与多模态基准测试中取得SOTA水平。此次合作标志着国产基础设施与大模型技术的协同创新进入新阶段。 技术突破:
    的头像 发表于 07-01 14:35 1925次阅读

    壁仞科技担任智集群异构工作组组长

    参与了本次交流,分享智集群异构的关键技术进展、成功落地案例,为突破大模型异构
    的头像 发表于 05-27 16:55 920次阅读

    拼版怎么拼好,板厂经常说利用率太低,多收费用?

    做板的时候,板厂经常说我拼版利用率太低,要多收取费用,哪位大神知道怎么利用率
    发表于 05-14 13:42

    DeepSeek MoE架构下的网络负载如何优化?解锁90%网络利用率的关键策略

    、All-to-All等),网络面临高并发、低延迟、无损传输的严苛需求。然而,传统以太网的网络利用率长期徘徊在35%~40%,成为制约AI释放的关键瓶颈。
    的头像 发表于 04-28 12:04 686次阅读
    DeepSeek MoE<b class='flag-5'>架构</b>下的网络负载如何优化?解锁90%网络<b class='flag-5'>利用率</b>的关键策略

    梯度科技助力客户破解调度难题

    在数字经济与人工智能深度融合的新阶段,已成为支撑人工智能发展的核心生产。梯度科技基于云原生技术架构研发的
    的头像 发表于 04-27 16:32 998次阅读

    RAKsmart智能架构异构计算+低时延网络驱动企业AI训练范式升级

    在AI大模型参数量突破万亿、多模态应用爆发的今天,企业AI训练正面临效率与成本的双重挑战。RAKsmart推出的智能架构,以
    的头像 发表于 04-17 09:29 597次阅读

    DeepSeek驱动AI市场升温,智中心利用率望提升

    。 尽管目前这一需求尚未对供给造成直接影响,但卡价格已经呈现出上涨趋势。这一变化反映出市场对AI的强烈需求,以及DeepSeek等技术推动下的
    的头像 发表于 02-19 14:00 706次阅读

    DeepSeek对芯片的影响

    DeepSeek模型,尤其是其基于MOE(混合专家)架构的DeepSeek-V3,对芯片的要求产生了深远影响。为了更好地理解这一影响,我们可以从几个方面进行分析。一.MOE
    的头像 发表于 02-07 10:02 1616次阅读
    DeepSeek对<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>的影响

    壁仞科技联合中国电信等合作伙伴共同发布智异构四芯解决方案

    工智能实验室等发布了“智异构四芯解决方案”,打造、网络、平台、通信库、框架全栈
    的头像 发表于 12-07 17:56 2978次阅读