0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程与智谱AI完成大模型性能测试与适配

CHANBAEK 来源:网络整理 2024-06-14 16:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,摩尔线程与智谱AI人工智能领域开展了一轮深入的合作,共同对GPU大模型进行了适配及性能测试。此次测试不仅涵盖了大模型的推理能力,还涉及了基于摩尔线程夸娥(KUAE)千卡智算集群的大模型预训练,旨在全面评估摩尔线程GPU在大模型应用中的性能表现。

在推理性能测试中,摩尔线程自研的全功能GPU展现出了卓越的性能。与基准对比产品RTX 3090和RTX 4090相比,摩尔线程的GPU在全部测试用例中均优于RTX 3090,而在多batch情况下更是超越了RTX 4090。这一结果充分证明了摩尔线程GPU在推理能力上的出色表现,为用户提供了更加高效、准确的计算体验。

在训练性能测试中,摩尔线程夸娥千卡智算集群同样展现出了强大的性能。测试结果显示,夸娥千卡智算集群的训练精度与A100集群误差在1%以内,这一数据足以证明其在训练过程中的精确度和稳定性。同时,夸娥千卡智算集群的性能扩展系数超过90%,意味着在分布式计算环境下,该集群能够充分利用各节点的计算能力,实现高效的并行计算。此外,模型算力利用率(MFU)与A100集群相当,进一步证明了夸娥千卡智算集群在大模型训练中的高效性。

此次测试的成功不仅为摩尔线程和智谱AI的合作奠定了坚实的基础,也为双方在人工智能领域的深入探索提供了有力的技术支撑。未来,双方将继续携手合作,共同推动GPU大模型在更多领域的应用和发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296392
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261434
  • 摩尔线程
    +关注

    关注

    2

    文章

    256

    浏览量

    6203
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程新一代大语言模型对齐框架URPO入选AAAI 2026

    近日,摩尔线程在人工智能前沿领域取得重要突破,其提出的新一代大语言模型对齐框架——URPO统一奖励与策略优化,相关研究论文已被人工智能领域的国际顶级学术会议AAAI 2026收录。这一成果标志着
    的头像 发表于 11-17 16:03 226次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>新一代大语言<b class='flag-5'>模型</b>对齐框架URPO入选AAAI 2026

    华为CANN与智GLM端侧模型完成适配

    已于7月28日正式开源其新一代基座模型GLM-4.5,其GLM端侧模型完成与CANN的适配。这标志着国产大模型与计算架构在端云协同方向实现
    的头像 发表于 08-11 11:00 2191次阅读

    摩尔线程亮相WAIC 2025:以“AI工厂”理念驱动算力进化,全栈AI应用赋能千行百业

    模型的“超级工厂”。此次参会不仅彰显了摩尔线程AI基础设施领域的系统性创新,更通过多行业案例展现了国产GPU技术的广泛应用前景。     首提“A
    的头像 发表于 07-28 11:34 1401次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>亮相WAIC 2025:以“<b class='flag-5'>AI</b>工厂”理念驱动算力进化,全栈<b class='flag-5'>AI</b>应用赋能千行百业

    摩尔线程AI工厂”:五大核心技术支撑,打造大模型训练超级工厂

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打
    的头像 发表于 07-28 11:28 3963次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>“<b class='flag-5'>AI</b>工厂”:五大核心技术支撑,打造大<b class='flag-5'>模型</b>训练超级工厂

    摩尔线程AI工厂”:以系统级创新定义新一代AI基础设施

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打
    发表于 07-28 10:34 2391次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>“<b class='flag-5'>AI</b>工厂”:以系统级创新定义新一代<b class='flag-5'>AI</b>基础设施

    摩尔线程率先支持腾讯混元-A13B模型

    近日,腾讯正式开源基于专家混合(MoE)架构的大语言模型混元-A13B。同日,摩尔线程团队凭借技术前瞻性,率先完成模型在全功能GPU的深度
    的头像 发表于 07-04 14:10 676次阅读

    摩尔线程AI算力平台AutoDL达成深度合作

    近日,摩尔线程与国内领先的AI算力平台AutoDL宣布达成深度合作,双方联合推出面向个人开发者的“摩尔线程专区”,首次将国产GPU算力开放至
    的头像 发表于 05-23 16:10 1423次阅读

    摩尔线程MTT S4000完成DeepSeek R1-671B大模型适配验证

    研究院(简称:中国信通院)依托“人工智能芯片测试评估公共服务平台”,构建了AI芯片与大模型协同适配的标准化体系,为产业链上下游深度合作提供关键支撑,并开展
    的头像 发表于 05-10 09:49 1050次阅读

    摩尔线程GPU成功适配Deepseek-V3-0324大模型

    架构和全功能GPU的强大技术实力,摩尔线程迅速响应并完成了对DeepSeek-V3的无缝升级,实现了零报错、零兼容性问题的光速部署,充分展现了摩尔
    的头像 发表于 03-31 11:34 1104次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>GPU成功<b class='flag-5'>适配</b>Deepseek-V3-0324大<b class='flag-5'>模型</b>

    摩尔线程与当虹科技达成深度合作

    近日,摩尔线程与当虹科技达成深度合作,基于国产GPU成功完成了与BlackEye多模态视听大模型的深度融合。双方联手打造专业级视听“引擎”,并在超高清GPU算力场景中成功落地。
    的头像 发表于 03-20 15:22 1279次阅读

    摩尔线程GPU原生FP8计算助力AI训练

    近日,摩尔线程正式开源MT-MegatronLM与MT-TransformerEngine两大AI框架。通过深度融合FP8混合训练策略和高性能算子库,这两大框架在国产全功能GPU上实现
    的头像 发表于 03-17 17:05 1209次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>GPU原生FP8计算助力<b class='flag-5'>AI</b>训练

    摩尔线程支持阿里云通义千问QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义千问QwQ-32B。摩尔线程在该模型发布后2小时内,迅速且高效完成了对千问QwQ-32B的支持。
    的头像 发表于 03-07 17:48 1103次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>支持阿里云通义千问QwQ-32B开源<b class='flag-5'>模型</b>

    摩尔线程完成DeepSeek开源库FlashMLA和DeepGEMM适配

    自DeepSeek启动“开源周”以来,已陆续开源三个代码库。摩尔线程基于全新MUSA Compute Capability 3.1计算架构,可提供原生FP8计算能力,同时升级了高性能线性代数模板库
    的头像 发表于 02-27 14:40 1094次阅读

    摩尔线程图形显卡MTT S80实现DeepSeek模型部署

    摩尔线程“全功能”图形显卡MTT S80,不仅游戏渲染性能强大,能玩《黑神话:悟空》,现在还能本地部署DeepSeek R1蒸馏模型。搭配最新发布的MUSA SDK RC3.1.1版本
    的头像 发表于 02-21 15:46 4030次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>图形显卡MTT S80实现DeepSeek<b class='flag-5'>模型</b>部署

    摩尔线程宣布成功部署DeepSeek蒸馏模型推理服务

    。 据悉,DeepSeek开源模型在多语言理解与复杂推理任务中一直表现出卓越的性能,其V3、R1等系列模型更是备受业界关注。而此次摩尔线程
    的头像 发表于 02-06 13:49 1183次阅读