0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程率先完成对“悟道·天鹰”大模型的推理兼容适配

摩尔线程 来源:摩尔线程 2023-06-12 14:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

6月,智源研究院在北京智源大会上重磅发布了全面开源的“悟道3.0”系列大模型,包括“悟道·天鹰”(Aquila)语言大模型等领先成果。目前,摩尔线程已率先完成对“悟道·天鹰”(Aquila)大模型的推理兼容适配,整个适配过程仅花费不到6小时时间,便实现与摩尔线程自研MUSAChat应用的无缝集成。此前,摩尔线程曾在ChatGLM发布后24小时内实现适配,并在数小时内适配LLaMA模型,摩尔线程CUDA兼容的技术能力一再被验证。

这充分得益于摩尔线程强大的代码移植工具"MUSIFY"。该工具可快速将现有的CUDA程序迁移至摩尔线程MUSA,零成本完成CUDA代码自动移植,之后用户短时间内即可完成热点分析和针对性优化,大大缩短迁移优化的周期,从而使得大模型适配形成了标准“流水线作业”,让开发者可以省时、省力、省事、省心。

目前,基于摩尔线程打造的AI云计算平台,已经可以运行ChatGLM、Stable Diffusion、LLaMA、“悟道3.0”等开源大模型,以及摩尔线程自研的MUSAChat和MUSABert等模型的部分训练和推理应用。借助摩尔线程元计算统一系统架构MUSA,用户可以复用PyTorch开源社区的大量模型算子,降低开发成本。与此同时,摩尔线程开源的MT Pytorch可以支持多种模型的推理,覆盖CV、NLP、语音等多个领域,能够运行典型的大模型分布式多卡推理,也可以支持单机多卡与多机多卡的分布式训练。利用数据并行、模型并行以及ZERO等分布式训练技术,MT PyTorch还可以完成简单基础模型以及典型Transformer结构的NLP语言模型的训练。

据悉,智源此次发布的“悟道3.0”系列开源模型涵盖语言、视觉、多模态等基础大模型,其中,“悟道·天鹰”(Aquila)语言大模型是首个具备中英双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。其在中英文高质量语料基础上从0开始训练,通过数据质量的控制、多种训练的优化方法,实现在更小的数据集、更短的训练时间内,获得比其他开源模型更优的性能。

“悟道・天鹰(Aquila)”语言大模型开源商用许可无疑将会成为自主大语言模型产业生态的一个里程碑事件。摩尔线程也愿与众多优秀的基础模型供应商深度合作,携手从硬件、算子、算法多个方面进行深度优化,从硬件、软件、模型、业务多个维度赋能应用开发商,致力于让大模型更好赋能千行百业。
责任编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7314

    浏览量

    93970
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51710
  • 摩尔线程
    +关注

    关注

    2

    文章

    256

    浏览量

    6212

原文标题:“悟道·天鹰”(Aquila)发布24小时后,摩尔线程率先实现兼容适配

文章出处:【微信号:moorethreads,微信公众号:摩尔线程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程发布大模型训练仿真工具SimuMax v1.0

    近日,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax 1.0版本。该版本在显存和性能仿真精度上实现突破性提升,同时引入多项关键功能,进一步增强了模型
    的头像 发表于 09-11 18:19 3334次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>发布大<b class='flag-5'>模型</b>训练仿真工具SimuMax v1.0

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企
    的头像 发表于 08-14 11:34 1150次阅读

    摩尔线程“AI工厂”:五大核心技术支撑,打造大模型训练超级工厂

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打造生产先进模型的“超级工厂”。   “AI工
    的头像 发表于 07-28 11:28 3975次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>“AI工厂”:五大核心技术支撑,打造大<b class='flag-5'>模型</b>训练超级工厂

    摩尔线程率先支持腾讯混元-A13B模型

    近日,腾讯正式开源基于专家混合(MoE)架构的大语言模型混元-A13B。同日,摩尔线程团队凭借技术前瞻性,率先完成
    的头像 发表于 07-04 14:10 676次阅读

    Say Hi to ERNIE!Imagination GPU率先完成文心大模型的端侧部署

    ImaginationTechnologies宣布率先完成百度文心大模型(ERNIE4.5开源版)在其GPU硬件上的端侧部署。适配完成后,开
    的头像 发表于 07-01 08:17 768次阅读
    Say Hi to ERNIE!Imagination GPU<b class='flag-5'>率先</b><b class='flag-5'>完成</b>文心大<b class='flag-5'>模型</b>的端侧部署

    壁仞科技完成Qwen3旗舰模型适配

    近日,在高效适配Qwen3系列模型推理后,壁仞科技宣布完成旗舰版Qwen3-235B-A22B模型的训练
    的头像 发表于 05-16 16:23 778次阅读

    摩尔线程GPU率先支持Qwen3全系列模型

    近日,阿里云正式发布Qwen3系列的8款开源混合推理模型摩尔线程团队在模型发布当天,率先完成
    的头像 发表于 05-07 15:24 838次阅读

    摩尔线程GPU成功适配Deepseek-V3-0324大模型

    架构和全功能GPU的强大技术实力,摩尔线程迅速响应并完成了对DeepSeek-V3的无缝升级,实现了零报错、零兼容性问题的光速部署,充分展现了摩尔
    的头像 发表于 03-31 11:34 1104次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>GPU成功<b class='flag-5'>适配</b>Deepseek-V3-0324大<b class='flag-5'>模型</b>

    摩尔线程与当虹科技达成深度合作

    近日,摩尔线程与当虹科技达成深度合作,基于国产GPU成功完成了与BlackEye多模态视听大模型的深度融合。双方联手打造专业级视听“引擎”,并在超高清GPU算力场景中成功落地。
    的头像 发表于 03-20 15:22 1286次阅读

    摩尔线程GPU原生FP8计算助力AI训练

    并行训练和推理,显著提升了训练效率与稳定性。摩尔线程是国内率先原生支持FP8计算精度的国产GPU企业,此次开源不仅为AI训练和推理提供了全新
    的头像 发表于 03-17 17:05 1212次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>GPU原生FP8计算助力AI训练

    摩尔线程支持阿里云通义千问QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义千问QwQ-32B。摩尔线程在该模型发布后2小时内,迅速且高效完成了对千问QwQ-32B的支持。
    的头像 发表于 03-07 17:48 1111次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>支持阿里云通义千问QwQ-32B开源<b class='flag-5'>模型</b>

    摩尔线程全面支持DeepSeek开源周成果

    DeepSeek开源周正式收官,作为国内率先原生支持FP8计算精度的国产GPU企业,摩尔线程迅速响应,并在短时间内,成功实现对DeepSeek各个开源项目的全面支持,涵盖FlashMLA
    的头像 发表于 03-04 10:06 843次阅读

    摩尔线程完成DeepSeek开源库FlashMLA和DeepGEMM适配

    MUTLASS,快速支持了FlashMLA。不仅如此,摩尔线程还基于MUTLASS在全新GPU架构上优化实现了FP8矩阵乘法,支持DeepGEMM的相应功能,充分展示了摩尔线程MUSA
    的头像 发表于 02-27 14:40 1103次阅读

    昆仑芯率先完成Deepseek训练推理全版本适配

    本文是昆仑芯适配DeepSeek系列推文第一篇,将于近期分别推出在昆仑芯P800上进行DeepSeek-V3/R1推理、训练的深度文章,干货满满、持续关注!
    的头像 发表于 02-06 15:13 2254次阅读
    昆仑芯<b class='flag-5'>率先</b><b class='flag-5'>完成</b>Deepseek训练<b class='flag-5'>推理</b>全版本<b class='flag-5'>适配</b>

    摩尔线程宣布成功部署DeepSeek蒸馏模型推理服务

    近日,摩尔线程智能科技(北京)有限责任公司在其官方渠道发布了一则重要消息,宣布公司已经成功实现了对DeepSeek蒸馏模型推理服务的部署。这一技术突破,标志着
    的头像 发表于 02-06 13:49 1183次阅读