0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

沐曦股份开源TileLang-Metax并入驻TileAI社区

沐曦MetaX 来源:沐曦metaX 2026-04-28 15:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月27日,沐曦股份面向沐曦GPUTileLang适配支持与优化项目TileLang-Metax正式成为TileAI社区官方主线版本,代码已开源并托管于TileAI组织之下,与TileLang生态中的相关项目协同向开发者全面开放。

大模型时代呼唤芯片、编译器、框架与算子库的全栈协同创新。高性能算子(Kernel)是连接模型算法与底层硬件能力的重要桥梁,也是释放GPU算力价值的核心环节。

TileLang-Metax作为TileAI社区生态的重要组成部分,将持续面向更广泛的开发者、研究者和生态伙伴演进迭代;沐曦GPU对TileLang生态的适配支持,也由此正式进入持续迭代、社区共建的全新阶段。

面向沐曦GPU的TileLang深度优化

随着大模型技术高速发展,训练与推理场景对底层算子的性能、开发效率和跨平台适配能力提出了更高要求。如何让开发者更便捷地在不同AI加速硬件上编写、迁移和优化高性能算子,已成为AI基础软件生态建设的关键课题。

TileLang是专为高性能算子开发设计的编程语言与工具体系,旨在帮助开发者以更高层、更易用的方式描述底层计算逻辑,同时兼顾高性能算子的优化需求。在大模型训练与推理中,算子性能直接影响端到端效率;而算子开发往往要求开发者深入理解硬件架构、内存层级、并行策略和编译优化,门槛较高。

围绕这一目标,沐曦股份持续推进沐曦GPU在编译器、算子库、AI框架、推理引擎和开源工具链中的适配与优化。

TileLang-Metax在沐曦GPU上的支持已覆盖多个关键方向,包括编译适配、运行时支持、示例适配、优化特性与高性能算子实现。通过该项目,沐曦股份希望进一步降低开发者在沐曦GPU上进行底层算子开发的门槛。无论是模型开发者、框架开发者,还是专注底层性能优化的系统工程师,均可借助TileLang-Metax探索沐曦GPU上的更多优化可能。

目前,TileLang-Metax已对多个重要开源项目和算子场景提供支持,具体包括:

TileLang examples: 覆盖开发者学习、验证和扩展TileLang 算子的典型示例场景,是了解TileLang编程模型、算子实现方式与性能优化路径的重要入口。

TileOPs: 面向大模型训练与推理的TileLang算子生态项目。借助TileLang-Metax,沐曦GPU可更深度地参与TileOPs中相关算子的开发、验证与优化。

TileKernels: 由DeepSeek开源的高性能算子项目。TileLang-Metax对相关TileLang 算子的适配支持,将有力推动高性能算子在国产GPU平台上的进一步验证与优化。

SGLang/vLLM等主流推理框架中的相关TileLang kernel: 面向大模型推理框架中的关键算子场景,TileLang-Metax已提供相应支持,为沐曦GPU在主流大模型推理生态中的适配与性能优化奠定基础。

上述支持不仅标志着沐曦GPU在TileLang生态中的适配范围持续扩大,也代表着国产GPU正在以更深入的方式参与开源AI基础软件生态建设。

开源共建,推动国产AI算力生态繁荣

开源项目的生命力,不仅来自一次性适配,更源于长期维护、持续演进以及与社区主线的紧密协同。TileLang生态正处于快速发展阶段,社区主线代码持续迭代,新功能、新接口、新优化策略与算子实践不断涌现。

为确保沐曦GPU对TileLang生态的支持始终保持最新状态,沐曦股份在TileLang-Metax中建立了与社区主线代码的持续同步机制,实现与TileLang社区主线的周级同步。这意味着开发者可以更及时地获取上游社区的新特性、新优化和新算子能力,并在沐曦GPU上快速验证和适配社区最新进展。

此次将TileLang-Metax开源并入驻TileAI社区,是沐曦股份践行开放协作理念的重要一步。沐曦股份将以社区共建的方式,携手TileAI、DeepSeek、SGLang、vLLM等开源生态伙伴及广大开发者,持续完善沐曦GPU在TileLang生态中的支持能力。

相关开源项目链接

TileAI TileLang官方仓库:

https://github.com/tile-ai/tilelang

TileLang-Metax:

https://github.com/tile-ai/tilelang-metax

TileAI TileOPs官方仓库:

https://github.com/tile-ai/TileOPs

TileOPs-Metax:

https://github.com/MetaX-MACA/TileOps-Metax

DeepSeek TileKernels官方仓库:

https://github.com/deepseek-ai/TileKernels

TileKernels-Metax:

https://github.com/MetaX-MACA/TileKernels-Metax

关于沐曦股份

沐曦股份致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5278

    浏览量

    136076
  • 开源
    +关注

    关注

    3

    文章

    4353

    浏览量

    46446
  • 沐曦
    +关注

    关注

    1

    文章

    103

    浏览量

    1880

原文标题:沐曦股份开源TileLang-Metax,携手TileAI社区共建国产GPU高性能算子生态

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    股份Day 0适配DeepSeek-V4-Flash模型

    4月24日,股份携手FlagOS,已完对DeepSeek最新开源的DeepSeek-V4-Flash模型的Day 0适配。同日,
    的头像 发表于 04-28 15:53 40次阅读

    股份云C系列GPU产品Day 0适配腾讯混元Hy3 preview语言模型

    4月23日,腾讯混元团队正式发布并开源Hy3 preview语言模型。股份旗下云 C 系列 GPU已完成Day 0适配,为率先支持该模
    的头像 发表于 04-28 15:51 55次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU产品Day 0适配腾讯混元Hy3 preview语言模型

    股份与上海联通正式签署战略合作协议

    4月17日,股份与中国联合网络通信有限公司上海市分公司(简称“上海联通”)正式签署战略合作协议,此次签约标志着双方在算力基础设施建设、人工智能产业赋能等领域的合作迈入深度融合的新阶段。
    的头像 发表于 04-23 14:33 1175次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b>与上海联通正式签署战略合作协议

    股份Day 0适配阿里千问Qwen3.6-35B-A3B大模型

    阿里巴巴千问模型团队最新宣布,开源旗下多模态“智能体小钢炮” Qwen3.6-35B-A3B模型。股份与FlagOS合作,完成了该模型的Day0 适配。经测试,基于
    的头像 发表于 04-22 11:13 580次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b>Day 0适配阿里千问Qwen3.6-35B-A3B大模型

    股份云C系列GPU产品Day 0适配MiniMax M2.7模型

    4月12日,MiniMax新一代Agent旗舰大模型M2.7开源股份云C系列GPU已完成对 M2.7的Day 0深度适配,将为M2.
    的头像 发表于 04-13 17:08 825次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU产品Day 0适配MiniMax M2.7模型

    股份全面入国家教育开源平台启悟学习社区

    经国家教育部科技司指导,国家教育开源平台“AI专区”近日正式上线“启悟学习社区”(https://qiwoo.edu.cn)。社区设有“微课程”“创空间”等多个版块,旨在通过校企多方协同合作,共建共享自主可控的人工智能
    的头像 发表于 04-13 10:07 481次阅读

    股份云C系列GPU产品Day 0适配智谱GLM-5.1旗舰模型

    4月8日,智谱新一代旗舰模型GLM-5.1实现开源。目前,股份云 C 系列 GPU已完成该系列模型Day 0 全量适配,再度以全栈自主
    的头像 发表于 04-09 11:25 395次阅读

    股份与百度飞桨黑客松硬核赛题来袭

    股份作为飞桨黑客松第十期文心合作伙伴赛道核心出题方之一,携专属赛题「优化 PaddleOCR-VL-1.5+MetaX GPU」重磅来袭,邀全球开发者共探深度学习框架与国产GPU的
    的头像 发表于 04-02 09:20 429次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b>与百度飞桨黑客松硬核赛题来袭

    股份北京AI研究院暨企业开源中心正式揭牌启动

    3月20日,股份北京AI研究院暨“企业开源中心”正式揭牌启动。活动以“芯生,
    的头像 发表于 03-24 10:11 331次阅读

    股份GPU产品正式接入华佗开源生态

    股份坚持“自主创新与开放兼容”双轨战略,以自研MXMACA软件栈为核心,构建硬件与应用的桥梁,并承载开源核心使命。该栈于2025年2月正式开源
    的头像 发表于 03-16 14:40 1695次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b>GPU产品正式接入华佗<b class='flag-5'>开源</b>生态

    股份CXO预科班2026冬令营圆满收官

    2月6日,由集成电路(上海)股份有限公司(股票代码:688802,简称“股份”)主办、之
    的头像 发表于 02-25 16:29 1289次阅读

    股份云C系列GPU Day 0适配智谱GLM-4.6V多模态大模型

    12月8日智谱AI发布并开源 GLM-4.6V 系列多模态大模型,股份云C系列GPU完成Day 0适配。
    的头像 发表于 12-17 14:28 840次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU Day 0适配智谱GLM-4.6V多模态大模型

    股份携手红帽共同发布MXAIE解决方案

    在2025红帽论坛上,股份与全球领先的企业级开源解决方案提供商红帽共同发布MXAIE解决方案。该方案不仅实现了从底层算力到平台运营的全栈整合,更通过深度参与
    的头像 发表于 12-09 14:59 796次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b>携手红帽共同发布MXAIE解决方案

    DLInfer联手股份实现数据生成场景的实际落地

    近期,上海 AI 实验室 DeepLink 团队推出的 DLInfer 通过支持 LMDeploy 主流模型推理,助力股份云 C500 落地 MinerU 多模态数据生成场景,G
    的头像 发表于 12-09 14:55 875次阅读
    DLInfer联手<b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b>实现数据生成场景的实际落地

    云C系列产品已支持TileLang

    近日,DeepSeek宣布在其新版本中拥抱国产GPU语言TileLang,引发业界广泛关注。作为国产高性能GPU的代表,云C系列产品已率先在这一新兴
    的头像 发表于 10-14 09:25 1345次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C系列产品已支持<b class='flag-5'>TileLang</b>