0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

澎峰科技亮相2026 TritonNext技术大会

perfxlab 来源:perfxlab 2026-01-13 16:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

算力已成为 AI 时代的“石油”,但如何高效挖掘异构算力的潜能,打破单一硬件架构的软件壁垒,是全行业面临的共同考题。

过去二十年,CUDA 几乎定义了 GPU 编程的主流路径。但在 2026 年,随着更多国内AI芯片算力崛起与异构计算的普及,Triton 正从一个学术界的编程语言,演变为工业界打破 CUDA 垄断、连接上层算法与底层芯片的关键“通用语”。然而,语言的繁荣也带来了新的挑战:算子开发如何平衡易用性与极致性能?如何解决碎片化的硬件适配难题?

1 月 9 日,由众智 FlagOS 开源社区、北京智源人工智能研究院与 CSDN 联合主办的「2026 TritonNext 技术大会」在北京海淀区中关村国家自主创新示范区展示中心盛大开幕。

作为国内首个聚焦 Triton 生态、下一代算子编程和编译器的硬核技术盛会,本次大会以“聚焦下一代算子编程语言与真实落地实践”为核心,汇聚了来自北京智源人工智能研究院、中科院计算所、华为、蚂蚁集团、字节跳动、百度、摩尔线程等顶尖机构与企业的 AI 系统专家。从 FlagOS 的统一生态构建到大厂的落地实战,从 AI 辅助编程到 RISC-V 的前沿探索,与会专家共同探讨了 AI 编译器、高性能算子开发及异构硬件适配的最新解法,吹响了 AI 系统软件栈向“好用”、“通用”进军的号角。澎峰科技作为 FlagOS 生态伙伴参加会议并作了《基于 FlagGems Triton 的运行时调优与算子优化》分享。

张先轶:基于 FlagGems Triton 的运行时调优与算子优化

作为 OpenBLAS 的发起人,北京澎峰科技创始人兼 CEO 张先轶以 FlagGems C++ Wrapper 的底层依赖——轻量级 C++ 运行时库 libtriton_jit 为例,分享了团队在高性能算子库上的核心优化实践。他表示,重构 libtriton_jit 有两个核心目标:一是降低开销,消除纯 Python 运行时中不可避免的解释器开销和调度延迟;二是实现多后端统一,提供统一 C++ 接口,支持多硬件后端,并屏蔽底层 API 差异。

在技术实现上,他选择了 Policy-Based Design(编译时多态),利用 C++ 模板在编译期静态确定行为,从而消除抽象层开销,同时兼顾灵活性。虽然这种做法会增加二进制体积,但经过优化,wrapper 延迟显著下降,整体性能提升 2.5~4 倍;在小算子场景下,平均延迟仅为 11.69 μs,比重构前快 43%。此外,他进一步分享了算子层面的优化实践,包括在 mm 算子加入 TMA 优化,同时提升 TensorDescriptor 稳定性,并扩大 Triton Autotuning 搜索空间;对 Kron、argmin、resolve_conj、gelu_backward、glu_backward 等算子,则通过针对算法特性的 Block_size 调整,实现了更高加速比。整体而言,这些优化不仅大幅降低了延迟,也实现了算子层面的极致解耦,为构建高性能算子库提供了一套高效、灵活且可维护的解决方案。

一场技术盛会的价值,不仅在于前沿思想的碰撞,更在于生态力量的凝聚。大会举行了 “众智 FlagOS v1.6 研发致谢单位授予仪式”。澎峰科技代表与北京智源研究院、中科院计算所、中科加禾、安谋科技、北京大学、北京师范大学、百度飞桨、硅基流动、寒武纪、海光信息、华为、基流科技、摩尔线程、沐曦科技、清微智能、天数智芯、先进编译实验室、移动研究院、中国矿业大学(北京)等多家在 FlagOS v1.6 版本研发中做出卓越贡献的单位代表上台,接受了这份代表社区认可的荣誉。

这一环节不仅是对过去一年多来所有贡献者辛勤付出的肯定,更展现了 FlagOS 社区“众智”的力量——正是这些来自产学研各界的核心力量,共同推动着国产 AI 系统软件栈从愿景走向现实。

TritonNext:始于一行代码,成于众人之智

从上午场深度的技术趋势及架构剖析,到下午场热烈的技术实践与代码实战操练,2026 TritonNext 技术大会不仅呈现了一场关于 Triton 与 AI 系统软件的技术盛宴,更生动诠释了“众智”的力量。

当“一次编写,处处运行”不再是遥远的理想,当 AI 开始自动生成并验证算子,当开发者们能够通过统一的开源社区协同攻克异构硬件的壁垒——我们看到的,是一个正在加速繁荣的、由开发者驱动的开源新生态。这场大会是起点,更是集结号,真正的变革将在每一行被贡献的代码、每一次社区的讨论中发生。

对于奋战在一线的开发者而言,“异构适配”与“性能优化”或许是过去几年中最令人头疼的工程难题。而贯穿 2026 TritonNext 技术大会始终的,正是对这些难题的正面回应。

从 KernelGen 将算子开发门槛降至“分钟级”,到 FlagTree 让跨芯迁移成本缩短至“天级”,再到 Triton-Distributed 将分布式编程化繁为简——大会传递出一个明确的信号:工具的进化,正在将开发者从繁琐的底层适配工作中解放出来,能够重新聚焦于最具创造力的算法与应用创新。AI 系统软件的未来,正由每一位被赋能的开发者亲手构建。澎峰科技将持续深度参与 FlagOS 生态构建,与产业伙伴共同推动 Triton 在技术攻坚、应用落地与社区生态的协同发展与繁荣。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40941

    浏览量

    302523
  • RISC-V
    +关注

    关注

    49

    文章

    2941

    浏览量

    53520
  • 澎峰科技
    +关注

    关注

    0

    文章

    83

    浏览量

    3756

原文标题:TritonNext技术大会圆满落幕,澎峰科技受邀参会

文章出处:【微信号:perfxlab,微信公众号:perfxlab】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    海康威视亮相2026边坡与滑坡工程技术创新大会

    近日,2026年边坡与滑坡工程技术创新大会在成都举行,海康威视携多款边坡监测产品亮相,以数智技术为边坡安全打造系统性解决方案。
    的头像 发表于 04-20 17:38 409次阅读

    TE Connectivity亮相2026商用航空发动机技术大会

    2026年3月31日至4月1日,2026(第十届)商用航空发动机技术大会在上海举行。TE Connectivity航空航天、防务与船舶事业部(以下简称“TE AD&M”)
    的头像 发表于 04-15 18:05 1277次阅读

    IPAC大会全面升级,2026年开启双技术峰会!

    影响力的标杆盛会。2026年,IPAC大会全面升级,开启双技术峰会新篇章!为进一步聚焦零碳技术前沿,英飞凌将于2026年首次推出两大主题
    的头像 发表于 04-10 09:07 374次阅读
    IPAC<b class='flag-5'>大会</b>全面升级,<b class='flag-5'>2026</b>年开启双<b class='flag-5'>技术</b>峰会!

    云英谷科技亮相ICDT 2026国际显示技术大会

    近日,2026年国际显示技术大会(ICDT)在重庆圆满落幕。云英谷VTDR6135 AMOLED显示驱动芯片凭借在显示组件领域的技术实力与创新表现,荣获SID中国区显示行业六大奖项(C
    的头像 发表于 04-08 17:28 792次阅读

    华大九天亮相ICDT 2026国际显示技术大会

    2026 年 3 月 31 日至 4 月 3 日,全球显示领域瞩目的学术与产业盛会 ——2026 国际显示技术大会(ICDT 2026) 在
    的头像 发表于 04-03 17:18 1561次阅读

    西门子EDA亮相2026玄铁RISC-V生态大会

    2026年3月24日,“开放·连接” 2026玄铁 RISC-V 生态大会在上海圆满举办。西门子 EDA 携 Veloce proFPGA CS 系列亮相展台,为在场观众展示了专为玄铁
    的头像 发表于 04-01 13:43 1610次阅读

    大咖集结·即刻报名 | 2026 玄铁 RISC-V 生态大会主论坛议程正式发布!

    2026 年 3 月 24 日,“开放·连接” 2026 玄铁 RISC-V 生态大会将在上海世博桐森酒店盛大启幕。主论坛议程现已正式发布,立即扫描下方海报二维码报名。期待与大家再聚申城,春暖花开,共启芯篇! 扫码报名,到现场赢
    发表于 03-17 20:45

    智领未来:寻迹智行亮相2026第十一届物流技术大会

    3月11日至13日,寻迹智行(Beacon Robot)荣幸受邀参加2026第十一届物流技术大会,与行业同仁共话智慧物流新未来。
    的头像 发表于 03-14 16:50 2501次阅读
    智领未来:寻迹智行<b class='flag-5'>亮相</b><b class='flag-5'>2026</b>第十一届物流<b class='flag-5'>技术</b><b class='flag-5'>大会</b>

    华阳多媒体亮相2026德国纽伦堡国际电子显示大会

    3月11日至12日,2026国际电子显示大会 (electronic displays Conference 2026 简称edC 2026) 在德国纽伦堡会展中心举行。本届
    的头像 发表于 03-13 17:05 829次阅读

    科技亮相2026美国西部光电展

    2026年1月20日至22日,全球光电产业风向标——美国西部光电展SPIE Photonics West 2026在旧金山莫斯康会议中心举行。科创板首批上市企业光科技应邀参展,在西馆6228展位
    的头像 发表于 01-22 16:57 782次阅读

    科技亮相CES 2026国际消费电子展

    全球科技产业年度风向标——国际消费电子展(CES 2026)在美国拉斯维加斯举办,半导体激光光源领先企业光科技携蜻蜓G1、蜻蜓G1 mini、彩虹C1三款LCoS AR光机产品亮相CES。
    的头像 发表于 01-06 17:42 1002次阅读

    科技完成OpenAI最新开源推理模型适配

    科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企业级 AI 生产力!
    的头像 发表于 08-14 11:34 1534次阅读

    科技亮相第六届中国科学院大学校友创新论坛

    近日,第六届中国科学院大学校友创新论坛在北京成功举行。科技作为国内领先的算力基础软件与解决方案提供商,荣获本届论坛“未来之星校友企业奖”殊荣。公司创始人兼CEO张先轶博士受邀出席本次活动并领奖。
    的头像 发表于 05-29 10:27 913次阅读
    <b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技<b class='flag-5'>亮相</b>第六届中国科学院大学校友创新论坛

    Imagination与科技携手推动GPU+AI解决方案,共拓计算生态

    的深度融合展开合作。双方将结合 Imagination 领先的 GPU IP 技术科技在 AI 模型压缩与性能优化方面的软硬协同能力,共同开拓面向 AI 行业应用的计算解决方案,推动国产计算生态
    发表于 05-21 09:40 1289次阅读

    Imagination与科技携手推动GPU+AI解决方案,共拓计算生态

    结合Imagination领先的GPUIP技术科技在AI模型压缩与性能优化方面的软硬协同能力,共同开拓面向AI行业应用的计算解决方案,推动国产计算生态的繁荣
    的头像 发表于 05-20 08:33 1016次阅读
    Imagination与<b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技携手推动GPU+AI解决方案,共拓计算生态