3月31日,2026国际集成电路展览会暨研讨会(IIC2026)将在上海召开。 作为全球集成电路领域最具影响力的行业盛会之一,本届大会以“技术赋能产业,生态链接价值”为核心定位,聚焦AI芯片、汽车电子、工业控制、通信系统、绿色能源等关键应用场景,汇聚全球IC设计、EDA工具、IP授权、先进封装等领域的顶尖企业与专家,打造贯通芯片设计制造、能源技术革新、产品商业化落地的超级产业连接器。
届时,国科微AI算法部部长倪亚宇将在“边缘AI与算力芯片”垂直技术论坛上发表题为《Flash Attention-4:新一代大模型推理NPU流水线范式设计》的主题演讲。
Flash Attention系列由Tri Dao团队主导开发,其核心哲学是IO-Aware的算法-硬件协同优化:通过精细拆分计算任务以适配芯片的内存层次结构,将传统注意力机制中的高开销数据搬运,转化为片上高效计算。该系列自2022年首次发布以来,已迭代至第四版,但即便是V1版本,在NPU平台上的落地实践仍面临巨大挑战。
本次演讲将揭秘FlashAttention-V4如何让算法与NPU硬件实现“默契配合”,通过流水线式的协同设计,打通访存带宽、存储层级、同步机制等关键堵点,为国产算力平台上的大模型推理开辟一条高效新路径。更进一步,倪亚宇还将在演讲中披露国科微新一代NPU架构——该架构支持高性能FlashAttention推理,并配套新一代工具链,持续夯实国科微在打造“端边AI芯引擎”战略中的技术积累。
-
集成电路
+关注
关注
5463文章
12667浏览量
375607 -
国科微
+关注
关注
0文章
121浏览量
7694 -
大模型
+关注
关注
2文章
3748浏览量
5268
原文标题:IIC2026演讲预告 | 倪亚宇:新一代大模型推理NPU流水线范式设计
文章出处:【微信号:国科微,微信公众号:国科微】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
亿纬锂能亮相第43届美国国际电池研讨会暨展览会
晶科储能亮相ESIE 2026储能国际峰会暨展览会
以韧为刃•向高而跃:2026国际集成电路展览会暨研讨会(IIC SHANGHAI 2026)盛大开幕 "中国IC设计成就奖&qu
芯启源科技邀您共赴2026年莫斯科国际通信展览会
展会邀请|瑞迅科技邀您共赴德国纽伦堡embedded world 2026国际嵌入式展览会
国科微邀您共赴IIC 2026国际集成电路展览会暨研讨会
评论