0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

海光DCU完成阶跃星辰基座模型Step 3.5 Flash推理适配

CHANBAEK 来源:海光信息 2026-03-26 09:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,海光DCU正式完成对阶跃星辰旗舰开源基座模型Step 3.5 Flash的全流程适配与深度调优。得益于新一代海光DCU原生支持FP8精度、超越主流旗舰产品的更大显存等核心优势,高效完成Step 3.5 Flash FP8的推理适配,打造“适配更全面、性能更卓越”的国产算力解决方案。

作为阶跃星辰推出的新一代基座模型,Step 3.5 Flash总参数达1960亿,推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS,专为智能体(Agent)场景设计,在复杂推理和长链任务中表现出色,其推理深度可媲美部分顶级闭源模型,获得全球开发者广泛认可。

本次适配工作中,海光DCU团队充分依托以DTK(异构计算平台)在内的全栈AI软件栈协同优势,针对Step 3.5 Flash的稀疏MoE架构特性,重点开展底层算子优化、硬件调度加速与全流程推理性能打磨,优化模型推理时延与吞吐效率,确保模型在海光DCU平台上实现高可靠、低延迟的稳定运行。

相较于主流的FP16精度,新一代海光DCU原生支持的FP8在相同硬件平台上可大幅增加理论峰值性能,同时降低内存占用与通信开销,有效节约模型部署成本、提升Token Efficiency,为开发者提供更具性价比的算力支撑。

现在,全球开发者可在光合开发者社区一键下载Step 3.5 Flash及Step 3.5 Flash FP8模型并落地部署,满足多样化推理需求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3902

    浏览量

    52412
  • DCU
    DCU
    +关注

    关注

    0

    文章

    23

    浏览量

    3215
  • 海光信息
    +关注

    关注

    0

    文章

    67

    浏览量

    2767
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    沐曦股份曦云C系列GPU产品Day 0适配阶跃星辰开源Step 3.7 Flash模型

    5 月 29 日,阶跃星辰正式开源面向Agent 生产化阶段推出的新一代 Flash 模型Step 3.7
    的头像 发表于 05-30 17:25 1353次阅读
    沐曦股份曦云C系列GPU产品Day 0<b class='flag-5'>适配</b><b class='flag-5'>阶跃</b><b class='flag-5'>星辰</b>开源<b class='flag-5'>Step</b> 3.7 <b class='flag-5'>Flash</b><b class='flag-5'>模型</b>

    壁仞科技壁砺166M产品Day 0适配阶跃星辰开源Step 3.7 Flash模型

    5月29日,阶跃星辰正式发布并开源Step 3.7 Flash。凭借壁仞科技自研的全栈多智能体编排平台SUPACODE与BIRENSUPA的协同优势,壁砺 166M在
    的头像 发表于 05-30 11:52 640次阅读
    壁仞科技壁砺166M产品Day 0<b class='flag-5'>适配</b><b class='flag-5'>阶跃</b><b class='flag-5'>星辰</b>开源<b class='flag-5'>Step</b> 3.7 <b class='flag-5'>Flash</b><b class='flag-5'>模型</b>

    智源FlagOS携手信息完成DeepSeek V4 Flash全量适配

    近日,北京智源研究院众智FlagOS社区宣布,已完成DeepSeekV4Flash 284B大模型等多款AI芯片上的Day0全量
    的头像 发表于 05-14 17:34 929次阅读

    信息DCU产品深度适配商汤科技SenseNova U1系列大模型

    近日,商汤科技推出并开源新一代原生多模态大模型SenseNova U1,DCU率先完成适配
    的头像 发表于 05-14 17:32 802次阅读

    信息深算3号DCU深度适配腾讯混元Hy3 preview大模型

    近日,信息自主研发的深算3号DCU完成与腾讯最新开源大模型 —— 混元Hy3 preview的全面深度
    的头像 发表于 05-12 17:49 1615次阅读

    信息DCU平台完成对DeepSeek V4模型极速适配

      4月24日,深度求索正式发布并开源DeepSeek V4。DCU同步完成对DeepSeek V4的Day0适配,以“
    的头像 发表于 04-24 17:32 2018次阅读

    信息DCU平台适配阿里通义Qwen3.6-35B-A3B大模型

      近日,阿里通义正式开源多模态智能体大模型Qwen3.6-35B-A3B,发布不到24小时,信息联合众智FlagOS社区完成模型
    的头像 发表于 04-21 17:40 2175次阅读

    DCU Day0适配百度文心ERNIE-Image文生图模型

      今天,百度文心大模型团队发布ERNIE-Image文生图模型DCU同步完成Day0
    的头像 发表于 04-15 15:47 460次阅读

    DCU完成Qwen3.5多模态MoE模型全量适配

    近日,DCU完成Qwen3.5-397B MoE旗舰多模态模型、Qwen
    的头像 发表于 03-26 09:35 971次阅读

    燧原科技训推一体芯片L600适配阶跃星辰基座模型Step 3.5 Flash

    2026年2月2日,阶跃星辰发布并开源最新基座模型 Step 3.5
    的头像 发表于 02-02 17:50 1735次阅读
    燧原科技训推一体芯片L600<b class='flag-5'>适配</b><b class='flag-5'>阶跃</b><b class='flag-5'>星辰</b><b class='flag-5'>基座</b><b class='flag-5'>模型</b><b class='flag-5'>Step</b> <b class='flag-5'>3.5</b> <b class='flag-5'>Flash</b>

    壁仞科技壁砺166系列产品适配阶跃星辰基座模型Step 3.5 Flash

    NEWS 2月2日,阶跃星辰发布并开源最新旗舰基座模型Step 3.5
    的头像 发表于 02-02 17:48 1611次阅读
    壁仞科技壁砺166系列产品<b class='flag-5'>适配</b><b class='flag-5'>阶跃</b><b class='flag-5'>星辰</b><b class='flag-5'>基座</b><b class='flag-5'>模型</b><b class='flag-5'>Step</b> <b class='flag-5'>3.5</b> <b class='flag-5'>Flash</b>

    阶跃星辰开源Step 3.5 Flash,多家国产芯片厂商完成适配

    2月2日,阶跃星辰正式发布新一代开源Agent基座模型——Step 3.5
    的头像 发表于 02-02 15:36 2058次阅读

    沐曦曦云C600 GPU产品适配阶跃星辰基座模型Step 3.5 Flash

    今天,阶跃星辰技术团队发布并开源最新旗舰基座模型 Step 3.5
    的头像 发表于 02-02 14:44 672次阅读
    沐曦曦云C600 GPU产品<b class='flag-5'>适配</b><b class='flag-5'>阶跃</b><b class='flag-5'>星辰</b><b class='flag-5'>基座</b><b class='flag-5'>模型</b><b class='flag-5'>Step</b> <b class='flag-5'>3.5</b> <b class='flag-5'>Flash</b>

    燧原科技加入阶跃星辰模芯生态创新联盟

    近日,阶跃星辰在上海召开「Step 3大模型发布会暨生态联盟成立大会」,会上阶跃发布了新一代基础大模型
    的头像 发表于 07-26 14:21 1346次阅读

    DCU率先展开文心系列模型的深度技术合作 FLOPs利用率(MFU)达47%

    DCU实现文心4.5模型高效适配; FLOPs利用率突破47%。 2025年6月30日,在百度文心4.5系列大
    的头像 发表于 07-01 14:35 2749次阅读