0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

海光DCU完成阶跃星辰基座模型Step 3.5 Flash推理适配

CHANBAEK 来源:海光信息 2026-03-26 09:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,海光DCU正式完成对阶跃星辰旗舰开源基座模型Step 3.5 Flash的全流程适配与深度调优。得益于新一代海光DCU原生支持FP8精度、超越主流旗舰产品的更大显存等核心优势,高效完成Step 3.5 Flash FP8的推理适配,打造“适配更全面、性能更卓越”的国产算力解决方案。

作为阶跃星辰推出的新一代基座模型,Step 3.5 Flash总参数达1960亿,推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS,专为智能体(Agent)场景设计,在复杂推理和长链任务中表现出色,其推理深度可媲美部分顶级闭源模型,获得全球开发者广泛认可。

本次适配工作中,海光DCU团队充分依托以DTK(异构计算平台)在内的全栈AI软件栈协同优势,针对Step 3.5 Flash的稀疏MoE架构特性,重点开展底层算子优化、硬件调度加速与全流程推理性能打磨,优化模型推理时延与吞吐效率,确保模型在海光DCU平台上实现高可靠、低延迟的稳定运行。

相较于主流的FP16精度,新一代海光DCU原生支持的FP8在相同硬件平台上可大幅增加理论峰值性能,同时降低内存占用与通信开销,有效节约模型部署成本、提升Token Efficiency,为开发者提供更具性价比的算力支撑。

现在,全球开发者可在光合开发者社区一键下载Step 3.5 Flash及Step 3.5 Flash FP8模型并落地部署,满足多样化推理需求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3810

    浏览量

    52253
  • DCU
    DCU
    +关注

    关注

    0

    文章

    20

    浏览量

    3192
  • 海光信息
    +关注

    关注

    0

    文章

    49

    浏览量

    2733
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DCU Day0适配百度文心ERNIE-Image文生图模型

      今天,百度文心大模型团队发布ERNIE-Image文生图模型DCU同步完成Day0
    的头像 发表于 04-15 15:47 140次阅读

    DCU完成Qwen3.5多模态MoE模型全量适配

    近日,DCU完成Qwen3.5-397B MoE旗舰多模态模型、Qwen
    的头像 发表于 03-26 09:35 623次阅读

    天数智芯完成阿里云通义千问Qwen3.5系列多模态模型全量适配

    近日,天数智芯携手众智FlagOS 社区完成阿里云通义千问 Qwen3.5 系列多模态模型全量适配,实现模型精度精准对齐与端到端无缝部署,再
    的头像 发表于 03-26 09:25 1388次阅读

    摩尔线程快速完成对Qwen3.5模型全面适配

    2月17日,摩尔线程宣布已在旗舰级AI训推一体全功能GPU MTT S5000上完成对阿里最新大模型Qwen3.5的全方位适配。此次支持充分展示了摩尔线程MUSA生态的成熟度与完备性,
    发表于 02-18 08:32 1116次阅读

    燧原科技训推一体芯片L600适配阶跃星辰基座模型Step 3.5 Flash

    2026年2月2日,阶跃星辰发布并开源最新基座模型 Step 3.5
    的头像 发表于 02-02 17:50 1498次阅读
    燧原科技训推一体芯片L600<b class='flag-5'>适配</b><b class='flag-5'>阶跃</b><b class='flag-5'>星辰</b><b class='flag-5'>基座</b><b class='flag-5'>模型</b><b class='flag-5'>Step</b> <b class='flag-5'>3.5</b> <b class='flag-5'>Flash</b>

    壁仞科技壁砺166系列产品适配阶跃星辰基座模型Step 3.5 Flash

    NEWS 2月2日,阶跃星辰发布并开源最新旗舰基座模型Step 3.5
    的头像 发表于 02-02 17:48 1393次阅读
    壁仞科技壁砺166系列产品<b class='flag-5'>适配</b><b class='flag-5'>阶跃</b><b class='flag-5'>星辰</b><b class='flag-5'>基座</b><b class='flag-5'>模型</b><b class='flag-5'>Step</b> <b class='flag-5'>3.5</b> <b class='flag-5'>Flash</b>

    阶跃星辰开源Step 3.5 Flash,多家国产芯片厂商完成适配

    2月2日,阶跃星辰正式发布新一代开源Agent基座模型——Step 3.5
    的头像 发表于 02-02 15:36 1766次阅读

    沐曦曦云C600 GPU产品适配阶跃星辰基座模型Step 3.5 Flash

    今天,阶跃星辰技术团队发布并开源最新旗舰基座模型 Step 3.5
    的头像 发表于 02-02 14:44 527次阅读
    沐曦曦云C600 GPU产品<b class='flag-5'>适配</b><b class='flag-5'>阶跃</b><b class='flag-5'>星辰</b><b class='flag-5'>基座</b><b class='flag-5'>模型</b><b class='flag-5'>Step</b> <b class='flag-5'>3.5</b> <b class='flag-5'>Flash</b>

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企
    的头像 发表于 08-14 11:34 1529次阅读

    华为CANN与智谱GLM端侧模型完成适配

    已于7月28日正式开源其新一代基座模型GLM-4.5,其GLM端侧模型完成与CANN的适配。这标志着国产大
    的头像 发表于 08-11 11:00 2742次阅读

    阶跃星辰和燧原科技亮相WAIC 2025

    近日,2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)在上海开幕。开幕前夕,中国AI大模型头部企业阶跃星辰发布新一代基础大模型
    的头像 发表于 08-06 16:21 2125次阅读

    寒武纪联手阶跃星辰成立模芯生态创新联盟

    近日,阶跃星辰发布了新一代基础大模型Step 3。Step 3兼顾智能与效率,通过模型和系统联合
    的头像 发表于 07-31 11:26 1276次阅读

    燧原科技加入阶跃星辰模芯生态创新联盟

    近日,阶跃星辰在上海召开「Step 3大模型发布会暨生态联盟成立大会」,会上阶跃发布了新一代基础大模型
    的头像 发表于 07-26 14:21 1196次阅读

    DCU率先展开文心系列模型的深度技术合作 FLOPs利用率(MFU)达47%

    DCU实现文心4.5模型高效适配; FLOPs利用率突破47%。 2025年6月30日,在百度文心4.5系列大
    的头像 发表于 07-01 14:35 2512次阅读

    壁仞科技完成Qwen3旗舰模型适配

    近日,在高效适配Qwen3系列模型推理后,壁仞科技宣布完成旗舰版Qwen3-235B-A22B模型的训练
    的头像 发表于 05-16 16:23 1141次阅读