0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

曦望发布新一代推理GPU芯片,单位Token推理成本降低90%

Carol Li 来源:电子发烧友网 作者:李弯弯 2026-01-28 17:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道 1月27日,国产GPU厂商曦望(Sunrise)重磅发布新一代推理GPU芯片——启望S3。这是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。2025年,曦望芯片交付量已突破万片。

启望S3是专为大模型推理打造的定制化GPGPU芯片。在典型推理场景下,它的整体性价比较上一代提升超10倍。在算力与存储设计方面,该芯片支持FP16至FP4精度切换,采用LPDDR6显存方案,显存容量提升4倍,有效缓解了大模型推理的显存瓶颈,成为国内首款采用此显存方案的芯片。在DeepSeek V3/R1满血版等主流大模型推理中,单位Token成本较上一代降低约90%,让“百万Token一分钱”成为可能,极大推动了大模型推理的大规模普惠应用。

曦望是国产全栈自研人工智能算力芯片企业,其前身是商汤大芯片部门,于2024年底分拆独立运营。它专注于高性能GPU及多模态场景推理芯片的研发与商业化,凭借八年技术沉淀、二十亿研发投入及两代量产芯片的工程化验证,已成为国产GPU替代的核心力量。公司致力于为千行百业提供成本降低十倍、能效比突破的智能算力基石,推动各行业智能化发展,助力实现通用人工智能(AGI)的普惠化目标。

曦望已构建起覆盖全场景需求的三代芯片产品矩阵。2020年量产的首款AI推理芯片S1,适配千余种CV模型,满足了视觉推理领域的需求。2024年量产的S2芯片,深度兼容CUDA生态,能流畅推理DeepSeek、Qwen等开源大模型,以及文生图、文生视频、文生3D主流模型,进一步拓展了应用场景。而此次推出的S3芯片,定位“推理性价比之王”,在单位Token成本、能耗表现上实现数量级突破,原生支持FP8/FP4低精度推理,为大模型推理提供核心支撑。

作为国内首家All - in推理的GPU芯片公司,曦望始终深耕推理赛道。在一年内,它顺利完成了近30亿元战略融资,投资方阵容强大。既有三一集团旗下华胥基金、范式智能等产业投资方,也有无极资本、IDG资本等国内知名VC/PE机构,还获得了诚通混改基金等国资背景资本的鼎力加持。所筹资金将专项用于下一代推理GPU的核心技术研发、规模化量产及生态共建,持续夯实其在推理算力赛道的核心竞争力。

此次发布,曦望不仅带来了启望S3芯片,还推出了一整套面向大模型推理的解决方案。寰望SC3 - 256超节点方案,面向千亿、万亿级参数多模态MoE推理,采用全液冷设计,支持大规模专家并行部署,同等算力规模下,整体交付成本从“亿元级”降至“千万元级”。“百万Token一分钱”计划,联合商汤科技等伙伴共同发起,大幅降低企业使用算力的门槛。共建推理云通过GPU池化与弹性调度,将算力整合为统一“算力池”,以MaaS为核心入口,让企业按需调用算力。

当前,AI模型训练已迈入深水区,推理环节成为AI技术商业化落地的关键。曦望以启望S3芯片为核心,通过“芯片 + 系统 + 生态”的布局,让推理算力变得更像水电一样,成为可规模化、可持续的基础设施,引领国产GPU迈向新的高度。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5313

    浏览量

    136169
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    堪称史上最强推理芯片!英伟达发布 Rubin CPX,实现50倍ROI

    款AI芯片,Rubin CPX采用了成本效益极高的单芯片设计,集成强大的NVFP4计算资源,其GPU专为AI
    的头像 发表于 09-11 08:25 1.1w次阅读
    堪称史上最强<b class='flag-5'>推理</b><b class='flag-5'>芯片</b>!英伟达<b class='flag-5'>发布</b> Rubin CPX,实现50倍ROI

    能够降低Token成本的因素有哪些

    传统数据中心过去主要用于数据的存储、检索与处理。但在生成式 AI 与代理式 AI 时代,这些设施已演变为 AI Token 工厂。随着 AI 推理成为其核心工作负载,它们的主要产出已转变为以 Token 形式制造的智能。
    的头像 发表于 04-27 15:45 719次阅读
    能够<b class='flag-5'>降低</b>每<b class='flag-5'>Token</b><b class='flag-5'>成本</b>的因素有哪些

    国内推理GPU厂商,获超10亿元融资

    40亿元,整体估值突破百亿大关。本轮融资吸引了多家产业战略投资者、地方国资及头部财务机构的共同参与,资金将主要用于新一代S3推理GPU的规模化量产、全栈软件生态建设,以及后续S4/S5芯片
    的头像 发表于 04-21 10:41 1573次阅读

    云C系列GPU Day 0 适配智谱全新一代大模型GLM-5

    智谱AI正式上线并开源全新一代大模型 GLM-5,沐股份实现 Day 0 深度适配。 GLM-5目前可于云 C 系列(C500/C550/C588)上稳定高效运行。 近期,智谱AI相继发布
    的头像 发表于 02-12 10:53 1229次阅读
    <b class='flag-5'>曦</b>云C系列<b class='flag-5'>GPU</b> Day 0 适配智谱全<b class='flag-5'>新一代</b>大模型GLM-5

    百亿Token分钱!云天励飞喊出“推理成本万倍降”,公布三年三芯路线图

    电子发烧友网报道(文/莫婷婷)当前,全球人工智能迈入具身智能(Agentic AI)时代,云天励飞董事长兼CEO陈宁博士在“大算力芯片战略前瞻会”上再次强调:公司将聚焦大模型推理芯片。在大会上,云天
    的头像 发表于 02-09 14:54 5917次阅读
    百亿<b class='flag-5'>Token</b><b class='flag-5'>一</b>分钱!云天励飞喊出“<b class='flag-5'>推理成本</b>万倍降”,公布三年三芯路线图

    力争百万 Tokens 推理成本降低百倍:云天励飞发布未来三年大算力芯片战略,首曝 DeepVerse 路线图

    集中于攻克大模型落地的“成本壁垒”,致力于通过底层架构创新,力争实现百万 Tokens 推理成本降低 100 倍以上的目标,推动 AI 从技术尝鲜走向普惠生产力。产业变局:推理竞速,从
    的头像 发表于 02-03 20:25 3277次阅读
    力争百万 Tokens <b class='flag-5'>推理成本</b><b class='flag-5'>降低</b>百倍:云天励飞<b class='flag-5'>发布</b>未来三年大算力<b class='flag-5'>芯片</b>战略,首曝 DeepVerse 路线图

    今日看点:消息称 AMD、高通考虑导入 SOCAMM 内存;发布新一代推理GPU芯片S3

    发布新一代推理GPU芯片
    发表于 01-28 11:09 1424次阅读

    云巨头算力战升级!微软新一代3nm AI推理芯片性能提升30%,落地数据中心

    据外媒报道,微软发布新一代人工智能芯片Maia 200,这款芯片有望成为英伟达旗舰处理器以及云服务竞争对手亚马逊、谷歌同类产品的替代选择。微软称,这款
    的头像 发表于 01-27 12:29 1w次阅读
    云巨头算力战升级!微软<b class='flag-5'>新一代</b>3nm AI<b class='flag-5'>推理</b><b class='flag-5'>芯片</b>性能提升30%,落地数据中心

    NVIDIA在CES 2026发布新一代Rubin AI平台

    通过跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网交换机的极致协同设计,大幅缩短训练时间,降低
    的头像 发表于 01-09 10:23 906次阅读

    华为数据存储与「DaoCloud 道客」发布AI推理加速联合解决方案

    规模化发展的拦路虎。在有限算力下,长序列输入导致首Token时延(TTFT)增加,甚至超长序列超出模型上下文窗口限制;随着并发数增加,推理吞吐开始下降,任务频繁卡顿;历史对话和行业知识的重复调用造成算力浪费,加大推理成本。如何优
    的头像 发表于 11-28 10:03 514次阅读
    华为数据存储与「DaoCloud 道客」<b class='flag-5'>发布</b>AI<b class='flag-5'>推理</b>加速联合解决方案

    首款全国产通用GPU芯片发布集成推出云C600

    ,并支持MetaXLink超节点扩展技术,在硬件性能和软件兼容上完全满足下一代生成式AI的训练和推理需求。 而且,沐股份与中国科学院合作的国产千卡集群,已完成多个大模型全参数训练,证实国产算力已具备大模型预训练能力。 公开资料
    的头像 发表于 10-19 20:04 4.7w次阅读

    今日看点丨华为发布AI推理创新技术UCM;比亚迪汽车出口暴增130%

    缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低Token
    发表于 08-13 09:45 5779次阅读

    今日看点丨两家国产头部厂商发布新一代AI芯片 ;台积电在美先进封装布局启动

        H20重返中国在即,两家国产头部厂商发布新一代AI芯片   日前,燧原科技和沐这两家头部国产AI芯片厂商首发各自
    发表于 07-28 10:41 2676次阅读
    今日看点丨两家国产头部厂商<b class='flag-5'>发布</b><b class='flag-5'>新一代</b>AI<b class='flag-5'>芯片</b> ;台积电在美先进封装布局启动

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力,融合了自然语言处理(NLP)、深度
    发表于 07-16 15:29

    大模型推理显存和计算量估计方法研究

    随着人工智能技术的飞速发展,深度学习大模型在各个领域得到了广泛应用。然而,大模型的推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。为了解决这问题,本文将探讨大模型推理显存和计算量的估计
    发表于 07-03 19:43