电子发烧友网报道 4月20日,国内专注于全栈自研AI推理GPU的企业曦望(Sunrise)宣布,成功完成新一轮超10亿元人民币的融资。自一年多前从商汤分拆独立以来,曦望已累计完成七轮融资,总额约达40亿元,整体估值突破百亿大关。本轮融资吸引了多家产业战略投资者、地方国资及头部财务机构的共同参与,资金将主要用于新一代S3推理GPU的规模化量产、全栈软件生态建设,以及后续S4/S5芯片的研发迭代。
与行业主流的“训推一体”路线不同,曦望自成立之初便深耕推理赛道,以用户真实的Token成本、单位能耗和服务稳定性为芯片设计的核心。目前,曦望已成功推进三代推理GPU的迭代,并实现数万颗GPU的量产落地,构建了从芯片研发、产品量产到解决方案交付的完整闭环。值得一提的是,曦望的芯片均实现一次性流片成功,且流片后性能完全符合设计预期。
曦望董事长徐冰指出,当前AI算力基建的重心已发生彻底转变。预计到2026年,AI推理计算需求将达到训练需求的4-5倍,推理算力租赁价格半年内涨幅近40%。曦望的产品布局紧扣这一趋势:2020年量产的曦望S1是一款视觉推理芯片,适配多种CV模型,并已实现IP授权;2024年量产的曦望S2则是一款大模型推理GPGPU芯片,兼容CUDA生态,可适配主流模型。
2026年1月,曦望正式发布新一代旗舰产品——启望S3推理GPU。作为国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU,启望S3专为大模型推理定制,支持从FP16到FP4的精度切换,并采用LPDDR6显存方案。在主流大模型推理场景中,其单位Token推理成本较上一代显著优化,整体推理性价比大幅提升。该芯片从AICore计算架构到内存IO系统进行了全链路重构,通过裁剪训练态所需模块,将节省的晶体管与功耗预算集中投向推理,使单位面积有效算力效率提升5倍以上,目标实现Token成本下降90%。
围绕启望S3,曦望推出了寰望SC3-256超节点方案(全液冷设计)及覆盖PCIe卡、OAM模组、一体机及AI计算集群的S3产品矩阵,满足从单机推理到大规模集群部署的多样化需求。同时,曦望启动“共建推理云”计划,以启望S3为基础,通过GPU池化与弹性调度整合算力资源,并以MaaS(模型即服务)模式向企业提供大模型推理服务。
2026年,曦望将全力推进S3芯片的量产交付,并完成与国内外主流大模型、多模态模型和Agent框架的全面适配。此外,公司已规划S4高性能推理GPU和S5安全可控推理GPU的技术路线,持续探索近存计算、光电共封等前沿技术。
在生态合作方面,2025年7月25日,游族网络与曦望宣布建立深度协同战略伙伴关系。2026年1月27日,曦望在杭州举办首届Sunrise GPU Summit,发布启望S3并披露算力产品体系及共建推理云生态计划。会上,曦望与浙江大学成立“智能计算联合研发中心”,并与中交信科集团、杭钢数字科技等企业达成战略合作,联合商汤科技、第四范式等发起推理成本计划。同日,曦望与游族网络就数字经济算力协同达成合作,探索国产推理芯片接入游戏研运流程。2026年2月11日,曦望宣布完成与北京智源人工智能研究院众智FlagOS体系中FlagTree统一编译器及FlagGems算子库的适配优化工作。
-
gpu
+关注
关注
28文章
5265浏览量
136040
发布评论请先 登录
爆赚20亿,营收暴增超400%!国产GPU三巨头年度业绩放榜
华源智信宣布完成过亿元融资
一文看懂 | 中国华北、华东地区SiC功率器件厂商2026年最新动态【上】
蔚来芯片子公司安徽神玑完成首轮超22亿元融资
华进半导体宣布完成超12亿元融资
图像传感器厂商元视芯完成超3亿元A+轮融资
曦望发布新一代推理GPU芯片,单位Token推理成本降低90%
今日看点:消息称 AMD、高通考虑导入 SOCAMM 内存;曦望发布新一代推理GPU芯片启望S3
存算一体AI芯片公司九天睿芯完成超亿元B轮融资
踏歌智行完成超2亿元C+轮融资
北极芯微完成超亿元A轮融资
曦智科技完成超15亿元C轮融资
GPU新星获10亿元融资!“烧钱”升级,高端芯片单项目投入近20亿
国内推理GPU厂商曦望,获超10亿元融资
评论