国内推理GPU厂商曦望，获超10亿元融资-电子发烧友网

电子发烧友网报道 4月20日，国内专注于全栈自研AI推理GPU的企业曦望（Sunrise）宣布，成功完成新一轮超10亿元人民币的融资。自一年多前从商汤分拆独立以来，曦望已累计完成七轮融资，总额约达40亿元，整体估值突破百亿大关。本轮融资吸引了多家产业战略投资者、地方国资及头部财务机构的共同参与，资金将主要用于新一代S3推理GPU的规模化量产、全栈软件生态建设，以及后续S4/S5芯片的研发迭代。

与行业主流的“训推一体”路线不同，曦望自成立之初便深耕推理赛道，以用户真实的Token成本、单位能耗和服务稳定性为芯片设计的核心。目前，曦望已成功推进三代推理GPU的迭代，并实现数万颗GPU的量产落地，构建了从芯片研发、产品量产到解决方案交付的完整闭环。值得一提的是，曦望的芯片均实现一次性流片成功，且流片后性能完全符合设计预期。

曦望董事长徐冰指出，当前AI算力基建的重心已发生彻底转变。预计到2026年，AI推理计算需求将达到训练需求的4-5倍，推理算力租赁价格半年内涨幅近40%。曦望的产品布局紧扣这一趋势：2020年量产的曦望S1是一款视觉推理芯片，适配多种CV模型，并已实现IP授权；2024年量产的曦望S2则是一款大模型推理GPGPU芯片，兼容CUDA生态，可适配主流模型。

2026年1月，曦望正式发布新一代旗舰产品——启望S3推理GPU。作为国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU，启望S3专为大模型推理定制，支持从FP16到FP4的精度切换，并采用LPDDR6显存方案。在主流大模型推理场景中，其单位Token推理成本较上一代显著优化，整体推理性价比大幅提升。该芯片从AICore计算架构到内存IO系统进行了全链路重构，通过裁剪训练态所需模块，将节省的晶体管与功耗预算集中投向推理，使单位面积有效算力效率提升5倍以上，目标实现Token成本下降90%。

围绕启望S3，曦望推出了寰望SC3-256超节点方案（全液冷设计）及覆盖PCIe卡、OAM模组、一体机及AI计算集群的S3产品矩阵，满足从单机推理到大规模集群部署的多样化需求。同时，曦望启动“共建推理云”计划，以启望S3为基础，通过GPU池化与弹性调度整合算力资源，并以MaaS（模型即服务）模式向企业提供大模型推理服务。

2026年，曦望将全力推进S3芯片的量产交付，并完成与国内外主流大模型、多模态模型和Agent框架的全面适配。此外，公司已规划S4高性能推理GPU和S5安全可控推理GPU的技术路线，持续探索近存计算、光电共封等前沿技术。

在生态合作方面，2025年7月25日，游族网络与曦望宣布建立深度协同战略伙伴关系。2026年1月27日，曦望在杭州举办首届Sunrise GPU Summit，发布启望S3并披露算力产品体系及共建推理云生态计划。会上，曦望与浙江大学成立“智能计算联合研发中心”，并与中交信科集团、杭钢数字科技等企业达成战略合作，联合商汤科技、第四范式等发起推理成本计划。同日，曦望与游族网络就数字经济算力协同达成合作，探索国产推理芯片接入游戏研运流程。2026年2月11日，曦望宣布完成与北京智源人工智能研究院众智FlagOS体系中FlagTree统一编译器及FlagGems算子库的适配优化工作。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
5265

浏览量
136040

搜索历史

国内推理GPU厂商曦望，获超10亿元融资

评论