0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

硅基流动携手沐曦首发基于曦云的Kimi K2推理服务

沐曦MetaX 来源:硅基流动 2025-07-23 17:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:硅基流动

今天,硅基流动联合沐曦集成电路(上海)股份有限公司(简称“沐曦”),全球首发基于沐曦曦云 C550 集群的月之暗面 Kimi-K2 大模型商业化服务部署。该服务运行于汇天网络科技有限公司(简称“汇天网络”)运营的沐曦曦云C550 三千卡通用 GPU 国产集群。此次合作标志着硅基流动正式将该国产集群纳入算力网络,进一步为大模型产业落地提供充沛的高性能国产算力。

技术突破层面,三方通过芯片层、框架层、模型层的深度协同优化,显著提升了 Kimi-K2 在曦云 C550 集群上的推理效率。沐曦自主研发的曦云 C550 通用 GPU 为模型提供了高性能、高稳定的核心硬件支撑,可以大幅增加集群算力,缩短大模型计算及推理时间;硅基流动将曦云 C550 集群接入一站式算力纳管平台,丰富了算力资源,并依托自研推理加速引擎,将集群利用率提升至业界领先水平,最终在其大模型云服务平台提供金融级高可靠性、高速响应、高性价比的 Kimi-K2 推理服务。

此次落地在汇天网络的沐曦国产 GPU 集群,是华北地区首个专为大模型规模化商用设计的高性能算力基础设施。该集群纳入硅基流动大模型云服务平台后,将重点服务于金融、政务、教育、科研等领域的头部客户,提供企业级 AI 推理部署解决方案。

下一步,硅基流动、汇天网络与沐曦三方将围绕"北京国产万卡集群"建设目标,持续推进集群硬件扩容与绿色 AIDC 技术研发。同时,三方将深化与国内主流大模型企业的生态合作,通过"算力-算法-应用"的全链路协同创新,突破产业链应用瓶颈,助力“国产算力+大模型产业”实现从技术突破到商业化落地的跨越式发展。

关于沐曦

沐曦致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 集成电路
    +关注

    关注

    5470

    文章

    12778

    浏览量

    376466
  • 沐曦
    +关注

    关注

    1

    文章

    125

    浏览量

    1899
  • 大模型
    +关注

    关注

    2

    文章

    3895

    浏览量

    5326

原文标题:硅基流动联合沐曦首发基于曦云的 Kimi K2 推理服务,落地汇天网络北京国产 GPU 智算集群

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    股份C系列GPU产品深度适配腾讯混元翻译模型Hy-MT2

    5月21日,腾讯混元翻译模型Hy-MT2正式开源,包含3个尺寸的模型Hy-MT2-1.8B、Hy-MT2-7B、Hy-MT2-30B-A3B。
    的头像 发表于 05-22 17:20 2031次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b><b class='flag-5'>云</b>C系列GPU产品深度适配腾讯混元翻译模型Hy-MT<b class='flag-5'>2</b>

    股份与文心合作伙伴赛道Meetup上海站即将举办

    股份携手文心大模型,围绕专属赛题「优化 PaddleOCR-VL-1.5 + MetaX GPU」,共同探索国产算力平台在大模型能力上的部署与推理优化实践。
    的头像 发表于 05-19 10:34 473次阅读

    股份C系列GPU产品Day 0适配腾讯混元Hy3 preview语言模型

    4月23日,腾讯混元团队正式发布并开源Hy3 preview语言模型。股份旗下 C 系列 GPU已完成Day 0适配,为率先支持该模型的国产算力。
    的头像 发表于 04-28 15:51 1863次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b><b class='flag-5'>云</b>C系列GPU产品Day 0适配腾讯混元Hy3 preview语言模型

    股份携手合作伙伴完成全栈产品兼容性互认证

    近日,股份携手粤港澳大湾区国家技术创新中心工业软件产业发展中心(以下简称“国创工软”)、国产高性能服务器与操作系统合作伙伴,以及十沣科技、迈
    的头像 发表于 04-23 14:27 456次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>携手</b>合作伙伴完成全栈产品兼容性互认证

    股份C系列GPU产品Day 0适配百度文心ERNIE-Image文生图模型

    4月15日,百度文心大模型团队重磅推出ERNIE‑Image文生图模型,股份 C 系列 GPU 已完成对 ERNIE‑Image 的Day 0 深度适配,同步支持 ERNIE‑
    的头像 发表于 04-15 17:39 634次阅读

    股份C系列GPU深度适配通义千问Qwen3.5模型

    今天,通义千问今天正式发布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的开放权重版本。股份C系列GPU 完成对Qwen 3.5模
    的头像 发表于 02-26 14:26 978次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b><b class='flag-5'>云</b>C系列GPU深度适配通义千问Qwen3.5模型

    C500/C550 GPU产品深度适配MiniMax M2.5模型

    2月13日晚间,MiniMax正式开源MiniMax M2.5模型。技术团队依托MXMACA软件栈,在24小时内完成C500/C55
    的头像 发表于 02-26 14:19 1371次阅读

    股份CXO预科班2026冬令营圆满收官

    2月6日,由集成电路(上海)股份有限公司(股票代码:688802,简称“股份”)主办、之江实验室大力支持、
    的头像 发表于 02-25 16:29 1419次阅读

    C500/C550 GPU产品适配智谱GLM-OCR模型

    今天,智谱AI正式发布并开源GLM-OCR,以 “小尺寸、高精度” 实现文档解析能力新标杆。股份C500/C550 GPU充分发挥高生态兼容性、软硬协同能力优势,高效完成与智谱
    的头像 发表于 02-03 11:36 1084次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b><b class='flag-5'>云</b>C500/C550 GPU产品适配智谱GLM-OCR模型

    C600 GPU产品适配阶跃星辰基座模型Step 3.5 Flash

    今天,阶跃星辰技术团队发布并开源最新旗舰基座模型 Step 3.5 Flash。股份已实现C600与该模型深度协同适配,为国内首先完成与该模型Day 0适配的国产算力。
    的头像 发表于 02-02 14:44 664次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b><b class='flag-5'>云</b>C600 GPU产品适配阶跃星辰基座模型Step 3.5 Flash

    C500/C550 GPU产品适配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上线,C500/C550 Day 0 适配PaddleOCR-VL-1.5模型,助力Padd
    的头像 发表于 01-30 10:19 1678次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b><b class='flag-5'>云</b>C500/C550 GPU产品适配PaddleOCR-VL-1.5模型

    股份C系列GPU Day 0适配智谱GLM-4.6V多模态大模型

    12月8日智谱AI发布并开源 GLM-4.6V 系列多模态大模型,股份C系列GPU完成Day 0适配。
    的头像 发表于 12-17 14:28 956次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b><b class='flag-5'>云</b>C系列GPU Day 0适配智谱GLM-4.6V多模态大模型

    DLInfer联手股份实现数据生成场景的实际落地

    近期,上海 AI 实验室 DeepLink 团队推出的 DLInfer 通过支持 LMDeploy 主流模型推理,助力股份 C500
    的头像 发表于 12-09 14:55 969次阅读
    DLInfer联手<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份实现数据生成场景的实际落地

    股份与上海电信完成首期GPU生态专家认证培训

    近期,集成电路(上海)股份有限公司(以下简称“股份”)携手上海电信天翼能力运营中心(以
    的头像 发表于 10-31 10:33 780次阅读

    首款全国产通用GPU芯片发布 集成推出C600

    集成电路(南京)有限公司近日正式发布了首款全国产通用GPU——C600,这标志着国产高性能GPU实现历史性突破。 据新华日报报道显示,
    的头像 发表于 10-19 20:04 4.7w次阅读