0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

硅基流动携手沐曦首发基于曦云的Kimi K2推理服务

沐曦MetaX 来源:硅基流动 2025-07-23 17:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:硅基流动

今天,硅基流动联合沐曦集成电路(上海)股份有限公司(简称“沐曦”),全球首发基于沐曦曦云 C550 集群的月之暗面 Kimi-K2 大模型商业化服务部署。该服务运行于汇天网络科技有限公司(简称“汇天网络”)运营的沐曦曦云C550 三千卡通用 GPU 国产集群。此次合作标志着硅基流动正式将该国产集群纳入算力网络,进一步为大模型产业落地提供充沛的高性能国产算力。

技术突破层面,三方通过芯片层、框架层、模型层的深度协同优化,显著提升了 Kimi-K2 在曦云 C550 集群上的推理效率。沐曦自主研发的曦云 C550 通用 GPU 为模型提供了高性能、高稳定的核心硬件支撑,可以大幅增加集群算力,缩短大模型计算及推理时间;硅基流动将曦云 C550 集群接入一站式算力纳管平台,丰富了算力资源,并依托自研推理加速引擎,将集群利用率提升至业界领先水平,最终在其大模型云服务平台提供金融级高可靠性、高速响应、高性价比的 Kimi-K2 推理服务。

此次落地在汇天网络的沐曦国产 GPU 集群,是华北地区首个专为大模型规模化商用设计的高性能算力基础设施。该集群纳入硅基流动大模型云服务平台后,将重点服务于金融、政务、教育、科研等领域的头部客户,提供企业级 AI 推理部署解决方案。

下一步,硅基流动、汇天网络与沐曦三方将围绕"北京国产万卡集群"建设目标,持续推进集群硬件扩容与绿色 AIDC 技术研发。同时,三方将深化与国内主流大模型企业的生态合作,通过"算力-算法-应用"的全链路协同创新,突破产业链应用瓶颈,助力“国产算力+大模型产业”实现从技术突破到商业化落地的跨越式发展。

关于沐曦

沐曦致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 集成电路
    +关注

    关注

    5446

    文章

    12469

    浏览量

    372708
  • 沐曦
    +关注

    关注

    0

    文章

    54

    浏览量

    1658
  • 大模型
    +关注

    关注

    2

    文章

    3444

    浏览量

    4970

原文标题:硅基流动联合沐曦首发基于曦云的 Kimi K2 推理服务,落地汇天网络北京国产 GPU 智算集群

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    股份与上海电信完成首期GPU生态专家认证培训

    近期,集成电路(上海)股份有限公司(以下简称“股份”)携手上海电信天翼能力运营中心(以
    的头像 发表于 10-31 10:33 256次阅读

    强强联合:之江实验室与股份共建智算集群联合实验室

    2025年10月22日, 之江实验室与集成电路(上海)股份有限公司(以下简称“股份”)正式签署合作协议,共同组建“智算集群联合实验室”,携手
    的头像 发表于 10-23 10:50 1030次阅读

    首款全国产通用GPU芯片发布 集成推出C600

    集成电路(南京)有限公司近日正式发布了首款全国产通用GPU——C600,这标志着国产高性能GPU实现历史性突破。 据新华日报报道显示,
    的头像 发表于 10-19 20:04 4.5w次阅读

    GPU与龙蜥操作系统完成适配

    集成电路(上海)股份有限公司(以下简称"")于 2020 年 9 月成立于上海,其拥有技术完备、设计和产业化经验丰富的团队,曾主导过十多款世界主流高性能 GPU 产品研发
    的头像 发表于 10-17 15:06 812次阅读

    C系列产品已支持TileLang

    近日,DeepSeek宣布在其新版本中拥抱国产GPU语言TileLang,引发业界广泛关注。作为国产高性能GPU的代表,C系列产品已率先在这一新兴开源社区获得支持。TileLa
    的头像 发表于 10-14 09:25 646次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b><b class='flag-5'>云</b>C系列产品已支持TileLang

    书生大模型实战营魔乐专场MeetUP精彩回顾

    近日,由书生大模型社区、、魔乐社区、算丰和 DaoCloud 道客等联合打造的「书生大模型实战营魔乐专场 MeetUP 暨颁奖仪式」在上海漕河泾国际孵化中心圆满落幕。
    的头像 发表于 08-20 11:33 907次阅读

    ‌Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技‌ 最近,Moonshot AI 的千亿参数大模型 ‌Kimi K2‌ 在 ‌GroqCl
    的头像 发表于 08-07 10:01 652次阅读

    亮相2025世界人工智能大会

    子技术标准化研究院、上海市算力网络协会等权威机构,汇聚院士、政府领导、头部企业CTO及学术领袖共话AI算力未来。论坛现场重磅发布基于国产供应链的旗舰GPUC600,首发训推一体技术全栈方案,聚焦“开源生态”与“训推能力”两大
    的头像 发表于 07-28 18:08 4471次阅读

    万亿参数!元脑企智一体机率先支持Kimi K2大模型

    应用大模型提供高处理性能和完善的软件工具平台支持。   Kimi K2是月之暗面推出的开源万亿参数大模型,创新使用了MuonClip优化器进行训练,大幅提升了模型的学习效率。K2在代码生成、数学
    的头像 发表于 07-22 09:27 403次阅读
    万亿参数!元脑企智一体机率先支持<b class='flag-5'>Kimi</b> <b class='flag-5'>K2</b>大模型

    PaddleScience完成与AI芯片适配

    当前,PaddleScience已与展开深度合作,涵盖智能仿真、高性能计算、科学建模等多个方向。这一趋势正加速形成面向"Al for Science"的国产智算生态新格局。
    的头像 发表于 05-06 14:49 1361次阅读

    C500通用计算GPU与百度飞桨完成Ⅱ级兼容性测试

    近日,C500通用计算GPU与百度飞桨已完成Ⅱ级兼容性测试。测试结果显示,双方兼容性表现良好,整体运行稳定。这是
    的头像 发表于 03-31 14:22 1483次阅读

    加速DeepSeek满血版单卡C500异构推理

    近日,基于开源KTransformers架构的 CPU/GPU 异构推理能力,C500单卡GPU上成功实现DeepSeek-R1-
    的头像 发表于 03-20 15:52 1890次阅读

    Gitee AI 联合首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

    、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四个较小尺寸的 DeepSeek 模型。值得关注的是, 本次上线的四个模型均部署在国产
    的头像 发表于 02-10 09:56 1099次阅读
    Gitee AI 联合<b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>首发</b>全套 DeepSeek R1 千问蒸馏模型,全免费体验!

    澎峰科技与完成联合测试,实现全面兼容

    近日,澎峰科技与科技宣布,双方已完成对PerfXLM推理引擎、PerfXCloud大模型服务平台与
    的头像 发表于 01-21 15:20 969次阅读

    澎峰科技计算软件栈与GPU完成适配和互认证

    ‍近期,澎峰科技与完成了对PerfXLM(推理引擎)、PerfXCloud(大模型服务平台)与
    的头像 发表于 01-21 09:51 1195次阅读