0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

万亿参数!元脑企智一体机率先支持Kimi K2大模型

全球TMT 来源:全球TMT 作者:全球TMT 2025-07-22 09:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

北京2025年7月21日 /美通社/ --浪潮信息宣布元脑企智一体机已率先完成对Kimi K2 万亿参数大模型的适配支持,并实现单用户70 tokens/s的流畅输出速度,为企业客户高效部署应用大模型提供高处理性能和完善的软件工具平台支持。


Kimi K2是月之暗面推出的开源万亿参数大模型,创新使用了MuonClip优化器进行训练,大幅提升了模型的学习效率。K2在代码生成、数学推理、Agent多步骤任务上展现出领先能力,评测指标达到业界领先水平。自发布以来,K2在开发者和研究社区引起广泛关注,迅速获得在编码辅助和Agent驱动自动化任务中的部署应用。

Kimi K2的模型总参数量达1万亿,激活参数为320亿。K2使用混合专家(MoE)模型结构,较DeepSeek V3采用了更大的参数量和更多的专家数。K2模型1万亿的参数量对AI计算系统提出至少1TB的显存容量需求,384个路由专家所带来的专家负载不均衡性对推理速度有很大影响。目前业界可公开访问的K2 API的输出速度一般低于20 tokens/s,这样较低的性能对于编程或Agent类场景很不友好,会严重影响用户体验。Kimi K2凭借其为智能体任务设计的架构和优秀的智能体验,展现出巨大的应用潜力,但提升推理速度和输出稳定性是其成为可信赖的生产力工具需要解决的核心挑战。

元脑企智一体机采用元脑服务器NF5688G7作为算力底座,其搭载FP8计算引擎,配备1128GB HBM3e高速显存,单台服务器即可支持K2 万亿参数全量模型部署。NF5688G7服务器具备900GB/s的GPU P2P带宽,为Kimi K2提供了专家间高速并行通信,最大化并行效率。该服务器可支持3200Gbps的RDMA扩展网络,为预填充-解码分离部署和大规模专家并行预留了充足的扩展空间。

浪潮信息已完成元脑企智一体机对K2的适配,支持64K上下文长度和多路用户实时并发访问。基于SGLang推理框架,通过减少MoE对齐块大小内核的小批量模式开销和fused_moe的内存消耗,并复用deepGEMM等高效算子,实现单用户并发下输出速度超过70 tokens/s,25用户并发时每用户输出速度超过25 tokens/s。优化后的计算性能可保证用户在进行复杂的代码生成、长文本书写或Agent调用时,能够获得流畅、低延迟的交互体验。

wKgZO2h-PNGAL-wnAAF67yjafGk421.jpg


SGLang启动K2推理服务,用户交互时的解码速度

元脑企智一体机提供了元脑企智(EPAI)平台与K2大模型的无缝集成,为企业用户提供了一套软硬件协同优化、开箱即用的端到端大模型私有化部署解决方案。通过元脑企智平台,企业可利用低代码、可视化界面,便捷地进行数据准备、模型微调、知识检索(RAG)和智能体(Agent)构建。

元脑企智一体机已成功部署于金融、制造、能源、医疗等多个关键行业,帮助企业快速、安全、经济地构建专属大模型应用,加速产业智能化转型步伐。

浪潮信息是全球领先的IT基础设施产品、方案和服务提供商,通过发展新一代以系统为核心的计算架构,打造开放、多元、绿色的元脑智算产品和方案。浪潮信息致力于AI计算平台、资源平台和算法平台的研发创新,并通过元脑生态携手领先伙伴,加速人工智能的创新和应用落地。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大模型
    +关注

    关注

    2

    文章

    3448

    浏览量

    4974
  • Kimi
    +关注

    关注

    0

    文章

    13

    浏览量

    250
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    润和软件入选大模型一体机产业图谱

    近日,由中国人工智能产业发展联盟与中国信息通信研究院联合编制的《大模型一体机产业图谱》正式发布。该图谱系统梳理并收录了国内大模型一体机产业链上下游70余家代表性企业,全面呈现我国大
    的头像 发表于 12-10 17:56 69次阅读
    润和软件入选大<b class='flag-5'>模型</b><b class='flag-5'>一体机</b>产业图谱

    浪潮信息发布&quot;SD200&quot;超节点,面向万亿参数模型创新设计

    扩展支持64路本土GPU芯片。SD200可实现单机内运行超万亿参数模型,并
    的头像 发表于 08-08 22:17 532次阅读
    浪潮信息发布&quot;<b class='flag-5'>元</b><b class='flag-5'>脑</b>SD200&quot;超节点,面向<b class='flag-5'>万亿</b><b class='flag-5'>参数</b>大<b class='flag-5'>模型</b>创新设计

    ‌Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技‌ 最近,Moonshot AI 的千亿参数
    的头像 发表于 08-07 10:01 657次阅读

    浪潮信息:智DeepSeek一体机将举办生态伙伴推介体验会

     3月11日,浪潮信息将面向全国生态伙伴举办"智DeepSeek一体机生态伙伴推介体验
    的头像 发表于 03-09 14:20 485次阅读
    浪潮信息:<b class='flag-5'>元</b><b class='flag-5'>脑</b><b class='flag-5'>企</b>智DeepSeek<b class='flag-5'>一体机</b>将举办生态伙伴推介体验会

    360发布DeepSeek大模型一体机!开箱即用

    日前,360正式发布DeepSeek大模型一体机,以低门槛、高性能、强安全、多场景的站式解决方案……
    的头像 发表于 03-03 14:46 981次阅读
    360发布DeepSeek大<b class='flag-5'>模型</b><b class='flag-5'>一体机</b>!开箱即用

    迅为2K0300开发板进步刨析,打造HMI一体机产品的灵活优势

    迅为2K0300开发板进步刨析,打造HMI一体机产品的灵活优势
    的头像 发表于 02-26 13:58 1042次阅读
    迅为<b class='flag-5'>2K</b>0300开发板进<b class='flag-5'>一</b>步刨析,打造HMI<b class='flag-5'>一体机</b>产品的灵活优势

    中科曙光推出DeepSeek人工智能一体机

    为满足用户对DeepSeek的多方位需求。近日,中科曙光推出DeepSeek人工智能一体机。该一体机集多形态曙光高端计算服务器、高效能基础模型、全流程AI工具链于一体,并内置曙光自研A
    的头像 发表于 02-21 11:40 1558次阅读

    格灵深瞳发布全国产超融合大模型一体机

    模型一体机最大的亮点在于其支持单台运行DeepSeek-R1满血版。DeepSeek-R1是格灵深瞳自主研发的款高性能AI大模型,具备强
    的头像 发表于 02-19 15:37 1081次阅读

    澎峰科技发布DeepSeek智算一体机

    人工智能普惠化迎来里程碑式突破!澎峰科技发布业内“首款”万级别DeepSeek智算一体机,本地运行671B满血模型
    的头像 发表于 02-15 16:29 1854次阅读

    宁畅推出DeepSeek大模型一体机

    为加速人工智能大模型技术在企业级场景中的规模化落地,宁畅正式发布DeepSeek大模型一体机解决方案。作为款面向企业的“开箱即用”智能算力平台,宁畅大
    的头像 发表于 02-15 14:51 1957次阅读

    曙光云推出DeepSeek大模型一体机

    近日,曙光云震撼发布全国产DeepSeek大模型超融合一体机。这创新产品将为政府和企业的数字化、智能化转型按下“加速键”。
    的头像 发表于 02-14 18:02 1664次阅读

    云从科技从容大模型训推一体机成功适配DeepSeek

    了新的动能。 从容大模型训推一体机是云从科技基于昇腾AI基础软硬件平台推出的创新产品。该产品集成了大模型一体化生产平台,具备模型训练、推理、
    的头像 发表于 02-14 15:44 1363次阅读

    拓维信息与整数智能联合推出智能数据标注一体机

    近日,拓维信息与整数智能携手合作,共同推出了业内首款搭载DeepSeek全系列模型的智能数据标注一体机。这款一体机率先实现了“数据标注平台+大模型+算力”全栈国产化的软硬
    的头像 发表于 02-14 15:22 2658次阅读

    云天天书大模型训推一体机成功适配DeepSeek

    近日,云天天书大模型训推一体机成功适配DeepSeek。该一体机由云天励飞与华为联合推出,可以部署在华为昇腾服务器上,支持私有化部署,实现开箱即用,满足本地化、专属化的业务需求。
    的头像 发表于 02-14 11:02 1299次阅读