0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

万亿参数!元脑企智一体机率先支持Kimi K2大模型

全球TMT 来源:全球TMT 作者:全球TMT 2025-07-22 09:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

北京2025年7月21日 /美通社/ --浪潮信息宣布元脑企智一体机已率先完成对Kimi K2 万亿参数大模型的适配支持,并实现单用户70 tokens/s的流畅输出速度,为企业客户高效部署应用大模型提供高处理性能和完善的软件工具平台支持。


Kimi K2是月之暗面推出的开源万亿参数大模型,创新使用了MuonClip优化器进行训练,大幅提升了模型的学习效率。K2在代码生成、数学推理、Agent多步骤任务上展现出领先能力,评测指标达到业界领先水平。自发布以来,K2在开发者和研究社区引起广泛关注,迅速获得在编码辅助和Agent驱动自动化任务中的部署应用。

Kimi K2的模型总参数量达1万亿,激活参数为320亿。K2使用混合专家(MoE)模型结构,较DeepSeek V3采用了更大的参数量和更多的专家数。K2模型1万亿的参数量对AI计算系统提出至少1TB的显存容量需求,384个路由专家所带来的专家负载不均衡性对推理速度有很大影响。目前业界可公开访问的K2 API的输出速度一般低于20 tokens/s,这样较低的性能对于编程或Agent类场景很不友好,会严重影响用户体验。Kimi K2凭借其为智能体任务设计的架构和优秀的智能体验,展现出巨大的应用潜力,但提升推理速度和输出稳定性是其成为可信赖的生产力工具需要解决的核心挑战。

元脑企智一体机采用元脑服务器NF5688G7作为算力底座,其搭载FP8计算引擎,配备1128GB HBM3e高速显存,单台服务器即可支持K2 万亿参数全量模型部署。NF5688G7服务器具备900GB/s的GPU P2P带宽,为Kimi K2提供了专家间高速并行通信,最大化并行效率。该服务器可支持3200Gbps的RDMA扩展网络,为预填充-解码分离部署和大规模专家并行预留了充足的扩展空间。

浪潮信息已完成元脑企智一体机对K2的适配,支持64K上下文长度和多路用户实时并发访问。基于SGLang推理框架,通过减少MoE对齐块大小内核的小批量模式开销和fused_moe的内存消耗,并复用deepGEMM等高效算子,实现单用户并发下输出速度超过70 tokens/s,25用户并发时每用户输出速度超过25 tokens/s。优化后的计算性能可保证用户在进行复杂的代码生成、长文本书写或Agent调用时,能够获得流畅、低延迟的交互体验。

wKgZO2h-PNGAL-wnAAF67yjafGk421.jpg


SGLang启动K2推理服务,用户交互时的解码速度

元脑企智一体机提供了元脑企智(EPAI)平台与K2大模型的无缝集成,为企业用户提供了一套软硬件协同优化、开箱即用的端到端大模型私有化部署解决方案。通过元脑企智平台,企业可利用低代码、可视化界面,便捷地进行数据准备、模型微调、知识检索(RAG)和智能体(Agent)构建。

元脑企智一体机已成功部署于金融、制造、能源、医疗等多个关键行业,帮助企业快速、安全、经济地构建专属大模型应用,加速产业智能化转型步伐。

浪潮信息是全球领先的IT基础设施产品、方案和服务提供商,通过发展新一代以系统为核心的计算架构,打造开放、多元、绿色的元脑智算产品和方案。浪潮信息致力于AI计算平台、资源平台和算法平台的研发创新,并通过元脑生态携手领先伙伴,加速人工智能的创新和应用落地。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大模型
    +关注

    关注

    2

    文章

    3771

    浏览量

    5273
  • Kimi
    +关注

    关注

    0

    文章

    14

    浏览量

    338
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    登临科技KS系列GPU产品Day 0适配Kimi-K2.6模型

    2026年4月,随着Kimi-K2.6这开源原生多模态智能模型的正式发布,AI领域迎来了又次重要的技术演进。该
    的头像 发表于 04-23 16:59 1350次阅读
    登临科技KS系列GPU产品Day 0适配<b class='flag-5'>Kimi-K</b>2.6<b class='flag-5'>模型</b>

    壁仞科技壁砺166系列GPU产品率先支持Kimi K2.6模型

    砺166系列在Kimi K2.6模型开源后率先完成模型接入与推理适配,为开发者及行业客户提供国产算力平台下的SOTA
    的头像 发表于 04-23 16:30 808次阅读
    壁仞科技壁砺166系列GPU产品<b class='flag-5'>率先</b><b class='flag-5'>支持</b><b class='flag-5'>Kimi</b> <b class='flag-5'>K</b>2.6<b class='flag-5'>模型</b>

    Kimi K2.6模型发布当天上线华为云

    4月20日, Kimi K2.6模型正式发布并开源,带来行业领先的代码、长程任务执行和Agent集群能力。当前,华为云完成适配并实现针对性优化。华为云MaaS模型即服务平台已为开发者提
    的头像 发表于 04-23 15:10 300次阅读
    <b class='flag-5'>Kimi</b> <b class='flag-5'>K</b>2.6<b class='flag-5'>模型</b>发布当天上线华为云

    触拓(CHUTO)32 寸立式点餐机,大屏触控点餐快人步#触拓 # 自助一体机 #点餐机

    一体机
    深圳市触拓科技有限公司
    发布于 :2026年04月08日 12:23:06

    触拓(CHUTO)户外广告一体机,无惧酷暑全天候在线# 触拓 #户外触摸一体机

    一体机
    深圳市触拓科技有限公司
    发布于 :2026年04月08日 12:20:40

    OBOO鸥柏交互式查询一体机:展馆里的智能信息导航站

    一体机
    鸥柏科技
    发布于 :2025年12月30日 19:04:58

    润和软件入选大模型一体机产业图谱

    近日,由中国人工智能产业发展联盟与中国信息通信研究院联合编制的《大模型一体机产业图谱》正式发布。该图谱系统梳理并收录了国内大模型一体机产业链上下游70余家代表性企业,全面呈现我国大
    的头像 发表于 12-10 17:56 1703次阅读
    润和软件入选大<b class='flag-5'>模型</b><b class='flag-5'>一体机</b>产业图谱

    澎峰科技最新推出Deep Fusion DF35智算一体机

    在人工智能加速落地的今天,企业部署大模型面临成本、性能与数据安全的三重挑战。澎峰科技最新推出的Deep Fusion DF35智算一体机,以29000起的突破性定价,将Qwen3-Next 80B FP16精度
    的头像 发表于 10-13 16:51 1970次阅读
    澎峰科技最新推出Deep Fusion DF35智算<b class='flag-5'>一体机</b>

    浪潮信息发布&quot;SD200&quot;超节点,面向万亿参数模型创新设计

    扩展支持64路本土GPU芯片。SD200可实现单机内运行超万亿参数模型,并
    的头像 发表于 08-08 22:17 782次阅读
    浪潮信息发布&quot;<b class='flag-5'>元</b><b class='flag-5'>脑</b>SD200&quot;超节点,面向<b class='flag-5'>万亿</b><b class='flag-5'>参数</b>大<b class='flag-5'>模型</b>创新设计

    ‌Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技‌ 最近,Moonshot AI 的千亿参数
    的头像 发表于 08-07 10:01 1337次阅读

    一体机主板步入大存储时代,存储突围到性能质变

    ,我们发现了客户新的需求。一体机电脑场景在企业办公多任务处理中,多开办公软件、数据报表处理卡顿,需要更多内存支持多应用同时流畅运行。场景二专业设计与渲染、4K视频剪
    的头像 发表于 06-19 10:47 669次阅读
    <b class='flag-5'>一体机</b>主板步入大存储时代,存储突围到性能质变

    开普云「开悟智核」:极致性价比的智能一体机,破局大模型应用难题

    当下,AI一体机凭借开箱即用、数据可控等优势,成为行业大模型落地的重要载体之。然而实际应用时,用户却面临诸多问题:算力成本与性能难以平衡;非满血版模型存在“幻觉”、精度低等问题;由于
    的头像 发表于 06-09 10:34 1320次阅读
    开普云「开悟智核」:极致性价比的智能<b class='flag-5'>体</b><b class='flag-5'>一体机</b>,破局大<b class='flag-5'>模型</b>应用难题

    松下4K手持式摄录一体机AJ-UPX380介绍

    2025年第季度,松下正式推出4K手持式摄录一体机AJ-UPX380,旨在为广播及流媒体专业人士提供更高品质的视频制作解决方案。作为UPX系列专业摄录一体机的新成员,AJ-UPX38
    的头像 发表于 05-30 15:54 1911次阅读