0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

杭州灵汐类脑智算集群实现大模型快速推理

北京灵汐科技有限公司 来源:脑启社区 2025-08-18 16:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

以下文章来源于脑启社区,作者脑启社区

据悉,“杭州灵汐类脑智算集群”已于7月底实现了大模型快速推理API的企业服务试运行。该集群由杭州灵汐类脑科技有限公司牵头搭建运营,中国电信、中国电子科技南湖研究院以及脑启社区作为合作方参与,由杭州电信具体承担集成建设。该集群部署在中国电信杭州智算中心,算力规模超200POPS。这也是类脑智算集群在全球范围内,首次以支持大模型快速推理的方式,走向商用试运行。

作为类脑智能技术的创新应用成果,该智算集群具有”存算一体、众核并行、稀疏计算、事件驱动”的特性,可显著提升计算效率、大幅降低能耗,实现大语言模型推理的“一快、一低、一降”:一是推理速度快,单用户的推理延迟控制在毫秒级别,速度性能相对于传统方案有明显优势(可流畅响应实时交互及长本文深度推理),告别卡顿;二是首token延迟低,可降至百毫秒乃至十毫秒级;三是智算集群的功耗大幅下降,较业界同等推理算力水平可降低功耗二分之一至三分之二以上。异构融合类脑芯片具有兼容PyTorch框架的类CUDA软件栈,可直接服务于多类开源大模型的快速推理、而不需要转换类脑算法

当前,大模型推理普遍存在吞吐速度慢(每秒十到几十词输出)和高延迟问题(常常超过1秒甚至数秒),对众多行业场景构成了制约。在此背景下,灵汐科技基于类脑智能技术给出了“高实时、高吞吐、低延迟”的推理服务解决方案,将在金融应用、情感陪聊、快速导览、大规模数据标注以及无人机实时航拍处理、灾害预警与应急处置等领域场景逐步落地。据介绍,该智算集群(中心)将持续升级,新一代类脑智算高密度计算平台也将在近期正式发布推出,集群能效比预计将进一步提升。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 集群
    +关注

    关注

    0

    文章

    159

    浏览量

    17705
  • 灵汐科技
    +关注

    关注

    0

    文章

    19

    浏览量

    1569
  • 大模型
    +关注

    关注

    2

    文章

    3883

    浏览量

    5310

原文标题:首次商用试运行,类脑智算集群支持大模型快速推理服务

文章出处:【微信号:北京灵汐科技有限公司,微信公众号:北京灵汐科技有限公司】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    功耗腰斩,延迟毫秒!杭州抢先手,押注计算

      电子发烧友网报道(文/莫婷婷)近期,杭州市正式出台《关于支持智能未来产业创新发展的若干措施》(以下简称“措施”),明确提出重点支持机接口与
    的头像 发表于 12-28 09:31 6668次阅读
    功耗腰斩,延迟毫秒!<b class='flag-5'>杭州</b>抢先手,押注<b class='flag-5'>类</b><b class='flag-5'>脑</b>计算

    神州鲲泰携手趋境科技推出大模型推理智能力调度解决方案

    近日,华为中国合作伙伴大会现场,神州鲲泰与趋境科技正式签订生态合作协议,并联合推出面向企业级大模型推理场景的智能力调度解决方案。
    的头像 发表于 04-17 15:12 651次阅读
    神州鲲泰携手趋境科技推出大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>智能<b class='flag-5'>算</b>力调度解决方案

    科技深度参编的2026计算芯片技术发展研究报告正式发布

    近日,《计算芯片技术发展研究报告(2026)》 在武汉正式发布。作为核心参编单位,北京科技有限公司深度参与了此次报告的编制工作,与中国电子技术标准化研究院、清华大学、中国电子科
    的头像 发表于 04-14 16:16 896次阅读

    国内首个国产AI推理千卡集群落地,采用云天励飞全自研AI推理芯片

    国产大模型,为政务、产业及各类应用场景提供更加便捷、低成本的AI能力,探索打造“国模国芯”的AI生态样板。   一、AI力从“训练优先”走向“推理优先” 智
    发表于 03-12 11:10 1384次阅读

    中科曙光3套scaleX万卡超集群落地国家超互联网郑州核心节点

    2月5日,由中科曙光提供的3套万卡超集群系统在国家超互联网郑州核心节点同时上线试运行,成为全国首个实现3万卡部署、且实际投入运营的最大国产AI力池,全面覆盖万亿参数
    的头像 发表于 02-09 10:32 834次阅读

    从训练到推理:大模型力需求的新拐点已至

    在大模型产业发展的早期阶段,行业焦点主要集中在大模型训练所需的力投入。一个万亿参数大模型的训练可能需要数千张GPU芯片连续运行数月,成本高达数千万甚至上亿元。但随着大
    的头像 发表于 02-05 16:07 1134次阅读
    从训练到<b class='flag-5'>推理</b>:大<b class='flag-5'>模型</b><b class='flag-5'>算</b>力需求的新拐点已至

    LLM推理模型是如何推理的?

    过程与核心见解拆解。一、核心论点与总览LRM(如o1,R1)的“推理”能力提升,并非源于模型学会了人类式的逻辑推理,而是通过两主要技术手段,优化了生成过程,使其
    的头像 发表于 01-19 15:33 864次阅读
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    杭州电信集群正式发布

    2025年12月11日,杭州电信集群
    的头像 发表于 12-23 16:19 867次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+神经形态计算、芯片

    。是实现芯片的基本模型。SNN中的神经元通过短的电脉冲相互沟通,脉冲之间的时间间隔起着重要作用。 最有利于硬件实现的脉冲神经元
    发表于 09-17 16:43

    启社区第二届智能创新大赛正式启动

    机智能全国重点实验室、北京科技、中国电信杭州中心协办。旨在挖掘刚需应用,形成一批可规
    的头像 发表于 08-18 16:11 1591次阅读

    科技与广电五舟达成战略合作

    2025年8月15日,北京科技有限公司与广州广电五舟科技股份有限公司经友好协商,现已达成战略合作协议。双方结合各自优势,进一步聚焦国产力底座构建、行业解决方案优化,在
    的头像 发表于 08-18 16:05 1554次阅读

    科技斩获第三届“华彩杯”力大赛东区决赛二等奖

    2025年7月10-11日,第三届“华彩杯”力大赛东区决赛专题赛暨颁奖典礼在杭州举行。“科技
    的头像 发表于 08-04 14:45 1543次阅读

    科技上线赤兔推理引擎服务,创新解锁FP8大模型

    模型轻量化部署方案。用户通过远程力平台预置的模型镜像与AI工具,仅需50%的GPU力即可解锁大模型
    的头像 发表于 07-30 21:44 1145次阅读

    模型推理显存和计算量估计方法研究

    随着人工智能技术的飞速发展,深度学习大模型在各个领域得到了广泛应用。然而,大模型推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。为了解决这一问题,本文将探讨大模型
    发表于 07-03 19:43

    亿铸科技入围工信部力强基揭榜行动

    、网络、计算的协同优化,旨在通过模型加速与调度加速等创新方法,实现大规模异构集群在大模型推理
    的头像 发表于 06-30 14:57 1301次阅读