0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI推理工作站要变天,超聚变如何强势进入?

章鹰观察 来源:电子发烧友网 作者:章鹰 2025-11-09 05:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(电子发烧友网报道 文/ 章鹰) 10月29日,在安博会的2025智能算力应用及产业发展论坛上,超聚变数字技术有限公司深圳解决方案总监丁元钊表示:“原来预计2026年是AI推理爆发元年,2025年DeepSeek-R1,V3模型推出,直接推动AI推理市场的上扬,未来3-5年都是AI推理领域的规模应用阶段。不管是行业应用,还是算力相关的芯片,都将大规模的围绕推理来爆发。”

超聚变成立四年来,最新企业在算力设备市场地位如何?公司在算力基础设施上有哪些新品?针对AI推理需求,公司提供了哪些解决方案?本文进行详细报道。

超聚变AI战略落地两大基石:算力芯片+平台解决方案

超聚变作为全球领先的算力设施提供商,聚焦液冷服务器、边缘一体机和AI服务器市场,自2021年11月成立以来,过去三年超聚变不断探索业务本质,寻求最优解,从0到1快速发展,2024年营收达435亿元。据悉,截至2024年底,超聚变算力业务三年复合增长率60%以上,在国内位列整体第二。

从东西方算力来看,美国英伟达AMD在AI硬件实力上领先,丁元钊指出,国内的单芯片还是落后美国一代,我们用数学、物理的方法来补缺,用软硬协同的集群计算,在性能上达到和美国比肩的水平。不管是硬件还是芯片,都需要我们不断的去用,去迭代。

“知识库是AI推理落地的一个关键因素,AI的幻觉,包括AI的上下文的序列长度,都是影响着 AI推理的发展。同时我们的知识库不管是联网,还是通过我们自己的数据来构建,都能够把序列放大,然后解决这些问题。同时从算力产业的视角,我们认为 AI的发展需要两大助力:一是非常优秀的平台能力,二是结合不断发展的新技术然后做演进。算力可以像所谓云资源一样按需分配,然后做快速扩展。围绕一个全生命周期,进行运营管理。”丁元钊分析说。

超聚变公司对AI算力产品进行了布局。2021年,超聚变公司2023年开始做国产化,当年1月发布全新一代FusionServer V7 AI服务器,2023年8月发布FusionPoD For AI整机柜液冷服务器解决方案。

2024年,超聚变布局软件和解决方案。2024年9月发布FusionOne AI训推一体解决方案,并且荣获了AI Cloud典型案例奖,6月发布了Fusion AI Space大模型加速引擎,并且荣获创新先锋案例,2024年公司营收达到435亿。

2025年,超聚变在AI行业应用落地进行布局。4月超聚变FusionOne AI首批通过信通院大模型轻量一体机技术能力认证,发布基于“伙伴+超聚变”模式的聚智A-in-one解决方案。FusionOne AI发布DeepSeek一体机,并且联合伙伴发布面向行业细分场景的应用一体机。
在广州举办的中移动合作伙伴大会上,记者看到了超聚变展台的超聚变 G5580 AI推理服务器,作为一款 4U2 路 AI 推理服务器,现场工作人员介绍说,这款产品在硬件配置、推理性能、部署运维和生态兼容四个维度上具备显著优势。

1、高算力,采用了双鲲鹏 920(48/64 核,2.6 GHz)+ 最大 4TB DDR4,先保证通用算力和内存带宽,8 张全高全长单宽 Atlas 300I Duo 推理卡,整机最高 2240 TOPS INT8 / 1120 TFLOPS FP16,单卡 280 TOPS,足以同时跑 8 路 4K 视频结构化或百亿参数大模型并发请求。

2、高扩展:11 根 PCIe 4.0 槽位(8 根专属 AI 卡槽)+ 2 个 Flex IO,可再插 100 Gb RDMA、NvMe-oF 等网卡,线性横向扩容无瓶颈。

3、高可靠:全国产 BMC/BIOS,支持芯片级可信启动、带内/带外双重签名校验,满足等保 2.0 三级要求。风扇 N+1 热插拔、电源/硬盘/PCIe 全模块免工具维护,现场更换 < 2 min,业务中断时间缩到最短。

4、高易用:出厂预装 KunLun AI Space,TensorFlow / PyTorch / ONNX 模型一键移植,支持 openEuler、CentOS、Ubuntu、麒麟、统信等主流国产及通用操作系统,适配昇腾、寒武纪、海光 DCU 等多种异构加速卡,保护既有投资。

联合算力主流厂商,超聚变布局推理加速技术三大方向

据悉,AI算力设备,超聚变布局覆盖单台小站、单台服务器,再到集群。超聚变近期还展示了X3 8000智能工作站、超聚变 FusionPoD forr AI整机液冷服务器。近日,IDC中国发布《IDC中国液冷服务器市场追踪报告(2025年上半年)》,超聚变在中国标准液冷服务器市场位居第一,在整体液冷服务器市场位居前三。

丁元钊指出,客户在AI落地的关键痛点是:一是算力的安全性,有可选的算力;二是围绕Token如何快速实现,实现Token的快速输出和优化;三是针对一些中小场景,很多客户希望是开箱即用。

针对客户痛点,超聚变推理加速技术有三大方向。一、框架调参模版话,内置主流模型、AI加速卡推理加速模版,上下游都是开源的,不管是底层芯片、上层的大模型,都是持续和国内、国际厂商合作;二、GPU切分复用,支持英伟达等主流厂商,单卡承载多个小模型,大幅度降低部署成本,提升卡的利用率;三、以存促算,提升多轮对话推理性能,降低部署成本。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38073

    浏览量

    296299
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    医院手持PDA移动护理工作站的保姆级操作使用手册

    专为医院护士打造的移动护理PDA保姆级使用指南。从硬件按键认识到扫码查房、输液三查七对实战,再到设备保养技巧,帮助新手护士快速掌握移动护理工作站操作,提升护理效率,保障医疗安全。
    的头像 发表于 12-01 12:02 177次阅读
    医院手持PDA移动护<b class='flag-5'>理工作站</b>的保姆级操作使用手册

    发力图形工作站AI推理市场,英特尔大显存GPU亮相湾芯展

    英特尔发布了面向专业的锐炫Pro B50和B60。这两款显卡比较RTX2000和5660Ti,有哪些性能上的优势?在支持AI推理工作站和大模型部署上,B60有哪些独到之处?10月16日,在深圳举行的湾区半导体大会上,英特尔中国区显卡和A
    的头像 发表于 10-22 13:40 1.1w次阅读
    发力图形<b class='flag-5'>工作站</b>和<b class='flag-5'>AI</b><b class='flag-5'>推理</b>市场,英特尔大显存GPU亮相湾芯展

    联想桌面AI工作站ThinkStation PGX开售

    10月15日,联想桌面AI工作站ThinkStation PGX正式在京东平台及联想官方网站开售,首批购买用户预计10月底可收到货。PGX以“小体积、大算力、低功耗”为核心定位,为开发者们提供
    的头像 发表于 10-22 10:37 606次阅读

    海辰储能获批2025年度厦门市院士专家工作站

    近日,厦门市院士专家工作站建设协调小组办公室《关于同意建立2025年度厦门市院士专家工作站的决定》,正式同意厦门海辰储能科技股份有限公司成立院士专家工作站
    的头像 发表于 10-16 15:27 480次阅读

    国产算力,正在AI工作站里“生根”

    从机房到桌面:AI工作站点燃“小型化革命”
    的头像 发表于 10-14 20:32 5606次阅读
    国产算力,正在<b class='flag-5'>AI</b><b class='flag-5'>工作站</b>里“生根”

    革新科研智造,引领材料未来——高通量智能科研制备工作站

    的“高通量智能科研制备工作站”,正推动一场科研范式的深刻变革。 智能驱动,全程自动化, redefine 科研效率 高通量智能科研制备工作站集成智能机器人控制技术,具备样品抓取转移、移液、旋涂、反溶剂萃取
    发表于 09-27 14:17

    微型导轨赋能微型工作站高效运转

    在自动化设备向微型化、精密化演进的浪潮中,微型导轨凭借其8mm窄滑座、微米级定位精度等特性,成为微型工作站实现毫米级操作的核心部件。
    的头像 发表于 09-12 17:47 857次阅读
    微型导轨赋能微型<b class='flag-5'>工作站</b>高效运转

    创通新科全栈AI算力产品亮相人工智能展 创盈芯AI工作站获双奖

    自主研发的AI工作站AI推理一体机和AI迷你主机系列产品。 创通新科集团构建全栈AI算力基座,
    的头像 发表于 09-02 18:37 358次阅读
    创通新科全栈<b class='flag-5'>AI</b>算力产品亮相人工智能展 创盈芯<b class='flag-5'>AI</b><b class='flag-5'>工作站</b>获双奖

    号外!PLC安川伺服,通过Profinet转EtherCAT网关同步多个工作站

    号外!PLC安川伺服,通过Profinet转EtherCAT网关同步多个工作站
    的头像 发表于 06-07 14:32 529次阅读
    号外!PLC安川伺服,通过Profinet转EtherCAT网关同步多个<b class='flag-5'>工作站</b>

    英特尔发布全新GPU,AI工作站迎来新选择

    Pro B50 GPU,搭载了为AI推理和专业工作站量身定制的配置,扩展了英特尔锐炫Pro产品系列。 英特尔 ® Gaudi 3 AI 加速器: 英特尔Gaud
    发表于 05-20 11:03 1664次阅读

    撕掉笨重标签,杰和科技WA814工作站还有哪些惊喜亮点?

    自杰和科技发布迷你工作站WA814以来,不少用户对“工作站”仍充满好奇。它到底与普通电脑有何不同?适合哪些人使用?现在就让我们逐一解答这些疑问,并多角度展现这款产品的外观与实力,带你全面了解
    的头像 发表于 05-15 11:31 650次阅读
    撕掉笨重标签,杰和科技WA814<b class='flag-5'>工作站</b>还有哪些惊喜亮点?

    工业机器人工作站的建设意义

    在现代工业生产中,工业机器人工作站的建设已成为提升生产效率和产品质量的关键举措。随着自动化技术的不断发展,工业机器人工作站不再局限于单个机器人的作业,而是通过整合工装夹具、多台机器人协同工作以及
    发表于 03-17 14:49

    快速升级DELL与HP工作站储存效能,实现高效工作流!

    充分利用HP&Dell工作站的ODD插槽位与PCIe扩展插槽位,提升系统存储空间新选择!现代的专业工作站旨在处理高强度的工作负载,但随着储存需求的增长,将储存空间进行升级已成为必然的任务之一
    的头像 发表于 02-14 15:38 974次阅读
    快速升级DELL与HP<b class='flag-5'>工作站</b>储存效能,实现高效<b class='flag-5'>工作</b>流!

    提升企业效能:迷你工作站的潜力

    杰和科技迷你工作站WA814正式上线以来,客户们和合作伙伴就对这款产品表现出了浓厚的兴趣,迫不及待地想要深入了解并亲身体验它所带来的价值。对比传统的工作站,杰和迷你工作站WA814只有3.4L的小巧体积,外出
    的头像 发表于 01-06 11:02 644次阅读
    提升企业效能:迷你<b class='flag-5'>工作站</b>的潜力

    云知声荣获上海市优秀专家工作站称号

    近日,2024年上海市院士(专家)工作站(服务中心)绩效评估结果揭晓。云知声(上海)智能科技有限公司(以下简称“云知声”)凭借其在人工智能技术研发、创新成果应用及高层次人才引进与培养等方面的杰出表现,荣获“上海市优秀专家工作站”称号。
    的头像 发表于 12-13 14:27 772次阅读