0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

润和软件StackRUNS异构分布式推理框架的应用案例

润和软件 来源:润和软件 2025-06-13 09:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

江苏润和软件股份有限公司(以下简称“润和软件”)自主研发的StackRUNS异构分布式推理框架已在实际场景中取得显著成效,成功应用于大型园区多模态模型演练及高校满血版DeepSeek-MoE 671B的运行,有效推动了大模型技术的快速落地。

案例一:大型园区多模态模型演练

案例背景:

由于建设分期不同及承建单位多样,该智慧园区的AI基础设施呈现出高度异构特征,包括NVIDIA T4、NVIDIA 3090、Atlas 300I DUO等多种AI加速设备,并在不同场景下协同运行。这些设备承担着包括人流密度监测、人脸识别、车牌抓拍等计算机视觉任务,系统负载、资源调度与运维策略已形成稳定运行机制。

近期,该园区在安防升级过程中面临一项临时但复杂的智能分析挑战:在突发事件响应、演练预警或夜间非业务时段,需临时部署并运行多模态大模型,实现图文联合理解、行为链条分析、场景异常检测等复杂推理任务。该需求需在不增加硬件投入、不影响现有业务运行的前提下完成。

应对方案:

为应对这一挑战,润和软件自研的StackRUNS异构分布式推理框架成为关键解决方案。该框架具备以下核心能力:

1. 异构算力识别与建模:自动识别各设备的计算能力、显存规格与精度支持能力,为模型切片和任务分配提供实时依据;

2. 模型智能切分与并行执行:支持基于专家路由与自动切分策略,将超大模型按需划分为多个计算子任务,分布式调度到可用节点;

3. 轻量级调度与动态推理通路编排:在不干扰现有CV业务的前提下,构建独立推理通路,临时占用空闲资源执行推理任务,任务完成后自动回收;

4. 混合精度与量化模型支持:支持INT8、INT4等低精度模型快速加载,提升内存利用率与执行效率;

5. 统一通信与高效协同机制:通过通信适配层封装多协议通信接口,实现多设备间高效数据传输与协同执行。

60eaf6f6-45df-11f0-b715-92fbcf53809c.png

StackRUNS多模态模型场景图

应用效果:

StackRUNS帮助超大模型在资源受限、基础设施异构的环境中,实现“即需即调、弹性运行、无感部署”的能力,显著提升园区对突发安防场景的智能响应水平,为大模型在城市级AI基础设施中的灵活应用提供了可复制范式。

案例二:高校运行满血版DeepSeek-MoE 671B

案例背景:

某高校在人工智能教学与科研实践中,面临运行超大规模模型的现实挑战。一方面,教学楼、实验楼与计算中心分布着多种异构计算资源,包括GPU、NPU设备及部分高性能CPU节点;另一方面,受限于经费与硬件条件,难以通过集中式部署满足超大模型推理需求。

为此,该高校引入润和软件自研的StackRUNS异构分布式推理框架,成功在现有资源基础上部署并运行了DeepSeek-MoE 671B级别的多模态大模型。

攻克难点:

1. 通信开销高,跨设备、节点推理效率受限:传统通信架构难以适配异构环境,频繁阻塞;

2. 模型规模大、结构复杂度高:单个子模型或路由后激活路径仍需百GB级显存支撑,传统GPU、NPU单卡难以支撑模型加载与中间态存储;

3. 切片并行策略自动生成难:模型需划分为跨卡跨节点子图,兼顾通信代价、算子依赖与硬件负载能力,自动化策略生成复杂;

4. 模型运行状态监控与可视化困难:推理过程中需监控路由结果、设备负载、通信代价、缓存命中率等。

6105b7de-45df-11f0-b715-92fbcf53809c.png

通过StackRUNS部署满血版DeepSeek示例图

最终效果:

借助StackRUNS,高校成功打通了异构设备之间的算力协同壁垒,实现了超大模型的低门槛部署与高效推理,广泛应用于图文语义理解、跨模态知识挖掘、学生AI实验等场景。该方案不仅显著提升了设备利用率与推理任务执行效率,也加速了人工智能专业课程与科研课题向真实算力环境的落地验证,真正实现了“在资源有限条件下,用分布式智能拼出超级算力”,为高校人工智能教学与科研提供了强有力的技术支撑。

江苏润和软件股份有限公司(简称“润和软件”)成立于2006年,2012年在深圳证券交易所创业板上市(证券代码:300339),是国家重点规划布局内的大型软件企业。公司总部位于南京,在北京、上海、深圳、香港等22个国内主要城市设有研发中心或分子公司,在日本、美国、新加坡等国设有海外分支机构,全球员工约13000人,拥有全球化的技术整合、客户响应与服务到达能力。

秉承“做民族软件脊梁,担世界进步责任”的使命,润和软件致力成为“中国数智技术与服务创新的引领者”,通过国产化、数字化、智能化创新技术,软硬件一体化解决方案能力及全生命周期软件服务体系,激活行业新动能、发展新质生产力,助力广大客户数字化转型和智能化升级。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41059

    浏览量

    302561
  • 润和软件
    +关注

    关注

    1

    文章

    420

    浏览量

    2295
  • 大模型
    +关注

    关注

    2

    文章

    3765

    浏览量

    5269

原文标题:润和软件StackRUNS异构分布式推理框架行业应用案例

文章出处:【微信号:hoperun300339,微信公众号:润和软件】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    分布式光伏发电接入配电网技术规定中关于“四可”装置的内容解析

    测、可调、可控)装置的技术要求,将其从行业推荐性能力升级为刚性并网门槛。详细了解光伏四可装置可咨询:1.3.7-5.0.0.4-6.2.0.0。这些规定既搭建了统一的技术框架,又为地方电网差异化落地预留空间,是分布式光伏合规并网、高效消纳的核心遵循。
    的头像 发表于 02-06 16:39 2840次阅读
    <b class='flag-5'>分布式</b>光伏发电接入配电网技术规定中关于“四可”装置的内容解析

    分布式 IO 选型注意事项

    在工业 4.0 浪潮推动下,分布式 IO 作为工业互联的核心底层设备,已成为制造业实现设备互联、数据采集、柔性生产的关键支撑。本文将助力企业避开选型误区,最大化发挥分布式 IO 的应用价值。​ 产品
    的头像 发表于 12-30 14:14 510次阅读
    <b class='flag-5'>分布式</b> IO 选型注意事项

    SC-3568HA:解锁鸿蒙全权限API与分布式能力的工业控制平台

    传统嵌入开发面临硬件碎片化、高权限功能缺失、分布式协同复杂及自动化测试不足等痛点。SC-3568HA开发板基于鸿蒙系统,通过统一内核抽象层和硬件驱动框架解决兼容问题,开放全量系统API支持高权限
    的头像 发表于 12-18 11:27 7540次阅读
    SC-3568HA:解锁鸿蒙全权限API与<b class='flag-5'>分布式</b>能力的工业控制平台

    如何解决分布式光伏计量难题?

    分布式光伏成增长主力 据《2025-2030年中国分布式光伏行业市场前景预测及未来发展趋势研究报告》显示,2024年中国分布式光伏新增装机118.18GW,同比增长23%,占光伏新增装机总量的43
    的头像 发表于 11-07 14:55 407次阅读
    如何解决<b class='flag-5'>分布式</b>光伏计量难题?

    工业数采网关在分布式设备运维管理中的作用

    支撑。以下从核心功能与运维价值两个维度展开分析: 一、核心功能:打通分布式设备的数据孤岛 多协议兼容与数据统一采集 分布式设备常涉及PLC、传感器、工业机器人等异构设备,采用Modbus、Profinet、OPC UA等不同协议
    的头像 发表于 09-19 10:53 815次阅读
    工业数采网关在<b class='flag-5'>分布式</b>设备运维管理中的作用

    【节能学院】Acrel-1000DP分布式光伏监控系统在奉贤平高食品 4.4MW 分布式光伏中应用

    摘要:在“双碳”和新型电力系统建设背景下,分布式光伏接入比例不断提高,对配电网电压、调度运行及调峰等环节造成强烈冲击。本文设计包含平台层、设备层二层架构体系的分布式光伏管控平台,以及小容量工商业
    的头像 发表于 08-23 08:04 3654次阅读
    【节能学院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏监控系统在奉贤平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中应用

    分布式光伏发电监测系统技术方案

    分布式光伏发电监测系统技术方案 柏峰【BF-GFQX】一、系统目标 :分布式光伏发电监测系统旨在通过智能化的监测手段,实现对分布式光伏电站的全方位、高精度、实时化管理。该系统能
    的头像 发表于 08-22 10:51 3462次阅读
    <b class='flag-5'>分布式</b>光伏发电监测系统技术方案

    对于当下分布式光伏发电市场前景预判

    自从531后,分布式光伏发电项目应该是相对减少了许多,但是依然还是会有,未来趋势是怎么样,是储能+自发自用余电不上网,还是有什么新的政策,欢迎讨论。
    发表于 07-25 08:58

    分布式光伏总出问题?安科瑞分布式光伏监控系统来“救场”

    一、分布式光伏的痛点大揭秘 在 “双碳” 目标的大力推动下,分布式光伏作为绿色能源领域的重要力量,正以前所未有的速度蓬勃发展,越来越多的企业和家庭选择安装分布式光伏系统。然而,随着分布式
    的头像 发表于 07-16 16:50 946次阅读
    <b class='flag-5'>分布式</b>光伏总出问题?安科瑞<b class='flag-5'>分布式</b>光伏监控系统来“救场”

    双电机分布式驱动汽车高速稳定性机电耦合控制

    摘要:为了利用所设计的双电机防滑差速驱动系统来提高分布式驱动汽车的动力学性能,在前期同轴耦合驱动控制理论研究的基础上,开展该车的高速稳定性机电耦合控制研究。建立并验证包含所设计驱动系统在内的分布式
    发表于 06-18 16:37

    软件发布StackRUNS异构分布式推理框架

    当下,AI模型规模持续膨胀、多模态应用场景日益复杂,企业正面临异构算力资源碎片化带来的严峻挑战。为应对行业痛点,江苏软件股份有限公司(以下简称“
    的头像 发表于 06-13 09:10 1597次阅读
    <b class='flag-5'>润</b>和<b class='flag-5'>软件</b>发布<b class='flag-5'>StackRUNS</b><b class='flag-5'>异构</b><b class='flag-5'>分布式</b><b class='flag-5'>推理</b><b class='flag-5'>框架</b>

    曙光存储领跑中国分布式存储市场

    近日,赛迪顾问发布《中国分布式存储市场研究报告(2025)》,指出2024 年中国分布式存储市场首次超过集中式存储,规模达 198.2 亿元,增速 43.7%。
    的头像 发表于 05-19 16:50 1451次阅读

    上海电信携手华为打造分布式云边协同训推方案

    Deepseek加速行业推理应用,面向企业算力租用以及推理数据不出园区的用算需求,上海电信基于“智云上海”新型基础架构,部署华为星河路由器打造400GE IP智算城域POD,提供分布式云边协同
    的头像 发表于 05-19 11:20 1050次阅读

    分布式光纤传感的用途

    生态灾难。这些场景中,一种名为"分布式光纤传感"的技术正悄然编织着一张无形的感知网络,用光信号的"语言"实时翻译着环境的细微变化。 一、技术原理:光与物质的"对话" 分布式光纤传感技术的核心,在于将光纤本身转化为兼具传感与传输功能的"智能神
    的头像 发表于 05-11 17:26 1560次阅读

    分布式光伏电力问题层出不穷?安科瑞分布式光伏运维系统来“救场”

    一、分布式光伏电力运维,痛点大揭秘​ ​ 分布式光伏作为实现绿色能源转型的关键一环,近年来在我国得到了迅猛发展。国家能源局数据显示,截至 2023 年底,中国分布式光伏电站累计并网容量约为 2.5
    的头像 发表于 05-07 17:14 1084次阅读
    <b class='flag-5'>分布式</b>光伏电力问题层出不穷?安科瑞<b class='flag-5'>分布式</b>光伏运维系统来“救场”