0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

沐曦股份GPU加速技术助力药物研发降本增效

沐曦MetaX 来源:沐曦MetaX 2025-12-02 15:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

沐曦股份科学计算团队近期取得突破性进展,成功将主流分子动力学模拟引擎GROMACS中的FEP计算全流程部署于GPU执行,并实现2.5倍性能提升,相关成果获得GROMACS官方团队的高度认可,该GPU加速功能将在GROMACS 2026官方版本中正式发布,核心论文已发表于国际权威期刊 ACS Omega。同时,团队自主研发的FEP工作流自动化管理工具MetaxFEP相关论文已正式发表在BIBE2025生物信息工程和生物医学会议论文集中,并在ICBBS会议上荣获分会最佳口头报告奖。这些成果的取得,标志着国产GPU加速技术在计算机辅助药物发现领域,已初步形成从算法优化到工具开发、再到实际工作流支撑的完整技术链条,为行业提供了切实可行的高效计算解决方案。

计算机辅助药物发现流程通常涵盖多个关键环节,包括分子表征、靶标蛋白结构预测、分子对接,以及基于动力学模拟的自由能预测等。其中,对配体-蛋白质结合自由能的精准预测通常采用自由能微扰(Free Energy Perturbation, FEP)方法,通过分子动力学模拟加以实现。FEP方法凭借其在预测结合自由能方面的高精度,被广泛视为药物筛选流程中最终阶段精细筛选与先导化合物优化的“金标准”工具。

然而,传统FEP应用长期面临两大关键瓶颈:一是计算速度缓慢,庞大的计算需求导致模拟耗时过长,严重制约了药物研发的迭代效率;二是操作流程复杂,涉及体系准备、拓扑生成、中间态窗口设置、平衡与采样以及数据分析等多个步骤,手动操作不仅费时,且容易引入误差。沐曦股份科学计算团队近期开展的一系列研究工作,正是为了系统性地应对上述挑战。

GROMACS模拟引擎中FEP

计算的GPU加速研究

GROMACS是一款由瑞典皇家理工学院(KTH)开发的开源分子动力学模拟引擎。凭借出色的性能与完善的功能,它在全球范围内拥有大量活跃用户,并常年位列世界各大超级计算机上使用最广泛的前三大科学计算应用之一。在制药领域,GROMACS常被用于FEP计算,以预测分子间相互作用的自由能变化。然而,目前其官方版本中的FEP计算仅支持在CPU上运行,这严重限制了整体模拟效率。

针对这一瓶颈,沐曦股份科学计算团队实现了FEP算法在GPU上的完整移植与优化。该GPU加速版本能够将FEP模拟全流程部署于GPU执行,使整体性能提升至原版的2.5倍。此项工作获得了GROMACS官方团队的高度认可,相关代码现已正式合入GROMACS官方代码仓库,计划纳入其2026年首版发布中。相关研究成果已发表于美国化学会旗下期刊 ACS Omega,全文开放获取,欢迎感兴趣的读者查阅下载。

核心贡献

GPU算法设计与优化:开发了基于GPU的自由能微扰(FEP)作用力计算算法,并针对不同GPU硬件架构进行了深度优化,包括任务划分逻辑、数据交换机制与内存排布策略等,充分发挥GPU并行计算效能。

全流程GPU化实现:在完成FEP作用力计算加速的基础上,进一步将积分与状态更新等关键步骤移植至GPU,实现了FEP模拟全流程的GPU运行,大幅减少了CPU与GPU之间的数据传输开销,使整体性能达到原版的2.5倍。

计算精度严格验证:优化后的代码通过了多阶段严谨验证,在多个测试数据集上的计算结果均达到化学精度(误差<2.0 kcal/mol),有力保障了模拟结果的可靠性与科学性。

MetaxFEP: 基于沐曦股份GPU的FEP

工作流自动化管理工具

沐曦股份科学计算团队自研的MetaxFEP工具可以实现自动化高效的FEP流程构建、执行和管理。MetaxFEP 针对性地解决了FEP研究领域存在的可复现性和易用性问题。用户仅需提供目标蛋白结构和配体分子的文件,MetaxFEP 即可智能解析并自动构建完整的FEP计算工作流,涵盖从预处理到结果分析的所有必要环节。同时,整个工作流在沐曦GPU上执行,实现了从数据准备到核心计算的全流程GPU深度加速。最终,平台会精准预测目标蛋白与配体间的结合自由能变化,并将可靠的计算结果以清晰易用的CSV格式文件输出。

MetaxFEP的计算可靠性和卓越性能已通过严谨的基准测试得到充分验证。其预测结果与实验测量值之间的误差小于2.0 kcal/mol,达到化学精度;同时,测试得到的Pearson秩相关系数(R2)大于0.6,有效证明了其出色的排序能力。在性能方面,凭借着前文中介绍的FEP计算的全程GPU优化,MetaxFEP 展现出显著优势。在单张沐曦曦云C500 GPU上执行FEP计算,其速度可达到128核CPU服务器的3倍以上。当扩展到配备8张曦云C500 GPU的高性能服务器时,完成一组典型的蛋白质-配体自由能计算任务所需时间大幅缩短至仅约10小时。相较于同等规模的128核CPU计算资源,整体效率提升高达17倍,从而极大加速了药物研发周期。

MetaxFEP相关论文发表在BIBE2025生物信息工程和生物医学会议论文集中。在BIBE2025和ICBBS2025会议上,沐曦股份科学计算团队向行业专家和学者做了MetaxFEP的学术报告,并在ICBBS会议中获得分会最佳口头报告奖项。

以上工作均是沐曦股份“AI for Drug Discovery (AI4DD)”计算平台构建中的关键组成部分。沐曦股份致力于打造一条完整、高效、由AI驱动并全面GPU加速的药物研发工作流。该平台深度整合传统计算工具与前沿AI模型,为用户提供高性能、一体化研发解决方案,实现从靶点发现到先导化合物优化的全流程加速。

关于沐曦股份

沐曦股份致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134471
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92688
  • 科学计算
    +关注

    关注

    0

    文章

    6

    浏览量

    1207
  • 沐曦
    +关注

    关注

    0

    文章

    54

    浏览量

    1657

原文标题:突破“金标准”计算瓶颈:沐曦股份GPU加速技术助力药物研发降本增效

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瀚海量子与股份达成战略合作 量子计算软件领军者+高性能GPU芯片领军者

    当量子计算软件领军者遇上高性能GPU芯片领军者,国产算力领域迎来一项重磅合作。 近日, 合肥瀚海量子科技有限公司(简称“瀚海量子”)与集成电路(上海)股份有限公司(简称“
    的头像 发表于 11-24 19:02 2057次阅读

    触拓科技工控一体机:智能工厂降本增效的核心引擎

    - 仓储” 全链路数字化解决方案,凭借工业级稳定性能与高效协同能力,成为智能工厂的 “数字神经末梢”,助力企业降本增效
    的头像 发表于 11-21 17:51 197次阅读
    触拓科技工控一体机:智能工厂<b class='flag-5'>降本增效</b>的核心引擎

    股份与上海电信完成首期GPU生态专家认证培训

    近期,集成电路(上海)股份有限公司(以下简称“股份”)携手上海电信天翼云能力运营中心(以
    的头像 发表于 10-31 10:33 256次阅读

    强强联合:之江实验室与股份共建智算集群联合实验室

    2025年10月22日, 之江实验室与集成电路(上海)股份有限公司(以下简称“股份”)正
    的头像 发表于 10-23 10:50 1030次阅读

    首款全国产通用GPU芯片发布 集成推出云C600

    ,并支持MetaXLink超节点扩展技术,在硬件性能和软件兼容上完全满足下一代生成式AI的训练和推理需求。 而且,股份与中国科学院合作的国产千卡集群,已完成多个大模型全参数训练,证
    的头像 发表于 10-19 20:04 4.5w次阅读

    GPU与龙蜥操作系统完成适配

    集成电路(上海)股份有限公司(以下简称"")于 2020 年 9 月成立于上海,其拥有技术
    的头像 发表于 10-17 15:06 812次阅读

    停车场照明焕新记:晶映节能改造的降本增效实践​

    晶映节能停车场照明改造以技术创新破传统困境,通过智能感应与数字化管理,实现电费大降、维护成本锐减,同步提升安全与用户体验,彰显降本增效深层价值。
    的头像 发表于 08-21 16:18 580次阅读
    停车场照明焕新记:晶映节能改造的<b class='flag-5'>降本增效</b>实践​

    液冷算力新标杆!科华数据联合股份在世界人工智能大会首发高密度液冷算力POD

    ,科华数据与股份联合推出的高密度液冷算力POD首次亮相,吸引了大量参会者驻足交流。该产品是科华数据专为高性能
    的头像 发表于 07-29 15:57 661次阅读
    液冷算力新标杆!科华数据联合<b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b>在世界人工智能大会首发高密度液冷算力POD

    硅基流动携手首发基于云的Kimi K2推理服务

    今天,硅基流动联合集成电路(上海)股份有限公司(简称“”),全球首发基于
    的头像 发表于 07-23 17:33 1564次阅读

    福田欧曼银河5助力物流运输行业降本增效

    在物流运输行业竞争日趋白热化的当下,每一分成本削减与效率提升都直接关乎用户的生存空间,而运输效率与运营效益已成为检验重卡性能的核心指标。面对行业降本增效的迫切需求,欧曼银河5精准锚定用户痛点,从动
    的头像 发表于 05-20 09:23 773次阅读

    云C500通用计算GPU与百度飞桨完成Ⅱ级兼容性测试

    近日,云C500通用计算GPU与百度飞桨已完成Ⅱ级兼容性测试。测试结果显示,双方兼容性表现良好,整体运行稳定。这是
    的头像 发表于 03-31 14:22 1483次阅读

    加速DeepSeek满血版单卡C500异构推理

    近日,基于开源KTransformers架构的 CPU/GPU 异构推理能力,云C500单卡GPU上成功实现DeepSeek-R1-
    的头像 发表于 03-20 15:52 1890次阅读

    澎峰科技与完成联合测试,实现全面兼容

    实现了全面兼容,为用户提供了更为高效、稳定的解决方案。 在测试过程中,澎峰科技与科技的技术团队紧密协作,对PerfXLM和PerfXCloud在云系列
    的头像 发表于 01-21 15:20 969次阅读

    澎峰科技计算软件栈与GPU完成适配和互认证

    ‍近期,澎峰科技与完成了对PerfXLM(推理引擎)、PerfXCloud(大模型服务平台)与云系列通用计算
    的头像 发表于 01-21 09:51 1195次阅读

    智慧光伏运维管理系统助力光伏运维降本增效

    智慧光伏运维管理系统助力光伏运维降本增效 智慧光伏运维管理系统是利用物联网、大数据、云计算、人工智能等先进技术,实现对光伏电站的智能监测、预测、控制和优化。通过实时监测光伏电站的运行状态,收集和分析
    的头像 发表于 01-03 17:00 860次阅读
    智慧光伏运维管理系统<b class='flag-5'>助力</b>光伏运维<b class='flag-5'>降本增效</b>