电子发烧友网报道(文/梁浩斌)中国超算的高光时刻,是2016年到2017年期间,神威·太湖之光连续四次登顶全球超级计算机TOP 500榜单。但在神威·太湖之光之后,国内超级计算机一直颇为低调,其继任者神威“Oceanlite”没有公开太多信息,也没有再参与TOP500排名。
不过近期中国科学技术大学的一个研究团队,在神威“Oceanlite”上利用大规模神经网络,实现了量子化学模拟的突破,在真实分子尺度下完成复杂量子化学建模。该成果也在近期发布在高性能计算领域顶级期刊IEEE TPDS上。
量子化学是什么?
量子化学研究的其实是分子、原子层面的量子行为(如电子云分布、化学键作用),比如通过捕捉化学反应中间的 “过渡态”(反应最关键、最短暂的步骤),来解释实验无法理解的反应本质。
然而这些过程根本无法通过传统实验直接观测或精准控制,首先电子运动速度极快,且一旦实验设备对其进行观测就会干扰其状态。
在微观尺度下,分子的量子行为遵循薛定谔方程,但直接求解这一方程的计算量会随着电子数量的增加呈指数级爆炸式增长。例如,一个仅包含 10 个电子的分子,其可能的量子态就超过 10 万亿种,而真实的药物分子或催化剂往往包含数十个电子和上百个自旋轨道。
那么如何计算?传统的近似方法如密度泛函理论(DFT)虽然能处理较大规模的系统,但在描述强电子关联现象(如化学键的断裂与形成)时会出现显著误差。量子计算机理论上能解决这一问题,但其当前仍处于含噪声中等规模(NISQ)阶段,无法支撑实际科研需求。
简单来说就是“实验做不到,计算太复杂”。
如何在超算上实现量子化学模拟?
这次中国科学技术大学研究团队的核心是突破神经网络量子态(NNQS)在大规模电子结构分析中的瓶颈,实现真实分子尺度的量子模拟,无需依赖未来的量子计算机。
团队利用神威“Oceanlite”超算,开发了一个名为数据并行NNQS-Transformer框架,在这个框架中主要有三大核心创新。
首先是采用了混合架构设计,研究团队将Transformer 的注意力机制引入量子波函数构建,通过动态捕捉电子间的长程相互作用,解决了传统神经网络量子态(NNQS)在强关联系统中的精度不足问题。
其次是使用了分层通信模型,针对神威“Oceanlite”超算采用的 SW26010-Pro CPU,单芯片384核心,整机4100万核心集群的独特架构,设计了管理核心(MPE)与计算核心(CPE)的分工体系。管理核心负责节点间通信,而配备 512 位向量引擎的 CPE 专注于本地量子计算,包括随机采样等,显著提升了数据访问效率。
SW26010 Pro是SW26010的升级版,CPU核心架构从上一代4个核簇升级为6个,每个核簇由一个MPE和64个CPE组成,MPE拥有32KB L1指令缓存、32KB L1数据缓存以及512KB L2缓存。每个CPE拥有32KB的L1指令缓存和256KB软件管理的高速临时存储。
最后,团队在3700万个CPE核心上进行量子化学模拟计算,在庞大规模的核心数量下,通过实时调整各个核心的任务分配,实现了92%的强扩展性和98%的弱扩展性,即无论是提高问题规模还是增加超算核心规模,都能保证系统性能,确保了超大规模计算中的资源高效利用。
神威超算的SW26010-ProCPU采用本地内存而非缓存的设计,原本更适合规则化的 AI 训练任务,但量子化学模拟需处理随机采样、不规则局域能量计算,所以还需要针对性改造算法。为适配量子化学的不规则计算特性,团队采用Julia语言进行代码开发,利用其可移植性和高性能特性,结合底层优化实现了与硬件的无缝对接。
最终,该团队成功模拟了包含120 个自旋轨道的分子系统,这是目前经典超算上规模最大的 AI 驱动量子化学计算。
新材料、药物研发领域前景广泛
计算机模拟量子化学的基本目的是理解自然规律,通过计算机模拟,可以捕捉化学反应中间的 “过渡态”,解释实验无法理解反应本质。在实际应用中,通过模拟还原一些自然环境中产生的化学反应,比如模拟光合作用,电子在叶绿素中的传递路径、过渡态的能量变化,为人工光合制氢提供理论指导。
而在这个过程中,对微观现象的模拟对于创造新的材料更是突破性的新模式。在药物研发领域,通过计算机模拟药物分子与疾病靶点,如蛋白质、病毒等的量子相互作用,预测 哪种分子能精准结合靶点、阻断疾病通路。
在材料领域,通过模拟分子、原子的量子结构,预测材料的物理化学性质,如导电性、催化活性、强度等,再反向设计出符合需求的材料。比如用于研发更高效的燃料电池催化剂、固态电池的电解质材料等。
写在最后
从该项研究成果可以看出,超算硬件算力基础,与软件生态系统能力的高度配合同样重要。目前中国神威“Oceanlite”超算不再参与算力排名,或许也表示国内超算的指标,从单纯追求硬件参数,转向了追求科研平台落地,构建自主的超算生态。
同时也证明了量子计算机实用化之前,经典超算与AI结合,仍有非常大的潜力可以挖掘。
不过近期中国科学技术大学的一个研究团队,在神威“Oceanlite”上利用大规模神经网络,实现了量子化学模拟的突破,在真实分子尺度下完成复杂量子化学建模。该成果也在近期发布在高性能计算领域顶级期刊IEEE TPDS上。
量子化学是什么?
量子化学研究的其实是分子、原子层面的量子行为(如电子云分布、化学键作用),比如通过捕捉化学反应中间的 “过渡态”(反应最关键、最短暂的步骤),来解释实验无法理解的反应本质。
然而这些过程根本无法通过传统实验直接观测或精准控制,首先电子运动速度极快,且一旦实验设备对其进行观测就会干扰其状态。
在微观尺度下,分子的量子行为遵循薛定谔方程,但直接求解这一方程的计算量会随着电子数量的增加呈指数级爆炸式增长。例如,一个仅包含 10 个电子的分子,其可能的量子态就超过 10 万亿种,而真实的药物分子或催化剂往往包含数十个电子和上百个自旋轨道。
那么如何计算?传统的近似方法如密度泛函理论(DFT)虽然能处理较大规模的系统,但在描述强电子关联现象(如化学键的断裂与形成)时会出现显著误差。量子计算机理论上能解决这一问题,但其当前仍处于含噪声中等规模(NISQ)阶段,无法支撑实际科研需求。
简单来说就是“实验做不到,计算太复杂”。
如何在超算上实现量子化学模拟?
这次中国科学技术大学研究团队的核心是突破神经网络量子态(NNQS)在大规模电子结构分析中的瓶颈,实现真实分子尺度的量子模拟,无需依赖未来的量子计算机。
团队利用神威“Oceanlite”超算,开发了一个名为数据并行NNQS-Transformer框架,在这个框架中主要有三大核心创新。
首先是采用了混合架构设计,研究团队将Transformer 的注意力机制引入量子波函数构建,通过动态捕捉电子间的长程相互作用,解决了传统神经网络量子态(NNQS)在强关联系统中的精度不足问题。
其次是使用了分层通信模型,针对神威“Oceanlite”超算采用的 SW26010-Pro CPU,单芯片384核心,整机4100万核心集群的独特架构,设计了管理核心(MPE)与计算核心(CPE)的分工体系。管理核心负责节点间通信,而配备 512 位向量引擎的 CPE 专注于本地量子计算,包括随机采样等,显著提升了数据访问效率。
SW26010 Pro是SW26010的升级版,CPU核心架构从上一代4个核簇升级为6个,每个核簇由一个MPE和64个CPE组成,MPE拥有32KB L1指令缓存、32KB L1数据缓存以及512KB L2缓存。每个CPE拥有32KB的L1指令缓存和256KB软件管理的高速临时存储。
最后,团队在3700万个CPE核心上进行量子化学模拟计算,在庞大规模的核心数量下,通过实时调整各个核心的任务分配,实现了92%的强扩展性和98%的弱扩展性,即无论是提高问题规模还是增加超算核心规模,都能保证系统性能,确保了超大规模计算中的资源高效利用。
神威超算的SW26010-ProCPU采用本地内存而非缓存的设计,原本更适合规则化的 AI 训练任务,但量子化学模拟需处理随机采样、不规则局域能量计算,所以还需要针对性改造算法。为适配量子化学的不规则计算特性,团队采用Julia语言进行代码开发,利用其可移植性和高性能特性,结合底层优化实现了与硬件的无缝对接。
最终,该团队成功模拟了包含120 个自旋轨道的分子系统,这是目前经典超算上规模最大的 AI 驱动量子化学计算。
新材料、药物研发领域前景广泛
计算机模拟量子化学的基本目的是理解自然规律,通过计算机模拟,可以捕捉化学反应中间的 “过渡态”,解释实验无法理解反应本质。在实际应用中,通过模拟还原一些自然环境中产生的化学反应,比如模拟光合作用,电子在叶绿素中的传递路径、过渡态的能量变化,为人工光合制氢提供理论指导。
而在这个过程中,对微观现象的模拟对于创造新的材料更是突破性的新模式。在药物研发领域,通过计算机模拟药物分子与疾病靶点,如蛋白质、病毒等的量子相互作用,预测 哪种分子能精准结合靶点、阻断疾病通路。
在材料领域,通过模拟分子、原子的量子结构,预测材料的物理化学性质,如导电性、催化活性、强度等,再反向设计出符合需求的材料。比如用于研发更高效的燃料电池催化剂、固态电池的电解质材料等。
写在最后
从该项研究成果可以看出,超算硬件算力基础,与软件生态系统能力的高度配合同样重要。目前中国神威“Oceanlite”超算不再参与算力排名,或许也表示国内超算的指标,从单纯追求硬件参数,转向了追求科研平台落地,构建自主的超算生态。
同时也证明了量子计算机实用化之前,经典超算与AI结合,仍有非常大的潜力可以挖掘。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
发布评论请先 登录
相关推荐
热点推荐
国产光芯片大突破,算力超百倍,绕开EUV
已经发表于国际顶级学术期刊《科学》(Science),并被选为高光论文重点报道。 这是国际上首次实现大规模全光生成式AI芯片,标志着光计算在生成式AI领域的应用从理论可行性迈入实际效能领先阶段。 全光
NVIDIA推出cuEST量子化学加速库
本周,NVIDIA 发布了 NVIDIA cuEST。这是一款全新的 NVIDIA CUDA-X 库,可将电子结构计算迁移到 GPU 上执行。应用材料公司、三星、新思科技和 TSMC 已率先采用。
龙芯中科深度参与京津冀首个万卡级国产智算枢纽启动建设
近日,汉腾科技投资建设的石家庄AI产业中心项目奠基仪式在石家庄高新区隆重举行,龙芯中科作为国产自主CPU领军企业参与仪式并共建智算生态。该项目正式开启实质性建设,标志着京津冀首个万卡
边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值
” 。
随着DeepSeek、LLaMA等开源模型的轻量化演进,以及具身智能、工业质检对实时性的严苛要求,AI计算正在从云数据中心扩散到离数据源头最近的物理世界。在这一背景下,AI M
发表于 03-10 14:19
中科曙光3套scaleX万卡超集群落地国家超算互联网郑州核心节点
2月5日,由中科曙光提供的3套万卡超集群系统在国家超算互联网郑州核心节点同时上线试运行,成为全国首个实现3
Banana Pi 基于龙芯2K3000的国产信创工业计算网关设计,采用无风扇设计
2K3000的国产信创工业计算网关[]()
产品采用核心板+底板设计,采用无风扇铜散热。
核心特性
全功能核心板: COM-E Type标
发表于 12-17 11:06
中科曙光scaleX640超节点亮相2025世界计算大会
11月20日,在以“计算万物,湘约未来——智算驱动新质生产力”为主题的长沙世界计算大会上,中科曙
谷歌芯片实现量子计算新突破,比超算快13000倍
电子发烧友综合报道 日前,谷歌宣布其量子计算机取得突破性进展,使用一种名为“量子回声(Quantum Echoes)”的算法,在
今日看点:谷歌芯片实现量子计算比经典超算快13000倍;NFC 技术突破:读取距离从 5 毫米提升至 20 毫米
谷歌芯片实现量子计算比经典超算快13000倍 近日,谷歌在《自然》杂志披露与Willow芯片相关的量子计
发表于 10-23 10:20
•1715次阅读
【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用
和量子计算的两项新兴的技术,将在生产假说方面发挥重要作用,从而改变科学发现的范式。
生成式AI:
2、穷举搜索
3、分析排错与组合优化
分析排错是生成假说的重要手段。强化学习也在优化假
发表于 09-17 11:45
【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》
RISC-V架构的AI加速器、量子AI芯片、光电组合AI芯片等。
随着大模型面临收益递减、资源浪费等困境,书中接着将目光投向 “后Transformer” 时代的新兴算法。详细解读了
发表于 07-28 13:54
新思科技携手合作伙伴共同推动量子计算研发
新思科技携手惠普实验室、应用材料公司(Applied Materials)、Qolab、Quantum Machines、威斯康星大学和1QBit等多家合作伙伴,共同推动量子计算研发,旨在构建具有实际工业应用价值的量子
AI驱动量子化学计算!4100万核心国产超算取得世界级突破!
评论