0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Net5.5G智能云网即将全面发布,打造新一代数字基础设施

华为数据通信 来源:智能感知与物联网技术研 2024-02-26 10:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

中科大团队开发首个通用的大语言模型分子交互学习框架,在多个数据集超 4,000,000 个分子对上验证了其可靠性。

简述

分子关系学习(Molecular Relational Learning)旨在理解和建模分子对的交互作用,如分子对交互(Drug-drug Interaction,DDI)、溶液-溶剂交互(Solution-solvent Interaction)。近来,凭借丰富的知识储备和优秀的推演能力,大型语言模型(LLMs)已成为实现分子关系高效学习的重要工具。

尽管这一方法颇有成效,但当前范式的主要问题是数据利用的不充分。如下图(a)所示,当前范式主要依赖于文本数据(如 SMILES),未能充分且显式地利用分子图中固有的丰富结构信息。

加剧这一问题的是统一学习框架的缺失,因为其阻碍了从各个数据集中学习到的关键交互信息与底层交互逻辑的高效共享和整合。如下图 b 所示,这一缺失扩大了数据利用的不充分的影响,使得 LLMs 因高度过拟合的风险而无法建模那些广泛存在的、数据量较少的分子交互任务。

wKgZomXb-xiAG2xwAAQuCmS3G-g797.jpg

▲ 图1:当前基于 LLMs 的分子交互学习范式与 MolTC 的比较。(a)现行方法的通用范式;(b)将当前范式应用于样本量较少的任务时所带来的挑战;(c)我们的 MolTC 的架构。

为了缓解这一问题,我们提出了一个通用的、基于 LLM 的多模态分子交互学习框架,MolTC(Molecular inTeraction Modeling enhanced by Chain-of-thought theory)。如上图 c 所示,MolTC 通过图编码器(Encoder)和映射器(Projector)高效地建模分子图信息,并创新性地提出了多层级思维链(Multi-hierarchical Chain-of-thought)的概念来引导训练范式的优化。

此外,为了加强数据间的信息共享,我们为其设计了一个新颖的动态参数共享策略,以实现效率和精度的双赢。同时,鉴于这一领域数据集的缺失,我们还构建了一个全面的分子交互指令数据集,MoT-instructions,用于提高当前基于 LLMs 的学习框架(包扩我们的 MolTC)对分子交互任务的理解能力。

我们在涉及超过 4,000,000 个分子对的十二个不同领域数据集上进行了验证实验。结果表明,我们的方法优于当前基于 GNN 的、基于(除 GNN 外)其它传统深度学习架构的、和基于 LLMs 的基线方法。

多模态输入框架

我们首先简要介绍上图 c 中所示的 MolTC 框架。其中,Graph Encoder 采用传统的图神经网络(GNN)架构;Projector 采用在视觉领域常用于多模态对齐的 Querying Transformers (Q-Former)架构,作为 backbone 的 LLM 则是采用在生化任务中表现突出的 Galactica。更多细节劳请移步我们的论文和代码。

基于多层级思维链的训练范式

我们重点介绍基于多层级思维链的 MolTC 训练范式。首先,考虑到从分子对中直接生成复杂相互作用的挑战性,处于上层的思维链指导 MolTC 的预训练过程优先识别并按次序输出输入分子对中,每个分子的关键生化性质,为准确预测它们的交互奠定基础。具体而言,在预训练阶段,Prompts 的统一设计如下:

wKgZomXb-xeACnZ9AADkUPAur2E880.jpg

预训练阶段的数据来自多个权威的、包含分子-性质对的生化数据库如 Drugbank 和 PubChem。为了提高 MolTC 在不同分子交互场景下的泛化能力,我们对上述数据库中的分子进行随机组合,来构造不同的分子对。

随后,在微调阶段,针对定性分子交互分析任务,Prompts 直接根据特定的下游任务进行定制。而针对传统 LLMs 较难处理的定量分析任务,下层的思维链指导 MolTC 优先为目标数值预估一个大致的范围,然后逐步将其细化到一个精确的值。以溶液-溶剂交互任务为例,其 Prompts 的设计如下:

wKgaomXb-xiAZAbwAAFjJa2wiP0534.jpg

动态参数共享策略

为了提高上述训练范式的效率,MolTC 引入了一种新颖的参数共享策略。具体而言,我们首先考虑分子交互任务的以下关键属性:

(1)交互中分子角色的重要性。例如,在溶液-溶剂交互场景中,水和乙醇互为溶剂会产生不同的能量释放。某些时候,角色的颠倒甚至会导致交互反应的停滞。

(2)交互中分子顺序的重要性。例如,在药物对交互场景中,药物引入顺序的不同可能会导致不同的治疗效果。

(3)分子角色/顺序带来的特征重要性的差异。例如,在发色团-溶液对中,一个化学基团在溶液内会对交互属性产生关键的影响,但其在发色团中时,则可能对交互无足轻重。

wKgZomXb-xiAfUCpAAGMqSlMQhw455.jpg

▲ 图2:应用动态参数共享策略后的的 MolTC 训练范式。其中,链环表示两个模块之间的参数共享;雪花表示参数冻结;火焰表示参数更新。

这些属性自然地启发 MolTC 适应性地优先考虑俩个分子内的不同信息,即根据角色和顺序为分子创建独特的编码。具体而言,为了学习到这种差异性,同时维持分子对中学习到的共性信息的共享,我们引入了如下参数共享策略:

(1)考虑 Graph Encoder 专注于提取底层的分子图结构,并未将语义与分子结构进行对齐,因此,在预训练和微调阶段,MolTC 共享俩个 Graph Encoder 的参数,以增强其学习效率。

(2)考虑 Projector 专注于实现分子结构与语义信息的对齐,因此,在预训练阶段,MolTC 共享俩个 Projector 的参数以提高系统的泛化性和鲁棒性;在微调阶段,MolTC 终止这一共享,实现根据不同下游任务中的分子角色和顺序量身定制的语义映射。

MoT-instruction数据集开发

在 MolTC 的训练过程中,鉴于当前缺乏一个通用的、为大模型分子关系学习量身定制的指令数据集,我们首先给出这一数据集应当满足的关键性质:(1)它应包含横跨多个领域的、可以进行交互的大量分子对;(2)它应详细描述这些分子对中每个分子的重要生化属性,以及(3)它应根据思维链的形式阐述分子对的交互性质。

具体来说,我们通过以下三步构建上述 MoT-instructions 数据集:

(1)我们首先收集多个具有代表性的分子交互数据集,并从 DrugBank 和 PubChem 等权威生化数据库中获取这些交互所涉及分子的生化属性;

(2)随后,我们进行最优指令确定。具体而言,我们根据训练 MolTC 得到的预测性能作为指标,来对定量交互 instructions 中的数值区间进行设定。并结合该值的统计数据(如均值和方差)得出最优区间设定和统计数据之间的规律,推广至更多的定量交互数据集中;

(3)最后,我们将交互涉及的每个属性单独抽取至一个独立的数据空间,以在排除交互属性中缺失值、模糊值的干扰下,不浪费分子对所提供的其他有用信息。

实验

为了更全面地评估 MolTC 的有效性,我们将基线算法分为三类:基于 GNN 的、基于其他深度学习模型的以及基于 LLMs 的方法。部分定性和定量的实验结果如下表所示。更多结果如消融实验结果烦请移步我们的文章或代码。

wKgaomXb-xiAAnDsAAKQuxqhQh8193.jpg

▲ 表1:定性实验结果(以药物对交互任务为例)

wKgZomXb-xiAC2skAAKYl0_5Cng646.jpg

▲ 表2:定量实验结果(以溶液溶剂交互任务为例)




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3903

    浏览量

    141437
  • 语言模型
    +关注

    关注

    0

    文章

    570

    浏览量

    11254
  • GNN
    GNN
    +关注

    关注

    1

    文章

    31

    浏览量

    6723
  • LLM
    LLM
    +关注

    关注

    1

    文章

    340

    浏览量

    1257

原文标题:MWC 2024 | 倒计时1天!Net5.5G智能云网即将全面发布,打造新一代数字基础设施

文章出处:【微信号:Huawei_Fixed,微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    新一代AtomGit平台暨人工智能开源社区发布

    、数据集及异构算力资源,共同打造中立、开放、公益的新一代“开源+人工智能体化基础设施平台——AtomGit,并正式
    的头像 发表于 10-30 09:46 377次阅读

    华为发布以AI-Centric全面升级的AI WAN解决方案

    Net5.5G IP承载的技术演进与产业智能化实践。峰会上,华为正式发布以AI-Centric全面升级的AI WAN解决方案,通过重新定义
    的头像 发表于 10-17 11:13 509次阅读

    IDC副总裁畅谈Net5.5G的创新场景

    IDC欧洲电信与基础设施副总裁Chris Barnard认为,业界提出的Net5.5G产业代际,在当前的数智化时代,极大的促进了数据通信产业的技术创新和发展,在企业园区网络、广域网络、数据中心网络以及网络安全得到了广泛应用,全面
    的头像 发表于 10-13 09:14 483次阅读

    【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦!

    【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦! 聆思全新一代六合芯片「LS26系列」,搭载WIFI / BLE & BT / NPU,与「小聆AI」强强联合
    发表于 09-25 11:47

    腾讯发布新一代智能驾驶地图9.0

    9月16-17日,2025腾讯全球数字生态大会在深圳举行。会议期间,腾讯正式发布新一代智能驾驶地图9.0。
    的头像 发表于 09-18 10:23 1282次阅读

    华为Net5.5G助力IP网络迈入智能新时代

    2025年8月21日,第九届未来网络发展大会在南京成功举办。华为数据通信标准专利部部长朱科义发表了主题演讲《智启未来:Net5.5G引领IP网络全面迈入智能新时代》,深入分析了AI时代IP网络新挑战
    的头像 发表于 08-22 16:57 1887次阅读

    摩尔线程“AI工厂”:以系统级创新定义新一代AI基础设施

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打造生产先进模型的“超级工厂”。   “AI工厂”:锻造先进模型的“超级工厂” 人工
    发表于 07-28 10:34 2399次阅读
    摩尔线程“AI工厂”:以系统级创新定义<b class='flag-5'>新一代</b>AI<b class='flag-5'>基础设施</b>

    Net5.5G的四大技术亮点

    互联网迎来AI大爆发,诞生了个新名词:新质互联网,也称为Net5.5G。它不是普通的网络升级,而是面向AI时代的全新网络架构。简单来说,它让互联网从连接“人”扩展到连接人 + 设备 + 算力 + 数据 + 空间。
    的头像 发表于 07-01 17:06 698次阅读

    华为开发者大会2025(HDC 2025)亮点:华为发布盘古大模型5.5 宣布新一代昇腾AI服务上线

    HarmonyOS、昇腾AI服务、盘古大模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为计算CEO张平安宣布基于CloudMatrix384 超节点的新一代昇腾AI服务
    的头像 发表于 06-20 20:19 3907次阅读
    华为开发者大会2025(HDC 2025)亮点:华为<b class='flag-5'>云</b><b class='flag-5'>发布</b>盘古大模型<b class='flag-5'>5.5</b> 宣布<b class='flag-5'>新一代</b>昇腾AI<b class='flag-5'>云</b>服务上线

    广和通发布新一代AI语音智能体FiboVista

    近日,2025火山引擎Force原动力大会正式开幕。广和通发布新一代AI语音智能体FiboVista,并已率先应用于车联网,成为智能驾驶的“用车伙伴”和“出行伴侣”。通过创新AI大模型
    的头像 发表于 06-17 09:22 998次阅读

    华为打造移动AI时代领先电信基础设施

    使能平台,助力运营商电信基础设施从架构、自动化、绿色、AI等方面全面升级,从容应对复杂网络挑战,使能AI业务创新,打造移动AI时代领先电信基础设施。 从电报、电话、移动通信、移动互联网
    的头像 发表于 03-08 11:39 1105次阅读

    全球产业界共同发布Net5.5G网络最佳实践白皮书

    以"下一代互联网演进,迈向智能化时代"为主题,吸引了来自全球产业组织、标准组织、政府机构、运营商、设备商等200余位行业领袖齐聚堂,共同探讨Net5.5G演进方向、网络技术创新、商用
    的头像 发表于 03-05 14:40 524次阅读
    全球产业界共同<b class='flag-5'>发布</b><b class='flag-5'>Net5.5G</b>网络最佳实践白皮书

    华为携手产业伙伴打造一代智能电信基础设施

    NFV是电信行业变革的重要催化剂,2012年NFV愿景白皮书的发布和ETSI NFV标准组织的成立,标志着电信行业新时代的开始。历经十年发展,基于虚拟机的电信网络化取得了令人瞩目的成就,业已成为5G
    的头像 发表于 02-24 17:00 760次阅读

    Garmin佳明和天马推出新一代数字座舱解决方案

    即将开幕的国际消费电子展(CES 2025)上,Garmin佳明推出全新一代数字座舱解决方案Garmin Unified Cabin 2025。该方案配备了天马多款车规级显示屏,其中包括款采用多屏全贴合技术的全新超宽显示屏,
    的头像 发表于 01-07 16:16 1279次阅读

    Garmin佳明和高通推出新一代数字座舱解决方案

    Garmin佳明和高通技术公司在2025年国际消费电子展(CES 2025)上宣布,双方将扩展在汽车技术领域的合作,推出全新一代数字座舱解决方案Garmin Unified Cabin 2025,可基于单个Garmin控制模组提供可扩展的域控制器功能。
    的头像 发表于 01-07 10:38 1185次阅读