0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

洪亮团队在生信期刊JCIM发布最新成果,蛋白质工程迈入通用人工智能时代

科技数码 来源:科技数码 作者:科技数码 2024-04-19 17:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,天鹜科技创始人&首席科学家洪亮教授团队,在生物信息学和人工智能研究领域的国际权威学术期刊JCIM(Journal of Chemical Information and Modeling)上发表最新研究成果:“基于微环境感知图神经网络构建指导蛋白质定向进化的通用人工智能”(Protein Engineering with Lightweight Graph Denoising Neural Networks)。在此项研究中,该团队设计了一种微环境感知图神经网络ProtLGN。ProtLGN能够从蛋白质三维结构中学习有益的氨基酸突变位点,建立自然选择下的氨基酸序列分布,用于指导蛋白质氨基酸位点设计,最终实现蛋白质指定功能的提升。

根据研究介绍,在生物化学实验的基础上,课题组证实了ProtLGN是一项通用的人工智能方法,在极少甚至没有实验数据的情况下,成功地实现了针对特定蛋白质性质的定向进化,包括提高抗体的亲和力和稳定性、增强多种荧光蛋白的荧光强度,以及提升核酸内切酶的DNA切割活性。这是全球首次也是唯一一次经湿实验验证,我们可以通过建立通用人工智能,在极少实验数据甚至无实验数据下实现不同蛋白特定性质的定向进化。

人工智能的进步正在改变生命科学领域的研究方法和思维范式,尤其是在生物医药领域,而蛋白质设计作为该领域的关键技术之一,正受到人工智能技术的深刻影响。传统的蛋白质设计方法存在效率低下、成本高昂、时间耗费长等难以解决的问题,基于深度学习的预测和筛选在蛋白质设计中被逐步应用并验证。

但现有方法大多是基于多序列比对(MSA)或蛋白质语言模型(PLM)对蛋白质序列进行特征提取。前者高度依赖于同源序列的数量,但在实际应用中,并非所有蛋白质序列都能进行深度的同源比对;后者需要大量训练数据和复杂的模型设计,导致训练成本很高。即使是使用当前主流的自然语言预训练模型的思路,考虑到每个蛋白质都有独特的性质和进化方向,使用通用预训练模型处理独特蛋白质时,不经重新训练直接应用也会带来泛化性和表达能力的挑战。

洪亮团队设计的能够提取氨基酸周围微观环境信息的等变图神经网络的预训练框架ProtLGN,结合蛋白质的结构信息对蛋白质上的每个氨基酸进行同步编码,学习蛋白质三维结构中有益的氨基酸突变位点和突变类型,用于指导具有不同功能的蛋白质单位点突变和多位点突变设计。

wKgaomYiPHmAOgknAAhCEfZomC4516.png

图1 ProtLGN框架示意图

LGN的零样本学习训练框架如上图所示。首先,输入蛋白质数据集中的每个序列被k临近邻居算法转换成一个蛋白质图,并基于氨基酸性质提取出节点特征、边特征、以及氨基酸的三维坐标信息。接着,对一部分的节点特征进行噪声扰动后输入到等变图神经网络中学习图上的节点表示。这一节点表示被全连接层解码后可以预测多个不同的目标,比如去噪的节点氨基酸类型标签SASA和B-factor数值等。这里的预测误差用于构建损失函数并传导回网络层进行反向传导。在预测阶段,模型输出突变蛋白质的氨基酸概率,与野生型比对后,通过处理和计算得出突变体的评分。

为了验证ProtLGN对蛋白质突变体活性的预测效果,作者在不同蛋白质的多种生理功能性质上进行了充分验证,确保ProtLGN预测效果的通用性,包括VHH抗体、荧光蛋白(绿色、蓝色、橙色)、核酸内切酶(KmAgo)等多种蛋白的热稳定性、结合能力、荧光强度、单链DNA剪切活性等蛋白质工程常规关注和改造的多种关键功能指标。

wKgaomYiPHmAYrHLAALDwicoGMM096.png

图2 荧光蛋白发光强度(FP),VHH抗体结合强度与热稳定性,以及中温核酸剪切酶(KmAgo)剪切活性的多点位突变结果

湿实验结果表明,ProtLGN可以在没有湿实验数据或仅少量类似功能蛋白质的实验数据基础上达到40%的单点位改造成功率,并且在部分单位点上实现了多种功能协同提升。

上述结果表明ProtLGN能够极大改善传统蛋白质工程方法中成本高、成功率低、数据稀缺等问题。更为重要的是,本文首次使用深度学习模型在学习单位点突变体活性数据后,准确预测组合位点的活性,并且在单轮湿实验中即可筛选出功能显著优于低位点突变体的高位点突变体,表明ProtLGN能够有效挖掘蛋白质定向进化中的正上位效应,为蛋白质的深度进化提供一条有效途径。

ProtLGN作为一种新型的蛋白质设计方法,为生物学家和药物研发人员提供了一个强大且可靠的计算工具。ProtLGN不仅能够深入解析蛋白质的结构与功能的复杂关系,而且能够突破传统蛋白质设计方法遇到的瓶颈,为基于蛋白质的医药研究、生物技术开发等提供了全新并且有效的解决方案。

自然科学研究院/上海国家应用数学中心(上海交通大学分中心)助理研究员周冰心博士,密歇根大学神经科学研究所/细胞与发育生物学研究所博士后郑力荣博士,生命科学技术学院博士研究生吴邦昊,上海人工智能实验室/华东理工大学信息科学与工程学院硕士研究生谭扬为共同第一作者。自然科学研究院/物理与天文学院/张江高等研究院洪亮教授为通讯作者。

该工作得到了国家自然科学基金委、上海市科委、教委、上海人工智能国家实验室和张江高等研究院的支持。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261524
  • PLM
    PLM
    +关注

    关注

    2

    文章

    148

    浏览量

    21945
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    福禄克流量校准系统在生物制药行业的应用

    在生物制药行业,生物反应器和发酵罐是生产生物制品(如疫苗、单克隆抗体和治疗性蛋白质)的核心设备。氧气、氮气或二氧化碳等气体的精密流量控制对于维持细胞生长、代谢和产品产量的最佳条件至关重要。
    的头像 发表于 10-31 17:00 1249次阅读

    【艾为视角】保证大方向正确!利用人工智能解决一线实际问题

    保证大方向正确,加快迭代,小步快跑。聚焦内部效率提升,利用人工智能改变作业模式、简化管理,结合业务场景解决一线实际问题。——任总在GTS人工智能实践进展汇报会上的讲话1聚焦内部效率提升,利用人工智能
    的头像 发表于 09-26 19:03 500次阅读
    【艾为视角】保证大方向正确!利<b class='flag-5'>用人工智能</b>解决一线实际问题

    云天励飞亮相2025深圳通用人工智能大会

    近日,以“模驱具身・智启未来”为主题的2025 AGIC深圳(国际)通用人工智能大会暨深圳(国际)通用人工智能产业博览会(以下简称大会)在深圳国际会展中心(宝安)开幕。
    的头像 发表于 09-01 14:09 703次阅读

    勇艺达亮相2025深圳通用人工智能大会

    2025 年 8 月 27 日,以 “模驱具身・智启未来” 为主题的深圳(国际)通用人工智能大会(AGIC)在深圳国际会展中心盛大开幕。国内领先的机器人企业勇艺达精彩亮相,现场展示了其明星产品小勇 T1 型服务机器人及全场景机器人落地方案,引发行业广泛关注。
    的头像 发表于 08-28 17:24 854次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软硬件平台
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软硬件平台
    发表于 08-07 14:23

    南方电网公司在2025世界人工智能大会展出多项人工智能成果

    上海2025年7月30日 /美通社/ -- 7月26至28日,"智能时代 同球共济"2025世界人工智能大会在上海举行。作为本次大会的战略合作伙伴,南方电网公司围绕"大瓦特,让每一度电都有AI"主题
    的头像 发表于 07-30 21:42 329次阅读
    南方电网公司在2025世界<b class='flag-5'>人工智能</b>大会展出多项<b class='flag-5'>人工智能成果</b>

    火极一时的AI蛋白质解析,怎么样了?

    AI蛋白质解析领域正在经历一场静水流深的变革
    的头像 发表于 07-27 17:18 2164次阅读
    火极一时的AI<b class='flag-5'>蛋白质</b>解析,怎么样了?

    中汽中心出席车用人工智能标准化促进中心成立会议

    近日,我国汽车领域首个以车用人工智能标准化为研究目标的技术组织——车用人工智能标准化促进中心成立会议在天津召开,中汽中心副总经理龚进峰出席会议并致辞。来自整车企业、零部件企业、高校、科研机构等70多家单位的180余位代表参会。
    的头像 发表于 07-21 16:48 719次阅读

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模
    发表于 07-04 11:10

    智慧路灯如何应用人工智能技术

    叁仟智慧路灯通过整合人工智能(AI)技术,显著提升了城市的智能化程度,为城市管理工作带来了诸多便利。以下将详细阐述叁仟智慧路灯在应用人工智能技术方面的几个关键领域: 一、智能照明控制
    的头像 发表于 03-07 09:18 795次阅读
    智慧路灯如何应<b class='flag-5'>用人工智能</b>技术

    华为依托昇腾AI打造蛋白结构预测工具

    蛋白质结构预测一直是“21世纪的生物物理学”最重要的课题之一,北京昌平实验室联合伙伴基于全场景AI框架“昇思MINDSPORE”开发的蛋白质结构预测模型在CAMEO竞赛拿下第一并霸榜四周,填补了中国AI基础软硬件在蛋白质结构预测
    的头像 发表于 03-03 13:52 850次阅读

    字节豆包大模型团队成立AGI长期研究团队Seed Edge

     据1月24日的报道,字节跳动旗下的豆包大模型团队已悄然组建了一个专注于通用人工智能(AGI)的长期研究团队,内部代号为“Seed Edge”。该团队旨在鼓励成员们大胆探索那些具有不确
    的头像 发表于 01-24 15:03 2019次阅读

    芯盾时代荣登“人工智能应用标杆TOP100”榜单

    近日,备受瞩目的第二届人工智能产业应用大会圆满落幕。会上,新智引擎与中关村人工智能研究院携手发布了备受关注的“人工智能应用标杆TOP100”榜单。这一榜单旨在表彰在
    的头像 发表于 01-15 16:50 802次阅读

    差示扫描量热仪在食品行业的应用

    ,还有材料科学、化工、医药生物和能源等领域。差示扫描量热仪在食品行业的具体应用1、蛋白质分析。不同的蛋白质具有不同的功能性质,这些性质与蛋白质的结构密切相关。蛋白质
    的头像 发表于 01-02 10:17 638次阅读
    差示扫描量热仪在食品行业的应用