0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

洪亮团队在生信期刊JCIM发布最新成果,蛋白质工程迈入通用人工智能时代

科技数码 来源:科技数码 作者:科技数码 2024-04-19 17:42 次阅读

近日,天鹜科技创始人&首席科学家洪亮教授团队,在生物信息学和人工智能研究领域的国际权威学术期刊JCIM(Journal of Chemical Information and Modeling)上发表最新研究成果:“基于微环境感知图神经网络构建指导蛋白质定向进化的通用人工智能”(Protein Engineering with Lightweight Graph Denoising Neural Networks)。在此项研究中,该团队设计了一种微环境感知图神经网络ProtLGN。ProtLGN能够从蛋白质三维结构中学习有益的氨基酸突变位点,建立自然选择下的氨基酸序列分布,用于指导蛋白质氨基酸位点设计,最终实现蛋白质指定功能的提升。

根据研究介绍,在生物化学实验的基础上,课题组证实了ProtLGN是一项通用的人工智能方法,在极少甚至没有实验数据的情况下,成功地实现了针对特定蛋白质性质的定向进化,包括提高抗体的亲和力和稳定性、增强多种荧光蛋白的荧光强度,以及提升核酸内切酶的DNA切割活性。这是全球首次也是唯一一次经湿实验验证,我们可以通过建立通用人工智能,在极少实验数据甚至无实验数据下实现不同蛋白特定性质的定向进化。

人工智能的进步正在改变生命科学领域的研究方法和思维范式,尤其是在生物医药领域,而蛋白质设计作为该领域的关键技术之一,正受到人工智能技术的深刻影响。传统的蛋白质设计方法存在效率低下、成本高昂、时间耗费长等难以解决的问题,基于深度学习的预测和筛选在蛋白质设计中被逐步应用并验证。

但现有方法大多是基于多序列比对(MSA)或蛋白质语言模型(PLM)对蛋白质序列进行特征提取。前者高度依赖于同源序列的数量,但在实际应用中,并非所有蛋白质序列都能进行深度的同源比对;后者需要大量训练数据和复杂的模型设计,导致训练成本很高。即使是使用当前主流的自然语言预训练模型的思路,考虑到每个蛋白质都有独特的性质和进化方向,使用通用预训练模型处理独特蛋白质时,不经重新训练直接应用也会带来泛化性和表达能力的挑战。

洪亮团队设计的能够提取氨基酸周围微观环境信息的等变图神经网络的预训练框架ProtLGN,结合蛋白质的结构信息对蛋白质上的每个氨基酸进行同步编码,学习蛋白质三维结构中有益的氨基酸突变位点和突变类型,用于指导具有不同功能的蛋白质单位点突变和多位点突变设计。

wKgaomYiPHmAOgknAAhCEfZomC4516.png

图1 ProtLGN框架示意图

LGN的零样本学习训练框架如上图所示。首先,输入蛋白质数据集中的每个序列被k临近邻居算法转换成一个蛋白质图,并基于氨基酸性质提取出节点特征、边特征、以及氨基酸的三维坐标信息。接着,对一部分的节点特征进行噪声扰动后输入到等变图神经网络中学习图上的节点表示。这一节点表示被全连接层解码后可以预测多个不同的目标,比如去噪的节点氨基酸类型标签SASA和B-factor数值等。这里的预测误差用于构建损失函数并传导回网络层进行反向传导。在预测阶段,模型输出突变蛋白质的氨基酸概率,与野生型比对后,通过处理和计算得出突变体的评分。

为了验证ProtLGN对蛋白质突变体活性的预测效果,作者在不同蛋白质的多种生理功能性质上进行了充分验证,确保ProtLGN预测效果的通用性,包括VHH抗体、荧光蛋白(绿色、蓝色、橙色)、核酸内切酶(KmAgo)等多种蛋白的热稳定性、结合能力、荧光强度、单链DNA剪切活性等蛋白质工程常规关注和改造的多种关键功能指标。

wKgaomYiPHmAYrHLAALDwicoGMM096.png

图2 荧光蛋白发光强度(FP),VHH抗体结合强度与热稳定性,以及中温核酸剪切酶(KmAgo)剪切活性的多点位突变结果

湿实验结果表明,ProtLGN可以在没有湿实验数据或仅少量类似功能蛋白质的实验数据基础上达到40%的单点位改造成功率,并且在部分单位点上实现了多种功能协同提升。

上述结果表明ProtLGN能够极大改善传统蛋白质工程方法中成本高、成功率低、数据稀缺等问题。更为重要的是,本文首次使用深度学习模型在学习单位点突变体活性数据后,准确预测组合位点的活性,并且在单轮湿实验中即可筛选出功能显著优于低位点突变体的高位点突变体,表明ProtLGN能够有效挖掘蛋白质定向进化中的正上位效应,为蛋白质的深度进化提供一条有效途径。

ProtLGN作为一种新型的蛋白质设计方法,为生物学家和药物研发人员提供了一个强大且可靠的计算工具。ProtLGN不仅能够深入解析蛋白质的结构与功能的复杂关系,而且能够突破传统蛋白质设计方法遇到的瓶颈,为基于蛋白质的医药研究、生物技术开发等提供了全新并且有效的解决方案。

自然科学研究院/上海国家应用数学中心(上海交通大学分中心)助理研究员周冰心博士,密歇根大学神经科学研究所/细胞与发育生物学研究所博士后郑力荣博士,生命科学技术学院博士研究生吴邦昊,上海人工智能实验室/华东理工大学信息科学与工程学院硕士研究生谭扬为共同第一作者。自然科学研究院/物理与天文学院/张江高等研究院洪亮教授为通讯作者。

该工作得到了国家自然科学基金委、上海市科委、教委、上海人工智能国家实验室和张江高等研究院的支持。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1777

    文章

    43920

    浏览量

    230835
  • PLM
    PLM
    +关注

    关注

    2

    文章

    85

    浏览量

    20726
收藏 人收藏

    评论

    相关推荐

    百川智能与北京大学将共建通用人工智能联合实验室

    近日,百川智能与北京大学携手合作,共同签署了“北大——百川通用人工智能联合实验室”的共建协议,标志着双方在人工智能领域迈出了坚实的合作步伐。
    的头像 发表于 03-21 11:45 407次阅读

    谷歌DeepMind推出SIMI通用AI智能

    近日,谷歌的DeepMind团队发布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),这是一个通用人工智能
    的头像 发表于 03-18 11:39 377次阅读

    天府锦城实验室在生物传感与蛋白质测序领域取得重要进展

    3月10日,记者从天府锦城实验室(未来医学城)获悉,四川大学华西医院临床检验医学研究中心与生物治疗全国重点实验室、天府锦城实验室(未来医学城)耿佳教授和华西第二医院陈路教授联合团队在生物传感与蛋白质测序领域取得重要进展。
    的头像 发表于 03-17 09:10 526次阅读
    天府锦城实验室<b class='flag-5'>在生</b>物传感与<b class='flag-5'>蛋白质</b>测序领域取得重要进展

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能
    发表于 02-26 10:17

    对新辅助TCHP治疗响应的HER2+乳腺癌空间蛋白质组特征

    GeoMx IPA可以实现对组织中任何区域(如肿瘤区域、免疫交界区域、肿瘤微环境和正常基质区域等)中的570多种蛋白质进行空间原位的表达检测,快速发现新的蛋白质生物标记物和药物靶点。
    的头像 发表于 12-26 16:52 428次阅读
    对新辅助TCHP治疗响应的HER2+乳腺癌空间<b class='flag-5'>蛋白质</b>组特征

    燧原科技发布“燎原”生态合作计划,共建通用人工智能产业化联盟

    12月20日,在全国一体化算力网络国家枢纽节点(甘肃)庆阳数据中心集群绿色普惠算力行动推进大会上, 燧原科技正式发布了“燎原”生态合作计划,携手产业上下游合作伙伴共建通用人工智能产业化联盟
    的头像 发表于 12-21 19:55 876次阅读
    燧原科技<b class='flag-5'>发布</b>“燎原”生态合作计划,共建<b class='flag-5'>通用人工智能</b>产业化联盟

    人工智能驱动蛋白质设计取得重大突破,人类健康和环境监测有望受益

     据华盛顿大学化学与生物工程系的David Baker教授透露,其领导的研究小组整合了深度学习算法和序列设计工具ProteinMPNN,从而实现了高效的蛋白质功能性设计。
    的头像 发表于 12-20 14:32 341次阅读

    DeepMind最新推出新一代蛋白质结构预测工具,已用于药物设计

    据悉,最新的 AlphaFold 系统由DeepMind及其衍生公司 Isomorphic Labs (专注于利用 AI 做药物发现)共同开发,不再局限于蛋白质折叠,还能够在配体、蛋白质、核酸以及
    的头像 发表于 11-03 15:39 458次阅读

    数智领航:绘制蛋白质行业新型“未来工厂”蓝图

    近年来,随着消费者愈发聚焦食品安全、个性口味、高品质肉类等需求,蛋白质行业拥抱着更大的市场机遇的同时,也面临了更多 产品追溯、柔性生产 等挑战。 在某全球蛋白质行业领军企业国内的新建工厂中,作为十年
    的头像 发表于 10-07 08:25 206次阅读

    ai人工智能机器人

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交
    发表于 09-21 11:09

    通用人工智能:初心与未来》-试读报告

    作者给出的结论。整体读下来,可以给我们关于通用人工智能全面的了解。作者也反复强调了通用人工智能与专用智能的区别。尤其是人们错误的认为一堆专用智能堆砌起来就是
    发表于 09-18 10:02

    2023通用人工智能算力论坛在京举办

    石景山智能算力中心启动建设 8月28日, 2023中国国际服务贸易交易会常态化活动的通用人工智能算力论坛在北京石景山成功举办。论坛以“智见·共创算力新时代”为主题,政府部门、院士专家学者及人工
    的头像 发表于 08-29 17:36 375次阅读
    2023<b class='flag-5'>通用人工智能</b>算力论坛在京举办

    聆心智能上榜“北京市通用人工智能大模型行业应用典型场景案例”

    交流平台,构建通用人工智能产业创新发展高地。 本次论坛发布了 21 项“大模型赋能行业应用场景案例”,其中聆心智能与洪恩基于大模型联合打造的儿童启蒙成长问答机器人成功上榜。作为国内深研大模型领域的
    的头像 发表于 07-05 09:54 432次阅读
    聆心<b class='flag-5'>智能</b>上榜“北京市<b class='flag-5'>通用人工智能</b>大模型行业应用典型场景案例”

    【书籍评测活动NO.16】 通用人工智能:初心与未来

    新的担忧,有些人认为人工智能将很快取代人类,人类的发展在不远的将来会面临极大挑战(机器人世界末日将会到来)。 《通用人工智能:初心与未来》 主要内容本书尝试给人们一个新的视角,即尽管人工智能
    发表于 06-21 14:41

    第一个用于电路的基于蛋白质的纳米计算代理

    在该实验中,研究组将工学蛋白质注入到活细胞中,使细胞暴露在刺激下。以前需要两个输入才能产生一个输出,但是新的设计现在可以有两个输出,输出取决于接收输入的顺序。如果先检测出雷帕霉素,再检测出光,细胞就会采取一个方向角度。
    的头像 发表于 05-31 09:27 546次阅读