0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind最新推出新一代蛋白质结构预测工具,已用于药物设计

医健AI掘金志 来源:医健AI掘金志 2023-11-03 15:39 次阅读

最新的AlphaFold模型不再局限于蛋白质折叠,还能够在配体、蛋白质、核酸以及翻译后修饰等方面生成高度精确的结构预测。DeepMind 其衍生公司 已将该系统用于药物设计。

大约五年前,谷歌最多产的以AI中心的研究实验室之一,DeepMind,推出了 AlphaFold。这是一种可以准确预测人体内许多蛋白质结构的人工智能系统。

从那时起,DeepMind 对系统进行了改进,于 2020 年发布了更新且功能更强大的 AlphaFold 版本--AlphaFold 2。

实验室的工作仍在继续。

10月31日,DeepMind表示,最新版本 AlphaFold 已经出炉,不少人将其取名为“ AlphaFold 3”。

据悉,最新的 AlphaFold 系统由DeepMind及其衍生公司 Isomorphic Labs (专注于利用 AI 做药物发现)共同开发,不再局限于蛋白质折叠,还能够在配体、蛋白质、核酸以及翻译后修饰等方面生成高度精确的结构预测。且 Isomorphic Labs 公司已经将该系统用于药物发现工作。

不过最新版本的“ AlphaFold 3 ”还处于预览阶段,后续开发工作还在进行。

AlphaFold新版本有哪些升级?

第一大升级:预测蛋白质数据库(PDB)中大多数分子类型的结构,达原子精度。

根据DeepMind的说法,AlphaFold可以预测蛋白质数据库(一个广泛使用的科学数据库)中几乎所有分子的结构。DeepMind声称,该模型通常以“原子精度”生成这些预测。

AlphaFold 新版本不仅可以估计蛋白质的形状,还可以估计其他生物分子的形状。包括:小分子(配体)、蛋白质、核酸(DNA和RNA)、具有翻译后修饰(PTM)的分子。

第二大升级:预测相关配体的结构。

所谓配体,是指其他不同分子与蛋白质结合,并导致蛋白质功能方式发生变化。配体在细胞信号传导中起着重要作用,细胞信号传导是细胞相互影响行为的关键生物过程。

一种情况是,当配体附着或结合到蛋白质上时,组合结构称为“蛋白质-配体复合物”。研究人员历来使用一种称为“对接”的方法评估这种复合物的形状。但这一方法的局限性是,只有当有大量关于蛋白质-配体复合物的蛋白质成分的数据可用时,才能使用这种方法。

根据 DeepMind 的说法,新版本的 AlphaFold 新版本可以比“对接”方法更准确地预测蛋白质-配体复合物的形状。与这些方法相比,AlphaFold 新版本需要的数据要少得多。

DeepMind最新模型为蛋白质-配体结构预测设定了新的标准,在预测蛋白质-配体相互作用方面,新AlphaFold的性能比传统方法高出约20%,并且还可以预测尚未进行结构表征的全新蛋白质。

因此,AlphaFold 新版本可能会使科学家更容易研究新发现的蛋白质-配体复合物,而这些复合物的信息很少,而且可以帮助科学家识别和设计潜在的药物新分子。

Isomorphic Labs 最新公布了3个案例实验:抗癌分子的结合(PORCN)、关键癌症靶标的共价配体结合(KRAS),脂质激酶变构抑制剂(PI5P4Kγ)的结构预测。结果显示,该模型预测的结构与案例实验中测定的结构非常接近。

这一举动引起相关学者和药企的关注。有人在国内外社交平台表示:“设计新的分子比开发工具更重要,开发类似工具的人可能要改行,毕竟设计新的高价值的分子才可能是更好的生财之道。”

不过,也有人希望新版本能力再做进一步提升:很多时候,最新的 Alphafold 的相对准确率(RMSD误差<2A)也只有50-60%,这对于药物设计来说往往会有很多问题。

更进一步说,蛋白质和小分子复合物的结构预测,应该是结合了AI和CADD两种方法,即分别基于数据库和物理原理,

第三大升级:预测核酸、以及翻译后修饰结构。

核酸是关键遗传信息的携带者,并破译翻译后修饰--即蛋白质诞生后发生的化学变化。

例如,在 CasLambda 与 crRNA 以及 DNA 结合的结构中,CasLambda 共享 CRISPR-Cas9 系统的基因编辑能力,通常被称为“基因剪刀”,研究人员可以利用它来改变动植物和微生物的DNA,而 CasLambda 的较小尺寸可能使其在基因编辑中更加有效。

据一位从事药物设计的公司创始人评价:做核酸药物的人有福了,至少有个结果。不过结果是否准确,还需找个有经验的CADD(计算机辅助药物设计)研究员来评估。

此外,也有人指出,“我更关心 Alphafold 3 是否可以用于预测病毒的蛋白质结构。AFDB(数据库)中有很多预测结构,几乎涵盖了所有物种,但没有病毒。而且新版本对RNA结构预测还不太好。”

总体而言,至于 AlphaFold 3 具体性能表现,DeepMind 和 Isomorphic Labs 研究人员透露:

•考虑到比较系统使用已知的蛋白质结构作为基础,AlphaFold 3 在配体对接的准确性方面,优于开源分子建模模拟软件 AutoDock Vina 等传统系统;

•与AlphaFold 2.3相比,AlphaFold 3 在预测蛋白质-蛋白质结构方面,抗体结合结构显著增强;

•此在蛋白质-核酸相互作用方面,AlphaFold 3 优于其他竞争方法,如RoseTTA2FoldNA等;

•在 RNA 结构预测方面,AlphaFold 3 优于自动化技术,但略低于顶级CASP 15 参赛者,后者涉及专家手动干预。

但饶有意味的是,针对最新版本,DeepMind的博客文章并没有介绍方法,也没有对比薛定谔的方法。这可能是竞争关系的原因。

无论如何,从表面上看,AlphaFold 3 的功能有了大幅度的提升,如果真如DeepMind所说,那么新版模型扩展的功能和性能提升可以加速生物医学突破,为疾病通路、基因组学、生物可再生材料、植物免疫、潜在治疗靶点、药物设计机制提供各种全新的可能性。

“AlphaFold3 ”能否继续开源?

尽管 AlphaFold 最新版本推出不到两天,但已经有不少人已经开始期盼望继续开源,“因为学术界对蛋白质的研究已经空前高涨。”

一个典型例子是:

尽管 OpenAI 的 ChatGPT 在 2022 年底亮相时就席卷全球,但 2022 年被引用次数最多的论文并非关于生成人工智能(AIGC),甚至不是来自大型科技公司,而是欧洲分子生物学实验室(EMBL-EBI)和 DeepMind 出版的“AlphaFold 蛋白质结构数据库”,被引次数为 1331 次。

更有趣的是,引用量第二同样属于“蛋白质折叠模型”--ColabFold。该系统由马克斯·普朗克多学科科学研究所(MPG)打造,引用次数为 1138 次。

从一定程度上说,尽管企业界将2022年描述为“生成人工智能年”,但学术界则认为:2022年绝对是“蛋白质折叠预测年”。

“目前 Alphafold 拥有3项以上的专利,这不该是理所当然的,也不该是常态。不过AF历代版本确实是目前生物领域最先进的工具,没有之一。”

更有人指出,“闭源不是最好的解决方案,为什么大多数国家都倾向于使用AlphaFold ?我有点怀疑大多数国家是否有人才和预算,来制造像AlphaFold 和蛋白质数据库这样的东西。”

据悉,DeepMind在 AlphaFold 3发布当天披露,已累计超过140万用户(来自190多个国家)访问了AlphaFold蛋白质结构数据库。

不过未来“AlphaFold 3”能否真正推动药物开发,还有待时间去验证。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264054
  • 数据库
    +关注

    关注

    7

    文章

    3591

    浏览量

    63370
  • DeepMind
    +关注

    关注

    0

    文章

    126

    浏览量

    10709

原文标题:「AlphaFold 3」要来了?DeepMind最新推出新一代蛋白质结构预测工具,已用于药物设计

文章出处:【微信号:IoT_talk,微信公众号:医健AI掘金志】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    洪亮团队在生信期刊JCIM发布最新成果,蛋白质工程迈入通用人工智能时代

    Networks)。在此项研究中,该团队设计了一种微环境感知图神经网络ProtLGN。ProtLGN能够从蛋白质三维结构中学习有益的氨基酸突变位点,建立自然选择下的氨基酸序列分
    的头像 发表于 04-19 17:42 108次阅读
    洪亮团队在生信期刊JCIM发布最新成果,<b class='flag-5'>蛋白质</b>工程迈入通用人工智能时代

    天府锦城实验室在生物传感与蛋白质测序领域取得重要进展

    3月10日,记者从天府锦城实验室(未来医学城)获悉,四川大学华西医院临床检验医学研究中心与生物治疗全国重点实验室、天府锦城实验室(未来医学城)耿佳教授和华西第二医院陈路教授联合团队在生物传感与蛋白质测序领域取得重要进展。
    的头像 发表于 03-17 09:10 522次阅读
    天府锦城实验室在生物传感与<b class='flag-5'>蛋白质</b>测序领域取得重要进展

    对新辅助TCHP治疗响应的HER2+乳腺癌空间蛋白质组特征

    GeoMx IPA可以实现对组织中任何区域(如肿瘤区域、免疫交界区域、肿瘤微环境和正常基质区域等)中的570多种蛋白质进行空间原位的表达检测,快速发现新的蛋白质生物标记物和药物靶点。
    的头像 发表于 12-26 16:52 423次阅读
    对新辅助TCHP治疗响应的HER2+乳腺癌空间<b class='flag-5'>蛋白质</b>组特征

    人工智能驱动蛋白质设计取得重大突破,人类健康和环境监测有望受益

     据华盛顿大学化学与生物工程系的David Baker教授透露,其领导的研究小组整合了深度学习算法和序列设计工具ProteinMPNN,从而实现了高效的蛋白质功能性设计。
    的头像 发表于 12-20 14:32 334次阅读

    双水相电泳分离蛋白质的研究

      本文提出了一种新型的双水相电泳装1并进行了双水相电泳分离肌红蛋白和牛血清白蛋白和细胞色素C及其混合物的实验,研究了电场方向、pH值、电场强度和电泳时间对双水相萃取分离效果的影响,并与不加电场的双水相萃取的结果进行了比较。
    发表于 11-28 14:46 0次下载

    数智领航:绘制蛋白质行业新型“未来工厂”蓝图

    近年来,随着消费者愈发聚焦食品安全、个性口味、高品质肉类等需求,蛋白质行业拥抱着更大的市场机遇的同时,也面临了更多 产品追溯、柔性生产 等挑战。 在某全球蛋白质行业领军企业国内的新建工厂中,作为十年
    的头像 发表于 10-07 08:25 200次阅读

    N杂五元芳烃的非共价成键机制研究

    N杂五元芳烃在生物和药物化学中占有重要地位,它是药物分子的基础结构单元,也是蛋白质、辅酶、生物碱、DNA 等生物分子的核心骨架。
    的头像 发表于 09-20 15:08 403次阅读
    N杂五元芳烃的非共价成键机制研究

    基于精准聚焦目标空间区域的转录组和蛋白质组一站式解决方案

    。这些研究会帮助人类发现新的药物开发和疾病诊疗相关的靶点,新一代的分子病理产品等等。那么深度空间蛋白组+ GeoMx DSP这对CP能带来哪些惊喜?   让我们一起了解下【精准聚焦目标空间区域的转录组和
    的头像 发表于 08-29 11:10 596次阅读
    基于精准聚焦目标空间区域的转录组和<b class='flag-5'>蛋白质</b>组一站式解决方案

    中国科学院:开发新型荧光RNA传感器,能监测代谢物、外源药物蛋白与金属离子等靶标!

    传感新品 【中国科学院:开发新型荧光RNA传感器,能监测代谢物、外源药物蛋白与金属离子等靶标!】 基因编码的荧光传感器可以在单细胞水平追踪代谢物、蛋白质或重金属离子等细胞内靶标的丰度变化和动力学
    的头像 发表于 08-01 08:46 901次阅读
    中国科学院:开发新型荧光RNA传感器,能监测代谢物、外源<b class='flag-5'>药物</b>、<b class='flag-5'>蛋白</b>与金属离子等靶标!

    农业科研:基于遥感与气象数据的冬小麦主产区籽粒蛋白质含量预报

    推信息化工程技术研究中心,与全国农业技术推广服务中心联手展开了研究。 籽粒蛋白质含量是小麦品质评价的关键指标,而品质的高低决定小麦收购价格、加工用途和使用价值等。该团队开展小麦籽粒蛋白质含量的监测预报研究,对于
    的头像 发表于 07-31 16:04 208次阅读

    【AI简报20230707】中国团队推出「全球首颗」AI 全自动设计 CPU!重磅,GPT-4 API 全面开放使用!

    /s/DNBO34Xk2nVwNiEMBjJ-Cg 在这场由 ChatGPT 掀起的 AI 热潮下,越来越多人开始看到如今 AI 的强悍:AI 作图、AI 写论文、AI 编代码、AI 预测完整人类蛋白质结构、AI 发现速度提升
    的头像 发表于 07-07 18:45 874次阅读
    【AI简报20230707】中国团队<b class='flag-5'>推出</b>「全球首颗」AI 全自动设计 CPU!重磅,GPT-4 API 全面开放使用!

    LasergeneProtein工作流程

    蛋白质序列分析对于研究和预测蛋白质功能和结构至关重要,但蛋白质序列分析工具通常缺乏解释所需的可视
    的头像 发表于 07-03 10:30 428次阅读
    LasergeneProtein工作流程

    通过石墨烯生物传感器同时检测蛋白质和RNA生物信号

    了Cardea Bio),通过在单个基于石墨烯的生物传感器上同时检测蛋白质和RNA生物信号,展示了新的多组学(Multiomics)方法。
    的头像 发表于 06-18 09:20 1110次阅读

    第一个用于电路的基于蛋白质的纳米计算代理

    在该实验中,研究组将工学蛋白质注入到活细胞中,使细胞暴露在刺激下。以前需要两个输入才能产生一个输出,但是新的设计现在可以有两个输出,输出取决于接收输入的顺序。如果先检测出雷帕霉素,再检测出光,细胞就会采取一个方向角度。
    的头像 发表于 05-31 09:27 542次阅读

    3D打印类皮肤表皮微流控系统用于汗液捕获和分析

    汗液是一类有吸引力的生物体液,可用于体内化学物质的无创监测。汗液中含有丰富的与生理健康状态相关的生物标志物,包括电解质、代谢物、激素、蛋白质和外源性药物等。
    的头像 发表于 05-10 09:27 601次阅读
    3D打印类皮肤表皮微流控系统<b class='flag-5'>用于</b>汗液捕获和分析