0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何利用 AI 获得科学发现

Tensorflowers 来源:工程师李察 2019-04-29 16:30 次阅读

今天,我们很高兴与大家分享 DeepMind 在论证人工智能研究如何推动并加速科学新发现方面的首个重要里程碑。由于我们的研究涉及大量学科领域,DeepMind 汇集了结构生物学、物理学和机器学习领域的多方专家,以应用前沿技术单独根据蛋白质的基因序列预测其 3D 结构。

在过去两年中,我们一直在研究 AlphaFold 系统,该系统基于之前使用海量基因组数据预测蛋白质结构的多年研究构建。AlphaFold 生成的蛋白质 3D 模型远比过去的任何模型都要精确,也因此在某个生物学核心挑战方面取得了重大进展。

什么是蛋白质折叠问题?

蛋白质是维持生命所必需的复杂大分子。人体的每项功能几乎都可以追溯至一种或多种蛋白质,以及这些蛋白质的移动和变化过程,例如收缩肌肉、感知光线或将食物转化为能量。这些蛋白质的配方(即基因)则以编码形式留在我们的 DNA 中。

任何一种蛋白质的功能,都取决于其独一无二的 3D 结构。例如,构成人体免疫系统的抗体蛋白呈 “Y 字形”,类似于形状独特的钩子。通过黏附在病毒和细菌上,抗体蛋白能够检测并标记致病微生物,从而将其消灭。与之类似,胶原蛋白的形状像绳子,可在软骨、韧带、骨骼和皮肤之间传递张力。Cas9 等其他类型的蛋白质以 CRISPR 序列为导向,像剪刀一样剪切并粘贴 DNA 片段;抗冻蛋白的 3D 结构使其能够与冰晶结合,并防止有机体冻结;核糖体的行动如同程序化的装配线一般,帮助蛋白质实现自身构建。

然而,仅依靠蛋白质的基因序列来找出其 3D 形状是一项非常复杂的任务。几十年来,这项难题一直困扰着科学家。这项任务的难点在于,DNA 仅包含关于氨基酸残基(可形成长链)这一蛋白质组成块的信息。所谓的 “蛋白质折叠问题” 便是预测这些链如何折叠成错综复杂的 3D 蛋白质结构。

蛋白质越大,需要考虑的氨基酸相互作用就越多,进行建模的复杂性和难度也就越高。正如利文索尔佯谬中所述,在我们获得正确的 3D 结构之前,我们枚举所有可能的典型蛋白质构型所需的时间可能比宇宙的年龄还要久远。

为什么蛋白质折叠很重要?

预测蛋白质形状的能力对科学家而言非常实用,因为这种能力对理解蛋白质在人体内的作用,以及诊断和治疗业界认为是由错误折叠的蛋白质所引起的疾病(例如阿尔茨海默症、帕金森症、亨廷顿舞蹈症和囊肿性纤维化)至关重要。

尤其令我们兴奋的是了解到蛋白质折叠可能会如何增强我们对人体及其工作原理的理解,进而帮助科学家更高效地设计出能够有效治愈疾病的新疗法。随着我们通过模拟和模型深入了解蛋白质形状及其工作原理,它不仅在药物发现领域展现出新潜力,同时还降低了实验的相关成本。最终,这会改善全世界数百万患者的生活质量。

此外,对蛋白质折叠的理解还将助力蛋白质设计,这将为我们不可胜数的益处。例如,生物可降解酶(可通过蛋白质设计实现)领域的进展有助于管理塑料和石油等污染物,进而帮助我们以更环保的方式分解废物。事实上,研究人员已经开始对细菌进行工程改造,令其分泌出使废物可经过生物降解并更易处理的蛋白质。

为了促进研究和衡量用于提高预测准确度的最新方法取得的进步,业界于 1994 年成立了名为蛋白质结构预测技术关键评估 (CASP) 的社区范围实验,该全球竞赛每两年举行一次,现已成为评估此类技术的黄金标准。

AI 如何大显身手?

在过去 50 年间,科学家已经能够在实验室中使用低温电子显微技术、核磁共振或 X 射线晶体学等实验性技术确定蛋白质的形状。但每种方法都要经过大量尝试与失败,每个结构都需耗时数年,且成本高达数万美元。这正是为什么生物学家将目光转向 AI 方法,希望用其取代这种漫长而艰苦的复杂蛋白质处理过程。

幸运的是,得益于基因测序成本的迅速降低,基因组学领域的数据相当丰富。因此在过去几年里,越来越多的研究人员利用深度学习方法来处理依赖于基因组数据的预测问题。在 DeepMind 对此类问题的研究中,AlphaFold 应运而生。今年,我们已向 CASP 提交了该作品。令我们引以为傲的是,CASP 的组织方评价 AlphaFold 是 “在预测蛋白质结构的计算方法能力方面取得的空前进展”,并在入围的众多参赛团队中,将第一名的桂冠颁发给我们(我们的参赛名称是 A7D)。

我们的团队特别关注从零开始对目标形状进行建模这一难题,而且并未使用此前已经解决的蛋白质结构作为模板。我们在预测蛋白质结构的物理属性时实现了高准确度,然后使用两种截然不同的方法来构建对蛋白质完整结构的预测。

利用神经网络预测物理属性

上述两种方法均依赖深度神经网络,这些经过训练的神经网络可以从其基因序列中预测蛋白质属性。该网络预测的属性包括:(a) 氨基酸对的间距和 (b) 连接这些氨基酸的化学键之间的角度。此方法的首要进步是改进了常用技术,这些技术可以估算氨基酸对是否彼此接近。

我们训练了一个神经网络,以预测蛋白质中每个残基对之间的单独距离分布。然后,我们将这些概率合并为分数,以估计所提出的蛋白质结构的精确程度。我们还训练了一个单独的神经网络,其综合使用所有距离来估算所提出的结构与正确答案的接近程度。

构建蛋白质结构预测的新方法

使用这些评分功能,我们能够搜索蛋白质结构,以找到符合预测的结构。第一种方法基于结构生物学的常用技术构建,并使用新的蛋白质片段反复替换蛋白质片段。我们训练了一个生成式神经网络来创建新片段,并针对所提出的蛋白质结构,利用这些片段不断提高其分数。

第二种方法通过梯度下降(机器学习领域常用的一种数学技术,能够不断产生微小的改进)来优化分数,进而生成高度精确的结构。此技术应用于整条蛋白质链,而非在组装前须分开折叠的片段,因而可简化预测过程。

未来如何发展?

我们首次涉足蛋白质折叠领域便取得成功,展示了机器学习系统如何整合各类信息来源,帮助科学家快速提出解决复杂问题的创造性解决方案。正如我们所见,AI 可通过 AlphaGo 和 AlphaZero 等系统帮助人们掌握复杂的游戏。同样地,我们希望某一天 AI 技术的突破也能帮助我们处理基本的科学问题。

我们很高兴看到蛋白质折叠领域的早期发展迹象,这证明了 AI 在科学发现中的作用。尽管该技术在对治疗疾病、管理环境等方面产生可量化影响之前仍需深入研究,但我们明白,AI 的潜力不可限量。在拥有重点研究机器学习如何推动科学世界进步的专门团队后,我们期待自己的技术能够在众多领域大展身手。

在我们发表关于此项研究的论文之前,请将其引用为:《通过基于评分的深度学习进行从头结构预测》(De novo structure prediction with deep-learning based scoring)R.Evans、J.Jumper、J.Kirkpatrick、L.Sifre、T.F.G.Green、C.Qin、A.Zidek、A.Nelson、A.Bridgland、H.Penedones、S.Petersen、K.Simonyan、S.Crossan、D.T.Jones、D.Silver、K.Kavukcuoglu、D.Hassabis、A.W.Senior发表于 2018 年 12 月 1 日至 4 日举行的第 13 届蛋白质结构预测技术关键评估(摘要)。如需查看摘要,请点击 此处(https://deepmind.com/documents/262/A7D_AlphaFold.pdf)。

此项研究是与以下人员协作完成:Richard Evans、John Jumper、James Kirkpatrick、Laurent Sifre、Tim Green、Chongli Qin、Augustin Zidek、Sandy Nelson、Alex Bridgland、Hugo Penedones、Stig Petersen、Karen Simonyan、Steve Crossan、David Jones、David Silver、Koray Kavukcuoglu、Demis Hassabis 和 Andrew Senior

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26364

    浏览量

    263957
  • 模型
    +关注

    关注

    1

    文章

    2701

    浏览量

    47658
  • 光线
    +关注

    关注

    0

    文章

    57

    浏览量

    10456

原文标题:AlphaFold:利用 AI 获得科学发现

文章出处:【微信号:tensorflowers,微信公众号:Tensorflowers】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    发现Minitab 22的强大之处!#人工智能 #Ai #Minitab

    AIMinitab
    MinitabUG
    发布于 :2024年04月17日 11:50:39

    微软支付6.5亿美元获得Inflection AIAI模型授权

    微软近日宣布向人工智能初创公司Inflection AI支付高达6.5亿美元的巨额资金,这一举动在业内引起了广泛关注。据悉,这笔资金主要用于获得Inflection AIAI模型授权
    的头像 发表于 03-25 10:39 236次阅读

    安进将开发生成式AI模型,以获取新的人类数据洞察并推动药物发现

    生成式 AI 正在改变药物研发,以前所未有的速度实现新药物发现。作为全球领先的生物技术公司之一,安进(Amgen)正在利用这项技术推进科研工作。
    的头像 发表于 03-20 11:30 243次阅读

    2024 CSRankings全球计算机科学排名发布!AI领域中国高校霸榜

    CSRankings 2024结果出炉!全世界计算机科学机构的排名进行了大更新。在AI板块,清华、北大、上交分列TOP 3,CMU和浙大并列第4。AI TOP 10中的中国高校
    的头像 发表于 01-08 09:28 592次阅读
    2024 CSRankings全球计算机<b class='flag-5'>科学</b>排名发布!<b class='flag-5'>AI</b>领域中国高校霸榜

    如何利用AI技术推进班组建设?

    建设带来了新的可能。 AI技术可以在班组的任务分配方面发挥重要作用。通过对员工能力和工作流程进行精确分析,AI可以合理、科学地进行任务的分配,提高工作效率和质量。 AI技术能够在班组的
    的头像 发表于 12-15 10:27 210次阅读

    AWS和英伟达携手推进AI,谷歌DeepMind重塑材料科学

    DeepMind在材料科学领域的最新发现,即220万种晶体结构的识别,将如何彻底改变我们对新材料发现和应用的理解。这些突破性成就不仅代表了科技的巨大进步,也为未来的产业发展铺平了道路。 AWS与英伟达加强合作,推动
    的头像 发表于 11-30 21:50 320次阅读
    AWS和英伟达携手推进<b class='flag-5'>AI</b>,谷歌DeepMind重塑材料<b class='flag-5'>科学</b>

    硅谷:设计师利用生成式 AI 辅助芯片设计

    芯片工程师展示了一个高度专业化的行业如何使用 NVIDIA NeMo 来定制大语言模型,以获得竞争优势。 10 月 31 日,NVIDIA 发布的一篇研究论文描述了生成式 AI 如何助力芯片
    的头像 发表于 11-01 20:25 254次阅读
    硅谷:设计师<b class='flag-5'>利用</b>生成式 <b class='flag-5'>AI</b> 辅助芯片设计

    硅谷:设计师利用生成式 AI 辅助芯片设计

    芯片工程师展示了一个高度专业化的行业如何使用 NVIDIA NeMo 来定制大语言模型,以获得竞争优势。     10 月 31 日,NVIDIA       发布的一篇研究论文描述了生成式 AI
    发表于 11-01 14:45 162次阅读
    硅谷:设计师<b class='flag-5'>利用</b>生成式 <b class='flag-5'>AI</b> 辅助芯片设计

    AI智能呼叫中心

    对这些数据的深入分析,呼叫中心可以有效改进服务质量、优化流程并提升业绩,此外,AI智能呼叫中心还可以基于数据分析的结果,进行智能预测并制定更加科学的策略,为企业的未来决策提供有力支持。四、节约成本传统
    发表于 09-20 17:53

    70%家长想给孩子普及AI,腾讯科学小会发布内测版“AI编程第一课”

    8月20日,由清华大学、中国宋庆龄基金会、腾讯公司共同举办的腾讯青少年科学小会在清华大学新清华学堂举行。本届小会是2023全国科普日科普专项行动、宋庆龄少年儿童未来科学日系列活动,主题为“用AI改编
    的头像 发表于 08-22 15:22 392次阅读
    70%家长想给孩子普及<b class='flag-5'>AI</b>,腾讯<b class='flag-5'>科学</b>小会发布内测版“<b class='flag-5'>AI</b>编程第一课”

    AI for Science:利用数据和算法发现自然科学的新规律

    AI for Science是指利用人工智能技术来辅助科学研究,发现自然科学的新规律,解决复杂的科学
    的头像 发表于 08-01 11:40 1206次阅读

    Cadence基于AI的Cadence Virtuoso Studio设计工具获得认证

    ,2023 年 6 月 30 日——楷登电子(美国  Cadence  公司,NASDAQ:CDNS)近日宣布,基于 AI 的 Cadence Virtuoso Studio 设计工具和解决方案已获得 Samsung Foundry 认证。 双方的共同客户可以放心
    的头像 发表于 06-30 10:08 742次阅读

    发现了更快的排序算法,速度快 70%

    这一次,Google DeepMind 的全新强化学习系统 AlphaDev 发现了一种比以往更快的哈希算法,这是计算机科学领域中的一种基本算法,AI 的成果现已被纳入 LLVM 标准 C++ 库 Abseil 并开源。
    的头像 发表于 06-12 14:46 350次阅读
    它<b class='flag-5'>发现</b>了更快的排序算法,速度快 70%

    如何发现AI+Science中的下一个AlphaFold和ChatGPT?

    帮助科学家探索科学框架的设计。我们可以让AI去更大的设计空间搜索设计策略和控制优化策略。比如近期发表在Nature 上的工作,使用深度强化学习控制核聚变反应中的等离子体,第一次发现了全
    的头像 发表于 04-21 09:56 427次阅读