0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习模型可以帮助化学家更快地制造出具有更高功效的分子

nlfO_thejiangme 来源:未知 作者:李倩 2018-07-24 10:25 次阅读

设计新的药物分子需要手工进行,耗时且容易出错。但是麻省理工学院的研究人员已经朝着完全自动化的设计过程向前迈出了一步,这将大大加快设计过程,并获得更好的结果。机器学习模型可以帮助化学家更快地制造出具有更高功效的分子。

药物发现依赖于先导化合物的优化。根据先导化合物与特定的生物目标的相互作用,增减官能团,手动调整分子结构来获得新的分子。每个修饰步骤都要耗费大量时间,并且往往得不到期望中的分子。

麻省理工学院计算机科学与人工智能实验室( CSAIL )和电子工程与计算机科学系( EECS )的研究人员开发了一种模型用于更有效的选择先导分子。该模型输入分子结构数据,创建分子图片,详细展示分子结构,节点代表原子,边线代表化学键。这些图又被分解成更小的有效官能团簇,成为“构件”,用于实现更精确的分子重构和修饰。

“设计这个模型的目的,是想用自动迭代取代低效的人工分子改造过程,并确保设计出有效的分子,”CSAIL博士生,本文的主要作者Wengong Jin说。该模型在7月份举行的2018国际机器学习会议上进行了展示。论文的共同作者还包括CSAIL和EECS的Delta电子系教授Regina Barzilay和电气工程和计算机科学,数据、系统和社会研究所的Tommi S. Jaakkola教授。

这项研究是麻省理工学院与八家制药公司于五月宣布的药物发现与合成机器学习联盟的其中一部分工作。该联盟将先导物的优化确定为药物发现的一个关键挑战。

Barzilay说:“ 目前来说,需要许多熟练的化学家的大量工作才能实现先导物的优化,而这正是我们想要改进的地方。下一步的计划,是让该技术从学术界走向真正的药物设计实践,并证明它可以帮助人类化学家完成该项工作,而这将是一个挑战。"

Jaakkola说:“程序自动化也为机器学习带来了挑战。通过学习关联、修改和生成分子图推动新的技术思想和方法的产生。"

生成分子图

近年来,分子设计自动化的系统层出不穷,但问题是产生的分子是否有效。Jin说,这些系统通常会产生符合化学规则但实质无效的分子,并且生成的分子不具备最佳性质。这实际上使完全自动化设计分子变得行不通。

这些系统运行在分子的线性符号上,称为“简化分子-输入线-进入系统”(simplified molecular-input line-entry systems, SMILES),其中长串的字母、数字和符号代表可由计算机软件解释的单个原子或化学键。当系统修改一个前导分子时,它会一个符号一个符号地扩展它的字符串表示,一个原子一个原子,一个键一个键,直到生成一个最终的具有更高的期望属性的SMILES字符串。最后,系统可能会生成一个最终的SMILES字符串,虽然在SMILES语法下似乎是有效的,但实质上是无效的分子。

研究人员通过建立一个直接在分子图上运行的模型来解决这个问题,和SMILES字符串不同,该方法可以更有效和准确的修改分子结构。

模型的核心是一个定制的可变自动编码器——一个神经网络,它将输入分子“编码”成向量,这个向量是分子结构数据的存储空间,然后将该向量“解码”成与输入分子匹配的图形。

在编码阶段,模型将每个分子图分解成簇或“子图”,每个簇或子图代表一个特定的构建元件。这样的簇是由一个常规的机器学习“树分解”来自动构建的,其中复杂的图被映射成一个簇的树结构,提供了原始的分子图支架。

支架树结构和分子图结构都被编码到它们自己的向量中,其中分子根据相似性被分在一组。使得寻找和修饰分子变得更容易。

在解码阶段,该模型以“由粗到细”的方式重建分子图——逐渐增加低分辨率图像的分辨率以创建更精细的版本。它首先生成树形结构的支架,然后将关联的簇(树中的节点)组装在一起形成一个连贯的分子图。确保重建的分子图是原始结构的精确复制。

该模型可以基于期望的性质修改先导分子。通过预测算法,用期望性质的效力值对每个分子进行评分。例如,在这篇论文中,研究人员寻找具有两种性质的分子——高溶解度和可合成性。

对于给定的期望性质,该模型通过使用预测算法来优化先导分子,从而通过编辑分子的官能团来修改向量,从而修改结构,以获得更高的效力分数。重复这个步骤经过多次迭代,直到找到最高的预测效能分数。然后,模型通过编译所有相应的簇,最终从更新的向量中解码出一个修改了结构的新分子。

正确且有效

研究人员在ZINK数据库中的25万个分子图上训练了他们的模型,ZINK数据库是一个可供公众使用的三维分子结构集合。他们对模型进行了任务测试,以产生有效分子并找到最佳前导分子,设计出具有增强能力的新型分子。

在第一次测试中,研究人员的模型从样本分布中产生了100 %的化学有效分子,而SMILES模型从相同分布中只产生43 %的有效分子。

第二项测试包括两项任务。首先,该模型搜索整个分子集合,以找到所需性质的最佳先导分子——溶解性和可合成性。在这项任务中,该模型发现了一种先导分子,其效力性能比传统系统高出30 %。第二项任务是修饰800个分子来获得更高的分子效力性能,但结构类似于先导分子。在此过程中,该模型创造了与先导分子结构非常相似的新分子,且分子平均效力提高了80 %以上。

除了溶解度以外,研究人员接下来的目标是测试模型的更多性质,这些性质与医疗关系更密切。但是这也需要更多的数据。制药公司对能够对抗生物靶点的分子特性更感兴趣,但他们掌握的这类数据较少。研究人员面对的挑战是开发一种能够在有限的训练数据下工作的模型。

未参与此项研究的Amgen医药公司的医药化学主管Angel Guzman-Perez说:“论文中描述的算法朝着模仿先导分子优化设计的目标迈出了重要的一步,而这个工作目前是医药化学家在做的。由于这种计算方法在向量空间中进行分子性能优化,它有可能设计出完全不同和新颖的化学结构,这是药物化学家在化学结构空间中考虑问题时所无法企及的。因此,这种算法可以补充和提升药物化学家的工作。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1775

    文章

    43716

    浏览量

    230494
  • 计算机科学
    +关注

    关注

    1

    文章

    140

    浏览量

    11230
  • 机器学习
    +关注

    关注

    66

    文章

    8095

    浏览量

    130519

原文标题:新药研发的加速器:MIT研究人员开发机器学习方法,实现分子设计自动化

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    最新纳米技术制造出彩虹色

    据国外媒体报道,英国伦敦皇家学院生物物理和纳米技术小组的科学家研究出了一种新的纳米技术,该技术能让具有纳米结构的物质把光线散射成不同的颜色而形成彩虹。这种纳米结构能够使金属表面的不同位置捕获不同波长
    发表于 09-17 17:09

    如何理解制造出这块电路板

    想理解制造出这块电路板该从哪里入手?要哪些东西 哪里找?
    发表于 02-25 19:29

    制造出高品质的线路板需要哪些条件

    `请问制造出高品质的线路板需要哪些条件?`
    发表于 03-11 15:03

    请问ARM是怎么制造出来的?

    今天突然有个问题单片机,ARM是怎么制造出来的?哪位高手能简单讲讲制造过程吗?还有一个问题,从电脑往单片机里面下载程序是二进制代码,这些进入单片机高低电平在起了什么作用,把单片机内部的电路进行了怎样的改变
    发表于 07-13 10:40

    芯片是怎样制造出来的

    芯片是怎样制造出来的?有哪些过程呢?
    发表于 10-25 08:52

    台湾科学家以水热法制造出白光LED

    台湾科学家以水热法制造出白光LED   据台湾媒体报道,台湾的科学家最近以氧化锌(ZnO)/蓝光有机材料复合薄膜,制作出白光发光
    发表于 12-12 11:12 678次阅读

    学家们发明了一种机器人化学家 意图通过其发现新的药物

    学家们发明了一种机器人化学家可以通过机器学习技术彻底改变新分子的发现方式。科
    发表于 11-05 10:26 1199次阅读

    人工智能正在学习量子力学以此来设计新分子

    一种新的机器学习算法可以探测分子的量子行为,从而使化学家具有更好的从头开始设计新化合物的能力。
    发表于 12-03 10:30 2307次阅读

    学家制造出鸽子机器人 一种能模仿鸟类飞行方式的飞行器

    学家制造出了一种会飞的鸽子机器人,它身上装有40根真正的鸽子羽毛,目的是制造出一种能模仿鸟类飞行方式的飞行器。
    发表于 01-17 15:35 2288次阅读

    日本制造出能感知疼痛的机器人 人与物体之间的界限更小了

    日本科学家宣称已经制造出一种可以“感觉”疼痛的机器人,专家称它们离1982年科幻电影《银翼杀手》中的人造人不远了。
    发表于 02-24 14:44 365次阅读

    日本制造出了一款能够感知疼痛的智能机器

    日本科学家宣称已经制造出一种可以“感觉”疼痛的机器人,专家称它们离1982年科幻电影《银翼杀手》中的人造人不远了。
    发表于 02-24 15:43 1217次阅读

    韩国科学家制造出电极,或能延长锂空气电池的寿命

    韩国科学家利用镍钴硫化物纳米薄片,在掺杂了硫的石墨烯上,制造出电极,或能够生产出长寿命高容量锂空气电池。
    的头像 发表于 03-07 16:03 2521次阅读

    如何制造出具有更高采样率的示波器?

    当 ADC 技术已经在最大采样率方面达到限制时,示波器厂商如何制造出具有更高采样率的示波器?追求更高采样率或许只是想满足示波器用户对于“越高越好”的认知,或者用户认为若要获得更高的带宽
    的头像 发表于 04-07 17:16 3635次阅读
    如何<b class='flag-5'>制造出具有</b><b class='flag-5'>更高</b>采样率的示波器?

    学家意外发明新材料,可制造更快的芯片

    化学家们意外地发明了一种不寻常的新材料,它所制造的半导体可将运算处理速度降低到飞秒(femto-seconds)等级,使下一代计算机变得更快。该材料是由铼、硒和氯组成的分子,称为Re₆
    的头像 发表于 11-11 08:11 165次阅读
    科<b class='flag-5'>学家</b>意外发明新材料,可<b class='flag-5'>制造</b><b class='flag-5'>更快</b>的芯片

    曙光智算AC.sugon.com平台助力“机器化学家”平台的成功应用

    与材料科学学院教授罗毅、江俊、王嵩团队终于带来一项具有深远影响的科研成果——“机器化学家”。其背后,曙光智算AC平台提供了算力最优解。 数据-知识-模型协同驱动的“
    的头像 发表于 12-13 09:35 320次阅读