0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于基因表达谱变化直接预测药效的计算模型

hl5C_deeptechch 来源:生辉SciPhi 作者:生辉SciPhi 2021-06-21 15:13 次阅读

鉴于许多疾病机理不明确或者发病机制涉及多条信号通路,基于靶点的药物开发策略存在一定的局限性。因此,开发一种不依赖于靶点,可以直接预测药效的计算模型似乎是一种解决方案,以往的研究人员已经进行了尝试,但是建立的模型往往针对一种疾病有效,缺乏普适性。

由于大部分疾病都会表现出基因表达谱的变化,研究人员利用化合物诱导的基因表达谱变化作为中间指标进行药效预测,开发出了一种基于基因表达谱变化直接预测药效的计算模型,这种模型适用于多种疾病研究和相关药物研发。

6 月 17 日,北京大学谢正伟团队在 Nature Biotechnology 在线发表了这项研究。在这项研究中,他们详细介绍了这种基于基因指纹和深度学习的药效预测系统(DLEPS,中文名灵素系统),并证明了 DLEPS 是一种药物发现和重定位的有效工具。在论文中,他们针对 3 种代谢性疾病开发了重定位和全新化合物分子。

有审稿人称,灵素系统是一个高度原创的解决方案,也是第一个被报道用神经网络连接化合物结构和基因表达谱的研究。

“这项工作初步完成了我的期望和设想”,谢正伟告诉生辉。

借此,生辉独家专访了该研究的共同通讯作者谢正伟博士。

今年是谢正伟独立开展科研活动的第五个年头。他现在是北京大学医学部的副研究员以及独立实验室负责人,长期从事基于多学科交叉和人工智能的创新药物算法开发,以及细胞衰老机制的研究。此前,他从事纯计算的研究工作,开发过微流芯片,并与诺奖得主 Elizabeth H.Blackburn 共同合作在 Cell 发表过论文。

2018 年,他创立了亿药科技,利用 AI 和深度学习加速药物研发。据谢正伟透露,亿药科技拥有一支多学科交叉创始团队,具有从头开发算法的能力,同时也有分子细胞生物学、结构生物学研究能力。目前团队规模 20 人左右,专业涵盖药理学、人工智能、药物化学、药理验证等。

利用 “基因指纹” 预测分子性能

多种疾病特别是年龄、代谢相关疾病的发生和发展都是由于系统失衡造成的基因表达紊乱,通过检测 “基因指纹” 即基因表达谱可以观察和研究疾病变化。

一方面,基因表达谱的检测可以应用于疾病生物标记物的筛选;另一方面,基因表达谱的检测也可以为基因功能研究提供线索,揭示疾病发生发展的分子机制。

在论文中,科研人员开发的灵素系统正是利用基因表达变化谱为中间指标建立了预测药效的计算模型,与传统连接图方法相比,这种模型适用于没有实验数据或者未发现的药物分子。而连接图方法虽然采用基因表达谱变化为指标,但是这种方法往往只适用于已有实验数据的分子,对于新分子束手无策。

在该研究中,他们首先构建了神经网络,使用 SMILES 化学编码输入,将小分子在高维空间进行编码,高维空间的坐标向量进一步预测 1000 个标记基因,然后对超过 1 万个基因进行预测;紧接着,他们用疾病相关基因指纹来反映特定疾病的 “内在痕迹”,并且使用基因集合富集分析 (GSEA) 来评估化合物对疾病的潜在疗效。

SMILES 即简化分子线性输入规范,这是一种用 ASCII 字符串明确描述分子结构的规范。GSEA:是一种分析基因表达信息的方法。

谢正伟团队将这种方法和模型称为基于深度学习的药效预测系统 —— 灵素系统。在预测基因表达变化部分,系统可以准确预测新分子对转录组造成的影响,训练集和测试集中预测的和真实的基因表达谱变化的平均相关性为 0.90 和 0.74,分布峰值分别在为 0.93 和 0.90。

这些指标说明系统成功地从已有数据中学习到深层次的分子结构 - 基因表达谱变化之间的关联,达到了外推到虚拟分子的效果。

“灵素系统在测试集上的优异表现,使我们相信灵素系统对于新结构分子,也可以取得准确的预测结果”,谢正伟说。

接下来,研究人员深入探索了测试集的一部分分子,这些分子在训练集中没有非常相似的分子。

“我们发现,灵素系统可以精确预测新结构小分子诱导的基因表达谱变化(平均相关性 0.6)。同时,系统还可以准确区分结构非常相似的小分子(只差一个基团)诱导的基因表达谱差异”,谢正伟补充道。

研究人员还分析出了哪些基团倾向于保持表达谱不变或者更倾向于改变,这些分析对于后续的药物设计至关重要。

谢正伟告诉生辉,与传统基于靶点的方法或者单基因标记筛选方法相比,灵素系统具有三大优势:

一是,灵素系统同时考虑多个基因指标,精度更高。灵素系统更加灵活,仅基于基因指纹就可预测候选分子,可以在复杂疾病上得到更好药效的化合物,更快的找到工具分子。

二是,灵素系统不需要预先合成实体分子库,大大的降低了成本和工作量,效率更高。

三是,找到小分子以后可以进一步发现疾病的新靶点,从而实现在药效预测和靶点上开发双管齐下、同步进行。

具有通用性,可预测多种疾病药物分子

“第一次看到这么好的拟合效果,我惊讶得半天说不出话来。不过,系统是否真正有用还得在实践中验证。由于动物实验周期长,验证的病种多,我们光验证就花了两年的时间”,谢正伟说。

在实验验证方面,谢正伟遇到了北京大学基础医学部郑瑞茂研究员,郑瑞茂当时正在测试雷公藤素,这是一个和连接图方法有渊源的分子。

两人一拍即合, 一番交流之后,郑瑞茂很快理解了灵素系统的潜在价值,并在促进脂肪褐变和减肥领域进行了尝试。

他们利用灵素系统预测了四个化合物,其中三个化合物可降低小鼠的脂肪含量,并且诱导数十个褐变基因表达上调,使白色脂肪组织变成棕色脂肪组织,减轻了小鼠的体重,达到了减肥目的。

“这大大增强了我们的信心,然后我们继续尝试扩展到其他的领域”,谢正伟说。

据谢正伟透露,针对高尿酸血症,灵素系统成功预测了天然产物紫苏烯,其可降低血清尿酸,效果上优于四种阳性药物,还具有抗炎和抗纤维化的优势。

针对非酒精性脂肪性肝炎(NASH),他们发现三种可缓解 NASH 进展的 MEK-ERK 信号通路抑制剂,并首次揭示了 MEK-ERK 通路在 NASH 中的重要作用。NASH 是一种在全球范围内十分普遍的慢性肝病,NASH 患者 10 年内肝硬化发生率高达 25%,市场需求巨大。吉利德、武田等制药大厂纷纷重金布局该领域,然而目前全球尚无一款药物获批上市。

“针对 NASH 适应症,我们发现至少需要调节七个通路才能取得良好的治疗效果,而这正是灵素系统所擅长的”,谢正伟说。

SaaS 服务基础上做自研

2016 年,谢正伟在北京大学医学院建立独立实验室,立志研发抗衰老药物。

“当时我们已经建立了一套高通量筛选系统,但是筛选效率低,无法满足针对多种疾病筛选药物分子的需求。我希望通过 AI 和深度学习预测化合物性能,寻找一些可以抗衰老的化合物,于是开发了这套灵素系统”,谢正伟说。

2018 年,谢正伟正式落地亿药科技,将自己的科研成果转化为 “药”。同年,亿药科技完成了种子轮融资。

据谢正伟介绍,论文中只提到了 3 种代谢性疾病,实际上,他们还在探索肌腱愈合、骨质疏松、长寿等领域的潜力,现在已经找到了长寿的化合物。借助于研发优势,亿药科技还开发了一条替代 GLP-1 的 “爆款” 管线。GLP-1 是 2 型糖尿病药物的主要作用靶点,GLP-1 类药物是糖尿病和减肥领域最闪耀的药物之一。

基于一系列的研究成果,亿药科技已经搭建了多条创新管线和 “老药新用” 管线,并且申请了十几个相关的专利。

药物发现处于整个生物医药产业链最前端,也是产生核心专利阶段。据了解,论文中涉及的小分子 - 神经网络 - 基因表达变化 - 药效的算法框架已经申请国内外专利。

“对我们来说,这个专利的优先权具有非常重大的意义和保护作用。因为它的出发点是一个原始创新的框架,所以保护范围非常大,能够帮助亿药科技建立专利壁垒和保持竞争优势”,谢正伟说。

谢正伟告诉生辉,一家 AI 制药公司的核心竞争力,主要体现在商业发展上,可以简单归结为两个指标。第一个指标是做技术服务的能力,是否能拿到大公司的订单;另一个指标是自研管线,是否有成为创新型研发中心以及未来成为药企的潜力。

基于灵素系统以及搭建的人工智能平台、药物化学平台、药理验证平台,亿药科技最近拿到中国科学院以及一家头部药企的订单合同。

“我们的商业模式可以简单归结为 3 种,一是提供 SaaS 平台付费计算服务,二是提供化合物筛选等技术服务,三是自有管线的研发”,谢正伟说。

目前,亿药科技正在进行 Pre-A 轮融资,本轮融资将会用于自有管线研发、平台建设、队伍扩充和管线的 IND 推进。

“做药一直是我们的初衷,我希望亿药科技成为一家 AI + 大数据驱动的科研型制药公司。未来,我们会在提供 SaaS 服务和技术服务的基础上,注重推动自研管线,并将这些管线推向临床、推向市场,最终使患者受益”,谢正伟这样描述亿药科技未来的发展规划。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26129

    浏览量

    263709
  • 人工智能
    +关注

    关注

    1773

    文章

    43356

    浏览量

    230123
  • 深度学习
    +关注

    关注

    73

    文章

    5200

    浏览量

    119803

原文标题:基于基因指纹的药效预测新模型登顶刊,这家AI制药初创瞄准衰老代谢疾病丨专访亿药科技

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LabVIEW进行癌症预测模型研究

    LabVIEW进行癌症预测模型研究 癌症是一种细胞异常增生的疾病。随着年龄的增长,细胞分裂速度放缓,但癌细胞会失去控制地不断分裂,形成可能良性或恶性的肿瘤。 2012年的国际癌症数据显示,新发癌症
    发表于 12-13 19:04

    如何从一个简单的数学表达式创建一个Saber模型

    如何从一个简单的数学表达式创建一个Saber模型,将你的输出描述为输入的函数?例如 out=a*in*in+b (其中 a 和 b 是常数)。
    的头像 发表于 12-05 13:42 306次阅读
    如何从一个简单的数学<b class='flag-5'>表达</b>式创建一个Saber<b class='flag-5'>模型</b>?

    基于机器学习的车位状态预测方法

    本发明公开一种基于机器学习的车位状态预测方法,基于历史数据,建立回归决策树模型进而构建改进决策树模型,对每个区域的停车率进行预测,基于停车率
    发表于 09-21 07:24

    基于角度域任意功率PDF的基函数采样近似拟合算法

    ( SpaTIal Fading CorrelaTIon,SFC)特征,重建了MIMO多输入多输出系统的信道参数模型。首先,研究小角度扩展功率PDF在Sinc分布、高斯分布以及拉普拉斯分布下的SFC闭合表达式,以
    发表于 09-19 07:53

    具有铁芯的P系列高推力直接驱动直线伺服电机

    P系列直线电机是一种具有铁芯的高推力直线电机。它具有很高的推力密度和较低的停止力。峰值推力可达450NM峰值加速度可达5G。它是TPA机器人的一种高性能的直接驱动线性运动台。常用于高精度直线电动机
    发表于 09-04 16:14

    zabbix触发器表达式 基本RS触发器表达式 rs触发器的逻辑表达

    及时响应异常。其中,触发器是Zabbix中最基本的组件之一,用于检测和处理指标的变化情况。本文将重点介绍Zabbix触发器表达式,以及基于RS逻辑的触发器表达式。 Zabbix触发器表达
    的头像 发表于 08-24 15:50 1087次阅读

    GPU助力基因组重测序分析

    不同的基因变化而造成,以至于同类型癌症患者对于相同药物的药效反应有很大的差别 。这些基因上的变化包含了单碱基突变(SNV)、小片段插入缺失(
    的头像 发表于 08-01 10:32 1067次阅读
    GPU助力<b class='flag-5'>基因</b>组重测序分析

    基因组重测序的应用领域有哪些

    强异质性,即相同症状、相同病理改变却可能由完全不同的基因变化而造成,以至于同类型癌症患者对于相同药物的药效反应有很大的差别 。这些基因上的变化
    的头像 发表于 08-01 10:29 1368次阅读
    <b class='flag-5'>基因</b>组重测序的应用领域有哪些

    计算模型SaaS是什么?有什么特点?

    计算模型中的SaaS(Software as a Service)是一种基于云计算架构的软件交付模型。在SaaS
    的头像 发表于 06-25 15:36 627次阅读

    计算模型PaaS有哪些优势?

    平台即服务(Platform as a Service,PaaS)是一种计算服务模型,为开发人员提供了一个完整的应用开发和部署平台。PaaS模型具有许多优势和广泛的应用场景。以下将详
    的头像 发表于 06-25 15:32 501次阅读

    无线通信信号传输模型介绍

    理论计算预测了无线信号的变化。   2. 传播模型的分类   在移动通信网络设计中,个主要的任务是在满足移动用户所需的话务容量条件下,使
    发表于 05-06 11:40

    云边协同储能可预测维护系统方案

    预测性维护算法,云端实现算法、模型、参数的优化,并通过边缘计算提供的流计算框架更新参数到边缘计算预测
    发表于 04-14 10:51 0次下载
    云边协同储能可<b class='flag-5'>预测</b>维护系统方案

    电力负荷预测的方法 电力负荷预测的意义

    基于时间序列模型的方法:该方法利用历史负荷数据,寻找其时间序列中的规律,利用时间序列模型(如ARIMA模型)来进行预测。这种方法优点在于模型
    发表于 04-09 16:17 7875次阅读

    一种整流器的直接功率控制Simulink仿真方案

      简述  直接功率控制时一种将瞬时有功功率、无功功率用于PWM变换器闭环控制系统中的新型控制策略。直接功率控制(Direct Power Control, DPC) 的控制策略与通常的电流控制策略
    发表于 03-29 16:35

    异步电机模型预测电流控制(MPCC)

    导读:本期主要是介绍模型预测电流控制。模型预测电流控制主要包括:转速环、磁链环、磁链观测器、预测模型
    发表于 03-29 10:14 1次下载
    异步电机<b class='flag-5'>模型</b><b class='flag-5'>预测</b>电流控制(MPCC)