0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI算法LinearDesign在生物学领域的应用研究

牵手一起梦 来源:中国网 作者:佚名 2020-06-01 17:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

新型冠状病毒全球累计确诊已超过400万人,疫苗是终结疫情的关键胜负手。在所有正在研发的疫苗路径中,研发速度更快、更具潜力的mRNA疫苗作为一种新兴技术受到了国内外的重点关注。但同时,mRNA疫苗由于稳定性不足容易在保存、运输中降解,也成为制约疫苗大规模推广和使用最亟待解决的问题。

现在,这个困扰世界顶级疫苗公司和学界的生物学难题有望通过AI解决!5月13日,百度研究院重磅推出全球首个mRNA疫苗基因序列设计算法LinearDesign。该算法能够在理论上设计出结构最稳定、蛋白质表达效率最高的mRNA序列,而这只需要90分钟。如果进一步应用线性时间近似算法,时间更可以缩短到16分钟!

美国罗彻斯特大学生物化学与生理系教授Dr. David H. Mathews表示:“LinearDesign的优势在于速度!它能够快速提供一系列的优良序列,研究者可以进一步通过实验来测试其稳定性是否足以充当疫苗。”

事实上,从能够转译同一种蛋白质的众多同源序列中找到二级结构足够稳定、密码子足够优化的mRNA序列挑战难度是相当巨大的。以新型冠状病毒为例,它的刺突蛋白(抗原)共有1273氨基酸,能翻译成刺突蛋白的mRNA序列有10的632次方之多!

遍历所有可能?这显然难以完成。

假设一台超级计算机能做到一秒钟计算一个mRNA结构,那么从宇宙形成开始计算到现在,计算140亿年,连mRNA序列所有可能的亿万分之一都无法算完!

要找出最优的mRNA,科学家们的传统做法是随机改变序列,再看看是否有益。当前,科学界也在寻找解决问题的不同策略,比如,卡耐基梅隆大学和斯坦福大学联合百度合作开发的平台Eterna,就旨在在通过解谜的方式吸引全球玩家共同设计安全稳定的mRNA。Eterna平台所使用的,正是今年1月底百度开放的LinearFold算法作为其结构分析引擎。

LinearFold是十分成功的实验性项目,它将生物学上的难题成功转化为形式语言理论和计算机语言学上的经典问题。在LinearFold的启发之下,百度研究院的研究团队想到了不只是结构分析,而可以进一步运用计算机科学来设计出更稳定、蛋白质表达水平更高的mRNA序列。由此,LinearDesign应运而生。

针对多达10的632次方mRNA序列,LinearDesign采用了动态规划算法来缩小搜索空间。我们知道直到AlphaGo出来之前,AI一直都无法战胜人类棋手,主要原因就是围棋的搜索空间太大了,有3的19x19次方个状态,约合10的172次方。可以看到,mRNA序列设计问题的搜索空间远远大于下围棋的搜索空间。

而LinearDesign的动态规划算法首先用确定有限状态自动机(DFA)来表达氨基酸和蛋白质,这样不同位置上密码子的选择就可以抽象为计算理论中常用的DFA图。如下图,分别把三种氨基酸(A: methionine, B: valine, C: serine)以及终止密码子(D)抽象为DFA图。

在此基础上,将氨基酸的DFA串联起来,即可得到一段蛋白质序列的DFA图。如下图是示例序列“methionineleucine stop”的DFA图。

接下来,我们需要通过DFA来找出二级结构最稳定的mRNA序列。在这里,百度研究院借用了通常用于计算机语言学的常见工具,也就是随机上下文无关文法(SCFG),用于指代RNA折叠。RNA二级结构可以通过SCFG构建语法树来表示。

mRNA疫苗序列设计优化问题实际上是将单个RNA序列的二级结构计算(RNAfolding)推广到多个RNA序列。在用DFA抽象表示多个RNA序列后,研究人员通过取DFA与SCFG的交集,来从多个mRNA序列中找到具有最稳定二级结构的序列。

从上图的新型冠状病毒突刺蛋白实验结果可以看出,对比最左侧图A自然界存在抗体所对应的mRNA序列,右边人工智能设计的二级结构非常紧密。其中的全局最优序列图C,设计时间只需要1.6小时!而如果进一步应用线性时间近似算法,如图B其设计时间将缩短到16分钟。这项技术同样适用于所有mRNA疫苗设计。

疫苗研发是一项耗时耗力的全世界性难题,运用人工智能,计算机科学技术疫苗研发正在不断加速。目前,百度研究院已将LinearDesign网站免费开放,同时相关论文已发布于arXiv,全球研究机构及疫苗研发企业均可使用。百度已与中国疾病预防控制中心病毒病预防控制所签署战略合作协议,后续也将使用百度LinearDesign算法设计的mRNA疫苗序列进行体外实验,验证疫苗的稳定性和蛋白质表达效率。相信在全球研究者的共同努力下,疫苗研发进度将不断提速。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42134

    浏览量

    303130
  • 百度
    +关注

    关注

    9

    文章

    2401

    浏览量

    95382
  • 引擎
    +关注

    关注

    1

    文章

    370

    浏览量

    23536
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    [完结15章]Java转 AI高薪领域必备-从0到1打通生产级AI Agent开发

    AI瞬间完成时,仅凭对Spring Boot框架的熟练度已无法构建职业护城河。Java工程师若想拒绝原地踏步,绝不是简单地学一Python或调用几个API,而是必须将自身深厚的工程化底座与大模型的认知
    发表于 04-30 13:46

    江南大学:AI赋能合成生物传感,四大领域迎来颠覆性突破

      01 摘要   人工智能正在推动合成生物学传感器(SBBs)从传统理性设计向 AI 驱动的预测性工程发生根本性转变。本综述首次构建了 AI 算法与合成
    的头像 发表于 04-02 20:00 9240次阅读
    江南大学:<b class='flag-5'>AI</b>赋能合成<b class='flag-5'>生物</b>传感,四大<b class='flag-5'>领域</b>迎来颠覆性突破

    英矽智能发布 PandaClaw:以智能体AI赋能生物学家开展治疗性发现

    现平台PandaOmics中的变革性新功能。PandaClaw将AI智能体与生物学生物信息学工作流程相结合,使研究人员能够借助直观、智能的自然语言界面,实现自动化实时分析,从而高效便
    的头像 发表于 03-23 11:51 191次阅读
    英矽智能发布 PandaClaw:以智能体<b class='flag-5'>AI</b>赋能<b class='flag-5'>生物学</b>家开展治疗性发现

    NVIDIA推出面向语言、机器人和生物学的全新开源AI技术

    NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展 AI 的普及并推动创新。NVIDIA 正将这些模型、数据和训练框架贡献给 Hugging Face,让
    的头像 发表于 11-06 11:49 1404次阅读

    北京理工大学:在AI辅助生物传感器改造领域取得重要进展

    转录因子BmoR为例,利用该方法成功地缩小了BmoR的改造区域,极大地加快了获得理想突变体的速度,为合成生物学生物制造的高度特定工具的理性设计提供了一个新的范例。该工作以北
    的头像 发表于 10-14 18:14 856次阅读
    北京理工大学:在<b class='flag-5'>AI</b>辅助<b class='flag-5'>生物</b>传感器改造<b class='flag-5'>领域</b>取得重要进展

    【「AI芯片:科技探索与AGI愿景」阅读体验】+具身智能芯片

    进行分析和处理,以便更好地理解和利用这些信息。 具身智能除了 习还有记忆功能,这在生物学中对应遗传。在芯片实现中,常常采用存算一体化(包含存内计算)以及把感知功能也集成在一起的感存算一体化技术
    发表于 09-18 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+化学或生物方法实现AI

    网络,极其复杂和精密。大脑本质上是一台湿润的软组织生物化学计算机,通过离子、分子之间的相互作用进行复杂的并行计算。 理解了怎么生物AI,作者为我们介绍了几种备受关注的研究方向和成果。
    发表于 09-15 17:29

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    目前生物学研究领域的前沿,即合成生物学。是旨在构建具有特定功能的细胞,该细胞可以是从头开始设计的,也可以通过修改现有生物体的细胞来得到。这些
    发表于 09-06 19:12

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    章 具身智能芯片 第9章 从AI芯片到AGI芯片 图2 各章重点及逻辑框架 该书可供AI和芯片领域的各层次人群阅读,无论是学习者还是研究人员。 对于本人来说,读这本书不但是为了丰富这
    发表于 09-05 15:10

    扫描电镜图像分辨率评估新方法

    SEM是一种功能强大的工具,在材料科学、生物学、纳米技术和医学研究等科学领域得到广泛应用,其常见用途是测量纳米和微米尺度上物体或结构的尺寸。
    的头像 发表于 08-12 10:38 2275次阅读
    扫描电镜图像分辨率评估新方法

    NVIDIA AI助力科学研究领域持续突破

    随着 AI 技术的广泛应用,AI 正在成为科学研究的引擎。NVIDIA 作为重要的技术推手,持续驱动着 AI 系统解锁更多领域的科学突破。
    的头像 发表于 08-05 16:30 1385次阅读

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    脑神经网络。 材料创新 这部分将视角投向化学与生物领域,探索 “湿件”的可能性,重新定义AI芯片的形态。 化学计算开辟了全新路径,通过酸碱反应构建逻辑门与神经网络,让化学反应成为计算的 “语言”。液态忆
    发表于 07-28 13:54

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    和实践项目经验。 考取相关的专业认证,如人工智能工程师认证等。这些认证可以证明自己在AI领域的知识水平,也有助于在求职或者参与相关项目时增加竞争力。 跨学科知识积累 结合计算机科学、物理学、生物学
    发表于 07-08 17:44

    高压功率放大器在生物和超声领域中的作用和实验

    高压功率放大器在生物和超声领域中具有重要作用,以下分别说明其在两个领域中的作用和实验: 生物领域 作用:高压功率放大器用于将低功率的信号放大
    的头像 发表于 06-04 18:04 868次阅读
    高压功率放大器<b class='flag-5'>在生物</b>和超声<b class='flag-5'>领域</b>中的作用和实验

    霍尔传感器在直流电机转速测量中的应用研究

    纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:霍尔传感器在直流电机转速测量中的应用研究.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 05-29 14:12