0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度蛋白大语言模型研究成果登上Nature子刊封面

百度 来源:百度 2023-11-25 11:25 次阅读

百度最新研究成果登上Nature子刊封面,文心生物计算大模型获国际顶刊认可!

10月,国际顶级学术期刊《自然》旗下子刊《机器智能》发表了百度飞桨螺旋桨联合百图生科研发的文心生物计算大模型的又一重大成果《A method for multiple-sequence-alignment-free protein structure prediction using a protein language model》,并登上《机器智能》10月份封面。该研究提出了全球首个开源、并提供在线服务,无需MSA输入的蛋白结构预测大模型HelixFold-Single。

41d8c29c-8ab6-11ee-939d-92fbcf53809c.png

该项研究是百度在生物计算领域继HelixGEM和Linear Design两项重磅工作之后,在蛋白领域的又一突破性成果。该工作打破了AlphaFold2等主流依赖MSA检索模型的速度瓶颈,将蛋白结构预测速度平均提高数百倍,实现了秒级别预测,该工作的发表也为产学研各界带来了使用门槛更低、适用范围更广的蛋白结构预测解决方案,有望促进我国生命科学、生物医药、蛋白研究等领域的发展。

HelixFold-Single目前已经落地在国家超算成都中心,通过超算平台赋能川渝地区蛋白领域的科学研究机构。在大分子药物的应用场景上,HelixFold-Single也已经整合进入百图生科AIGP平台,为百图提供更高效的蛋白分析能力,助力其探索大分子创新药。

另据研发团队介绍,基于HelixFold-Single和HelixFold研发过程中积累的经验,团队针对更具挑战性的抗原抗体、多肽蛋白的相互作用场景,研发了更具通用性和鲁棒性的复合体结构预测算法HelixFold-Multimer,相比业界同类方法,精度提升了数倍。

HelixFold-Multimer 在68例2022年10月后公开的Sabdab抗原-抗体测试数据上,单模型的DockQ达到0.49,多模型融合的DockQ达到0.5,成功率达到67.6%,远超其他已公开方法。

42117c7c-8ab6-11ee-939d-92fbcf53809c.png

HelixFold-Multimer在抗原-抗体复合物结构预测的结果

在多肽-蛋白复合物结构预测场景,选取PDB数据库在2021年10月后发布的 61个多肽-蛋白复合体结构数据进行评估。单模型DockQ达到0.380,多模型融合的DockQ达到0.387,领先于其他结构预测方法。

42312842-8ab6-11ee-939d-92fbcf53809c.png

HelixFold-Multimer 在多肽-蛋白复合物结构预测的结果

示例:

示例1:7VD7 沙门氏菌的毒素-抗毒素复合物,复合体构象预测可以帮助理解毒素和抗毒素如何相互作用以调节细胞内过程。Alphafold 2.3在红色圈部分预测差异大,而 HelixFold-Multimer 预测得到了准确的构象。

示例2:7UA2 疟疾传播阻断抗原Pfs230 domain 1 (Pfs230D1) 与纳米抗体的复合体构象,其中Pfs230D1是一种高功能活性的疟疾传播阻断疫苗抗原,已在临床试验中得到广泛验证。7UA2复合体包含了Pfs230D1疫苗接种的受试者产生的人源单克隆抗体(hmAbs)和Pfs230D1构象。可以看到 HelixFold-Multimer 预测的构象(蓝色)几乎与真值重合,对接面的预测 DockQ也达到0.819,Interface RMSD为0.826 Ȧ。

424ca66c-8ab6-11ee-939d-92fbcf53809c.png

42665d78-8ab6-11ee-939d-92fbcf53809c.png4288f004-8ab6-11ee-939d-92fbcf53809c.png

当前,AI大模型技术正驱动生物计算领域的高速发展。基于文心生物计算大模型技术打造的飞桨螺旋桨PaddleHelix平台,将帮助生命科学领域的研究人员更便捷、更高效地应用大模型技术,更好理解生命体的构成和变化规律,以帮助研究者进行更多开拓性研究。同时我们也深知,AI技术的更迭日新月异,想要全面领先,就需要集结大家的力量。我们希望探索出一种新形式,将强大的底座模型能力开放给国内的科研工作者们,以在更加广泛的维度上推动生物计算领域的技术变革。也希望对此工作感兴趣的专家学者与我们联系,共同推进生物计算大模型在应用侧的研究。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • MSA
    MSA
    +关注

    关注

    0

    文章

    28

    浏览量

    8803
  • ai技术
    +关注

    关注

    1

    文章

    1135

    浏览量

    23705

原文标题:首次!百度蛋白大语言模型研究成果登上Nature子刊封面

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.31】大语言模型:原理与工程实践

    深远影响,尤其在优化业务流程和重塑组织结构方面。然而,在研究和实践过程中,我们遇到了一个主要挑战:市场上缺乏大语言模型在实际应用方面的资料。现有的资料多聚焦于理论研究,而具体的实践方法
    发表于 03-18 15:49

    新品上市,公有云轻安防就选目凌云! #人工智能 #目 #目凌云 #百度智能云

    人工智能百度智能云
    jf_98614062
    发布于 :2024年02月19日 11:39:42

    再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知

    用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登 Nature。 作者之一、谷歌DeepMind研究副总裁Pushmeet Kohli表示: 训练数据中不会有这个
    的头像 发表于 12-24 21:40 338次阅读
    再登<b class='flag-5'>Nature</b>!DeepMind大<b class='flag-5'>模型</b>突破60年数学难题,解法超出人类已有认知

    LabVIEW进行癌症预测模型研究

    LabVIEW进行癌症预测模型研究 癌症是一种细胞异常增生的疾病。随着年龄的增长,细胞分裂速度放缓,但癌细胞会失去控制地不断分裂,形成可能良性或恶性的肿瘤。 2012年的国际癌症数据显示,新发癌症
    发表于 12-13 19:04

    英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

    市举办。 在NeurIPS 2023上,英特尔研究院将展示其最新AI研究成果,并和产业界、学术界分享英特尔“让AI无处不在”的愿景。大会期间,英特尔研究院将发表31篇论文,包括12篇主会场论文和19篇研讨会论文,并在405号展台
    的头像 发表于 12-08 19:15 350次阅读

    英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

    英特尔研究院将重点展示31项研究成果,它们将推进面向未来的AI创新。        英特尔研究院将在NeurIPS 2023大会上展示一系列富有价值、业界领先的AI创新成果。面向广大开
    的头像 发表于 12-08 09:17 403次阅读

    百度知识增强大语言模型关键技术荣获“2023世界互联网大会领先科技奖”

    荣获“世界互联网大会领先科技奖”,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰现场发布了文心大模型的关键技术成果
    的头像 发表于 11-09 11:02 330次阅读

    今日看点丨百度发布首个量子领域大模型,依托量子平台、文心大模型;福特暂停采用宁德时代技术建设电池

    1.百度发布首个量子领域大模型,依托量子平台、文心大模型 近日,2023量子产业大会上百度量子计算研究所所长段润尧带来
    发表于 09-26 11:06 477次阅读
    今日看点丨<b class='flag-5'>百度</b>发布首个量子领域大<b class='flag-5'>模型</b>,依托量子平台、文心大<b class='flag-5'>模型</b>;福特暂停采用宁德时代技术建设电池

    百度发布首个量子领域大模型百度量子助手

    所所长段润尧带来百度量子软硬件和解决方案等方面的最新成果,重磅发布首个量子领域大模型,及百度量子助手和量子写作助手两大AI原生应用,加速量子技术与大
    的头像 发表于 09-26 09:53 496次阅读

    解决医疗大模型训练数据难题,商汤最新研究成果登「Nature」子刊

    生成式AI正为医疗大模型迭代按下加速键。 近日,商汤科技联合行业合作伙伴,结合生成式人工智能和医疗图像数据的多中心联邦学习发表的最新研究成果 《通过分布式合成学习挖掘多中心异构医疗数据
    的头像 发表于 09-12 18:50 604次阅读
    解决医疗大<b class='flag-5'>模型</b>训练数据难题,商汤最新<b class='flag-5'>研究成果</b>登「<b class='flag-5'>Nature</b>」子刊

    鸿蒙升级3.0.0,百度导着航,系统中途会关闭我的定位

    然后百度显示没有定位了,就自动开启智能导航。系统决定我的定位开关设置在哪里,我记得以前开定位是手动开关的。升级后,下拉菜单打开定位,百度导航开着一会系统定位就被关闭了。害得我跑错了好多路。现在就是我的百度导航根本没法用
    发表于 09-03 23:34

    李彦宏百度预计年底推出文心一言大模型4.0版本

    李彦宏百度预计年底推出文心一言大模型4.0版本 在百度财报会议上,百度重点讲了生成式人工智能及大语言模型
    发表于 08-30 16:34 313次阅读

    百度年底将推出文心大模型4.0

    百度年底将推出文心大模型4.0 百度创始人、董事长兼CEO李彦宏称目前百度文心大模型更新至3.5版本,
    发表于 08-23 17:53 246次阅读

    中译语通展示格物多语言模型技术和工业实践

    模型技术和工业实践。会议还汇聚了腾讯AI Lab、百度等科技企业,学术界和工业界的研究学者与从业人员,分享各自研究成果和实践经验,推动了大模型
    的头像 发表于 07-27 09:44 393次阅读
    中译语通展示格物多<b class='flag-5'>语言</b>大<b class='flag-5'>模型</b>技术和工业实践