0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基因组学大型语言模型在多项任务中均展现出卓越的性能和应用扩展空间

NVIDIA英伟达 来源:未知 2023-01-17 01:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

InstaDeep、慕尼黑工业大学(TUM)和 NVIDIA 之间的合作推动了面向基因组学的多超级计算规模的基础模型开发进程。这些模型在大量预测任务(例如启动子和增强子位点预测)中展示了最先进的性能。

f0209c2e-95bd-11ed-bfe3-dac502259ad0.jpg

这一联合团队的研究指出,经过基因组学训练的大型语言模型(LLM)可将应用扩展到大量基因组学任务。

该团队使用 NVIDIA 的超级计算机 Cambridge-1 来训练参数规模从 500M 到 2.5B 不等的各种大型语言模型(LLM)。这些模型在各种基因组数据集上进行了训练,以探索模型规模和数据多样性对下游任务性能的影响。

分类任务包括预测增强子和启动子序列以及转录因子结合位点。这些任务有助于了解 DNA 如何转录生成 RNA 和蛋白质,从而开启新的临床应用。

研究中明确了 20 项任务。对于每一项任务,性能都随着模型规模和数据集多样性的增加而单调递增。参照专门的最新模型基线,在多物种数据集上训练的具有最大参数规模(2.5B 参数)的大型语言模型在 19 项任务中的 15 项中取得了同等或更高的性能。

这些结果是通过利用参数轻量化微调实现的。然而,即使依靠从 Transformer 模型各层提取的预训练嵌入以及简单的浅层感知器(MLP)或逻辑回归,也足以在 11 个任务中实现同等乃至更高的性能。

在每个模型检查点和每个任务的所有层上应用这种探测策略,训练出了 120 万个 MLP 模型。该研究对大型语言模型的训练和使用等各方面进行了详细分析,例如不同层对下游任务性能的影响。

在固定模型规模下直接比较序列多样性,显示出具有重要意义的性能提升,增加模型规模也是如此。例如,对于一个 500M 参数模型,仅在人类参考基因组上训练的性能不如在 1000 基因组数据集上训练的性能。

同样,在 1000 基因组数据集上训练的 2.5B 参数模型的性能优于任何 500M 参数模型。而对于相同的模型,性能会逊于在自定义多物种数据集上训练的结果,即使下游性能是在仅涉及人类基因组的任务上测量的。

研究人员观察到,并非所有嵌入都是平等创建的。虽然通常的做法建议使用大型语言模型的最后一层进行下游预测。但耐人寻味的是,中间层产生的表征在下游任务中显示出明显更高的性能。研究人员发现,最佳层的选择取决于任务,表明不同类型的 DNA 特征被不同层的模型所捕获。

InstaDeep 首席执行官 Karim Beguir 表示:“我们相信这些结果首次清楚地证明了基因组学基础模型的可行性,这些模型能够真正地推广到多项任务中。这些结果从很多方面反映出了过去几年内适应性基础模型在自然语言处理方面的发展进程。如今,其应用于药物研发和人类健康等如此具有挑战性的问题,着实令人难以置信的兴奋。”

NVIDIA 的 Cambridge-1 对该项目的成功至关重要。该项目需要高性能计算基础设施来训练具有捕获基因组中远程相互作用所需感受域的大型模型。

研究人员尝试了多种方法、数据集大小、模型规模和分词器方案,最终使用在 16 个 NVIDIA DGX A100 节点(128 个 A100 80GB GPU)上训练的 2.5B 参数稀疏注意力模型,在多任务上实现了迄今公开发表的最佳性能。

在未来的研究工作中,该团队计划通过直接微调模型,探索进一步的下游任务性能改进,并将继续在应用于基因组学的大型语言模型的架构创新方面展开合作。InstaDeep 是首批使用 Cambridge-1 的 NVIDIA 初创加速计划成员之一。

扫描下方海报二维码,即可免费注册 GTC 23,切莫错过这场 AI 和元宇宙时代的技术大会


原文标题:基因组学大型语言模型在多项任务中均展现出卓越的性能和应用扩展空间

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4044

    浏览量

    97700

原文标题:基因组学大型语言模型在多项任务中均展现出卓越的性能和应用扩展空间

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    第十二届全国功能基因组学高峰论坛在京举办:聚焦人工智能与多组融合发展

    时维金秋,群贤毕至。2025年第十二届全国功能基因组学高峰论坛(FGC-12)近日北京圆满落幕。本届论坛汇聚了包括60余位国内顶尖学者在内的近500名科研院所、高等院校及行业代表,围绕“融汇
    的头像 发表于 11-19 17:05 423次阅读
    第十二届全国功能<b class='flag-5'>基因组学</b>高峰论坛在京举办:聚焦人工智能与多组<b class='flag-5'>学</b>融合发展

    一文了解Mojo编程语言

    ,利用硬件加速提升效率。 科学计算与数据处理 高效处理大规模数值分析、基因组学数据等任务。 系统工具开发 开发操作系统级工具,结合 Python 的便捷性和 C 的性能优势。 嵌入式与实时应用 适用于
    发表于 11-07 05:59

    性能卓越的国产精密运放CYA37全面兼容OP37

    CYA37是一款高性能精密运算放大器,其不仅实现了与OP37的全面兼容,更在多项关键性能展现出显著优势,为工程师提供了更卓越、更可靠的国产
    的头像 发表于 09-04 14:36 736次阅读
    <b class='flag-5'>性能</b><b class='flag-5'>卓越</b>的国产精密运放CYA37全面兼容OP37

    中科曙光构建全国产化基因组学性能计算平台

    近日,中科曙光承建的国内某研究所基因组学性能计算平台正式交付。这是国内生物信息领域首个从底层硬件到上层软件实现完全自主可控,并深度融合高性能计算与人工智能算力的平台,成功填补了该领
    的头像 发表于 06-26 17:36 837次阅读

    小白模型:从零实现 LLM语言模型

    在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据,能够生成自然语言文本,完成各种复杂的
    的头像 发表于 04-30 18:34 1070次阅读
    小白<b class='flag-5'>学</b>大<b class='flag-5'>模型</b>:从零实现 LLM<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    SMA接口:如何在有限空间内实现卓越射频连接

    提供了全方位保障。无论是小型消费电子设备,还是复杂的通信基础设施,德索制造的 SMA 接口都展现出强大的适应性与可靠性,为现代电子设备的高效运行奠定了坚实基础
    的头像 发表于 03-21 10:48 932次阅读
    SMA接口:如何在有限<b class='flag-5'>空间</b>内实现<b class='flag-5'>卓越</b>射频连接

    无法OVMS上运行来自Meta的大型语言模型 (LLM),为什么?

    无法 OVMS 上运行来自 Meta 的大型语言模型 (LLM),例如 LLaMa2。 从 OVMS GitHub* 存储库运行 llama_chat Python* Demo 时
    发表于 03-05 08:07

    小白模型:训练大语言模型的深度指南

    在当今人工智能飞速发展的时代,大型语言模型(LLMs)正以其强大的语言理解和生成能力,改变着我们的生活和工作方式。最近的一项研究
    的头像 发表于 03-03 11:51 1214次阅读
    小白<b class='flag-5'>学</b>大<b class='flag-5'>模型</b>:训练大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的深度指南

    NVIDIA使用加速计算与AI推动精准医学发展

    加利福尼亚州圣克拉拉举行的精准医学世界大会上,NVIDIA 因推动了医学成像、基因组学、计算化学和 AI 驱动机器人技术的发展而受到表彰。NVIDIA 创始人兼首席执行官黄仁勋荣获“Luminary award”。
    的头像 发表于 02-17 17:14 783次阅读

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    的 AI 处理效率,成为部署各类 AI 模型的关键依托。 凭借这些卓越的硬件性能,RK3588 开发板保持低功耗的同时,展现出强大的运算能
    发表于 02-14 17:42

    探秘低温锂电池:极寒的能量守护者

    低温锂电池低温环境下展现出卓越性能,让它成为了众多领域不可或缺的 “能量守护者”。相信科技的不断推动下,低温锂电池
    的头像 发表于 01-16 17:14 876次阅读
    探秘低温锂电池<b class='flag-5'>组</b>:极寒<b class='flag-5'>中</b>的能量守护者

    【「基于大模型的RAG应用开发与优化」阅读体验】+大模型微调技术解读

    。通过微调,模型可以学习特定领域的专业知识和语言特征,从而在高度专业化的领域中展现出卓越的表现。微调过程主要有这几项内容:数据清洗:消除噪声、提高数据质量。包括处理缺失值(如用特殊符号
    发表于 01-14 16:51

    NVIDIA 携手行业领先机构推动基因组学、药物发现及医疗健康行业发展

    ——NVIDIA 今日宣布新的合作伙伴关系,旨在通过加速药物发现、提升基因组研究,以及利用代理式和生成式 AI 开创先进医疗服务,推动规模达 10 万亿美元的医疗健康与生命科学产业的变革。   AI、加速计算与生物数据的融合,正将医疗健康产业转变为大规模的技术产业。医疗健康领域的领先机构
    发表于 01-14 13:39 557次阅读
    NVIDIA 携手行业领先机构推动<b class='flag-5'>基因组学</b>、药物发现及医疗健康行业发展

    Kimi发布视觉思考模型k1,展现卓越基础科学能力

    色,其能力还成功扩展到了物理、化学等基础科学领域。这标志着Kimi视觉思考模型的技术研发上取得了重大突破,为用户多个学科领域提供了强大的支持。
    的头像 发表于 12-17 09:59 1083次阅读

    NaVILA:加州大学与英伟达联合发布新型视觉语言模型

    日前,加州大学的研究人员携手英伟达,共同推出了一款创新的视觉语言模型——NaVILA。该模型机器人导航领域展现出了独特的应用潜力,为智能机
    的头像 发表于 12-13 10:51 960次阅读