0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于炼丹神器深度学习下的生命科学冷冻电镜单细胞基因分析的解决方案

GPU视觉识别 来源:GPU视觉识别 作者:GPU视觉识别 2022-10-20 11:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当前随着冷冻电镜、蛋白质组学、深度学习、基因测序、卷积神经网络、高性能计算、单细胞基因、数据挖掘、数据分析、靶点发现、晶体预测、AlphaFold等技术的快速发展,生命科学开始被逐渐被人们所重视。

生命科学行业涉及研究微生物、动植物等一切生物的科学领域,也包括生命伦理学等相关领域的考量。生命科学的研究对提高人类生活质量有很大帮助。从全球范围来看,21世纪以来,全球生命科学发展进入快车道,特别是人类基因组计划的实施、干细胞研究的深入、克隆技术的不断发展等因素将生命科学的发展推向了新的高度,同时相应领域的研发投入也在不断增加。作为强烈依赖科技信息技术的典型代表,生命科学行业的药物研发和基因测序分析领域面临着计算资源短缺、研发周期长等问题。

poYBAGNQvHKAQVOXAAdAanSOzQQ199.png

生命科学领域面临的挑战

清华大学生命科学学院生物计算平台主管杨涛认为:冷冻电镜目前在科研方向的挑战分别是:数据管理的挑战,科研进度的挑战和实验风险的挑战。

一、数据管理

源于超量数据,在最大化压缩的前提下,每天大约会产生4TB的数据量。为了使计算设备的效率最大化,需要365天不间断工作。一年的数据总量非常惊人,给数据管理带来巨大的挑战。

二、科研管理

冷冻电镜技术已经备受认可,各科研机构都在调动资源抢占高地,所以存在时间效率的问题,哪怕比别人慢半天,都会失去首发的价值。

三、实验风险

这是一个非常长时间的实验流水线,任何中间环节都存在风险。一旦不能及时解决风险,整个系统的产出就会大打折扣。

pYYBAGNQvHKACXDnAAI5liPGK1U626.png

客户需求

某学院单细胞基因组研究技术中心(简称“该中心”)旨在建立标准化、自动化的工程技术,提高单细胞结构分析水平,高精度确定从蛋白质分子到全细胞的三维结构,并在此基础上揭示蛋白质及其复合体功能,大规模制备蛋白/抗体,建成具有国际一流水平和综合示范功能的蛋白质科学研究核心基地。

就生命科学研究项目而言,每个项目涉及的数据量小在上百TB。对于时间周期长、领域广的项目,未来数据需求可能在PB级。此外,该中心需要考虑支持多种生命科学研究项目,而其中,不同应用对高性能平台计算环境有不同的要求,如基因测序需要高I/O性能和内存大消耗,而分子动力学研究除了I/O性能外,还需要较高的网络和并发处理能力。所有这些都对该中心构建高性能平台提出了挑战:

一、数据量增长10多倍,计算能力也要“跟上”

研究团队采用的冷冻电镜技术在近两年取得了革命性的进展,具体来说就是相机技术实现了飞跃,采集数据的能力提高了10多倍,甚至上百倍,从而使得研究蛋白质结构的源数据呈几何级数增长,这就需要中心在后期全面提升数据处理和计算能力。

二、亟需简化管理保障服务品质

随着生命科学研究项目越来越多,如何根据不同项目和研究人员个性化需求分配资源,及时回收资源,实现跨整个高性能资源池的集中统一管理,简化维护管理,减轻运维人员负担,是科研高性能计算平台普遍面临问题。

三、TCO居高不下

生命科学研究迅速成为国家战略发展方向,导致研究项目和跨学科研究需求快速增加。传统的分层计算存储资源利用率低,导致新增费用快速增加。此外,能耗也成为阻碍高性能计算中心扩展的不可逾越的“高墙”。

四、网络性能不能拖后腿

作为保证高性能集群正常运行的关键,高性能网络承担着重要的连接任务。随着单节点计算和存储性能的不断提升,高性能用户需要万兆,四万兆,十万兆,InfiniBand网络选择以满足不同的高性能计算需求。

解决方案特点

蓝海大脑基于融合架构助力某学院单细胞基因组研究技术中心搭建了一个分布式高性能平台,拥有250个物理计算节点,5000个计算核心,总存储容量1.92PB,理论计算能力208Tflops。通过Lustre技术实现了跨20个融合架构的集中统一管理。

一、4.1TFLOPS/U的计算密度,4倍性能提升

可针对不同项目量身定制配置。其中,高密度计算节点支持14核英特尔®至强TM E5-2600v3处理器,在2U中拥有224个计算核心的密度,单U空间的计算性能密度达到业界领先的4.1TFLOPS,同时支持64个DIMM高密度内存,确保高性能和低延迟的性能要求。此外,还支持InfiniBand接口,非常适合要求超低延迟的工作负载。在强大计算能力的保证下,计算效率提升3-4倍,过去4-5天才能完成的计算任务,一天就能完成。

二、简化高性能资源池监控管理

根据项目要求定制不同的系统配置,同时通过机箱管理控制器(CMC),可以集中监控和管理20个FX系统。此外,无代理生命周期管理和一对多远程管理功能可确保BIOS和固件程序更新不会影响业务稳定性,并提高系统中计算节点生命周期管理的效率。而且在扩展服务器时,IT人员可以通过下发配置文件,使系统自动更新BIOS和固件程序,避免了重复输入配置参数的繁琐过程,减少了人工输入错误导致的系统故障,简化了管理运维,降低了管理费用。

三、TCO降低约20%

自动化、高密度、低能耗的集成部署、集中统一管理,可以使中心的TCO降低20%左右。其中,蓝海大脑将通过主板连接服务器、存储和1G0b网络,通过模块化设计形成融合一体机,同时提供散热、供电、网络、管理和PCIe扩展的共享插槽,降低数据中心的占地和能耗,帮助中心获得良好的性价比。

四、高速网络保障平台I/O性能

蓝海大脑为中心提供四万兆高性能网络,在保持成本优势的基础上,为用户提供稳定的网络性能,保证高性能、低延迟要求。

五、打破原有的服务器散热方式,采用液冷散热

蓝海大脑液冷服务器系统突破传统风冷散热模式,采用风冷和液冷混合散热模式——服务器内主要热源 CPU 利用液冷冷板进行冷却,其余热源仍采用风冷方式进行冷却。通过这种混合制冷方式,可大幅提升服务器散热效率,同时,降低主要热源 CPU 散热所耗电能,并增强服务器可靠性。经检测,采用液冷服务器配套基础设施解决方案的数据中心年均 PUE 值可降低至 1.2 以下。

poYBAGNQvHOACZlhAAZltQ8jCCY461.png

客户收益

一、蓝海大脑HPC高性能计算与AI平台已成为高性能、多功能、专业的前沿计算平台,尤其在AI深度学习方面,为校内外生物学研究提供高效的计算支持。同时为计算生物学、深度学习、基因测序等多个研究组提供计算服务。包括测序仪的离线处理、序列搜寻比对分析、分子动力学模拟、计算机辅助药物设计和分子对接、生物网络的计算。

二、全力支持基于深度学习的分子图编码和基于深度学习的中药方剂系统的研发。研发人员可以利用HPC高性能计算和AI平台开发基于三维分子图谱的深度学习编码,进行基于深度学习的中医诊断处方。多任务分子预测模型由卷积神经网络或递归神经网络构成。交叉验证用于调整和验证参数,外部数据用于测试和评估模型。同时,从预测模型中挖掘关键信息。同时通过卷积神经网络或递归神经网络学习大量的方剂配伍信息,然后用主药生成语义自动关联分析得到的辅药,从而生成新的方剂。蓝海大脑HPC高性能计算和AI平台提供了高效并行的计算资源,大大加快了模型的训练速度,从而在有效的时间内完成最终的任务。

三、支持基于化学片段的从头计算药物设计,对疾病的治疗和生物学功能的理解有重要的促进作用。传统的药物筛选过程耗时长,成本高,导致整个药物设计和发现过程效率低下。为了加快药物设计和发现的进程,研究人员利用这一平台逐步发展了分子从头设计的方法,并取得了良好的效果。研究人员通过蒙特卡洛树搜索和神经网络模型的结合,实现了巨大化学空间的搜索和最优结构的采样,快速完成了完整的从头计算药物设计过程,并探索了蛋白质口袋表征和评分功能。

四、利用深度学习框架构建深度学习模型,加强学习模型的训练,实现深度学习的评分函数模型的训练和测试,并对模型进行训练。对于模型生成的分子,通过聚类分析分子的合成、毒性和理化性质,选择合适的分子。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90886
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123907
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    从“波长困境”到“光谱自由”:OPSL技术如何重塑生命科学的激光应用范式

    生命科学领域,激光技术早已成为现代仪器不可或缺的核心部件,其性能直接决定了实验的灵敏度、分辨率和可靠性。从流式细胞术的精准分选到共聚焦显微镜的高清成像,再到高通量基因测序的快速解读,激光光源的质量
    的头像 发表于 12-05 15:43 10次阅读
    从“波长困境”到“光谱自由”:OPSL技术如何重塑<b class='flag-5'>生命科学</b>的激光应用范式

    北京理工大学与中科曙光成功研发大规模冷冻电镜图像原位重构软件

    冷冻电镜技术是解析生物大分子三维结构的关键手段,曾获2017年诺贝尔化学奖,并在新冠病毒结构解析中发挥重要作用。然而,该技术的数据处理面临图像信噪比低、计算规模巨大、重构耗时长等挑战,尤其在大规模原位结构解析中缺乏高效算法与软件支持。
    的头像 发表于 10-31 14:45 406次阅读

    压电物镜定位器让冷冻电子显微镜中的原子清晰可见

    项技术的核心挑战之一,便是在原子冷冻的状态,也能实现极高的成像精度。 一、冷冻电子显微镜:窥探原子结构的眼睛 冷冻电子显微镜(Cryo-electron microscopy,简称c
    的头像 发表于 08-22 08:55 904次阅读
    压电物镜定位器让<b class='flag-5'>冷冻电</b>子显微镜中的原子清晰可见

    2025施耐德电气电子及生命科学新质生产力峰会成功举办

    近日,以“破界新生,致电未来”为主题的2025施耐德电气电子及生命科学新质生产力峰会在杭州成功举办。施耐德电气携手行业专家、生态伙伴及客户,围绕产业数智化转型升级,聚焦全球领先的绿色能源管理、绿色
    的头像 发表于 07-15 10:12 656次阅读

    施耐德电气助力生命科学行业数字化转型

    2025,生命科学行业的数字化转型趋势在何处?企业正面临哪些转型难点?
    的头像 发表于 07-02 09:53 570次阅读

    AI在医疗健康和生命科学中的发展现状

    NVIDIA 首次发布的“AI 在医疗健康和生命科学中的现状”调研,揭示了生成式和代理式 AI 如何帮助医疗专业人员在药物发现、患者护理等领域节省时间和成本。
    的头像 发表于 04-14 14:10 736次阅读

    西门子51亿美元收购Dotmatics 加码AI生命科学赛道

    德国工业巨头西门子已同意以51亿美元收购Dotmatics,作为向生命科学公司提供更多人工智能软件战略举措的一部分。 这家德国企业在周三发布的一份声明中宣布了对这家由Insight Partners
    的头像 发表于 04-03 17:37 520次阅读

    IBM Spectrum LSF在生命科学和生物制药领域的应用

    随着基因测序技术的突破、蛋白质组学,分子动力学研究的深入以及 AI 技术的崛起,生命科学与生物制药领域正经历前所未有的变革。
    的头像 发表于 03-06 09:25 803次阅读

    IBM Maximo助力生命科学行业合规远航

    近日,德勤发布的《2024中国高科技高成长 50强及明日之星报告》[1]指出,在所有高增长领域中,生命科学在近三年内比重逐年攀升,占比达到 36%,首次超越了软件与硬件行业,并位居榜首。在荣膺“中国
    的头像 发表于 02-18 09:17 939次阅读

    材料的哪些性质会影响扫描电镜的成像效果

    中图仪器扫描电镜通过加装各类探头和附件,满足用户的拓展性需求,这使其在材料科学生命科学、纳米技术、能源等多个领域得到了广泛应用。
    发表于 02-14 09:47 0次下载

    中科曙光助力浙江精准医疗实验室突破算力瓶颈

    近日,位于浙江的一家前沿精准医疗实验室,正依托先进的冷冻电镜等高端装备,深入探索基因诊断、分子分型、细胞基因治疗等多个精准医疗领域的奥秘。这些领域的研究对于推动医疗科技的发展、提高疾
    的头像 发表于 02-13 14:42 890次阅读

    中科曙光高端计算解决方案助力精准医疗科研工作

    近日,浙江某精准医疗实验室依托冷冻电镜等先进装备,探索基因诊断、分子分型、细胞基因治疗等前沿领域。为突破冷冻电镜场景算力瓶颈,中科曙光高端
    的头像 发表于 02-12 17:42 993次阅读

    扫描电镜有哪些作用?

    扫描电镜作为一种用于微观结构分析的重要仪器,在材料科学生命科学、地质科学、电子信息等多个领域都有重要作用。它具有以下显著特征:1.高分辨率
    的头像 发表于 02-12 14:42 1775次阅读
    扫描<b class='flag-5'>电镜</b>有哪些作用?

    借助NVIDIA AI Foundry平台推动医疗健康与生命科学行业发展

    借助 NVIDIA AI Foundry,全球领先的临床研究与商业服务提供商 IQVIA 将为其全球生命科学领域的客户提供 AI 智能体,助力加速药物研发、数据管理及商业化等复杂工作流。
    的头像 发表于 01-17 09:59 1271次阅读

    施耐德电气助力生命科学与电子行业的可持续发展

    在上一期《行业·启施录》之中,施家智囊团与行业大咖们共同探讨了新质生产力时代生命科学与电子行业的机遇与挑战。
    的头像 发表于 12-09 10:02 762次阅读