0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Clara Parabricks 3.7可加速基因组的分析

星星科技指导员 来源:NVIDIA 作者:Vanessa Braunstein 2022-04-06 15:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

GPU 驱动的 NVIDIA Clara Parabricks v3 的最新版本。 7 包括对种系变体调用者的更新、对 RNA 序列管道的增强支持以及基因面板的优化工作流程。现在有超过 50 种工具, Clara Parabricks 为临床和研究工作流程中的基因面板、外显子组和基因组提供准确和加速的基因组分析。

迄今为止, Clara Parabricks 已经证明,与基于 CPU 的环境相比,用于全基因组工作流程( 22 分钟内完成端到端分析)和外显子组工作流程( 4 分钟内完成端到端分析)的最先进生物信息学工具的速度提高了 60 倍。大规模测序项目和其他全基因组研究能够在单个 DGX 服务器上每天分析 60 多个基因组,同时降低了相关成本,产生了比以往任何时候都有用的见解。

包括 泰国国家生物银行 、 人类基因组中心与东京大学 、 基因组学研究院 、 圣路易斯华盛顿大学 、 Regeneron 遗传学中心和英国生物银行 和 斯坦福大学 Euan Ashley 的实验室 在内的许多组织正在使用 Clara Parabricks 进行快速基因组和外显子组分析,以用于大人口项目、危重患者以及其他癌症和遗传病项目。他们的工作旨在准确、快速地识别致病变异,与加速的下一代测序和加速的基因组分析保持同步。

NVIDIA Clara Parabricks v3.7 概述

通过支持独特的分子标识符( UMIs ),也称为分子条形码,加快和简化基因面板工作流程。

使用第二个基因融合调用者 Arriba 和 RNA-Seq 定量工具 Kallisto 对转录组工作流的 RNA-Seq 支持。

用 ExpansionHunter 检测短串联重复序列( STR )。

集成最新版本的生殖系调用者 DeepVariant v1 。 1 和 GATK v4 。 2 为单倍型。

一个 10 倍加速的 BAM2FASTQ 工具,用于将存储为 BAM 或 CRAM 文件的存档数据转换回 FASTQ 。数据集可以根据新的和改进的引用进行更新。

poYBAGJNRImADk6SAAEVq02a6m4789.png

poYBAGJNRImADk6SAAEVq02a6m4789.png

图 1:Clara Parabricks 3.7 包括用于基因面板的 UMI 工作流程、用于短串联重复序列的 ExpansionHunter 、包含 DeepVariant 1.1 和 GATK 4.2 版本,以及用于 RNA Seq 工作流程的 Kallisto 和 Arriba 。

Clara Parabricks 3.7 加速和简化了基因面板分析

尽管全基因组测序( WGS )由于大规模的人群计划而不断增长,但基因面板仍然主导着临床基因组分析。随着时间成为临床护理中最重要的因素之一,加速和简化基因小组工作流程对于临床测序中心至关重要。通过进一步减少与基因面板相关的分析瓶颈,这些测序中心可以更快地向临床医生返回结果,提高患者的生活质量。

用于基因检测的癌症样本通常来自实体肿瘤或患者血液(液体活组织检查)中的无细胞 DNA 。与 WGS 的发现工作相比,基因小组狭隘地专注于识别已知基因中的基因变体,这些基因要么会导致疾病,要么可以通过特定疗法进行靶向治疗。

遗传性疾病的基因面板通常测序覆盖率为 100 倍,而癌症测序的基因面板测序深度要高得多,液体活检样本的测序深度高达 1000 倍。检测与癌症相关的低频率体细胞突变需要更高的覆盖率。

为了提高这些基因面板的检测极限,使用了分子条形码或 UMI ,因为它们显著降低了背景噪声。这一检测极限适用于液体活组织检查,可以包括数以万计的检测范围,并与 UMIs 相结合,以识别血液中循环的大海捞针体细胞突变。高深度基因面板测序可以在更多测序读取所需的处理中重新引入计算瓶颈。

使用 Clara Parabricks , UMI 基因面板现在可以比传统工作流程快 10 倍,在不到一小时的时间内产生结果。

分析工作流程也得到了简化。从 raw FASTQ 到 consensus FASTQ ,与传统的 Fulcrum Genomics ( Fgbio )等价物相比,单个命令行运行多个输入,如下面的示例所示。

pYYBAGJNRIqAEz69AADmizKW0mg816.png

pYYBAGJNRIqAEz69AADmizKW0mg816.png

图 2:Clara Parabricks 3.7 与 Fgbio 等效物相比,简化并加速了基因面板 UMI 工作流程。

Arriba 和 Kallisto 的 RNA Seq 支持

正如基因面板对于癌症测序分析很重要一样, RNA-Seq 工作流程对于转录组分析也很重要。除了恒星融合, Clara Parabricks v3 。 7 现在包括 Arriba ,一种基于恒星的融合检测算法 RNA 序列比对器。基因融合是两个不同的基因由于染色体的巨大改变而结合在一起,与从白血病到实体瘤等多种不同类型的癌症有关。

Arriba 还可以检测病毒整合位点、内部串联重复、整外显子重复、环状 RNA 、涉及免疫球蛋白/ T 细胞受体位点的增强子劫持事件以及内含子或基因间区域的断点。

Clara Parabricks v3 。 7 还结合了 Kallisto ,这是一种基于伪比对的快速 RNA 序列量化工具,可从批量或单细胞 RNA 序列数据集中识别转录物丰度(基于测序读取计数的 aka 基因表达水平)。 RNA 序列数据的比对是 RNA 序列分析工作流程的第一步。 Clara Parabricks 3.7 提供了转录本定量、读取比对和融合调用的工具,现在提供了一整套支持多个 RNA 序列工作流的工具。

用 ExpansionHunter 进行短串联重复检测

为了支持从短读测序数据中对短串联重复序列( STR )进行基因分型,在 Parabricks v3 中添加了 ExpansionHunter 支持。 STR ,也称为微卫星,在人类基因组中普遍存在。这些非编码 DNA 区域具有类似手风琴的 DNA 延伸,包含长度在 2 到 7 个核苷酸之间的核心重复单元,串联重复,最多几十次。

STR 在遗传图谱构建、基因定位、遗传连锁分析、个体鉴定、亲子鉴定、群体遗传学和疾病诊断等应用中非常有用。

人类基因组中有许多区域由这些重复序列组成,它们的重复次数会增加,从而导致疾病。脆性 X 综合征、肌萎缩侧索硬化症和亨廷顿氏病是常见的重复相关疾病。

ExpansionHunter 旨在通过对 BAM / CRAM 文件执行有针对性的搜索来估计重复序列的大小,以便对每个 STR 中完全包含的跨、侧翼和侧翼读取进行排序。

添加体细胞呼叫者并支持归档数据

2021 以前的版本 Clara Parabricks 带来了一系列新的工具,最重要的是增加了五个躯体学呼叫者 MuSE 、 LoFReq 、 StRekA2 、 MutuSc2 和体细胞狙击手,用于全面的癌症基因组分析。

poYBAGJNRI2AC_3WAAOwFwK-y2o975.png

poYBAGJNRI2AC_3WAAOwFwK-y2o975.png

图 3:Clara Parabricks v3 。 6.1 和 3.7 包括用于全面加速癌症基因组分析的五位躯体来电者 Muse 、 LoFreq 、 Strelka2 、 Mutect2 和 SomaticSniper 。

此外,还添加了一些工具,以便在删除原始 FASTQ 文件以节省存储空间的情况下利用归档数据。 BAM2FASTQ 是 GATK Sam2fastq 的加速版本,它将现有 BAM 或 CRAM 文件转换为 FASTQ 文件。这允许用户将测序读数重新调整到一个新的参考基因组,这将允许调用更多的变体,同时为研究人员提供将所有数据标准化为同一参考的能力。使用现有的 fq2bam 工具, Clara Parabricks 可以在不到 2 小时的时间内将读取从一个参照物重新排列到另一个参照物,从而获得 30 倍的全基因组。

pYYBAGJNRJWAUkkMAAQDKc_o6SQ295.png

pYYBAGJNRJWAUkkMAAQDKc_o6SQ295.png

图 4:Clara Parabricks v3 。 7 添加了带有单倍型调用程序的种系变体调用程序 DeepVariant 1.1 和 GATK 4.2 的最新版本。

使用 免费提供 90 天试用评估许可证 为您的种系、癌症和 RNA 序列分析工作流试用 GPU 加速的 NVIDIA Clara Parabricks 基因组分析工具。

通道 NVIDIA Clara 抛物面 通过 AWS Marketplace 在本地或云中进行。

关于作者

Vanessa Braunstein 在 NVIDIA 的医疗团队从事产品营销工作。此前,她在基因组学、医学成像、制药、化学和诊断公司从事产品开发和营销。她学习分子和细胞生物学、公共卫生和商业。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5685

    浏览量

    110111
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136059
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    筑基AI4S:摩尔线程全功能GPU加速中国生命科学自主生态

    精准医疗与药物研发正被人工智能深刻重塑。作为AI for Science(AI4S)领域的核心阵地,解码生命奥秘的关键已从实验观测转向算力与算法的协同突破。蛋白质结构预测、基因组分析与医学影像,构成
    的头像 发表于 04-17 17:47 1105次阅读
    筑基AI4S:摩尔线程全功能GPU<b class='flag-5'>加速</b>中国生命科学自主生态

    OCAD应用:双联动补偿式连续变焦系统

    联动补偿式连续变焦系统初始结构设计方法和三元连续变焦系统设计方法类似,他是在三元变焦系统的基础上对变焦组分割后扩展起来的。变焦的分割有两种方法,一是把变焦组分割为两块分别置于
    发表于 04-14 08:33

    芯科科技助力涂鸦智能推出免编码AIoT平台

    新平台可加速智能照明创新进程及人工智能物联网(AIoT)生态系统构建
    的头像 发表于 01-21 11:28 325次阅读

    算力赋能,打造生命科学云上新范式

    一站式分析服务,轻松应对学数据繁复、分析门槛高、项目协作难等挑战。该平台全面支撑蛋白质结构预测、时空学、单细胞与基因组数据
    的头像 发表于 01-12 14:01 556次阅读

    第十二届全国功能基因组学高峰论坛在京举办:聚焦人工智能与多组学融合发展

    时维金秋,群贤毕至。2025年第十二届全国功能基因组学高峰论坛(FGC-12)近日在北京圆满落幕。本届论坛汇聚了包括60余位国内顶尖学者在内的近500名科研院所、高等院校及行业代表,围绕“融汇学・
    的头像 发表于 11-19 17:05 642次阅读
    第十二届全国功能<b class='flag-5'>基因组</b>学高峰论坛在京举办:聚焦人工智能与多组学融合发展

    一文了解Mojo编程语言

    ,利用硬件加速提升效率。 科学计算与数据处理 高效处理大规模数值分析基因组学数据等任务。 系统工具开发 开发操作系统级工具,结合 Python 的便捷性和 C 的性能优势。 嵌入式与实时应用 适用于
    发表于 11-07 05:59

    NVIDIA Clara开放模型加速科学与医疗行业变革

    Clara 为从预测蛋白质结构到设计可在实验室合成的分子的整个早期药物发现流程提供支持。
    的头像 发表于 11-06 11:42 1117次阅读

    序祯达生物利用NVIDIA Parabricks技术加速多组学分析

    序祯达生物是中国领先的多组学和测序服务提供商之一,该公司利用 NVIDIA Parabricks加速多组学分析。借助 Parabricks,序祯达生物将全
    的头像 发表于 09-29 16:05 1152次阅读

    NVMe高速传输之摆脱XDMA设计17:PCIe加速模块设计

    PCIe加速模块负责实现PCIe传输层任务的处理,同时与NVMe层进行任务交互。如图1所示,PCIe加速模块按照请求发起方分为请求模块和应答模块。请求模块负责将内部请求事务转化为配置管理接口信号或
    发表于 08-07 18:57

    今日看点丨我国团队研制出系列牛用基因芯片;Littelfuse推出紧凑型PTS647轻触开关系列

    1、我国团队研制出系列牛用基因芯片 日前,国家乳液技术创新中心传来消息,该中心技术研发团队成功研制出奶牛种用胚胎基因组遗传评估芯片和“高产、抗病、长生产期”功能强化基因组预测芯片。该系列基因
    发表于 07-22 11:26 2306次阅读
    今日看点丨我国团队研制出系列牛用<b class='flag-5'>基因</b>芯片;Littelfuse推出紧凑型PTS647轻触开关系列

    SK海力士的未来愿景

    1969年,40万名科技工作者凭借坚韧不拔的协作精神,成功完成登月计划“阿波罗11号任务”,开启了人类探索宇宙的新纪元。2003年,来自6个国家20多家研究机构的科学家,历经13年通力合作,完成了“人类基因组计划”,重塑了现代医学格局。当人类团结一心,便能够不断创造新的辉煌。
    的头像 发表于 07-21 15:57 974次阅读

    微软医疗智能体协调器赋能开发者加速临床医疗创新进程

    基因组数据与电子健康记录整合,通过多智能体协同编排功能将癌症决策流程从数小时压缩至分钟级,并能够直接嵌入Microsoft Teams、Microsoft Worcd等工具,赋能开发者加速临床医疗创新进程。
    的头像 发表于 06-30 09:49 4113次阅读
    微软医疗智能体协调器赋能开发者<b class='flag-5'>加速</b>临床医疗创新进程

    中科曙光构建全国产化基因组学高性能计算平台

    近日,中科曙光承建的国内某研究所基因组学高性能计算平台正式交付。这是国内生物信息学领域首个从底层硬件到上层软件实现完全自主可控,并深度融合高性能计算与人工智能算力的平台,成功填补了该领域国产高端算力的空白。
    的头像 发表于 06-26 17:36 1138次阅读

    SL4010升压芯片:3.7V升5V 3.7V升12V解决方案

    SL4010升压芯片:3.7V升5V/12V解决方案的优选方案 随着便携式设备、LED照明等领域的快速发展,高效稳定的升压电源管理芯片需求日益增长。SL4010作为一款高性能DC-DC升压芯片
    发表于 05-07 16:31

    FPGA时序约束之设置时钟

    Vivado中时序分析工具默认会分析设计中所有时钟相关的时序路径,除非时序约束中设置了时钟或false路径。使用set_clock_groups命令可以使时序分析工具不
    的头像 发表于 04-23 09:50 1637次阅读
    FPGA时序约束之设置时钟<b class='flag-5'>组</b>