0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Clara Parabricks 3.7可加速基因组的分析

星星科技指导员 来源:NVIDIA 作者:Vanessa Braunstein 2022-04-06 15:43 次阅读

GPU 驱动的 NVIDIA Clara Parabricks v3 的最新版本。 7 包括对种系变体调用者的更新、对 RNA 序列管道的增强支持以及基因面板的优化工作流程。现在有超过 50 种工具, Clara Parabricks 为临床和研究工作流程中的基因面板、外显子组和基因组提供准确和加速的基因组分析。

迄今为止, Clara Parabricks 已经证明,与基于 CPU 的环境相比,用于全基因组工作流程( 22 分钟内完成端到端分析)和外显子组工作流程( 4 分钟内完成端到端分析)的最先进生物信息学工具的速度提高了 60 倍。大规模测序项目和其他全基因组研究能够在单个 DGX 服务器上每天分析 60 多个基因组,同时降低了相关成本,产生了比以往任何时候都有用的见解。

包括 泰国国家生物银行 、 人类基因组中心与东京大学 、 基因组学研究院 、 圣路易斯华盛顿大学 、 Regeneron 遗传学中心和英国生物银行 和 斯坦福大学 Euan Ashley 的实验室 在内的许多组织正在使用 Clara Parabricks 进行快速基因组和外显子组分析,以用于大人口项目、危重患者以及其他癌症和遗传病项目。他们的工作旨在准确、快速地识别致病变异,与加速的下一代测序和加速的基因组分析保持同步。

NVIDIA Clara Parabricks v3.7 概述

通过支持独特的分子标识符( UMIs ),也称为分子条形码,加快和简化基因面板工作流程。

使用第二个基因融合调用者 Arriba 和 RNA-Seq 定量工具 Kallisto 对转录组工作流的 RNA-Seq 支持。

用 ExpansionHunter 检测短串联重复序列( STR )。

集成最新版本的生殖系调用者 DeepVariant v1 。 1 和 GATK v4 。 2 为单倍型。

一个 10 倍加速的 BAM2FASTQ 工具,用于将存储为 BAM 或 CRAM 文件的存档数据转换回 FASTQ 。数据集可以根据新的和改进的引用进行更新。

poYBAGJNRImADk6SAAEVq02a6m4789.png

poYBAGJNRImADk6SAAEVq02a6m4789.png

图 1:Clara Parabricks 3.7 包括用于基因面板的 UMI 工作流程、用于短串联重复序列的 ExpansionHunter 、包含 DeepVariant 1.1 和 GATK 4.2 版本,以及用于 RNA Seq 工作流程的 Kallisto 和 Arriba 。

Clara Parabricks 3.7 加速和简化了基因面板分析

尽管全基因组测序( WGS )由于大规模的人群计划而不断增长,但基因面板仍然主导着临床基因组分析。随着时间成为临床护理中最重要的因素之一,加速和简化基因小组工作流程对于临床测序中心至关重要。通过进一步减少与基因面板相关的分析瓶颈,这些测序中心可以更快地向临床医生返回结果,提高患者的生活质量。

用于基因检测的癌症样本通常来自实体肿瘤或患者血液(液体活组织检查)中的无细胞 DNA 。与 WGS 的发现工作相比,基因小组狭隘地专注于识别已知基因中的基因变体,这些基因要么会导致疾病,要么可以通过特定疗法进行靶向治疗。

遗传性疾病的基因面板通常测序覆盖率为 100 倍,而癌症测序的基因面板测序深度要高得多,液体活检样本的测序深度高达 1000 倍。检测与癌症相关的低频率体细胞突变需要更高的覆盖率。

为了提高这些基因面板的检测极限,使用了分子条形码或 UMI ,因为它们显著降低了背景噪声。这一检测极限适用于液体活组织检查,可以包括数以万计的检测范围,并与 UMIs 相结合,以识别血液中循环的大海捞针体细胞突变。高深度基因面板测序可以在更多测序读取所需的处理中重新引入计算瓶颈。

使用 Clara Parabricks , UMI 基因面板现在可以比传统工作流程快 10 倍,在不到一小时的时间内产生结果。

分析工作流程也得到了简化。从 raw FASTQ 到 consensus FASTQ ,与传统的 Fulcrum Genomics ( Fgbio )等价物相比,单个命令行运行多个输入,如下面的示例所示。

pYYBAGJNRIqAEz69AADmizKW0mg816.png

pYYBAGJNRIqAEz69AADmizKW0mg816.png

图 2:Clara Parabricks 3.7 与 Fgbio 等效物相比,简化并加速了基因面板 UMI 工作流程。

Arriba 和 Kallisto 的 RNA Seq 支持

正如基因面板对于癌症测序分析很重要一样, RNA-Seq 工作流程对于转录组分析也很重要。除了恒星融合, Clara Parabricks v3 。 7 现在包括 Arriba ,一种基于恒星的融合检测算法 RNA 序列比对器。基因融合是两个不同的基因由于染色体的巨大改变而结合在一起,与从白血病到实体瘤等多种不同类型的癌症有关。

Arriba 还可以检测病毒整合位点、内部串联重复、整外显子重复、环状 RNA 、涉及免疫球蛋白/ T 细胞受体位点的增强子劫持事件以及内含子或基因间区域的断点。

Clara Parabricks v3 。 7 还结合了 Kallisto ,这是一种基于伪比对的快速 RNA 序列量化工具,可从批量或单细胞 RNA 序列数据集中识别转录物丰度(基于测序读取计数的 aka 基因表达水平)。 RNA 序列数据的比对是 RNA 序列分析工作流程的第一步。 Clara Parabricks 3.7 提供了转录本定量、读取比对和融合调用的工具,现在提供了一整套支持多个 RNA 序列工作流的工具。

用 ExpansionHunter 进行短串联重复检测

为了支持从短读测序数据中对短串联重复序列( STR )进行基因分型,在 Parabricks v3 中添加了 ExpansionHunter 支持。 STR ,也称为微卫星,在人类基因组中普遍存在。这些非编码 DNA 区域具有类似手风琴的 DNA 延伸,包含长度在 2 到 7 个核苷酸之间的核心重复单元,串联重复,最多几十次。

STR 在遗传图谱构建、基因定位、遗传连锁分析、个体鉴定、亲子鉴定、群体遗传学和疾病诊断等应用中非常有用。

人类基因组中有许多区域由这些重复序列组成,它们的重复次数会增加,从而导致疾病。脆性 X 综合征、肌萎缩侧索硬化症和亨廷顿氏病是常见的重复相关疾病。

ExpansionHunter 旨在通过对 BAM / CRAM 文件执行有针对性的搜索来估计重复序列的大小,以便对每个 STR 中完全包含的跨、侧翼和侧翼读取进行排序。

添加体细胞呼叫者并支持归档数据

2021 以前的版本 Clara Parabricks 带来了一系列新的工具,最重要的是增加了五个躯体学呼叫者 MuSE 、 LoFReq 、 StRekA2 、 MutuSc2 和体细胞狙击手,用于全面的癌症基因组分析。

poYBAGJNRI2AC_3WAAOwFwK-y2o975.png

poYBAGJNRI2AC_3WAAOwFwK-y2o975.png

图 3:Clara Parabricks v3 。 6.1 和 3.7 包括用于全面加速癌症基因组分析的五位躯体来电者 Muse 、 LoFreq 、 Strelka2 、 Mutect2 和 SomaticSniper 。

此外,还添加了一些工具,以便在删除原始 FASTQ 文件以节省存储空间的情况下利用归档数据。 BAM2FASTQ 是 GATK Sam2fastq 的加速版本,它将现有 BAM 或 CRAM 文件转换为 FASTQ 文件。这允许用户将测序读数重新调整到一个新的参考基因组,这将允许调用更多的变体,同时为研究人员提供将所有数据标准化为同一参考的能力。使用现有的 fq2bam 工具, Clara Parabricks 可以在不到 2 小时的时间内将读取从一个参照物重新排列到另一个参照物,从而获得 30 倍的全基因组。

pYYBAGJNRJWAUkkMAAQDKc_o6SQ295.png

pYYBAGJNRJWAUkkMAAQDKc_o6SQ295.png

图 4:Clara Parabricks v3 。 7 添加了带有单倍型调用程序的种系变体调用程序 DeepVariant 1.1 和 GATK 4.2 的最新版本。

使用 免费提供 90 天试用评估许可证 为您的种系、癌症和 RNA 序列分析工作流试用 GPU 加速的 NVIDIA Clara Parabricks 基因组分析工具。

通道 NVIDIA Clara 抛物面 通过 AWS Marketplace 在本地或云中进行。

关于作者

Vanessa Braunstein 在 NVIDIA 的医疗团队从事产品营销工作。此前,她在基因组学、医学成像、制药、化学和诊断公司从事产品开发和营销。她学习分子和细胞生物学、公共卫生和商业。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4592

    浏览量

    101719
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126705
收藏 人收藏

    评论

    相关推荐

    3.7V锂电池浪涌静电防护方案详解

    3.7V锂电池是一种标称电压为3.7V,满电电压为4.2V的锂电池,其容量从几百到几千毫安时不等,一般应用于各种仪器仪表、检测仪器、医疗仪器、POS机、笔记本电脑等产品上。浪涌静电,可谓是无处不在。针对3.7V锂电池浪涌静电保护
    的头像 发表于 01-18 09:24 490次阅读
    <b class='flag-5'>3.7</b>V锂电池浪涌静电防护方案详解

    如何使用SBC ToolBox云平台进行时间序列分析

    使用SBC ToolBox云平台时间序列分析模块探索基因集在不同时间点的表达趋势,使用c-means算法对基因集进行聚类分群,寻找出表达趋势一致的基因集。
    的头像 发表于 09-20 16:52 689次阅读
    如何使用SBC ToolBox云平台进行时间序列<b class='flag-5'>分析</b>?

    PCR基因扩增实验室装修设计解决方案-生命科学

    的预防与控制: PCR实验室设计的核心问题是如何避免污染。在实际工作中,常见的有以下几种污染类型:扩增产物的污染;天然基因组DNA的污染;试剂的污染以及标本间的污染。由于一旦发生污染,实验就必须停止
    发表于 09-19 14:28

    3.7V转3.3V,3.7V转1.5V芯片FS2405

    3.7V转3.3V,3.7V转1.5V芯片FS2405
    发表于 09-18 16:30 1次下载

    你身体里有光伏人基因吗?6大职业特征

                原文标题:你身体里有光伏人基因吗?6大职业特征 文章出处:【微信公众号:纳芯微电子】欢迎添加关注!文章转载请注明出处。
    的头像 发表于 09-07 12:00 214次阅读
    你身体里有光伏人<b class='flag-5'>基因</b>吗?6大职业特征

    基因检测仪热保护器工作原理

    基因检测仪通常需要在特定温度范围内进行反应和放大DNA样本。基因检测仪中的热保护器在PCR(聚合酶链反应)和其他分子生物学实验中起到关键作用,确保反应在稳定的温度条件下进行,从而产生准确和可靠的结果。以下是基因检测仪中热保护器的
    的头像 发表于 08-18 13:08 500次阅读
    <b class='flag-5'>基因</b>检测仪热保护器工作原理

    基于液滴微流控的亚硫酸盐测序平台研究

    基因组DNA甲基化图谱在整个表观基因组图谱中具有重要意义。单细胞DNA甲基化组学研究为根据甲基化组学特征检测和分析细胞亚群提供强大助力。
    的头像 发表于 08-17 09:11 868次阅读
    基于液滴微流控的亚硫酸盐测序平台研究

    数字赋能,擎科智能化基因工厂推动产业发展

    北京2023年8月14日 /美通社/ -- 近日,擎科生物副总裁赵春德作客阿里云创新中心直播间,与阿里云产品解决方案架构师石益一起,围绕"基因工厂"话题共话基因合成领域的数字化、产业化和工程化
    的头像 发表于 08-14 22:21 635次阅读

    Arm RAN加速库资料

    Arm RAN加速库(ArmRAL)包含一用于加速电信应用的功能,例如但不限于5G无线电接入网络(RAN)。 Arm RAN加速库23.07包提供了一个针对基于Arm AArch64
    发表于 08-08 07:46

    GPU助力基因组重测序分析

    等。随着近几年基因测序成本如图 1所示不断下降,在万元内即可完成人类的全基因组测序,GPU的技术发展也带来分析成本与时间的下降,于是用于检测基因组变化的重测序技术在癌症治疗中起到了越来
    的头像 发表于 08-01 10:32 1154次阅读
    GPU助力<b class='flag-5'>基因组</b>重测序<b class='flag-5'>分析</b>

    基因组重测序的应用领域有哪些

    背景介绍 1.1 基因测序在癌症领域上的应用 癌症是目前人类所面临的最大敌人,其发病率随着年龄增长而升高,在人口老龄化加剧的当下,全社会的癌症负担也将愈发严峻。癌症难以治愈的原因之一是肿瘤具有
    的头像 发表于 08-01 10:29 1578次阅读
    <b class='flag-5'>基因组</b>重测序的应用领域有哪些

    NVIDIA Parabricks v4.1的功能

    NVIDIA Parabricks 4.1 中的长读测序工作流和更高吞吐量
    的头像 发表于 07-05 16:30 426次阅读
    NVIDIA <b class='flag-5'>Parabricks</b> v4.1的功能

    利用深度学习模型最大限度地提高外显子组测序分析的准确性

    使用 NVIDIA Parabricks ,通过深度学习加速整个外显子组分析,降低 70% 的成本
    的头像 发表于 07-05 16:30 315次阅读
    利用深度学习模型最大限度地提高外显子组测序<b class='flag-5'>分析</b>的准确性

    用于基因组学、转录组学和临床研究的综合NGS软件

    直观的项目设置和分析,与我们获得专利的组装算法相结合,使您能够以无与伦比的轻松和速度组装和对齐NGS数据,以便您可以专注于结果。不再需要在软件工具之间切换来组装序列、识别重要变异并确定差异表达基因。你需要的一切都在这里。
    的头像 发表于 07-03 16:27 864次阅读
    用于<b class='flag-5'>基因组</b>学、转录组学和临床研究的综合NGS软件

    利用水凝胶涂层实现硬质微球在液滴中的超泊松分布装载

    在液滴中高效率地封装单个功能化微球对基于液滴的高通量分析具有至关重要的作用,如单细胞基因组学和数字免疫分析
    的头像 发表于 06-09 10:57 843次阅读
    利用水凝胶涂层实现硬质微球在液滴中的超泊松分布装载