0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Clara Parabricks 3.7可加速基因组的分析

星星科技指导员 来源:NVIDIA 作者:Vanessa Braunstein 2022-04-06 15:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

GPU 驱动的 NVIDIA Clara Parabricks v3 的最新版本。 7 包括对种系变体调用者的更新、对 RNA 序列管道的增强支持以及基因面板的优化工作流程。现在有超过 50 种工具, Clara Parabricks 为临床和研究工作流程中的基因面板、外显子组和基因组提供准确和加速的基因组分析。

迄今为止, Clara Parabricks 已经证明,与基于 CPU 的环境相比,用于全基因组工作流程( 22 分钟内完成端到端分析)和外显子组工作流程( 4 分钟内完成端到端分析)的最先进生物信息学工具的速度提高了 60 倍。大规模测序项目和其他全基因组研究能够在单个 DGX 服务器上每天分析 60 多个基因组,同时降低了相关成本,产生了比以往任何时候都有用的见解。

包括 泰国国家生物银行 、 人类基因组中心与东京大学 、 基因组学研究院 、 圣路易斯华盛顿大学 、 Regeneron 遗传学中心和英国生物银行 和 斯坦福大学 Euan Ashley 的实验室 在内的许多组织正在使用 Clara Parabricks 进行快速基因组和外显子组分析,以用于大人口项目、危重患者以及其他癌症和遗传病项目。他们的工作旨在准确、快速地识别致病变异,与加速的下一代测序和加速的基因组分析保持同步。

NVIDIA Clara Parabricks v3.7 概述

通过支持独特的分子标识符( UMIs ),也称为分子条形码,加快和简化基因面板工作流程。

使用第二个基因融合调用者 Arriba 和 RNA-Seq 定量工具 Kallisto 对转录组工作流的 RNA-Seq 支持。

用 ExpansionHunter 检测短串联重复序列( STR )。

集成最新版本的生殖系调用者 DeepVariant v1 。 1 和 GATK v4 。 2 为单倍型。

一个 10 倍加速的 BAM2FASTQ 工具,用于将存储为 BAM 或 CRAM 文件的存档数据转换回 FASTQ 。数据集可以根据新的和改进的引用进行更新。

poYBAGJNRImADk6SAAEVq02a6m4789.png

poYBAGJNRImADk6SAAEVq02a6m4789.png

图 1:Clara Parabricks 3.7 包括用于基因面板的 UMI 工作流程、用于短串联重复序列的 ExpansionHunter 、包含 DeepVariant 1.1 和 GATK 4.2 版本,以及用于 RNA Seq 工作流程的 Kallisto 和 Arriba 。

Clara Parabricks 3.7 加速和简化了基因面板分析

尽管全基因组测序( WGS )由于大规模的人群计划而不断增长,但基因面板仍然主导着临床基因组分析。随着时间成为临床护理中最重要的因素之一,加速和简化基因小组工作流程对于临床测序中心至关重要。通过进一步减少与基因面板相关的分析瓶颈,这些测序中心可以更快地向临床医生返回结果,提高患者的生活质量。

用于基因检测的癌症样本通常来自实体肿瘤或患者血液(液体活组织检查)中的无细胞 DNA 。与 WGS 的发现工作相比,基因小组狭隘地专注于识别已知基因中的基因变体,这些基因要么会导致疾病,要么可以通过特定疗法进行靶向治疗。

遗传性疾病的基因面板通常测序覆盖率为 100 倍,而癌症测序的基因面板测序深度要高得多,液体活检样本的测序深度高达 1000 倍。检测与癌症相关的低频率体细胞突变需要更高的覆盖率。

为了提高这些基因面板的检测极限,使用了分子条形码或 UMI ,因为它们显著降低了背景噪声。这一检测极限适用于液体活组织检查,可以包括数以万计的检测范围,并与 UMIs 相结合,以识别血液中循环的大海捞针体细胞突变。高深度基因面板测序可以在更多测序读取所需的处理中重新引入计算瓶颈。

使用 Clara Parabricks , UMI 基因面板现在可以比传统工作流程快 10 倍,在不到一小时的时间内产生结果。

分析工作流程也得到了简化。从 raw FASTQ 到 consensus FASTQ ,与传统的 Fulcrum Genomics ( Fgbio )等价物相比,单个命令行运行多个输入,如下面的示例所示。

pYYBAGJNRIqAEz69AADmizKW0mg816.png

pYYBAGJNRIqAEz69AADmizKW0mg816.png

图 2:Clara Parabricks 3.7 与 Fgbio 等效物相比,简化并加速了基因面板 UMI 工作流程。

Arriba 和 Kallisto 的 RNA Seq 支持

正如基因面板对于癌症测序分析很重要一样, RNA-Seq 工作流程对于转录组分析也很重要。除了恒星融合, Clara Parabricks v3 。 7 现在包括 Arriba ,一种基于恒星的融合检测算法 RNA 序列比对器。基因融合是两个不同的基因由于染色体的巨大改变而结合在一起,与从白血病到实体瘤等多种不同类型的癌症有关。

Arriba 还可以检测病毒整合位点、内部串联重复、整外显子重复、环状 RNA 、涉及免疫球蛋白/ T 细胞受体位点的增强子劫持事件以及内含子或基因间区域的断点。

Clara Parabricks v3 。 7 还结合了 Kallisto ,这是一种基于伪比对的快速 RNA 序列量化工具,可从批量或单细胞 RNA 序列数据集中识别转录物丰度(基于测序读取计数的 aka 基因表达水平)。 RNA 序列数据的比对是 RNA 序列分析工作流程的第一步。 Clara Parabricks 3.7 提供了转录本定量、读取比对和融合调用的工具,现在提供了一整套支持多个 RNA 序列工作流的工具。

用 ExpansionHunter 进行短串联重复检测

为了支持从短读测序数据中对短串联重复序列( STR )进行基因分型,在 Parabricks v3 中添加了 ExpansionHunter 支持。 STR ,也称为微卫星,在人类基因组中普遍存在。这些非编码 DNA 区域具有类似手风琴的 DNA 延伸,包含长度在 2 到 7 个核苷酸之间的核心重复单元,串联重复,最多几十次。

STR 在遗传图谱构建、基因定位、遗传连锁分析、个体鉴定、亲子鉴定、群体遗传学和疾病诊断等应用中非常有用。

人类基因组中有许多区域由这些重复序列组成,它们的重复次数会增加,从而导致疾病。脆性 X 综合征、肌萎缩侧索硬化症和亨廷顿氏病是常见的重复相关疾病。

ExpansionHunter 旨在通过对 BAM / CRAM 文件执行有针对性的搜索来估计重复序列的大小,以便对每个 STR 中完全包含的跨、侧翼和侧翼读取进行排序。

添加体细胞呼叫者并支持归档数据

2021 以前的版本 Clara Parabricks 带来了一系列新的工具,最重要的是增加了五个躯体学呼叫者 MuSE 、 LoFReq 、 StRekA2 、 MutuSc2 和体细胞狙击手,用于全面的癌症基因组分析。

poYBAGJNRI2AC_3WAAOwFwK-y2o975.png

poYBAGJNRI2AC_3WAAOwFwK-y2o975.png

图 3:Clara Parabricks v3 。 6.1 和 3.7 包括用于全面加速癌症基因组分析的五位躯体来电者 Muse 、 LoFreq 、 Strelka2 、 Mutect2 和 SomaticSniper 。

此外,还添加了一些工具,以便在删除原始 FASTQ 文件以节省存储空间的情况下利用归档数据。 BAM2FASTQ 是 GATK Sam2fastq 的加速版本,它将现有 BAM 或 CRAM 文件转换为 FASTQ 文件。这允许用户将测序读数重新调整到一个新的参考基因组,这将允许调用更多的变体,同时为研究人员提供将所有数据标准化为同一参考的能力。使用现有的 fq2bam 工具, Clara Parabricks 可以在不到 2 小时的时间内将读取从一个参照物重新排列到另一个参照物,从而获得 30 倍的全基因组。

pYYBAGJNRJWAUkkMAAQDKc_o6SQ295.png

pYYBAGJNRJWAUkkMAAQDKc_o6SQ295.png

图 4:Clara Parabricks v3 。 7 添加了带有单倍型调用程序的种系变体调用程序 DeepVariant 1.1 和 GATK 4.2 的最新版本。

使用 免费提供 90 天试用评估许可证 为您的种系、癌症和 RNA 序列分析工作流试用 GPU 加速的 NVIDIA Clara Parabricks 基因组分析工具。

通道 NVIDIA Clara 抛物面 通过 AWS Marketplace 在本地或云中进行。

关于作者

Vanessa Braunstein 在 NVIDIA 的医疗团队从事产品营销工作。此前,她在基因组学、医学成像、制药、化学和诊断公司从事产品开发和营销。她学习分子和细胞生物学、公共卫生和商业。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109087
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134454
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    第十二届全国功能基因组学高峰论坛在京举办:聚焦人工智能与多组学融合发展

    时维金秋,群贤毕至。2025年第十二届全国功能基因组学高峰论坛(FGC-12)近日在北京圆满落幕。本届论坛汇聚了包括60余位国内顶尖学者在内的近500名科研院所、高等院校及行业代表,围绕“融汇学・
    的头像 发表于 11-19 17:05 421次阅读
    第十二届全国功能<b class='flag-5'>基因组</b>学高峰论坛在京举办:聚焦人工智能与多组学融合发展

    一文了解Mojo编程语言

    ,利用硬件加速提升效率。 科学计算与数据处理 高效处理大规模数值分析基因组学数据等任务。 系统工具开发 开发操作系统级工具,结合 Python 的便捷性和 C 的性能优势。 嵌入式与实时应用 适用于
    发表于 11-07 05:59

    NVIDIA Clara开放模型加速科学与医疗行业变革

    Clara 为从预测蛋白质结构到设计可在实验室合成的分子的整个早期药物发现流程提供支持。
    的头像 发表于 11-06 11:42 594次阅读

    序祯达生物利用NVIDIA Parabricks技术加速多组学分析

    序祯达生物是中国领先的多组学和测序服务提供商之一,该公司利用 NVIDIA Parabricks加速多组学分析。借助 Parabricks,序祯达生物将全
    的头像 发表于 09-29 16:05 618次阅读

    今日看点丨我国团队研制出系列牛用基因芯片;Littelfuse推出紧凑型PTS647轻触开关系列

    1、我国团队研制出系列牛用基因芯片 日前,国家乳液技术创新中心传来消息,该中心技术研发团队成功研制出奶牛种用胚胎基因组遗传评估芯片和“高产、抗病、长生产期”功能强化基因组预测芯片。该系列基因
    发表于 07-22 11:26 1905次阅读
    今日看点丨我国团队研制出系列牛用<b class='flag-5'>基因</b>芯片;Littelfuse推出紧凑型PTS647轻触开关系列

    微软医疗智能体协调器赋能开发者加速临床医疗创新进程

    基因组数据与电子健康记录整合,通过多智能体协同编排功能将癌症决策流程从数小时压缩至分钟级,并能够直接嵌入Microsoft Teams、Microsoft Worcd等工具,赋能开发者加速临床医疗创新进程。
    的头像 发表于 06-30 09:49 3733次阅读
    微软医疗智能体协调器赋能开发者<b class='flag-5'>加速</b>临床医疗创新进程

    中科曙光构建全国产化基因组学高性能计算平台

    近日,中科曙光承建的国内某研究所基因组学高性能计算平台正式交付。这是国内生物信息学领域首个从底层硬件到上层软件实现完全自主可控,并深度融合高性能计算与人工智能算力的平台,成功填补了该领域国产高端算力的空白。
    的头像 发表于 06-26 17:36 830次阅读

    FPGA时序约束之设置时钟

    Vivado中时序分析工具默认会分析设计中所有时钟相关的时序路径,除非时序约束中设置了时钟或false路径。使用set_clock_groups命令可以使时序分析工具不
    的头像 发表于 04-23 09:50 967次阅读
    FPGA时序约束之设置时钟<b class='flag-5'>组</b>

    高光谱相机:温室盆栽高通量植物表型光谱成像研究

    基因测序技术的快速发展(如全基因组关联分析GWAS)远超表型数据的获取能力,形成“基因型-表型数据鸿沟”,限制了作物育种的精准性。高光谱成像(400-2400nm)技术的成熟,使得非
    的头像 发表于 04-14 17:34 570次阅读

    Claude 3.7:编码助手首选,claude api key如何申请获取与深度解析*

    、开发者友好。 强大功能集 :支持图像分析、20万令牌超大上下文窗口,轻松驾驭大型项目与复杂任务。 Claude 3.7:树立编码助手新标杆 2025年2月24日,Anthropic 推出
    的头像 发表于 03-24 09:43 1441次阅读
    Claude <b class='flag-5'>3.7</b>:编码助手首选,claude api key如何申请获取与深度解析*

    NVIDIA使用加速计算与AI推动精准医学发展

    在加利福尼亚州圣克拉拉举行的精准医学世界大会上,NVIDIA 因推动了医学成像、基因组学、计算化学和 AI 驱动机器人技术的发展而受到表彰。NVIDIA 创始人兼首席执行官黄仁勋荣获“Luminary award”。
    的头像 发表于 02-17 17:14 776次阅读

    NVIDIA RTX赋能AI工作站加速数据科学工作流程

    各行各业都在借助 AI 实现转型,以提高竞争力和运营效率。在零售业中,聊天机器人正在简化用户的产品库存搜索。在金融服务业,基于 AI 的工具正应用于欺诈检测。而在医疗健康领域,AI 正在帮助从基因组学中发现新的见解,从而改善患者的治疗效果。
    的头像 发表于 02-08 10:01 1072次阅读
    NVIDIA RTX赋能AI工作站<b class='flag-5'>加速</b>数据科学工作流程

    NVIDIA携手行业巨头,共促医疗健康产业变革

    近日,NVIDIA宣布了一系列新的合作伙伴关系,旨在通过前沿技术推动医疗健康与生命科学产业的变革。此次合作,NVIDIA将携手行业内的领先机构,共同加速药物发现、提升基因组研究水平,并利用代理
    的头像 发表于 01-20 14:02 802次阅读

    NVIDIA携手多家机构推动医疗健康产业变革

    合作的目标直指规模高达10万亿美元的医疗健康与生命科学产业。NVIDIA将凭借其强大的AI和加速计算技术,助力合作伙伴在药物发现、基因组研究等领域实现突破性进展。通过加速计算,科学家们能够更高效地处理和
    的头像 发表于 01-14 14:28 1535次阅读

    NVIDIA 携手行业领先机构推动基因组学、药物发现及医疗健康行业发展

    ——NVIDIA 今日宣布新的合作伙伴关系,旨在通过加速药物发现、提升基因组研究,以及利用代理式和生成式 AI 开创先进医疗服务,推动规模达 10 万亿美元的医疗健康与生命科学产业的变革。   AI、加速计算与生物数据的融合,正
    发表于 01-14 13:39 548次阅读
    NVIDIA 携手行业领先机构推动<b class='flag-5'>基因组</b>学、药物发现及医疗健康行业发展