0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

应用深度学习分析提高基因组分析的准确性

Tensorflowers 来源:TensorFlow 作者:Howard Yang 2021-05-14 09:49 次阅读

发布人:Google Health Genomics 产品负责人 Andrew Carroll 和 Genomics 项目经理 Howard Yang

Google Health 的 Genomics 团队很高兴分享我们对 DeepVariant 的最新扩展 - DeepTrio。

DeepVariant 于 2017 年首次发布,是一种开源工具,支持研究人员和临床医生分析个人的基因组测序数据并识别基因变异,如可导致疾病的变异片段。我们在 DeepVariant 方面的持续研究因其一流的准确性而获得肯定。借助 DeepTrio,我们扩展了 DeepVariant,从而能够在分析母亲-父亲-子女三人的基因序列数据时考量基因变异。

人类是二倍体生物,携带人类基因组的两个副本。每个个体都分别继承了来自母亲和父亲的一个基因组副本。父母遗传信息有助于分析符合孟德尔遗传规律的特征和疾病。DeepTrio 学习直接在测序数据中使用孟德尔遗传的特性,以便在可以共同分析父母和子女样本的情况下更准确地识别基因变异。

修改 DeepVariant 以分析三人样本

DeepVariant 学习到如何将基因组中的位置分类为参考或者“基因组浏览器”(相关专家用于分析的工具)中数据表示的变种。“《使用 DeepVariant1.0 提高基因组分析的准确性》(Improving the Accuracy of Genomic Analysis with DeepVariant 1.0)”一文很好地概述了有关内容。

使用 DeepVariant1.0 提高基因组分析的准确性

https://ai.googleblog.com/2020/09/improving-accuracy-of-genomic-analysis.html

DeepVariant 接收数据作为以候选变异为中心的基因组窗口,并且按照要求将数据分类为参考(无变异)、杂合子(变异的一个副本)或纯合子(两个副本均为变异)。DeepVariant 将序列证据视为代表数据特征的通道(请参阅“《透过 DeepVariant 深入观察》(Looking through DeepVariant’s eyes)”获取更深入解释)。

透过 DeepVariant 深入观察

我们修改了 DeepTrio,以在单个图像中表示来自三人的序列数据,其中每个样本的高度固定,子女的数据置于中间。我们使用来自美国国家标准与技术研究院 (NIST) 瓶中基因组联盟 (GIAB) 的黄金标准样本作为真实标签,训练一个模型调用子女样本中的变异,并训练另一个模型调用顶部父母样本中的变异。为调用父母双方的样本,我们翻转父母样本的位置。

衡量 DeepTrio 提高的准确性

我们研究发现,对于父母和子女变异检测,DeepTrio 比 DeepVariant 更准确,在覆盖率较低的情况下具有特别明显的优势。这使研究人员能够以更高的准确性分析样本,或者在显著降低费用的同时保持相当的准确性。

为评估 DeepTrio 的准确性,我们借助 NIST 瓶中基因组联盟提供的涵盖广泛特征的黄金标准,将其与 DeepVariant 的准确性进行比较。为获得在训练中从未见过的评估数据集,我们在训练中排除了 20 号染色体,并对 20 号染色体进行了评估。

我们训练 DeepVariant 和 DeepTrio,以对来自两种不同仪器 Illumina 和 Pacific Biosciences (PacBio) 的数据进行测序。如要详细了解这些技术之间的差异,请参见我们之前的博客。这些测序仪均以容易错误的方式随机采样基因组。为准确分析基因组,我们需要重复采样相同区域。在某个位置的采样深度称为覆盖范围。以近似线性的方式测序来覆盖更大的范围将导致成本更高。因此我们经常需要在成本、准确性和测序样本之间进行权衡。而权衡的结果是,在三人样本中,父母样本通常以较低的深度进行测序。

在下方图表中,我们绘制了一系列不同覆盖范围中 DeepTrio 和 DeepVariant 的准确性。

00077b0a-b42c-11eb-bf61-12bb97331649.png

001e90f6-b42c-11eb-bf61-12bb97331649.png

图 2.子女样本(顶部)和父母样本(底部)上 DeepTrio(实线)和 DeepVariant(虚线)的 F1 得分,使用 Illumina(蓝色)和 PacBio(黑色)仪器进行测序。在具有一系列测序覆盖范围(x 轴)的样本中,对 20 号染色体上所有类型的小变异进行 F1 测量

DeepTrio 在 de novo 变异上的表现

相对于人类参考基因组,每个人大约有 500 万处变异,其中绝大多数从父母处继承而来。一小部分(大约 100 处)是新变异(称为 de novo),由 DNA 复制过程中的复制错误导致。我们的研究证明,DeepTrio 大大减少了 de novo 变异检测的假阳性情况。对于 Illumina 数据,其真阳性回收率的下降幅度较小,而对于 PacBio 数据,这种权衡不会发生。

为评估准确性,我们分析了父母两人都被称为非变异但子女被称为杂合变异的位点。我们观察到 DeepTrio 更不愿意将变异命名为 de novo,这类似于人类对于违反孟德尔遗传规律的位点,需要获得更高水平的证据。因此,此类 de novo 变异的假阳性率低得多,但 DeepTrio Illumina 的召回率则略低。通常,在发生这种情况时,子女的样本仍将称作变异,但父母样本则给予“不调用”的判断(分类器没有足够的信心进行调用)。

促进罕见病研究

通过将 DeepTrio 作为开源软件发布,我们希望这一软件能够支持科学家更准确地分析样本,进而提升对基因组数据的分析能力。我们希望这能促进研究和临床开发,进而更好地解析罕见病病例,并改进治疗方法的开发。

除了将 DeepTrio 的代码作为开放源代码发布之外,我们还发布了为训练这些模型而生成的测序数据。这些数据会在预印本“《用于基准测试和开发的黄金标准样本的广泛序列数据集》(An Extensive Sequence Dataset of Gold-Standard Samples for Benchmarking and Development)”中加以说明。通过发布该生产模型和训练相似复杂度模型所需的数据,我们希望能为基因组学界的方法开发做出贡献。

原文标题:应用深度学习分析家庭基因组数据

文章出处:【微信公众号:TensorFlow】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    2982

    浏览量

    41698
  • 深度学习
    +关注

    关注

    73

    文章

    5226

    浏览量

    119870

原文标题:应用深度学习分析家庭基因组数据

文章出处:【微信号:tensorflowers,微信公众号:Tensorflowers】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    电流探头测试小技巧:提高准确性和安全性

    电流探头是一种常用的测试工具,用于测量电路中的电流。正确使用电流探头可以提高测试的准确性,并确保操作的安全性。本文将介绍一些电流探头的测试小技巧,帮助您更好地使用电流探头进行电流测量。 技巧一:正确
    的头像 发表于 03-08 09:31 86次阅读
    电流探头测试小技巧:<b class='flag-5'>提高</b><b class='flag-5'>准确性</b>和安全性

    FLOEFD T3STER自动校准模块—提高电子产品散热设计的准确性

    西门子工业数字软件FLOEFD T3STER 自动校准模块——提高电子产品散热设计的准确性
    的头像 发表于 02-21 10:10 170次阅读
    FLOEFD T3STER自动校准模块—<b class='flag-5'>提高</b>电子产品散热设计的<b class='flag-5'>准确性</b>

    振弦采集仪在工程监测中的性能评估与分析

    分析指标: 振弦采集仪在工程监测中的性能评估与分析 1. 准确性:振弦采集仪的准确性是指它测量和记录振弦信号的精确程度。评估准确性的方法包
    的头像 发表于 01-11 15:53 132次阅读
    振弦采集仪在工程监测中的性能评估与<b class='flag-5'>分析</b>

    深度学习技术在AI智能分析盒子人数统计中的应用与优势

    在AI盒子的人数统计中,当多人同时出入视野范围时,传统的算法模型很难准确识别和计算人数,容易导致重复统计。为解决这一难题,AI算法模型可以采用目标检测与追踪相结合、深度学习技术和传感器技术等方法,有效避免重复统计,
    的头像 发表于 11-29 09:07 224次阅读

    Transography美国数据产品为交通建模和分析提供准确性

    据服务情况。 Caliper公司的Transography美国数据产品和数据处理服务为交通建模和分析以及许多相关应用提供了前所未有的洞察力和准确性。Transography产品从手机应用程序、联网车辆数据、行驶速度实时监测、专有网络和GIS数据以及人口统计等众多不同来源的
    的头像 发表于 09-05 09:28 542次阅读

    启英泰伦通话降噪方案,采用深度学习降噪算法,让通话更清晰

    消除方案和基于深度学习的降噪方案推出了通话降噪方案,利用该方案可以实时消除回声及环境噪声,并通过算法优化提升语音信号的清晰度和逼真度,使得通话更加清晰、准确提高语音交流的效率和舒适
    发表于 08-22 17:36

    GPU助力基因组重测序分析

    等。随着近几年基因测序成本如图 1所示不断下降,在万元内即可完成人类的全基因组测序,GPU的技术发展也带来分析成本与时间的下降,于是用于检测基因组变化的重测序技术在癌症治疗中起到了越来
    的头像 发表于 08-01 10:32 1127次阅读
    GPU助力<b class='flag-5'>基因组</b>重测序<b class='flag-5'>分析</b>

    如何提高数据填报的准确性?#数据填报 #光点科技

    数据
    光点科技
    发布于 :2023年07月28日 12:09:16

    水雨情远传系统——提高防洪准确性

    我国每年都会遭受不同程度的洪涝灾害,建立自动化的水雨情远传系统,可以提高洪水预警准确性,为防洪抢险提供科学依据。 一、系统构成 水雨情远传系统主要包含以下组件: 1)检测设备:采集降雨、水位等参数
    的头像 发表于 07-13 15:11 176次阅读
    水雨情远传系统——<b class='flag-5'>提高</b>防洪<b class='flag-5'>准确性</b>

    利用深度学习模型最大限度地提高外显子组测序分析准确性

    使用 NVIDIA Parabricks ,通过深度学习加速整个外显子组分析,降低 70% 的成本
    的头像 发表于 07-05 16:30 306次阅读
    利用<b class='flag-5'>深度</b><b class='flag-5'>学习</b>模型最大限度地<b class='flag-5'>提高</b>外显子组测序<b class='flag-5'>分析</b>的<b class='flag-5'>准确性</b>

    开发深度学习系统:基于人工神经网络的图像分类和分析软件 (ANNICAS)

    最近,显微镜专家 Christophe Jung 博士和 LMU 基因中心的数学和物理讲师 Markus Hohle 博士使用 MATLAB 携手开发了一款深度学习工具,可以通过分析
    的头像 发表于 06-29 16:04 355次阅读
    开发<b class='flag-5'>深度</b><b class='flag-5'>学习</b>系统:基于人工神经网络的图像分类和<b class='flag-5'>分析</b>软件 (ANNICAS)

    基于深度阈值噪声消除的多尺度分析调制识别网络

    为了提高多变环境下调制信号识别的准确性、减少先验知识不足等因素对识别结果的影响,研究人员逐渐采用深度学习技术来替代传统的调制信号处理技术。
    的头像 发表于 06-20 15:03 283次阅读
    基于<b class='flag-5'>深度</b>阈值噪声消除的多尺度<b class='flag-5'>分析</b>调制识别网络

    新型定量微流控装置用于促进轴突转录组分析

    微流控装置是研究神经元轴突mRNA定位和翻译的有力工具。除了轴突的特定操作和测量外,微流控装置还用于收集轴突以进行轴突转录组分析
    的头像 发表于 06-02 16:49 724次阅读
    新型定量微流控装置用于促进轴突转录<b class='flag-5'>组分析</b>

    聚类分析中的机器学习与统计方法综述(一)

    单细胞转录组测序(scRNA-seq)技术能够对细胞群中的每一个细胞进行大规模的全转录组分析
    的头像 发表于 05-19 10:03 540次阅读
    聚类<b class='flag-5'>分析</b>中的机器<b class='flag-5'>学习</b>与统计方法综述(一)

    智造之眼丨深度学习应用

    智造之眼®科学设计深度学习各应用流程,在尽量简化前期准备工作的基础上为客户提供稳定且准确深度学习解决方案。
    的头像 发表于 05-04 16:55 459次阅读
    智造之眼丨<b class='flag-5'>深度</b><b class='flag-5'>学习</b>应用