0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全球数据都能存储在一个咖啡杯中?

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2021-06-26 09:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

全球数据都能存在一个咖啡杯中?一杯星巴克中杯是 354 毫升,世界人口目前七十多亿,这能存的下吗?

答案是:理论上可以。

近日,麻省理工学院(MIT)科学家研发出一种新型 DNA 存储技术,该技术可从大规模数据库中检索和标记 DNA 数据文件,实现了将数据存储为 DNA 形式的可能。

当地时间 6 月 10 日,相关论文发表在 Nature Materials 上,通讯作者是 MIT 生物工程学教授马克·巴斯(Mark Bathe)。

论文题为《在档案文件存储系统中使用布尔搜索的随机存取 DNA 存储器》(Random access DNA memory using Boolean search in an archival file storage system)。

这项研究意味着照片、音频、文档和其他文件都可存储为 DNA 的形式,有望彻底改变人类存储数据的方式。

据了解,当前全球大约有 10 万亿字节的数据,大部分数据存储在占地面积庞大的数据中心里。这些数据中心比足球场还大,光是建设和维护成本就得 10 亿美元。

以 DNA 形式储存数据的灵感来自于包含遗传信息的 DNA 分子,该团队认为 DNA 分子有望以极高密度去存储大量数据信息。马克·巴斯表示,理论上一个咖啡杯即可存储全球所有的数据。

据悉,DNA 的密度是闪存的 1000 倍,一旦制造出 DNA 聚合物,它就不会消耗任何能量,把 DNA 写下来之后,即可进行永久存储。

该团队表示,他们可将图像和文本页面编码为 DNA,但是要突破从众多 DNA 片段的混合物中挑选出所需文件,即检索功能的技术壁垒。

据悉,研究人员以 DNA 形式存储数据需要一种约 6 微米大的二氧化硅颗粒,然后把数据文件固定在二氧化硅颗粒中,接下来用短 DNA 序列对文件进行标记。

其中,每个颗粒都标有与文件内容相对应的单链 DNA “条形码”。用这种方法能从最多 1020 张图像中准确提取出单个图像。

北京大学第三医院博士生导师、国家妇产疾病临床医学研究中心副主任李默告诉 DeepTech,这带来的好处非常显著,应用潜力也很巨大。

包括提高大规模数据存储的效率、节省公共资源、极大提升信息运输与流通速度等,还包括对诸多专业领域的促进,如以核酸为代表的生命科学在交叉学科的应用、机密信息的安全储备、以及环境保护等。

以 DNA 形式存储的数据,先到可以放在手掌里

在数字化时代, 文本、照片或任何其他形式的信息,都是由 0 和 1 通过二进制编码而成的。类似的,我们也可将这些信息用四种核苷酸 A、T、C、G 编码为 DNA,例如把 G 和 C 表示为 0,A 和 T 表示为 1。

作为一种存储介质,DNA 具有高稳定性和高密度的优点,高稳定性意味着 DNA 的合成和测序比较容易,高密度指的是每个核苷酸只有两个比特大小,即大约 1 立方纳米。因此以 DNA 形式存储的数据,其体积之小甚至能放在手掌中。

但是,西湖大学特聘研究员郭天南告诉 DeepTech,目前 DNA 存储数据的访问速度尚远不及硬盘,数据读写成本较高,该成果的优势在于数据存储的稳定性,因此较适合于冷数据。

为了考察新方法的读取速度,MIT 团队将 20 个不同的图片编码到大约 3000 个核苷酸长的 DNA 片段中,大小相当于大约 100 个字节。

这些图片包含猫、老虎、飞机和人物照等,因此研究人员给每张图都设置了相对应的条形码。

当提取特定图像时,首先需要移除 DNA 样本,然后添加与一定的标签,比如老虎照片对应的标签是 “猫科动物”“橘色” 和 “野生”,猫照片对应的标签是 “猫”“橘色” 和 “家养”。

研究人员用荧光、或磁性颗粒来标记这些引物(primer),为的是方便从样本中取出、并识别对应的匹配物。这时,需要的文件就可以被删除,而剩下的 DNA 文件毫无损伤,并能被完整地放回原处。

该检索过程还支持布尔逻辑(Boolean algebra)搜索查询,比如从 “总统和 18 世纪” 可以搜出乔治・华盛顿的结果,和我们日常使用的百度搜索、谷歌搜索很相似。在概念验证阶段,搜索速度是每秒 1KB,搜索速度由每个胶囊的数据大小决定。

中国科学院生物学博士、助理研究员李雷告诉 DeepTech,事实上这等于提供了一种更加便捷的检索策略,使得我们在查找信息的时候,可以更加容易找到具体的信息点,而不是像过去那样通过 PCR( polymerase chain reaction 聚合酶链反应)来在全 DNA 上进行搜索。换句话,这种新策略使得数据定位更加容易,可以针对性地提取信息。

另据悉,该团队使用哈佛医学院(Harvard Medical School)遗传学和医学教授史蒂芬・埃利奇(Stephen Elledge)开发的 10 万个序列中的单链 DNA 序列作为条形码,如果在每个文件上放置两个这样的标签,就可以唯一地标记 10^10 个不同的文件,也就是 100 亿。

这意味着,每个文件上有 4 个标签,就可以唯一地标记 10^20 个文件。故此,哈佛医学院遗传学教授乔治・丘奇(George Church)将该成果描述为 “知识管理和搜索技术的巨大飞跃”。

目前,该团队已成立一家名为 Cache DNA 的初创公司,该公司目前正在开发 DNA 长期存储技术,届时相关技术既能用于数据的长期存储,也可用于短期存储。

但是,该成果仍有可优化的空间。比如,这种新技术成本非常高昂,写 1PB 数据(100 万 GB)需要花费 1 万亿美元。

如果想比普通用于存储数据的磁带更具竞争力,该团队认为成本还需要降低约 6 个数量级。他们认为,这预计能在 10 年或 20 年内实现,因为过去几十年存储信息的成本一直在大幅下降。

另一个主要瓶颈,是这种技术难以从其他文件中挑选出想要的文件。假设成本问题已经解决,我们就能在 DNA 中写入 1EB 甚至 1ZB 数据,然而这时就有无数的文件、图像或电影和其他东西,要想找到目标文件简直就像大海捞针。

当下,人们通常使用 PCR 来检索 DNA 文件,每个 DNA 数据文件都包含一个与特定 PCR 引物结合的序列。要想提取特定文件,就得把该引物添加到样本中以查找和扩增所需序列。

然而,这种方法的一个缺点是引物和脱靶 DNA 序列之间可能存在串扰,导致不需要的文件被拉出。此外,PCR 检索过程需要酶,最终会消耗池中的大部分 DNA,因为所有其他 DNA 都没有被放大,这是能做的就是把它扔掉。

西湖大学特聘研究员郭天南告诉 DeepTech,这种新方法的优势主要在于克服了传统方法对 PCR 扩增的依赖,减小了 PCR 扩增中可能产生的技术噪音。并且,这种方法尽量减小对未读取数据的损害,即未读取的 DNA 可以有效回收并且再次按需读取。

针对 COVID-19 检测、人类基因组测序等,我们迫切需要低成本、大规模存储解决方案。如果 DNA 合成可以变得足够便宜,那么就能可以实现存储更大的文件。

另据悉,该团队计划将这种 DNA 封装技术用于存储 “冷” 数据,即保存在档案中的不经常访问的数据。

对此李雷认为这主要是因为 DNA 存储技术不成熟,具体地说是 DNA 保存技术。DNA 很容易发生降解,除了会受到温度影响,化学因素比如储存 DNA 的溶液等都会致其发生降解,而一旦降解,这些物质就彻底成为杂乱无章的信息。此外反复访问同样会对 DNA 进行处理,最终导致 DNA 自身的不稳定。

李默认为,该技术的 “数据检索” 环节依赖于荧光激活分类,限制了数据检索及读取的速度与效率,因此该技术不适用于读取 “热数据”,即存储后被高频次访问的数据,并且读取速度较传统硬盘也不具备优势。但如日后能在这些环节有所突破,则将是另一次质的进步。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7315

    浏览量

    93986
  • 存储
    +关注

    关注

    13

    文章

    4696

    浏览量

    89572

原文标题:一杯“咖啡”存储全人类数据?MIT团队把数据存到DNA里,体积小到能放手掌中 | 专家解析

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    精准调控,香醇每一杯:捷捷微电可控硅与光耦方案赋能咖啡机智能调速新体验

    电子技术的深度应用,咖啡机已实现从磨粉、压粉到冲泡、清洁的全流程自动化控制。在这技术演进历程,捷捷微电凭借功率半导体领域的深厚积累,为咖啡
    的头像 发表于 11-28 17:30 292次阅读
    精准调控,香醇每<b class='flag-5'>一杯</b>:捷捷微电可控硅与光耦方案赋能<b class='flag-5'>咖啡</b>机智能调速新体验

    刷脸喝咖啡?乐鑫科技ESP32-P4+摄像头方案,改写咖啡机的规则

    你理想的咖啡瞬间是什么?是走进常去的咖啡店,无需开口,咖啡师会意笑开始制作?没有人能拒绝一杯
    的头像 发表于 11-12 18:05 353次阅读
    刷脸喝<b class='flag-5'>咖啡</b>?乐鑫科技ESP32-P4+摄像头方案,改写<b class='flag-5'>咖啡</b>机的规则

    说说瑞之辰MEMS压力变送器智能咖啡机上的应用

    一杯意式浓缩的油脂、口美式咖啡的清爽,背后都离不开咖啡机“压力”的精准调控。从萃取时的8-10bar高压,到锅炉的0.9-1.1bar稳压,再到水泵的动态压力适配,压力参数的稳定性直
    的头像 发表于 11-12 17:13 476次阅读
    说说瑞之辰MEMS压力变送器<b class='flag-5'>在</b>智能<b class='flag-5'>咖啡</b>机上的应用

    激光焊接技术焊接咖啡罐工艺的应用

    激光焊接技术以其精密的加工特性,咖啡罐制造领域展现出独特价值。这项先进的连接工艺为咖啡包装容器提供了高质量的表面处理和密封解决方案。下面来看看激光焊接技术焊接
    的头像 发表于 11-12 13:42 129次阅读
    激光焊接技术<b class='flag-5'>在</b>焊接<b class='flag-5'>咖啡</b>罐工艺<b class='flag-5'>中</b>的应用

    咖啡机精准萃取:铝电解电容为加热回路 “把控” 电流节奏

    咖啡机的世界里,精准萃取是评判一杯咖啡品质的关键指标之。要实现这目标,除了
    的头像 发表于 09-18 15:34 200次阅读
    <b class='flag-5'>咖啡</b>机精准萃取:铝电解电容为加热回路 “把控” 电流节奏

    全自动咖啡杯焊接机

    焊接
    jf_21751002
    发布于 :2025年05月23日 15:22:13

    全自动咖啡杯焊接机

    焊接机
    jf_21751002
    发布于 :2025年04月25日 15:18:31

    霍尔开关DH188空心电机的应用

    霍尔开关DH188空心电机的应用主要体现在对电机转子位置的精确检测上,这是确保电机正常工作并实现高效率运转的关键。以下是对霍尔开关在空心电机
    的头像 发表于 03-11 15:21 1933次阅读
    霍尔开关DH188<b class='flag-5'>在</b>空心<b class='flag-5'>杯</b>电机<b class='flag-5'>中</b>的应用

    RTOS的本地存储指针使用

    本地存储指针是RTOS重要特性,增强了任务管理和数据处理能力。RTOS上下文中,本地
    的头像 发表于 02-28 16:33 1171次阅读
    RTOS<b class='flag-5'>中</b>的本地<b class='flag-5'>存储</b>指针使用

    KEPServerEX 数据存储插件

    好LogGroup之后,Triggers里面记录条件,设置 “登录静态间隔”--否; “在数据更改时记录”---是 这样数据就会在变化的时候才会
    的头像 发表于 02-28 14:47 510次阅读
    KEPServerEX <b class='flag-5'>数据</b><b class='flag-5'>存储</b>插件

    大联大世平集团推出基于NXP产品的AI胶囊咖啡机方案

    ,各行各业都在积极探索AI技术的应用,以便实现产业的智能化转型。公众熟知的咖啡行业,带有AI功能的胶囊咖啡机正以便捷的操作性、高效的咖啡
    的头像 发表于 02-22 11:09 870次阅读
    大联大世平集团推出基于NXP产品的AI胶囊<b class='flag-5'>咖啡</b>机方案

    全自动咖啡杯焊接机

    机械自动化
    jf_21751002
    发布于 :2025年01月22日 13:55:22

    数据怎么云存储电脑,数据怎么操作才能云存储电脑

    怎么操作才能云存储电脑。    在数字化时代,云存储成为了种高效、灵活的数据管理方式。通过将数据
    的头像 发表于 01-14 10:10 1157次阅读
    <b class='flag-5'>数据</b>怎么云<b class='flag-5'>存储</b><b class='flag-5'>在</b>电脑,<b class='flag-5'>数据</b>怎么操作才能云<b class='flag-5'>存储</b><b class='flag-5'>在</b>电脑

    控制咖啡机水温的关键在于NTC温度传感器

    对于热爱咖啡的人来说,一杯完美的咖啡需要精心挑选优质的咖啡豆,熟练掌握烘焙技巧,以及恰到好处地控制水温。
    的头像 发表于 01-14 09:40 1177次阅读

    【半导体存储】关于NAND Flash的些小知识

    的情况下保持原位,在这一过程中不管是否有电源连 接,芯片都能继续存储一个值。 []()   NAND Flash 为大容量数据
    发表于 12-17 17:34