0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度智能云以虚拟化块存储CDS打造云上多样解决方案

高端存储知识 来源:高端存储知识 作者:高端存储知识 2020-09-24 15:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在数字经济时代,海量的数据成为数字经济的重要生产要素,特别是受今年疫情的影响,线下的生产和生活迅速的转移到了线上,相应的数据也再次迎来了新一波快速增长。 对于百度智能云这样的云服务商来说,海量的数据既是资产也是压力,尤其是大量冷数据的产生让存储分层变得“迫在眉睫”。在此背景下,磁带库因性价比较高且能够快速写入,成为了百度智能云快速存档冷数据的理想之选。

但在实际应用中,百度智能云发现磁带库虽然可以快速写入数据,但数据首先需要在缓存盘上进行序列化,这就需要一款快速的缓存盘作为载体化解这一难题。基于此,百度智能云创新的引入了英特尔傲腾固态盘,借助其速度和耐用性兼备的特性,不仅大大提升了磁带库备份的速度,也满足了归档存储应用中繁重的读/写混合型工作负载的要求。 毫无疑问,百度智能云与英特尔的成功合作,不仅为数据归档和备份的优化和升级提供了重要的参考和借鉴方向,也让更多的行业和用户享受到了云存储服务所带来的好处,真正实现了冷数据在更长久周期内的可用性、可回溯性和可审计性。 冷数据带来的挑战 今天,海量数据的增长正在成为一种“新常态”,而保存和管理这些海量数据也变得日益困难,特别是把所有数据保存在同一个存储介质中更是不切实际的。 因此,业内通常的做法是,将数据根据类型的不同划分为三个分层,即热数据、温数据和冷数据。其中,最“冷”的数据十分适合存储到磁带库这种价格便宜的长期存储介质之中。

得益于光纤通道和串行连接 SCSISAS)等技术的发展,如今磁带库的顺序读写性能也得以不断提升。然而,磁带库本身的写入速度虽快,但是基于磁带库的备份架构却存在一个常常会妨碍数据以其最大速率写入磁带库的技术障碍。 具体来说,在将数据备份到磁带库上之前,首先需要将数据收集到缓存层的数据节点上,以便为写入磁带介质做准备(进行序列化)。对于此类数据节点中的SAS RAID缓存层磁盘,其读取和写入操作通常无法达到让磁带库管道饱和的速度,进而导致出现备份速度缓慢等挑战,无法发挥磁带库的高速潜能。

百度智能云旧备份架构中缓存盘面临的挑战 以百度智能云此前使用的机械硬盘(HDD)为例,其读取速度仅为200 MB/s,不但难以满足磁带库写入速度为每秒600 MB/s的要求,还把磁带库的备份速度降低了三分之二,使得大量数据存储归档和备份工作变得效率低下。 例如,通过安装在车队 300 辆车上的物联网IoT传感器,百度的自动驾驶汽车解决方案生成了大量数据,且已记录超过200万公里,这些物联网数据大部分被归类为“冷”数据,并通过数据节点发送到磁带上以进行长期存储,但由于缓存层磁盘速度较慢,使得这个工作变得十分的缓慢。 再如,百度的数据保留政策要求每3-6年就要将存储在磁带库上的数据转移至新磁带库,这就需要使用缓存盘,而这种超负荷的缓存工作负载(不断写入和读取越来越多的存档数据),同样也暴露出系统的低效率问题。 由此可见,快速的磁带库离不开快速缓存盘,缓存盘的性能之于数据备份速度的重要性不言而喻。为了打破缓存层磁盘带来的“瓶颈”,百度智能云希望通过寻找到一种更好的缓存驱动替代方案,以进一步提升磁带库备份的速度。 缓存盘选型的难题 根据自身的实际业务情况,百度智能云团队在考虑其缓存驱动的替代方案时,提出了以下数据层要求: 一是,读取速度要求方面,希望在写入压力很大的情况下,替代的缓存盘也需具备600 MB/s的读取性能,以匹配磁带库600 MB/s的写入速度。 二是,写速度要求方面,为了保持磁带写入速度饱和以提高成本效益,磁盘将新数据写入缓存盘的速度应至少与缓存数据写入磁带的速度相等,即600 MB/s。 三是,耐用性要求方面,磁带库的存储容量为16PB,而百度智能云团队希望缓 存盘能够持续服务三代磁带,为了实现此目标,缓存盘需支持总写入量为48 PBW (硬盘理论寿命所对应的总写入数据量)的耐用性。 为此,百度智能云团队首先研究了使用基于NAND的SSD替代数据节点上基于HDD的缓存盘。但是研究显示,基于NAND的SSD的局限在于,随机写入操作需要大量的后台介质管理,这会大大降低每个磁盘的吞吐量并缩短磁盘寿命。 在此基础上,百度的团队又评估多个 NAND 驱动器的两种配置,包括16盘 RAID0 的标准耐用性配置,以及6盘 RAID0+1的中等耐用性配置,虽然这两种配置方案都能满足600 MB/s的读取和写入要求,但却需要过多的NVMe插槽才能达到所需的吞吐率,这将使得维护工作变得更加复杂。 此外,根据设备规格进行的计算还表明,这两种配置方案也都不能满足耐用性要求,其PBW分别为30.72和36.75,显然和百度智能云所确定的48 PBW目标“相距甚远”。 不难看出,无论是传统的HDD还是基于NAND的SSD,都难以满足百度智能云希望实现的性能和耐用性要求,通过多方的对比,最终百度智能云团队将目标锁定在了英特尔傲腾固态盘上。 速度和耐用性兼备 测试显示,百度智能云通过采用英特尔傲腾固态盘作为数据节点上的缓存盘,该解决方案可在600 MB/s (随机)写入工作负载下,实现 600 MB/s 的读取性能。与基于 NAND 的固态盘不同,英特尔傲腾固态盘的优势还在于,无论其写入压力如何,都能保持读取响应时间不变。

将英特尔傲腾固态盘的镜像用作缓存盘,满足了百度的备份解决方案要求 不仅如此,英特尔傲腾固态盘的高耐用性(164 PBW 和每日整盘写入次数为 60 DWPD),远远超出了48 PBW的耐用性要求,通过这一全新解决方案,百度可以在 相同时间内备份三倍的数据量。 可以看到,借助英特尔傲腾固态盘,百度智能云不仅实现了出色耐用性的同时,也满足繁重的读/写混合型工作负载带宽要求,而通过此解决方案,百度现在备份相同数据量所需的时间比之前的解决方案减少了67%。 对此,百度智能云相关人士表示:“英特尔傲腾固态盘凭借其高带宽、高耐用性、低延迟和易于维护的优势,为百度带来了高价值,并帮助我们加快创新磁带库解决方案,同时降低成本、提高效率。”

值得一提的是,百度智能云还进一步发挥其产品及技术优势,将英特尔傲腾方案推上云端,以智能云虚拟化块存储 CDS、云原生数据库 GaiaDB 等产品为出口,打造云上多样解决方案。而傲腾方案在较大的写入压力下依然能保持数据的快速响应及高性能读写,让百度智能云为客户提供超低成本及便携的数据管理能力,输出持续先进的云服务,丰富云端存储产品和体验打下了坚实的基础。 总的来看,今天数据的生命周期正变得越来越长,特别是过去几年国家出台了信息安全和个人隐私的相关法律,而被合规、数据保护等痛点困扰的企业也不在少数;再加上企业对数据越来越重视,特别是某些关键领域的企业甚至要求生产环境下的数据,需要有五年、十年,甚至数个十年的保存,由此也让数据归档变得更加重要。 目前,类似的需求在视频监控、生命科学、金融服务、媒体和娱乐、政府、医疗等行业特别明显。所以,未来如何保障数据在更长久周期内的可用性、可回溯性、可审计性,无疑今天用户最为关注的话题。

而在此过程中,百度智能云通过将英特尔傲腾固态盘作为缓存数据提升磁带库备份速度,不仅破解了海量数据增长带来的归档和备份的压力,也为众多用户提供了更为丰富的产品体验。

原文标题:【观察】百度智能云:释放“傲腾上云”红利,重新定义归档存储服务

文章出处:【微信公众号:高端存储知识】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10341

    浏览量

    181351
  • 百度
    +关注

    关注

    9

    文章

    2401

    浏览量

    95381
  • 数字经济
    +关注

    关注

    2

    文章

    1126

    浏览量

    20391

原文标题:【观察】百度智能云:释放“傲腾上云”红利,重新定义归档存储服务

文章出处:【微信号:High-end_Storage,微信公众号:高端存储知识】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度Create 2026发布“百度胜算”

    ;新尺子"取代沿用至今的Token消耗量指标,重新丈量AI时代的真实价值。与此同时,百度智能同步发布企业数据智能平台 **"百度胜算"**
    的头像 发表于 05-17 09:47 1364次阅读

    百度智能正式发布Hogee

    5月13日,在Create2026百度AI开发者大会上,百度智能正式发布了一款全新的企业一站式AI营销应用——Hogee。这款产品的亮相,标志着
    的头像 发表于 05-15 09:18 814次阅读

    利尔达作为“数据通道与硬件方案”核心伙伴亮相2026百度AI开发者大会

    “芯模体”全栈能力支撑智能体应用爆发。百度智能同步升级为面向大规模
    的头像 发表于 05-14 17:36 320次阅读
    利尔达作为“数据通道与硬件<b class='flag-5'>方案</b>”核心伙伴亮相2026<b class='flag-5'>百度</b>AI开发者大会

    百度地图LD解决方案助力无人配送行业规模落地

    在今日举办的智能网联汽车发展论坛无人配送生态大会主论坛百度地图无人车解决方案产品负责人发表了题为《百度LD无人配送规模
    的头像 发表于 03-31 13:54 569次阅读

    百度智能推出首个国产企业级满血版OpenClaw产品DuMate

    今天,首个国产企业级满血版OpenClaw——百度智能DuMate(中文名:搭子)正式上线,全量开放。你的专属AI搭子来了!
    的头像 发表于 03-24 10:27 811次阅读

    百度智能推出全球首款手机龙虾应用

    昨天,百度智能发布了一款即开即用的零部署服务DuClaw。目前,DuClaw网页端服务已上线,能够实现零门槛“养虾”。DuClaw来了!零门槛开启自由“养虾”
    的头像 发表于 03-13 11:38 682次阅读

    有方科技携手百度智能重塑AI赋能新生态

    12月30日,由百度智能主办的“智思享会:大模型重塑消费电子新体验”行业研讨会在深圳举办。本次大会汇聚了芯片、模组、方案商、大模型、品牌
    的头像 发表于 01-08 11:00 591次阅读

    百度世界大会亮点 五年五芯 百度宣布打造最硬AI

    年,持续为行业搭建起交流前沿技术、碰撞创新思维、洞察未来趋势的重要平台。 今日(11月13日)Baidu World 2025在北京举办。在这里,可以体验AI应用的价值涌现,见证AI能力的创新爆发。 今年的百度世界2025“效果涌现|AI in Action”为主题,设
    的头像 发表于 11-13 15:47 2064次阅读

    嵌入式实时操作系统及应用开发(第三版)罗蕾主编光盘镜像百度链接

    嵌入式实时操作系统及应用开发(第三版)罗蕾主编光盘镜像百度链接通过网盘分享的文件:嵌入式系统配套光盘.iso链接: https://pan.baidu.com/s/1R3IprlRnOTo0_7lEKjd_tA 提取码: 2c23
    发表于 11-12 16:20

    光庭信息成为百度智能大模型行业合伙人

    8月28日-30日,智能,生成无限可能”为主题的百度智大会在北京举办。数千位行业领袖、技术专家与企业代表齐聚一堂,共同见证人工智能从技
    的头像 发表于 09-02 16:17 1036次阅读

    珠海泰芯半导体携手百度共筑智能硬件产业新生态

    2025年8月29日,北京国际会议中心二期迎来科技行业年度盛会。由百度智能与极客公园联合主办的百度智大会AI+
    的头像 发表于 09-01 17:46 1314次阅读

    昆仑芯科技亮相2025百度智大会

    近日,2025百度智大会在北京国家会议中心二期隆重启幕。本届大会智能,生成无限可能”为主题,聚焦人工智能从技术到产业的全链条落地,深入
    的头像 发表于 09-01 11:00 1577次阅读

    百度智能全面升级舸5.0和千帆4.0

    大会上,百度智能全面升级舸AI计算平台5.0、千帆企业级AI开发平台4.0两大AI基础设施,帮助企业更低成本、更高效率部署和开发AI产
    的头像 发表于 08-30 09:18 2069次阅读

    百度智能亮相第二十二届ChinaJoy

    百度智能亮相第二十二届ChinaJoy 8月1日,第二十二届中国国际数码互动娱乐展览会(ChinaJoy)在上海开幕。大会期间,百度全景展示了百度
    的头像 发表于 08-05 09:47 1000次阅读

    65%央企大模型落地首选百度智能

    今天,很荣幸地分享一个好消息,百度智能已牵手65%的央企,共同推进大模型产业落地。得益于全栈的AI能力,百度联合众多央国企伙伴,针对各类不同业务场景,
    的头像 发表于 06-11 15:44 1108次阅读