0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

弹性、高效,腾讯云大数据混合云存储之道

存储界 来源:存储界 2020-07-02 11:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

企业数字化转型过程中,数据价值被显著放大,大数据应用成为不少企业探索的重点。

从技术上看,大数据业务由于数据体量大,且数据量很多时候呈急速膨胀状态;在进行大数据计算分析时,对资源的需求呈现浪涌式特征,又偶有突发性,因此通过上云充分发挥资源按需使用按需付费的优势,成为了不少企业在探索大数据应用时的常见模式。

这其中,企业在综合考量数据安全性、可扩展、可管理和成本效益等因素后,混合云部署的方式就成为了企业的主流选择。

近日,腾讯云存储高级产品经理贺永红在混合云主题论坛上发表演讲,详解了大数据应用上云的新思路。

一、企业自建大数据的难点

企业数据中心自建大数据业务,一般会遇到扩容的问题,随着大数据分析在业务价值挖掘上的作用愈加重要,新增及突发的分析任务越来越多,此时,趋于饱和使用率的硬件资源便会成为瓶颈,从提交预算申领设备到新设备加入分析集群通常需要较长时间(有时会超过一个月),这样会也导致大数据计算结果延期交付。随着时间推移,大数据中存储的数据越来越多,如何降低数据的存储成本,在需要的时候又能快速分析。

二、大数据混合云存储之道

大数据混合云存储将IDC大数据和公有云大数据连接为混合云,通过存算分离(计算与存储分离),实现计算弹性伸缩;通过数据全生命周期自动沉降实现存储低成本。

三、大数据混合云存储中的关键技术

1、存算分离

存算分离,计算与存储分离,计算基于标准HDFS协议访问存储,计算资源和存储资源各自按需扩容;计算资源可以分钟级按需创建及销毁,数据存储在COS(Cloud Object Storage)「https://cloud.tencent.com/product/cos」统一存储层,集中存储、统一管理。

存算分离,让数据存储在云中对象存储COS上,计算集群直接分析COS中的数据,计算资源专注于计算,按需实现弹性伸缩,按需创建及销毁,不用维持冗余设备来保存数据;通过计算与存储分离,实现计算弹性伸缩,按需创建及销毁,可以节约大数据20-30%的成本。

2、高效存储

存储资源COS(Cloud Object Storage)海量、无容量上限、无需扩容、按需供给,高效、平滑接入大数据生态、按需使用付费、通过生命周期策略自动沉降极致降低成本。

COS中存储类型分为标准存储、低频存储和归档存储,通过配置数据全生命周期策略实现自动沉降:经常访问的数据放在标准存储,较少访问的数据放在低频存储,基本不访问的数据放在归档存储,以上三种存储类型,价格不同,例如归档存储刊例价就不到标准存储刊例价的1/3,数据自动沉降后成本节约20-30%。数据沉降归档后,能及时回热,需要用的时候能及时被计算集群访问。

3、统一管理

云上云下的统一管理,一致使用体验;在数据面云上COS与IDC中HDFS统一元数据管理,实现全量数据ETL(抽取、转换、装载)。在技术面,云上和云下均采用大数据开源组件,接入大数据开源生态,保持一致使用体验。

4、数据高效流动

云下与云上的数据流动,这里主要包括两种数据流动。

其一、数据在IDC与云上COS间快速水平流动;用户每天可往云上COS灌入200TB+数据,基于COS海量并发设计,可进一步加粗上传管道,加速数据上云。数据下云,一般是结算结果返回到用户IDC,这部分数据量比较小,是从海量沙子里掏出的金子,不存在技术挑战。

其二、数据在EMR「https://cloud.tencent.com/product/emr」计算与COS存储间快速垂直流动,在EMR进行大数据计算时,需要在瞬间从COS中读取大量数据到EMR中进行计算,关键技术是COS的高性能,来满足数据的快速读写。

四、腾讯云大数据混合云存储实践

腾讯云大数据混合云存储方案,经历腾讯内部业务(微信、QQ、腾讯视频等)长期打磨而沉淀下来。

腾讯云大数据混合云存储,包括三层:混合大数据引擎、任务统一编排、数据开发平台:数据开发平台实现数据价值开发,包括用户画像、广告推荐等;任务统一编排实现大数据任务在IDC及云中全局调度及计算弹性伸缩;混合大数据引擎对IDC及云中大数据进行管理。

某头部游戏直播公司,大数据体量大,很早就成立了近百人的专业大数据团队,以支撑近百P规模的离线、实时流式数据的高效存储计算及数据科学探索。

其大数据架构如图,左边本地IDC,右边腾讯云 EMR ON COS,通过专线打通,数据互通,优先上传分析用到的数据,将数据导入到腾讯云COS中;基于存算分离,通过腾讯云EMR产品创建的Hadoop集群分析已导入到COS中数据。分析任务结束后,销毁EMR集群,不再产生费用,COS数据自动沉降进一步降低成本。

五、结语

腾讯云大数据混合云,能够实现大数据业务平滑上云,并实现对已有IDC硬件资源的合理利用,实现业务弹性伸缩,实现存储资源和计算资源的高效利用。

未来,腾讯云存储还将以业务场景为指引,推出更多高效的云存储方案,并结合生态资源,为用户提供更好的云上存储服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4892

    浏览量

    90292
  • 大数据
    +关注

    关注

    64

    文章

    9097

    浏览量

    144063
  • 腾讯云
    +关注

    关注

    0

    文章

    225

    浏览量

    17500

原文标题:弹性、高效,腾讯云大数据混合云存储之道

文章出处:【微信号:cunchujie,微信公众号:存储界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MediaTek与腾讯签署战略合作备忘录

    MediaTek 与腾讯正式签署战略合作备忘录(MOU),宣布将在智能座舱及移动计算领域展开深度合作。双方将结合 MediaTek 在旗舰移动芯片和边缘计算领域的深厚技术实力,与腾讯
    的头像 发表于 04-24 17:16 779次阅读

    科技经营模式与价值体系说明

    核心业务科技提供基于软件定义广域网的智能网络连接解决方案,并深度整合各类服务(公有、私有
    的头像 发表于 03-25 10:02 1411次阅读
    <b class='flag-5'>云</b>边<b class='flag-5'>云</b>科技经营模式与价值体系说明

    什么是企业服务器-计算

    企业服务器是指为企业提供的基于计算技术的服务器解决方案。华纳是一家计算服务提供商,为企业客户提供服务器和相关的
    的头像 发表于 12-29 17:57 1078次阅读

    科技SD-WAN解决方案 — 构建安全、高效、智能的网基石

    的数字竞争力。中宇联科技SD-WAN解决方案,以安全、高效、智能为核心,为企业提供新一代网融合能力,助力业务无缝上,保障关键应用体
    的头像 发表于 11-12 11:03 855次阅读
    <b class='flag-5'>云</b>边<b class='flag-5'>云</b>科技SD-WAN解决方案 — 构建安全、<b class='flag-5'>高效</b>、智能的<b class='flag-5'>云</b>网基石

    德明利企业级SSD与OpenCloudOS、腾讯完成技术兼容互认证

    德明利TS3160系列企业级SATA SSD产品与OpenCloudOS、腾讯相互兼容认证
    的头像 发表于 10-17 15:48 826次阅读
    德明利企业级SSD与OpenCloudOS、<b class='flag-5'>腾讯</b><b class='flag-5'>云</b>完成技术兼容互认证

    Jtti分享混合与多云环境中的网络互联与数据迁移

    混合与多云架构已成为企业数字化转型的核心策略,但实现高效的网络互联与数据迁移面临诸多挑战。本文将深入探讨技术方案、实践案例及未来趋势。 网络互联方案 1.  专线连接:通过专线服务提
    的头像 发表于 09-16 17:43 814次阅读

    科技银河存储:重构AI时代的存储新范式

    在人工智能与高性能计算需求呈指数级增长的今天,数据存储的效率与可靠性已成为算力释放的关键支撑。上海霄信息科技有限公司正式推出全新一代AI存储产品--霄
    的头像 发表于 08-21 10:36 1089次阅读
    霄<b class='flag-5'>云</b>科技银河<b class='flag-5'>存储</b>:重构AI时代的<b class='flag-5'>存储</b>新范式

    数据中台可以接入哪些物联网平台

    数据中台作为企业数字化转型的核心枢纽,能够通过标准化接口、协议适配及数据治理能力,接入多种类型的物联网平台,实现设备数据采集、存储、分析及
    的头像 发表于 08-19 15:22 939次阅读

    开放原子开源基金会与腾讯达成合作

    近日,在北京举行的2025开放原子开源生态大会现场,开放原子开源基金会与腾讯计算(北京)有限责任公司签署“开源协作平台互联合作协议”。
    的头像 发表于 08-05 11:06 1519次阅读

    存储数据安全吗?别再被骗了!这才是真正的企业级安全方案

    随着企业数字化转型加速,存储已成为数据管理的核心载体。然而,“数据”引发的安全焦虑始终挥之不去:我的文件会被黑客窃取吗?服务商能否看到
    的头像 发表于 07-31 10:03 1425次阅读
    <b class='flag-5'>云</b><b class='flag-5'>存储</b><b class='flag-5'>数据</b>安全吗?别再被骗了!这才是真正的企业级安全方案

    HarmonyOS5服务技术分享--存储指南

    Hi各位开发者伙伴们!今天咱们来聊一聊HarmonyOS存储的实战玩法,手把手教你实现文件上传、下载、元数据操作等核心功能。无需官方文档的严肃感,咱们用最接地气的方式搞懂这些API怎么用!(文末附
    发表于 05-22 19:17

    HarmonyOS5服务技术分享--存储SDK文章整理

    在HarmonyOS ArkTS应用中集成华为存储SDK指南 大家好呀!今天咱们来聊聊如何将华为存储SDK集成到基于ArkTS(API 9-11)的HarmonyOS应用中。这篇指
    发表于 05-22 19:09

    HarmonyOS5服务技术分享--数据库使用指南

    ​​: 敏感数据启用字段级加密(如用户手机号)。 ? ​​总结​​ 华为数据库(CloudDB)让HarmonyOS应用的数据管理变得轻松又高效
    发表于 05-22 18:29

    HarmonyOS5服务技术分享--ArkTS开发Node环境

    ? 性能优化 ​​冷启动优化​​:保持函数轻量(建议代码包<10MB),使用require按需加载模块。 ​​缓存机制​​:利用数据库存储高频访问数据,减少重复计算。 ⚠️ 常见问题
    发表于 05-22 17:21

    存储服务器租用的好处有哪些?

    随着企业数字化转型加速,存储服务器租用成为越来越多企业的首选方案。存储服务器租用的好处在于弹性灵活、成本可控、安全可靠,同时避免了传统服
    的头像 发表于 05-16 11:03 953次阅读