0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅谈大数据关键技术之大数据存储及管理

工程师邓生 来源: 51cto 作者:佚名 2020-11-20 17:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据存储作为大数据的核心环节之一,可以理解为方便对既定数据内容进行归档、整理和共享的过程。自磁盘系统问世以来,数据存储已经走过了近百年的历程。

对于存储,计算机就像我们的大脑一样,两者都可以拥有短期记忆和长期记忆,例如大脑是通过前额叶皮层来处理短期记忆,而计算机则利用RAM(随机存取存储器)来处理短期记忆。大脑和计算机都需要在清醒的状态下处理并记住事务,并在工作一段时间后会感到疲倦。

大脑在睡眠时会将工作记忆转换为长期记忆,而计算机则在睡眠时将活动记忆转换为存储卷。计算机还会按类型来分配数据,就像大脑按语义、空间、情感或规程来分配记忆一样。

而在大数据时代,由于从多渠道获得的数据通常缺乏一致性,数据结构混杂,且数据不断增长,更何况任何机器都会有物理上的限制:内存容量、硬盘容量、处理器速度等。

这就导致对于单机系统来说,即使及时不断提升硬件配置也很难跟上数据增长的速度,我们需要在硬件限制和性能之间做取舍。

因此对于那些希望从比存储和使用成本更高的数据中获得价值的企业和组织来讲,有效的数据存储和管理变得比以往任何时候都更加重要。

大数据存储与管理的技术对整个大数据系统都至关重要,数据存储与管理的好坏直接影响了整个大数据系统的性能表现。

数据存储和管理如今并不止被定义为接收、存储、组织和维护组织创建的数据,更多时候它还意味着更多内容,包括但不限于:

对数据进行分类; 聚合、收集和解析数据的元数据; 保护数据和元数据不受自然和人为中断的影响; 在内部部署和地理上移动数据,以进行共享、归档、复制、数据保护、存储系统技术更新和迁移,并访问所需的分析引擎,从而对该数据进行更深入的研究; 在进行一次或多次移动后,保持用户和应用程序对数据的透明访问; 提供用户可定义的策略,这些策略可自动移动、复制和删除数据; 部署人工智能机器学习以优化和自动化大多数数据管理功能; 搜索数据并提供可行的信息和见解; 使数据符合个人识别信息法律和法规; 将数据管理扩展到数百PB甚至EB的快速扩展数据。

根据数据存储和管理的内容范围,我们可以大致理解大数据存储及管理技术需要重点研究如何解决大数据的可存储、可表示、可处理、可靠性及有效传输等几个关键问题。

具体来讲需要解决的往往是以下几类问题:海量文件的存储与管理,海量小文件的传输、索引和管理,海量大文件的分块与存储,系统可扩展性与可靠性。

伴随着重点研究问题,在大数据存储和管理发展过程中,出现了几种较为有效的存储和管理大数据的方式:

1.不断加密

对于任何一个企业来说,任何类型的数据都可能是至关重要且私有的,只有能在自己掌控的范围内才可以说是安全的。然而,很多行业巨头容易成为黑客攻击的首要目标,许多公司会对此有危机感。

随着企业为保护资产而全面开展对于黑客的反击,加密技术成为了打击网络威胁的可行途径:

通过将所有内容转换为代码,使用加密信息,只有收件人可以解码。如果没有其他的要求,则加密保护数据传输,增强在数字传输中有效地到达正确人群的机会。

2. 仓库存储

有人说,大数据似乎就像一个永无休止的数据漩涡,极其难被管理。

因此,可以考虑将信息精简后统一集中到一个指定位置——数据仓库。

通过对数据的存储、校准、整合及输出,对数据进行集中分层次管理,在保证数据时效性、生态性的同时,还能够对数据完成不同程度的处理。

3. 备份服务 - 云端

设想一下,假如数据存储技术在物理层面就停滞不前,而大数据却依旧以现在的速度持续增长,迟早有一天我们会面临数据无处存储的窘境,所幸大数据存储和管理正在迅速脱离物理机器的范畴,并迅速进入数字领域。

由于云存储服务推动了数字化转型,使得云计算的应用越来越繁荣。数据可以随时随地进行访问,并在云存储服务上进行备份,这也意味着如果出现网络攻击,云端将数据从A迁移到B甚至到C的方式来确保数据安全。

数字经济时代,大数据管理不仅仅是数据存储架构的变革,更是大数据思维方式的转变升级。用好数据是企业数字化转型的关键。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4693

    浏览量

    89570
  • 关键技术
    +关注

    关注

    0

    文章

    20

    浏览量

    12491
  • 大数据
    +关注

    关注

    64

    文章

    9029

    浏览量

    143067
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    大数据时代下的管理变革:勤哲EXCEL服务器助力企业高效运营

    大数据高速发展的今天,先进信息技术正在潜移默化地改变现代企业的经营管理模式。实践证明,这些技术不但提升了管理效率,还为企业决策提供了科学依
    的头像 发表于 11-19 14:29 161次阅读

    组态大数据平台是什么?有什么功能?

    组态大数据平台是融合 组态技术大数据处理能力 的综合性平台,通过图形化、可配置的方式实现数据采集、存储、分析、可视化及远程控制,适用于
    的头像 发表于 10-30 11:29 91次阅读
    组态<b class='flag-5'>大数据</b>平台是什么?有什么功能?

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统

    数据,结合大数据分析、流程自动化及云边协同技术,实现电磁环境全生命周期管理。以下从五大维度精简解析: 应用案例 北京华盛恒辉、北京五木恒润研发的 EMC/EMI 智能
    的头像 发表于 09-17 14:58 443次阅读

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统
    的头像 发表于 09-17 14:58 380次阅读
    电磁兼容与电磁干扰在电磁兼容性<b class='flag-5'>大数据</b>分析中的智能<b class='flag-5'>管理</b>平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统
    的头像 发表于 09-17 14:42 591次阅读
    电磁兼容与电磁干扰在电磁兼容性<b class='flag-5'>大数据</b>分析中的智能<b class='flag-5'>管理</b>系统

    御控工业物联网大数据解决方案:排水设备远程监控与大数据统计系统

    御控工业物联网推出排水设备远程监控与大数据统计系统,通过物联网、大数据、云计算等技术构建“感知-传输-分析-决策”闭环管理体系,助力排水行业数字化转型。
    的头像 发表于 09-12 10:04 490次阅读

    无人值守光伏电站管理系统实现的关键技术

    、智能诊断和自动控制,从而减少人工干预、提升运营效率。 光伏电要实现无人值守,需要采取多种关键技术,如物联网与传感器技术、人工智能与大数据、自动化控制与执行、安全与可靠性设计等。物联网与传感器
    的头像 发表于 07-11 11:00 758次阅读
    无人值守光伏电站<b class='flag-5'>管理</b>系统实现的<b class='flag-5'>关键技术</b>

    智慧环保大数据管理平台有什么功能

    在环境污染问题日益严峻的当下,智慧环保大数据管理平台成为环境治理的重要利器。它围绕污水处理、垃圾处理、气体监测三大核心场景,深度融合大数据、物联网、人工智能等技术,构建起全方位、智能化的环境
    的头像 发表于 06-06 15:17 455次阅读
    智慧环保<b class='flag-5'>大数据管理</b>平台有什么功能

    更改最大数据包大小时无法识别USB设备如何解决?

    将生产者 EP 端点描述符中的最大数据包大小从 1024 字节更改为 512 字节时,无法识别 USB 设备。 请告知如何解决这个问题。
    发表于 05-20 08:13

    大数据与云计算是干嘛的?

    大数据与云计算是支撑现代数字化技术的两大核心。大数据专注于海量数据的采集、存储、分析与价值挖掘;云计算通过虚拟化资源池提供弹性计算、
    的头像 发表于 02-20 14:48 1272次阅读

    公有云服务器在大数据与AI时代的角色与机遇

    推动了大数据分析和AI应用的普及与创新。 公有云服务器以其大规模集群管理能力和资源利用效率最大化的特点,成为解决算力“供不上、用不起”问题的重要抓手。在大数据处理方面,公有云服务器提供了强大的
    的头像 发表于 02-20 11:10 679次阅读

    大数据云计算都需要考什么证书?

    大数据和云计算领域包含多种专业证书,其中大数据领域涵盖数据分析类证书、大数据工程类证书、数据治理类证书。云计算领域领域涵盖云计算
    的头像 发表于 02-19 11:05 1192次阅读

    Hadoop 生态系统在大数据处理中的应用与实践

    随着数据量的爆发式增长,大数据处理技术成为企业关注焦点,Hadoop 生态系统在其中扮演着核心角色。 Hadoop Distributed File System(HDFS)是其分布式文件存储
    的头像 发表于 01-21 17:48 673次阅读

    工程大数据平台

    由于无人驾驶系统开发需要长期迭代优化,其过程需要大量的路试数据支撑,经纬恒润针对无人驾驶系统持续运营和持续迭代的需求,开发并在云端部署了车路云工程大数据平台,依托5G网络,具有远程数据采集、压缩、传输、解析、回放与算法无缝衔接等
    的头像 发表于 01-10 17:00 936次阅读
    工程<b class='flag-5'>大数据</b>平台

    缓存对大数据处理的影响分析

    缓存对大数据处理的影响显著且重要,主要体现在以下几个方面: 一、提高数据访问速度 在大数据环境中,数据存储通常采用分布式
    的头像 发表于 12-18 09:45 1108次阅读