0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据的特征及技术关键

jf_78858299 来源:计算机大学生 作者:史爱武 2023-05-10 15:32 次阅读

大数据的特征

大数据的定义多而杂,不同企业、行业等都从自身角度来定义大数据,意思都差不多,就一句话,大数据由巨型数据集组成,这些数据集规模超出了常用软件在可接受时间下的收集、管理、处理和使用能力。

虽然大数据的定义没有统一,但是国际知名咨询公司IDC定义的大数据四个特征却受到业界的广泛接受,也就是4V特征——数据量大(Volume)、数据种类多(Variety)、数据价值密度低(Value) 以及数据产生和处理速度快(Velocity)。

01

数据量大(Volume)

传感器物联网工业互联网、车联网、手机、平板电脑等等,无一不是数据来源或者承载的方式。当今的数字时代,人们日常生活(微信、QQ、上网搜索与购物等)都在产生着数量庞大的数据。

大数据不再以GB或TB为单位来衡量,而是以PB(1000个T)、EB(100万个T)或ZB(10亿个T)为计量单位,从TB跃升到PB、EB乃至ZB级别。顾名思义,这就是大数据的首要特征。

02

数据种类多(Variety)

大数据不仅体现在量的急剧增长,数据类型亦是多样,可分为结构化、半结构化和非结构化数据。结构化数据存储在多年来一直主导着IT应用的关系型数据库中;半结构化数据包括电子邮件、文字处理文件以及大量的网络新闻等,以内容为基础,这也是谷歌和百度存在的理由;而非结构化数据随着社交网络、移动计算和传感器等新技术应用不断产生,广泛存在于社交网络、物联网、电子商务之中。

有报告称,全世界结构化数据和非结构化数据的增长率分别是32%、63%,网络日志、音视频、图片、地理位置信息等非结构化数据量占比达到80%左右,并在逐步提升。然而,产生人类智慧的大数据往往就是这些非结构化数据。

03

数据价值密度低(Value)

大数据的重点不在于其数据量的增长,而是在信息爆炸时代对数据价值的再挖掘,如何挖掘出大数据的有效信息,才是至关重要。

价值密度的高低与数据总量的大小成反比。虽然价值密度低是日益凸显的一个大数据特性,但是对大数据进行研究、分析挖掘仍然是具有深刻意义的,大数据的价值依然是不可估量的。毕竟,价值是推动一切技术(包括大数据技术)研究和发展的内生决定性动力。

04

数据产生和处理速度快(Velocity)

美国互联网数据中心指出,企业数据正在以55%的速度逐年增长,互联网数据每年将增长50%,每两年便将翻一番。IBM研究表明,整个人类文明所获得的全部数据中,90%是过去两年内产生的。

要求数据处理速度快也是大数据区别于传统数据挖掘技术的本质特征。有学者提出了与之相关的“一秒定律”,意思就是在这一秒有用的数据,下一秒可能就失效。数据价值除了与数据规模相关,还与数据处理速度成正比关系,也就是,数据处理速度越快、越及时,其发挥的效能就越大、价值越大。

大数据的关键技术

大数据技术是IT领域新一代的技术与架构,是从各种类型的数据中快速获得有价值信息的技术。大数据本质也是数据,其关键技术依然不外乎:大数据采集和预处理;大数据存储与管理;大数据分析和挖掘;大数据展现和应用(大数据检索、大数据可视化、大数据安全等)。

01

大数据采集和预处理技术

大数据技术的意义确实不在于掌握规模庞大的数据信息,而在于对这些数据进行智能处理,从中分析和挖掘出有价值的信息,但前提是得拥有大量的数据。

采集是大数据价值挖掘最重要的一环,一般通过传感器、通信网络、智能识别系统及软硬件资源接入系统,实现对各种类型海量数据的智能化识别、定位、跟踪、接入、传输、信号转换等。为了快速分析处理,大数据预处理技术要对多种类型的数据进行抽取、清洗、转换等操作,将这些复杂的数据转化为有效的、单一的或者便于处理的数据类型。

就算是大数据服务企业也很难就“哪些数据未来将成为资产”这个问题给出确切的答案。但可以肯定的是,谁掌握了足够的数据,谁就有可能掌握未来,现在的数据采集就是将来的流动资产积累。

02

大数据存储与管理技术

数据有多种分类方法,有结构化、半结构化、非结构化;也有元数据、主数据、业务数据;还可以分为GIS、视频、文本、语音、业务交易类各种数据。传统的关系型数据库已经无法满足数据多样性的存储要求。除了关系型数据库,还有两种存储类型,一种是以HDFS为代表的可以直接应用于非结构化文件存储的分布式存储系统,另一种是NoSQL数据库,可以存储半结构化和非结构化数据。大数据存储与管理就是要用这些存储技术把采集到的数据存储起来,并进行管理和调用。

在一般的大数据存储层,关系型数据库、NoSQL数据库和分布式存储系统三种存储方式都可能存在,业务应用根据实际的情况选择不同的存储模式。为了提高业务的存储和读取便捷性,存储层可能封装成为一套统一访问的数据服务(Data as a Service,DaaS)。DaaS可以实现业务应用和存储基础设施的彻底解耦,用户并不需要关心底层存储细节,只关心数据的存取。

03

大数据分析和挖掘技术

大数据分析和挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、有用的信息和知识的过程。大数据分析和挖掘涉及的技术方法很多:根据挖掘任务可分为分类或预测模型发现、关联规则发现、依赖关系或依赖模型发现、异常和趋势发现等;根据挖掘方法可分为机器学习、统计方法、神经网络等。其中,机器学习又可细分为归纳学习、遗传算法等;统计方法可细分为回归分析、聚类分析、探索性分析等;神经网络可细分为前馈网络、反馈网络等。

面对不同的分析或预测需求,所需要的分析挖掘算法和模型是完全不同的。上面提到的各种技术方法只是一个处理问题的思路,面对真正的应用场景时,都得按需求来调整这些算法和模型。

04

大数据展现和应用技术

大数据的使用对象远远不只是程序员和专业工程师,如何将大数据技术的分析成果展现给普通用户或者公司决策者,这就要看数据展现的可视化技术了,它是目前解释大数据最有效的手段之一。在数据可视化中,数据结果以简单形象的可视化、图形化、智能化的形式呈现给用户供其分析使用。常见的大数据可视化技术有标签云、历史流、空间信息流等。

我国的大数据应用广泛存在于商业智能、政府决策和公共服务等重点领域,疫情防控、反电信诈骗、智能交通、环境监测等日常生活场景都有大数据的功劳。

大数据时代对我们驾驭数据的能力提出了新挑战,也为获得更全面、睿智的洞察力提供了空间和潜力。大数据领域已经涌现出了大量新技术,它们成为大数据采集、存储、处理和展现的有力武器。随着大数据等新兴技术的发展和应用,我国“十四五”规划提出的碳达峰碳中和、数字化转型、数字经济等一系列战略目标将获得更大的技术支撑。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IDC
    IDC
    +关注

    关注

    4

    文章

    369

    浏览量

    36912
  • Value
    +关注

    关注

    0

    文章

    9

    浏览量

    8478
  • 大数据
    +关注

    关注

    64

    文章

    8649

    浏览量

    136587
收藏 人收藏

    评论

    相关推荐

    工业大数据

    工业大数据是未来工业在全球市场竞争中发挥优势的关键。无论是德国工业4.0、美国工业互联网还是《中国制造2025》,各国制造业创新战略的实施基础都是工业大数据的搜集和特征分析,及以此为未
    发表于 06-19 17:43

    大数据技术经验交流 场景化数据算法

    可视化数据指导,让每一个人看懂大数据;多场景数据算法,让所有数据都有迹可循;大数据技术经验交流群
    发表于 06-01 17:12

    常用大数据处理技术归类

    “21世纪最缺的是什么?人才!”。在大数据发展如此之快的今天,大数据工程师已经成为一个新兴职业。大数据是信息技术,是人和人、人和机器、机器和机器交互的内容
    发表于 02-28 17:02

    常见大数据应用有哪些?

    以及亚马逊等大型企业也将大数据技术列为未来发展的关键筹码,可见,大数据技术在当今乃至未来的重要性!大数据
    发表于 03-13 16:50

    大数据运用的技术

    大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所
    发表于 04-08 16:50

    大数据开发核心技术详解

    ,cube等。由此可以看来大数据两大核心为云技术和BI,离开云技术大数据没有根基和落地可能,离开BI和价值,大数据又变化为舍本逐末,丢弃
    发表于 07-26 16:26

    NLPIR系统KGB知识图谱技术助力大数据深度挖掘

    大数据技术不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的
    发表于 12-05 11:49

    NLPIR-Parser大数据技术实现深度文本语义理解

    、可计算的基础;在确定了特征表示方式的基础上,从文本大数据中学习能够精确表达文本语义的特征是实现内容理解的关键。  近年来,表示学习(representation learning)或
    发表于 12-18 11:58

    4G移动通信关键技术特征是什么?

    4G移动通信关键技术特征是什么?
    发表于 05-26 06:37

    大数据的定义及其应用

    目录1、大数据概述1.1. 概述1.2. 大数据定义1.3. 大数据技术发展2、大数据应用2.1. 大数
    发表于 07-12 06:12

    什么是大数据大数据的特点有哪些

    大数据(big data)目录1什么是大数据2大数据的定义3大数据的特点[1]4大数据的作用[2]5大数
    发表于 07-12 06:52

    大数据技术与应用是学什么的?

    大数据技术与应用是学什么的?大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据
    发表于 07-27 07:47

    大数据的主要特征有哪些

    从某种程度上说,大数据数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据
    的头像 发表于 02-07 10:43 1.6w次阅读

    大数据的4v特征有哪些 大数据技术包括哪些技术

    大数据的4V特征是指数据的特点,主要包括以下四个方面:   1. Volume(数据量):所谓大数据,就是指
    的头像 发表于 04-16 16:08 1.4w次阅读

    大数据的4个关键技术

    Volume 大数据数据量大,数据量单位为T 或者P级 * Variety 数据类型多,大数据包含多种
    的头像 发表于 05-10 15:30 2140次阅读
    <b class='flag-5'>大数据</b>的4个<b class='flag-5'>关键技术</b>