0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据的主要特征有哪些

汽车玩家 来源:个人图书馆、百度服务商 作者:个人图书馆、百度 2022-02-07 10:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术,明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。

在莱尼的理论基础上,IBM提出大数据的4V特征得到了业界的广泛认可:第一,数量,即数据巨大,从TB级别跃升到PB级别;第二,多样性,即数据类型繁多,不仅包括传统的格式化数据,还包括来自互联网的网络日志、视频、图片、地理位置信息等;第三,速度,即处理速度快;第四,真实性,即追求高质量的数据。

数据体量巨大

容量大是大数据的首要特征,随着网络的发展,迫切的需要足够大的容量去统计分析以及预测大规模的数据。最开始的mp3时代仅仅只是mb级的存储,但是已经能满足很多人的要求了。随着信息技术的高度发展,存储单位也慢慢的发生了演变。从大家耳熟能详的***存储到了tb存储,乃至现在有了pb,eb等存储。

数据速度快

大数据的数据产生、处理和分析的速度在持续加快。加速的原因是数据创建的实时性特点,以及将流数据结合到业务流程和决策过程中的需求。数据处理速度快,处理模式已经开始从批处理转向流处理。业界对大数据的处理能力有一个称谓——“1秒定律”,也就是说,可以从各种类型的数据中快速获得高价值的信息。大数据的快速处理能力充分体现出它与传统的数据处理技术的本质区别。

数据类型繁多

大数据的数据类型繁多,传统IT产业产生和处理的数据类型较为单一,大部分是结构化数据。随着传感器、智能设备、社交网络、物联网、移动计算、在线广告等新的渠道和技术不断涌现,产生的数据类型无以计数。

现在的数据类型不再只是格式化数据,更多的是半结构化或者非结构化数据,如XML、邮件、博客、即时消息、视频、照片、点击流、日志文件等。企业需要整合、存储和分析来自复杂的传统和非传统信息源的数据,包括企业内部和外部的数据。因为大数据的来源非常广泛,所以多样性成为了大数据的另一大特点。在任何形式下,所获取的来源都是可以使用的,目前为止应用比较广泛的有淘宝,网易云,头条等等。这些平台通过对用户的数据进行分析,从而对应的推荐一些用户比较喜欢的东西。

真实性

数据的重要性就在于对决策的支持,数据的规模并不能决定其能否为决策提供帮助,数据的真实性和质量才是获得真知和思路最重要的因素,是制定成功决策最坚实的基础。追求高数据质量是一项重要的大数据要求和挑战,即使最优秀的数据清理方法也无法消除某些数据固有的不可预测性。

在处理这些类型的数据时,数据清理无法修正这种不确定性,然而,尽管存在不确定性,数据仍然包含宝贵的信息。我们必须承认、接受大数据的不确定性,并确定如何充分利用这一点。

文章整合自:个人图书馆、百度服务商点亮工场、蚂蚜网

审核编辑:鄢孟繁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 格式化
    +关注

    关注

    2

    文章

    39

    浏览量

    9524
  • 智能设备
    +关注

    关注

    5

    文章

    1141

    浏览量

    53050
  • 大数据
    +关注

    关注

    64

    文章

    9029

    浏览量

    143055
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    组态大数据平台是什么?什么功能?

    组态大数据平台是融合 组态技术 与 大数据处理能力 的综合性平台,通过图形化、可配置的方式实现数据采集、存储、分析、可视化及远程控制,适用于工业自动化、能源管理、楼宇监控等领域。其核心价值在于降低
    的头像 发表于 10-30 11:29 89次阅读
    组态<b class='flag-5'>大数据</b>平台是什么?<b class='flag-5'>有</b>什么功能?

    如何通过地址生成器实现神经网络特征图的padding?

    ,从而使卷积输出特征图结果满足我们的需求,这种补零的操作称之为padding,如下图所示。 关于padding的实现,一般两种操作,第一种是使用稀疏地址生成器,寻找padding数据地址的规律,当
    发表于 10-22 08:15

    御控工业物联网大数据解决方案:排水设备远程监控与大数据统计系统

    御控工业物联网推出排水设备远程监控与大数据统计系统,通过物联网、大数据、云计算等技术构建“感知-传输-分析-决策”闭环管理体系,助力排水行业数字化转型。
    的头像 发表于 09-12 10:04 487次阅读

    氮化镓电源IC U8732的主要特征

    磁芯饱和会导致变压器线圈感抗变小,回路电流大增,从而引起开关管的损坏。想要避免这些后果,就必须确保开关电源主变压器在工作过程中不会进入磁饱和状态。氮化镓电源ic U8732内部集成软启动功能,在
    的头像 发表于 08-18 16:30 5673次阅读
    氮化镓电源IC U8732的<b class='flag-5'>主要特征</b>

    快充电源芯片U8609的主要特征

    发电、输电、储电和用电的各个环节需要更智能、更高效的能源管理,才能更好实现降低能源消耗、低碳化的愿景。功率半导体技术则是这一链条各环节的核心所在。GaN技术的一个典型应用是,提升智能手机和笔记本电脑的充电器效率和功率密度。在GaN FET驱动市场,有这么一颗广受关注的快充电源芯片U8609,推荐给各位小伙伴!
    的头像 发表于 08-12 17:50 1133次阅读

    在EZ串行的BLE“无响应写入”中, CAN一次通信中接收的最大数据包大小是多少?

    ; BLE (GATT) 应用程序 在此环境中,数据从客户端发送到 W \" rite,但没有响应 \" ez-Serial 的 “未确认数据特征” (UUID
    发表于 07-07 07:33

    PD快充芯片U8766的主要特征

    芯片工作频率指芯片内部时钟信号的振荡速率,是芯片性能的重要基础。晶体管导通电阻越小、切换速度越快,信号传输效率越高。PD快充芯片U8766的工作频率最高可达220kHz,可全范围工作在准谐振模式。芯片集成峰值电流抖动功能和驱动电流配置功能,可极大的优化系统EMI性能。U8766内置Boost供电电路,非常适用于宽输出电压的应用场景。
    的头像 发表于 06-18 16:47 861次阅读

    智慧环保大数据管理平台什么功能

    在环境污染问题日益严峻的当下,智慧环保大数据管理平台成为环境治理的重要利器。它围绕污水处理、垃圾处理、气体监测三大核心场景,深度融合大数据、物联网、人工智能等技术,构建起全方位、智能化的环境管理
    的头像 发表于 06-06 15:17 455次阅读
    智慧环保<b class='flag-5'>大数据</b>管理平台<b class='flag-5'>有</b>什么功能

    更改最大数据包大小时无法识别USB设备如何解决?

    将生产者 EP 端点描述符中的最大数据包大小从 1024 字节更改为 512 字节时,无法识别 USB 设备。 请告知如何解决这个问题。
    发表于 05-20 08:13

    大数据与云计算是干嘛的?

    大数据与云计算是支撑现代数字化技术的两大核心。大数据专注于海量数据的采集、存储、分析与价值挖掘;云计算通过虚拟化资源池提供弹性计算、存储及服务能力。两者结合,共同赋能企业决策、业务创新和效率提升。下面UU云小编将详细剖析
    的头像 发表于 02-20 14:48 1266次阅读

    大数据云计算都需要考什么证书?

    大数据和云计算领域包含多种专业证书,其中大数据领域涵盖数据分析类证书、大数据工程类证书、数据治理类证书。云计算领域领域涵盖云计算技术类证书、
    的头像 发表于 02-19 11:05 1191次阅读

    同步整流芯片U7612的主要特征

    同步整流芯片与主控配合,使整流元件与主开关管同步工作,避免了二极管反向恢复时间产生的电流谐波,能有效减少电磁干扰,使产品更易通过电磁兼容性测试。同步整流芯片U7612是一款带快速关断功能的高性能副边同步整流功率开关,可以替代肖特基整流二极管以提高系统效率。
    的头像 发表于 02-17 16:13 888次阅读

    电源管理IC U6018的主要特征

    DIP-8 封装的电源管理ic引脚布局相对简单,信号传输路径较为直接,有利于减少信号传输过程中的干扰和延迟,适合于一些对电气性能要求不是特别苛刻的低频、低功率电路应用。电源管理ic U6018采用DIP-8封装,内置通用初级侧CC控制,简化了隔离电源设计,是一款高性能电流模式PWM电源开关,适用于离线反激式转换器应用。
    的头像 发表于 02-12 15:57 894次阅读

    开关柜机械特征监控主要参数哪些?如何实现?

    蜀瑞创新为大家科普:开关柜机械特征监控是指对电力系统中使用的开关设备的机械性能进行监测,以确保其正常运行并预防故障。开关柜机械特征监控是确保电力系统安全稳定运行的重要环节。其实现方式主要依赖于多种技术手段的综合运用。
    的头像 发表于 12-21 16:35 737次阅读
    开关柜机械<b class='flag-5'>特征</b>监控<b class='flag-5'>主要</b>参数哪些?如何实现?

    缓存对大数据处理的影响分析

    缓存对大数据处理的影响显著且重要,主要体现在以下几个方面: 一、提高数据访问速度 在大数据环境中,数据存储通常采用分布式存储系统,
    的头像 发表于 12-18 09:45 1106次阅读