0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

应用这4个方面对大数据进行阐述

工业互联网前线 来源:大数据DT 作者:大数据DT 2020-12-15 16:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摘要

我们将从大数据的概念、核心技术、特点、通用应用这4个方面对大数据进行阐述。

01 大数据概念

数据发展推动科技进步,海量数据给数据分析带来了新的机遇和挑战。大数据是一种强大到在获取、存储、管理、分析方面远远超出传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和较低的价值密度这四大特征。

于是,我们需要新的处理模式来实现更强的数据处理能力以应对多样化的信息资产。

大数据技术追求的不是精确性的样本数据,而是面向全体的数据,这部分数据可能是不精确的、非结构化的,但大数据技术正是利用这些之前未被利用的数据,创造新的价值。

从海量数据中获得的数据处理结果可能是超乎我们的认知逻辑的,但是我们并不需要理解结果背后的因果关系。简言之,我们需要用相关思维替代因果思维。

02 大数据核心技术

大数据在信息系统的生命周期中,从数据源到最终产生有价值的可视化信息,主要经历6个步骤,分别是数据收集、数据存储、资源管理与服务协调、计算框架确定、数据分析和数据可视化,此过程涵盖了海量分布式系统、数据库、并行计算框架、数据挖掘等方面的技术。

图2-1罗列了大数据技术中各个步骤目前所对应的主流技术体系,大数据的相关技术日新月异、层出不穷,由于篇幅限制,不再一一列举。

▲图2-1 大数据的主流技术体系

03 大数据特点

大数据具有海量的数据规模、快速的数据流转、多样的数据类型和较低的价值密度这四大特征,下面将分别进行详细阐述。

1. 海量的数据规模(Volume)

大数据所采集、存储和计算的数据规模都非常大。随着互联网的广泛应用,使用互联网的人和企业等增多,数据的创造者变多,数据量呈几何级增长。近年来,随着数据维度变多、数据类型增加、数据的描述能力增强,数据可以传达的信息也越来越多,越来越准确。

2. 快速的数据流转(Velocity)

大数据不仅增长速度快,处理速度也快,有很强的时效性。在信息时代,人成为网络的核心,每个人每天都在制造新的数据,这些数据再被相应的机构如政府、互联网企业、银行、电信运营商等收集,形成了一个个庞大的数据体系。

面对如此庞大的数据体系,处理数据并得到结果的速度越快,数据的时效性就越强,价值就越高——而大数据和传统数据挖掘最大的区别也在于此,大数据更强调数据处理的实时性和时效性。

3. 多样的数据类型(Variety)

大数据的种类和来源多样化,多样的数据为数据处理带来了挑战。在数据结构上,大数据可以分为结构化数据、半结构化数据和非结构化数据;在具体形式上,大数据可以分为视频、音频、图像、博客、社交网络、互联网搜索等。大数据迎接的挑战就是要针对这些结构不一、形式多样的数据,挖掘其中的相关性。而这些前所未有的、来自各个领域的、不同形式的数据,赋予了大数据强大的威力。

4. 较低的价值密度(Value)

大数据的价值密度相对较低。数据的价值密度和数据的规模呈反相关,数据的规模越大,数据的价值密度越低。大数据最大的价值即在于从大量低价值密度数据中挖掘出对分析和预测等有价值的信息。

相较于传统数据挖掘利用结构化的数据类型,大数据把目光也投向了非结构化的、非抽样的、包含全体的数据类型。这为大数据带来了更多的有效信息,但同时也增加了大量无价值的甚至是错误的信息。

04 大数据的通用应用

大数据已经渗透到了全世界市场中的各个领域,彰显着巨大的价值,其在各个领域的详细应用情况如下。

1. 金融领域

大数据在金融领域应用广泛,如针对个人的信贷风险评估,银行根据用户的刷卡、转账、微信评论等数据有针对性地推送广告;理财软件通过大数据为客户有针对性地推荐理财产品。总结来说,大数据在金融领域的应用可以概括为精准营销、风险控制、效率提升、决策支持。

2. 医疗领域

医疗行业拥有大量的病例、检测记录、药物记录、治疗结果记录等,这些数据中蕴含着巨大的价值,如果可以加以利用,将对医疗界产生不可估量的影响。疾病确诊和因人而异的治疗方案设定是医疗领域的重大问题,大数据可以帮助建立针对疾病特点、病人状况以及治疗方案的数据库,为人类健康贡献巨大的力量。

3. 生物领域

各国研究人员正如火如荼地推进着人类基因组计划,这促进了生物数据的爆发式增长。基因检测可以帮助人们对自己现在的以及未来的健康状况有更深刻、全面的认识,甚至可以帮助父母在宝宝出生前就对其健康状况进行检测。因此,人类基因组计划是未来人类战胜疾病的重要工具。

大数据可以整合已有的人类基因的检测结果并进行分析,加速人类基因组研究的进程。

4. 零售领域

零售行业可以利用大数据了解顾客的消费偏好和趋势,用以商品的精准营销和相关产品的精准推销,降低运营成本,提高进货管理和过期产品管理效率。大数据可以帮助零售商预测消费者需求趋势,更高效地提高供应链满足需求的能力。对大数据带来的潜在信息的挖掘和有效利用,将成为未来零售领域的必争之地。

5. 电商领域

电商行业的数据集中、数据规模大,可以利用大数据在很多方面进行有效信息的分析提取,如用户消费趋势、地域消费特点等。

电商领域中的大数据应用已经颇具规模,电商也是最早利用大数据进行精准营销的行业。电商可以根据顾客消费习惯提前备货以提高商品送达效率,还可以通过对客户浏览、收藏、加入购物车和购买记录等数据的分析,对用户进行有效的商品推荐,提高销量。

关于作者:王健宗,博士,某大型金融集团科技公司资深人工智能总监、高级工程师,中国计算机学会大数据专家委员会委员、高级会员,美国佛罗里达大学人工智能博士后,曾任美国莱斯大学电子与计算机工程系研究员、美国惠普公司高级云计算解决方案专家。何安珣,某大型金融集团科技公司高级算法工程师,中国计算机学会会员,中国计算机学会青年计算机科技论坛(YOCSEF深圳)委员。拥有丰富的金融智能从业经验,主要研究金融智能系统框架搭建、算法研究和模型融合技术等,致力于推动金融智能的落地应用与价值创造。李泽远,某大型金融集团科技公司高级人工智能产品经理,中国计算机学会会员,长期致力于金融智能的产品化工作,负责技术服务类的产品生态搭建与实施推进。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 核心技术
    +关注

    关注

    4

    文章

    625

    浏览量

    20436
  • 数据存储
    +关注

    关注

    5

    文章

    1014

    浏览量

    52586
  • 大数据
    +关注

    关注

    64

    文章

    9029

    浏览量

    143066

原文标题:终于有人把大数据讲明白了

文章出处:【微信号:IndustryIOT,微信公众号:工业互联网前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国密系列算法简介及SM4算法原理介绍

    使用了Feistel结构(分组密码中的一种对称结构),其中密钥扩展部分也使用了Feistel结构,所以对数据和密钥的处理流程极为相似。下面对SM4加密过程进行
    发表于 10-24 08:25

    御控工业物联网大数据解决方案:排水设备远程监控与大数据统计系统

    御控工业物联网推出排水设备远程监控与大数据统计系统,通过物联网、大数据、云计算等技术构建“感知-传输-分析-决策”闭环管理体系,助力排水行业数字化转型。
    的头像 发表于 09-12 10:04 490次阅读

    在EZ串行的BLE“无响应写入”中, CAN一次通信中接收的最大数据包大小是多少?

    :所有数据都显示在与 ez-Serial 和 PUART 连接的 TeraTerm 上 [问题] (1)在 EZ 串行的 BLE“无响应写入”中, CAN 一次通信中接收的最大数据包大小是多少? (2
    发表于 07-07 07:33

    更改最大数据包大小时无法识别USB设备如何解决?

    将生产者 EP 端点描述符中的最大数据包大小从 1024 字节更改为 512 字节时,无法识别 USB 设备。 请告知如何解决这个问题。
    发表于 05-20 08:13

    深开鸿成为中国物流与采购联合会大数据分会“副会长单位”

    近日,深开鸿与中国物流与采购联合会规划院、中国物流与采购联合会大数据分会在北京举行合作会谈。双方围绕数据资产入表、物流规划和行业发展等相关内容进行了沟通,并达成多项合作共识。会上,李锦莹会长代表中国
    的头像 发表于 05-19 19:06 613次阅读
    深开鸿成为中国物流与采购联合会<b class='flag-5'>大数据</b>分会“副会长单位”

    程序设计与数据结构

    的地址)出发,采用推导的方式,深入浅出的分析了广大C程序员学习和开发中遇到的难点。 2. 从方法论的高度对C语言在数据结构和算法方面的应用进行了深入讲解和阐述。 3. 讲解了绝大多
    发表于 05-13 16:45

    大数据与云计算是干嘛的?

    大数据与云计算是支撑现代数字化技术的两大核心。大数据专注于海量数据的采集、存储、分析与价值挖掘;云计算通过虚拟化资源池提供弹性计算、存储及服务能力。两者结合,共同赋能企业决策、业务创新和效率提升。下面UU云小编将详细剖析
    的头像 发表于 02-20 14:48 1272次阅读

    大数据云计算都需要考什么证书?

    大数据和云计算领域包含多种专业证书,其中大数据领域涵盖数据分析类证书、大数据工程类证书、数据治理类证书。云计算领域领域涵盖云计算技术类证书、
    的头像 发表于 02-19 11:05 1192次阅读

    ADS1212、ADS1231和ADS12303种AD芯片性能比较

    Drift,Noise Performance和温漂性能4方面对他们做一下比较,但是数据资料中给出的上述信息不全或者不清晰,所以还请T
    发表于 01-21 06:47

    LITESTAR 4D案例:进行隧道照明设计

    对投标人提供的项目的自动分析,以及将数据和计算结果保存在 Excel 文件中,并与 UNI 11095:2021 标准所需的参数进行比较,项目分析时间可平均节省 90% 以上。 LITESTAR 4
    发表于 01-17 09:55

    工程大数据平台

    由于无人驾驶系统开发需要长期迭代优化,其过程需要大量的路试数据支撑,经纬恒润针对无人驾驶系统持续运营和持续迭代的需求,开发并在云端部署了车路云工程大数据平台,依托5G网络,具有远程数据采集、压缩、传输、解析、回放与算法无缝衔接等
    的头像 发表于 01-10 17:00 936次阅读
    工程<b class='flag-5'>大数据</b>平台

    阐述屏蔽和双屏蔽网线区别

    屏蔽网线(STP)与双屏蔽网线(SFTP)在多个方面存在显著差异,以下是关于二者区别的详细阐述: 一、结构差异 屏蔽网线(STP):只有一层屏蔽层,层屏蔽层通常是由一层铝箔纸构成。铝箔纸
    的头像 发表于 12-20 10:07 1827次阅读

    缓存对大数据处理的影响分析

    缓存对大数据处理的影响显著且重要,主要体现在以下几个方面: 一、提高数据访问速度 在大数据环境中,数据存储通常采用分布式存储系统,
    的头像 发表于 12-18 09:45 1108次阅读

    使用ads131a04过程中,实际采集得到的最大数据约为理论的1.8倍,为什么?

    大家好,我在使用ads131a04过程中出现一问题,我是使用外部参考电压模式,参考电压为2.5V,ADC前端输入差分信号,AINP和AINN输入信号峰峰值为700mVpp,ADC采用16位数据
    发表于 12-17 08:07

    工业物联网网关如何高效数据采集传输

    工业物联网网关在高效数据采集传输方面扮演着至关重要的角色。以下是关于如何实现这一目标的详细阐述: 一、前期准备 ‌ 设备调研与评估 ‌ 在开始数据采集之前,需要对工业现场设备
    的头像 发表于 12-13 09:07 1148次阅读