0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于大数据的数学基础和大数据的利弊分析

独爱72H 来源:网络整理 作者:佚名 2020-04-13 17:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:网络整理)

什么是数据?数据有狭义和广义之分。狭义的数据就是我们说的一些数字,比如我们学习过程中的物理、化学等实验数据,国家GDP等各种统计数据。广义的数据包括任意形式的信息,比如我们每个人的个人的姓名、年龄、家庭情况、学历等基本信息,还包括我们所能记录和查询的所有信息,如图纸、视频、音频等。

我们所要谈论的是广义上的数据。数据不仅在科学研究中,而且在生活的方方面面都很重要,它已经成为我们日常决策的重要依据。数据可以说伴随真我们的一生。远古时代的结绳记事等就是最原始的数据传递方式。人类的文明与进步,从某种意义上讲是通过对数进行收集、处理和总结而达成的。

“大数据”是怎么一回事呢?它就是我们字面意思理解的“大量的数据”吗?如果不是,这两者又有什么联系和区别呢?大数据是随着信息技术的发展而兴起的,当数据的计算和存储不再是问题时,人们发现超大量的数据会给我们决策带来惊喜,这才有了更多的人研究和应用大数据。

首先,大数据的数据量肯定是非常大的,但光是量大还不能称之为大数据。比如我们做结构有限元分析的实验数据,往往计算过程就需要几天甚至几周,数据量也很大,但是不能算是大数据。大数据对数据最基本的要求是数据的多维度和完备性,要将原本看似毫无联系的事物联系起来,达到对事物全方位的完整描述,以便做出更科学的决策。

与数据相比,大数据的核心就是大数据是对收集掌握的各个维度的数据的再处理和分析。没有经过科学收集和处理的数据只是客观存在,大数据可以理解为是一种决策能力的体现。

大数据(big data,mega data)或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值密度)、Veracity(真实性)。

理解了数据和大数据的联系和区别后,我们再来看看由数据到大数据应用过程和数学基础。有了数据之后,如何科学地使用数据,就要用到一门应用科学——统计学。

非数学专业在大学有一门课程叫《概率和统计》,但其实概率论和统计学虽然紧密相连,却是独立发展的。概率论是研究随机现象数量规律的数学分支;统计学是通过收集、整理、分析数据等手段,通过特定的数学模型和数学计算,以用来推测所测对象的本质,甚至预测对象未来的一门综合性科学。

比如我们在上篇文章中讨论的人工智能,数字人工智能中,如果没有足够多的数据供机器深度学习,得到的结果就会有很大的不确定性,那它跟仿生人工智能相比就不会有很大的进步。为什么数据要足够大且全面呢?举个简单的例子。

我们现在对着马路上的车辆进行统计,主要对国产和进口两个数据维度进行统计。如果半个小时之内,过去了100辆车,其中50台进口车,我们不能说进口车已经占50%,显然这个结论是有非常大的误差的。我们以这个调查来对但假如我们改变数据来源和数据的统计维度,从国家层面的车管所收集数据,比如2018年进口车占销量的4%,这个数据对企业决策就有比较大的参考意义。

这个例子比较特殊。如果数据具有代表性,统计量又足够,统计维度又比较科学,那么从这些数据中得到的统计结果,对我们的工作和生活就有意义,不然充其量就是大量的数据,而失去了数据存在的意义。

目前,大数据已经在我们生活中起着巨大的作用。政府层面:宏观经济调控、公共卫生安全防范、社会舆论监督、智慧交通管理;生活方面:医疗疾病风险跟踪、公司运营成本节省、售后服务质量提升、运输车辆的故障险情以提前预警维修、用户商品推荐和服务、个人旅游、二手市场买卖等等。

毫不夸张地说,大数据创造了一种新的生活和商业模式,给人们提供了前所未有的便捷,甚至在网络政务方面创造众多奇迹。大数据已经被当作一种核心资产和商业模式,被不同程度地进行着挖掘,随之带来了个人隐私和安全问题。

你刚刚搜索一个关键词,比如“手表”,你的浏览器甚至一些应用APP就开始频繁地向你推荐各类手表广告信息,难道你的手机这么懂你的“心思”?当然不是,你刚刚的搜索信息被收集并马上被应用到你的手机上了。是不是有点赤裸裸的感觉!个人信息安全相关法律法规亟需出台。大数据既带来了创新,也带来了挑战,数据的应用需要有一定的约束,需要相关法律法规进行有效地引导和管理。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数字技术
    +关注

    关注

    0

    文章

    336

    浏览量

    26420
  • 大数据
    +关注

    关注

    64

    文章

    9096

    浏览量

    144063
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI 与大数据驱动的半导体制造时代:面向分析就绪的 FDC 技术

    大数据分析与人工智能已成半导体制造核心技术,行业核心挑战并非数据采集,而是获取可被大规模使用、分析并快速响应的就绪型数据。普迪飞JonHolt在2025年用户大会提出:“如何应对
    的头像 发表于 04-21 16:03 192次阅读
    AI 与<b class='flag-5'>大数据</b>驱动的半导体制造时代:面向<b class='flag-5'>分析</b>就绪的 FDC 技术

    黑M-狂野大数据5期|网盘无密Mp4+大数据直播课-狂野大数据

    大数据直播成为了提升数据生产力的关键技术之一。它通过实时数据流的采集、分析和呈现,极大地优化了决策效率,推动了创新的步伐。那么,未来大数据
    的头像 发表于 04-06 11:13 206次阅读

    狂野大数据(六期)课程- 资源分享

      狂野大数据6期   如果用一个词来形容当下大数据领域的变革,我会选择“权力的转移”。过去,数据世界的权力掌握在少数“炼金术士”手中——那些精通算法、能调参、会写复杂脚本的数据科学家
    的头像 发表于 03-11 13:31 325次阅读

    大数据解决方案如何实施

    大数据解决方案实施的难点在于以下几点:  1.很少有优质可用的数据  在数聚股份看来,这几年数据交易机构如雨后春笋,“数据变现”成为很多拥有数据
    的头像 发表于 12-25 18:22 1149次阅读

    最受欢迎的大数据可视化工具

     在数聚股份看来,大数据可视化是进行各种大数据分析的最重要组成部分之一。 一旦原始数据流被以图像形式表示时,以此做决策就变得容易多了。 为了满足并超越客户的期望,大数据可视化工具应该具
    的头像 发表于 12-24 17:05 383次阅读
    最受欢迎的<b class='flag-5'>大数据</b>可视化工具

    大数据平台运营的基础是什么

    在数聚股份看来,越来越多的企业开始搭建自己的大数据平台体系,并倾注大量资源用于平台的迭代和运营。那么大数据平台作为越来越被关注的企业新兴价值点,它应该以何种方式看待,并且以什么样的方式去建设和运营
    的头像 发表于 12-23 16:07 355次阅读

    湖北大数据集团到访维智科技参观交流

    近日,湖北大数据集团有限公司党委书记、董事长汪小波率队到访维智科技。双方围绕时空数据融合、公共数据授权运营及行业应用场景开发等议题展开深入探讨。
    的头像 发表于 11-03 10:02 776次阅读

    东软集团领跑中国医疗大数据解决方案市场

    近日,国际数据公司(IDC)权威发布《中国医疗大数据解决方案市场份额,2024:全域数据支撑》(Doc#CHC53739825,2025年9月)报告。报告显示,在中国医疗大数据解决方案
    的头像 发表于 10-30 17:09 829次阅读

    组态大数据平台是什么?有什么功能?

    组态大数据平台是融合 组态技术 与 大数据处理能力 的综合性平台,通过图形化、可配置的方式实现数据采集、存储、分析、可视化及远程控制,适用于工业自动化、能源管理、楼宇监控等领域。其核心
    的头像 发表于 10-30 11:29 323次阅读
    组态<b class='flag-5'>大数据</b>平台是什么?有什么功能?

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统

    北京华盛恒辉电磁兼容 (EMC) 大数据智能管理系统精简解析 在 EMC 大数据分析中,电磁兼容与电磁干扰(EMI)智能管理系统是保障设备稳定、提升系统可靠性的核心工具。系统整合 EMC/EMI
    的头像 发表于 09-17 14:58 768次阅读

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统
    的头像 发表于 09-17 14:58 730次阅读
    电磁兼容与电磁干扰在电磁兼容性<b class='flag-5'>大数据分析</b>中的智能管理平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统
    的头像 发表于 09-17 14:42 1052次阅读
    电磁兼容与电磁干扰在电磁兼容性<b class='flag-5'>大数据分析</b>中的智能管理系统

    御控工业物联网大数据解决方案:排水设备远程监控与大数据统计系统

    御控工业物联网推出排水设备远程监控与大数据统计系统,通过物联网、大数据、云计算等技术构建“感知-传输-分析-决策”闭环管理体系,助力排水行业数字化转型。
    的头像 发表于 09-12 10:04 803次阅读

    更改最大数据包大小时无法识别USB设备如何解决?

    将生产者 EP 端点描述符中的最大数据包大小从 1024 字节更改为 512 字节时,无法识别 USB 设备。 请告知如何解决这个问题。
    发表于 05-20 08:13