0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据拥抱云计算,让数据变得智能化

独爱72H 来源:企业网D1Net 作者:企业网D1Net 2020-03-20 14:06 次阅读

(文章来源:企业网D1Net)

数据怎么样才能对人有用?人们整天都在讨论大数据,其实数据本身并不是有用的,必须要经过一定的处理。例如你每天跑步带个手环收集的也是数据,网上这么多网站也是数据,简称为Data,数据本身并没有什么作用,但是数据里面包含一些很重要的东西,叫做信息(Information),数据杂乱无章,只有经过了梳理和清洗,才能够称为信息。信息里面包含了很多规律,我们需要从众多信息中将规律总结出来,才能称为知识,知识才能改变命运。

信息是很多的,但是很多人看到了信息相当于白看,但是有人就能从信息中看到了电商的未来,有人看到了直播的未来,所以人家就牛了,如果没有从信息中提取出知识,天天只知道刷朋友圈,也只能在如今互联网滚滚大潮中做个看客。有了知识,然后利用这些知识去应用于实践,有的人就会做得非常好,这个东西叫做智慧Intelligence。有知识并不一定有智慧,很多学者很有知识,已经发生的事情可以从各个角度分析的头头是道,但一到实践就歇菜,并不能转化成为真正的智慧。而很多的创业家之所以伟大,就是通过获得的知识应用于实践,最后做成了很大的生意。

数据的处理分五个步骤,全部完成了才最后才会升华智慧。第一个步骤:数据的收集。首先得有数据,数据的收集有两个方式,第一个方式是拿(Pull),专业点的叫爬取或者抓取,常见的搜索引擎就是这么干的,它把网上的信息都下载到它的数据中心,然后被你搜索出来。比如你去搜索的时候,返回的是一个列表,这个列表为什么会在搜索引擎的公司里面呢,就是因为他把这个数据都爬下来了。

但是你一点链接,点出来这个网站就不在搜索引擎它们公司了。比如说搜狐有个新闻,你拿百度搜出来,你不点的时候,那一页在百度数据中心,一点出来的网页就跳转到搜狐的数据中心了。另外一个方式就是推送,有很多终端可以帮我收集数据,比如说智能手环,可以将你每天跑步的数据,血压的数据,心跳的数据都上传到数据中心里面。

第二个步骤是数据的传输。常见的会通过队列方式进行,数据量实在是太大了,数据必须经过处理才会有用,但是系统处理不过来,只好排排队,一条条地处理。

第三个步骤是数据的存储。现在数据就是Money,掌握了数据就相当于掌握了金钱。要不然你看购物网站怎么知道你想买什么呢?就是因为它有你历史的交易信息,然后通过这个信息分析出你的购物习惯。

第四个步骤是数据的处理和分析。上面存储的数据是原始数据,原始数据多是杂乱的,还有很多垃圾数据,因而需要清洗和过滤。对于整理过的数据,就可以进行分析,从而对数据进行归类,或者发现数据之间的相互关系。比如著名的啤酒和纸尿布的故事,就是通过对人们的购买数据进行比对分析,发现了男人在买尿布的时候,会同时想要购买啤酒,这样就发现了啤酒和尿布之间的对应关系,掌握了规律,然后应用到实践中,将啤酒和尿布的柜台放到一起,这就是一种智慧。

第五个步骤就是对于数据的检索和挖掘。检索就是搜索,俗话说外事不决问谷歌,内事不决问百度。两大搜索引擎都是将分析归纳后的数据放入搜索引擎,从而方便人们找到想要的信息。还有一个就是挖掘,搜索出来的信息还需要从中挖掘出相互的关系。例如财经检索,当搜索某个公司股票的时候,该公司的管理层是不是也应该被挖掘出来?如果仅仅搜索出这个公司的股票涨的特别好,你就去买了,结果第二天就跌了,这不坑人么?所以通过各种算法挖掘数据中的关系,形成知识数据库,十分重要。

数据分析是一项很有意思的技术,其功能就是帮我们梳理数据,存储信息,并从信息中总结规律。当数据量很小的时候,几台机器就能分析并解决问题。但是,慢慢的当数据量越来越大,大到最强的超级计算机都解决不了问题的时候,该怎么办呢?这时就要聚合多台机器的力量,也就是使用云计算的力量。

对于数据的收集,以物联网为例,外面部署这成千上亿的检测设备,将大量的温度,湿度,PH值,PM2.5等等数据统统收集上来,对于网页的搜索引擎来讲,需要将整个互联网所有的网页都下载下来,这显然一台服务器做不到,需要多台服务器组成分布式系统,每台机器下载一部分,同时工作,才能在有限的时间内,将海量的网页下载完毕。

对于数据的传输,一个内存里面的队列肯定会被大量的数据挤爆,于是就产生了基于存储系统的分布式队列,这样的队列可以多台服务器同时传输,随你数据量多大,只要我的队伍足够多,队列足够粗,就能够撑得住。

对于数据的存储也是一样,一台服务器的文件系统肯定是放不下了,那我们就做一个很大的分布式文件系统来做这件事情,把多台机器的硬盘打成一块大的文件系统。再比如数据的分析,可能需要对大量的数据做分类,统计,聚合,一台服务器肯定搞不定,处理几百年也分析不完,于是就有了分布式计算的方法,将大量的数据分成小份,每台服务器处理一小份,多台服务器并行处理,很快就能算完。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云计算
    +关注

    关注

    38

    文章

    7326

    浏览量

    135600
  • 大数据
    +关注

    关注

    64

    文章

    8623

    浏览量

    136566
收藏 人收藏

    评论

    相关推荐

    Get职场新知识:做分析,用大数据分析工具

    综合分析。但现在有了大数据分析工具,一切问题都可迎刃而解。 大数据分析工具,顾名思义就是专门为分析海量数据而开发的一类工具。这类工具具有极强的大数据分析、指标
    发表于 12-05 09:36

    智能运维技术的发展和设计资料

    )和大数据技术(BigData),设计开发智能终端和后台服务器系统,实现对变电站设备的实时增强显示、缺陷告警、缺陷分析与判断智能化、缺陷远程专家会诊等功能。
    发表于 09-21 07:18

    加速大数据计算存储应用

    电子发烧友网站提供《加速大数据计算存储应用.pdf》资料免费下载
    发表于 09-15 15:05 0次下载
    加速<b class='flag-5'>大数据</b>和<b class='flag-5'>计算</b>存储应用

    人工智能大数据是什么

    首先,我们需要了解人工智能大数据的定义。通俗地说,人工智能大数据就是将人工智能技术和大数据技术相
    的头像 发表于 08-13 10:57 2084次阅读

    大数据属于人工智能

    大数据属于人工智能大数据是一种新兴的技术,它可以帮助我们处理海量的数据,提供准确的分析和预测。许多人认为,大数据和人工
    的头像 发表于 08-12 17:44 1951次阅读

    大数据和人工智能哪个好

    大数据和人工智能哪个好 随着技术的不断发展,大数据和人工智能成为了当前最热门的话题之一,而且这两项技术也各有优缺点。下面我们将探讨一下大数据
    的头像 发表于 08-12 17:39 1339次阅读

    大数据是人工智能

    大数据是人工智能吗 随着互联网技术和数据采集技术的发展,数据量不断增大,大数据应运而生。大数据
    的头像 发表于 08-12 17:12 946次阅读

    工业物联网之“设备数据采集与控制+大数据存储分析+APP无代码应用开发”

    ,实现对PLC、CNC、MQTT、NB-IOT、OPC、水表、电表以及各类仪器仪表等设备毫秒级数据采集与控制;满足企业对工业现场设备的数据采集与控制、 远程运维、数据分析决策等智能化
    发表于 08-07 20:53

    大数据计算的关系(2)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月13日 00:12:15

    计算的分类#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月13日 00:06:59

    【机智物联网低功耗转接板】远程环境数据采集探索

    连接,只接出TXD、RXD两个IO口。机智专注于提供智能服务及物联网的软硬件解决方案 ,帮助传统硬件厂商产品升级,快速实现硬件智能化。机智
    发表于 06-27 18:02

    电商数据分析攻略,你轻松搞定数据分析!

    商行业共性分析需求打磨而成,旨在帮助电子商务公司更好地了解和满足他们的客户需求,以实现业务增长。 一、方案特点 奥威BI电商数据分析方案的特点是其高度自适应性和智能化。 它可以自动识别有效数据,并自动
    发表于 06-27 09:22

    大数据的人工智能区别

    大数据与人工智能一个比较明显的区别就在于大数据是需要变得有用之前进行清理、结构化和集成的原始输入,而人工智能则不同,它是要输出,也就是就是处
    的头像 发表于 06-08 16:57 765次阅读

    什么是计算

    、存储和网络服务。PaaS 提供了开发环境和应用程序部署服务,包括数据库、开发工具和应用程序服务。SaaS 则提供了各种类型的软件服务,包括电子邮件、客户关系管理和教育软件等。计算的安全性和可靠性也是
    发表于 04-21 10:45

    迅为RK3568核心板应用于智慧交通解决方案

    智慧通行领域迅速发展。在数字智能化、网络的发展进程中,人们对智慧通行管理与服务提出了更迅捷、安全和人性的服务需求。迅为推出RK35
    发表于 04-19 11:11