0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分享海量大数据背后的处理技术的原理

贸泽电子 来源:djl 作者:Murray Slovick 2019-08-29 10:34 次阅读

几乎每个人当然也包括工程师都听说过集成电路领域的摩尔定律,即戈登.摩尔预测,工艺技术的进步将导致芯片上的晶体管数量大约每两年就翻一番。但只有少数人听说过网络领域的摩尔定律,即梅特卡夫定律,它由罗伯特.梅特卡夫提出,他指出通信网络的价值正比于系统内连接用户数量的平方。简单地说,网络服务的用户越多,该网络服务对全体用户的价值也越大。

现在,让我们思考一下物联网IOT),在这个网中的用户并不一定是人,而是一个机器。人们开发了以太网系统,通过硬件来连接建筑物内的不同机器。它已演变成一系列网络技术,其最新迭代是40 / 100 千兆以太网(GE)标准,也被称为IEEE 802.3ba,特别针对数据中心通讯。

为管理不间断的高速连接,当前的数据中心需要容纳成千上万台主机服务器,这些服务器组成一个集群。每个主机包含一个或多个处理器、内存、网络接口以及本地高速I/O,它们通过高带宽网络紧耦合连接。大多数情况下,以太网采用集群方式连接(其次是采用InfiniBand)。

爆炸式增长

数据中心行业在不断壮大,随着全球更多设备加入线上网络以及更多的企业转向云计算以共享使用数据基础设施,这种发展的速度还在加速。对于数据中心市场以及供应商和相关技术来说,IoT对它们的转型影响最大。据研究公司Gartner推测,到2020年,IoT设备的安装量将达260亿台,它们生成的大数据规模将无法想象,而且这些数据还需要实时的处理和分析。这些数据占数据中心负载的比重也将越来越大,到时供应商将面临容量、速度、分析和安全等方面的新挑战。

分享海量大数据背后的处理技术的原理

图1:互连设备总量,单位是10亿台(来源:Gartner)

需求带宽

索引擎提供商和其它大数据用户(社交媒体论坛、在线购物网站,流媒体视频供应商)为顺畅的数据中心连接管道付出高额成本。以搜索引擎为例,数千台服务器通过关键字和元数据来索引整个互联网以提供网络搜索服务。谷歌每天的索引高达200亿页面。一旦它们完成这项任务,为保持相关性,这些索引必须迅速转移到其它数据中心。为适应该需求,连接数据中心的管道必须足够宽。但索引移动之后,管道的利用率就下降,此时服务器就可用于其它业务,但假设数据移动的不够快,服务器就不得不暂停。

因此带宽是大数据最大的考虑因素之一。这是一个简单直观的概念:更快连接,更好服务。目前,10Gbps的传输率是目前以太网中广泛使用的最快连接。为更易于理解,对比之下大多数家庭和企业使用5类双绞线电缆连接到以太网,最大传输率是1Gbps。

对于其中的内部基础设施,数据中心开始采用面向40Gbps到10Gbps以太网连接的IEEE802.3ba标准——比家庭双绞线电缆快40到100倍。最先由IEEE在2010年规定,100千兆以太网(简称100GbE)和40千兆以太网(简称40GbE)为首批实例,在一个单一的标准中规定两个不同的以太网速度。两种不同速度的采用来自于两种不同的应用要求,40Gbps的速率用以支持本地服务器应用,而100 GbE以太网更适用于网络聚合应用,如服务提供商的客户端连接、互联网骨干网、核心网等等。两年前, IEEE带宽评估报告预计,核心网络带宽每18个月就翻一番,而服务器带宽则是每24个月增加一倍。

数据中心内已经开始部署40Gbps和100Gbps以太网链路,这里的通信带宽要求最高,比如中心内机架到机架通信。大多数中心仍使用40GbE,但随着需求日益增加,快速迁移到100GbE以太网只是时间问题。互联网服务商对管道需求最高,已经开始采用100GbE,而路由器也已经支持该标准。

移动设备应用程序的繁盛使“东西通信”的重要性突显(服务器之间的通信或者是存储器到服务器之间的通信),而不再是传统的“南北通信”(客户端到服务器)。据思科所述,去年移动数据流量总和几乎是2000年全球互联网流量的18倍。2000年,全球互联网总共传输了一百亿亿字节 (EB)的流量,而2013移动网络承载了近18 EB的流量。

英特尔计算,每打开600部手机,就需要一个服务器的容量来满足这些手机流量请求。而每120个平板则需要另一台服务器,类似的,每台服务器支撑约20个数字标牌,或12个监控摄像头。

就在你看这篇微信的几分钟内 ,全球就产生了大量的数据,你知道全球一分钟产生多少数据吗?这是2014年5月最新的数据:

全球一分钟传送数据约64万GB;发布了2亿400万封邮件;下载了4.7万个App;亚马逊卖出了8.3万美元的货物;Flickr发布了2000万张照片;Youtube的视频被查看了130万次;Facebook被查看了600万次;Pandora电台播放了总计6.1万小时的歌曲。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    8120

    浏览量

    82518
  • 数据中心
    +关注

    关注

    15

    文章

    4187

    浏览量

    70065
  • 大数据
    +关注

    关注

    64

    文章

    8651

    浏览量

    136590
收藏 人收藏

    评论

    相关推荐

    云计算、大数据处理技术交流

    云计算、大数据处理技术交流图形图像是数据处理量最大的版块之一,也是当今云计算的重要课题之一,图形图像处理大会给大家带来诸多名家方案,探究大数据
    发表于 09-16 14:18

    未来,是大数据的时代

    的温度建议;还有,厂商应该能够通过故障处理服务平台了解到业主家的空调需要进行清洗了,并向业主传达空调需要进行清洗的服务信息(背后大数据服务);5、家中的智能家电等智能化产品,如出现故障,智能家居系统即能
    发表于 09-24 20:54

    常用大数据处理技术归类

    “21世纪最缺的是什么?人才!”。在大数据发展如此之快的今天,大数据工程师已经成为一个新兴职业。大数据是信息技术,是人和人、人和机器、机器和机器交互的内容特征,是最底层的信息
    发表于 02-28 17:02

    海量数据处理技术

    MapReduceMapReduce是云计算的核心技术之一,是一种简化并行计算的分布式编程模型,主要目的是为了大型集群的系统能在大数据集上进行并行工作,并用于大规模数据的并行运算。以上是处理
    发表于 03-23 14:23

    大数据运用的技术

    大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理
    发表于 04-08 16:50

    大数据专业技术学习之大数据处理流程

    集中的大型分布式数据库 或者分布式存储集群,利用分布式技术来对存储于其内的集中的海量数据进行普通的查询和分类汇总等,以此满足大多数常见的分析需求。特点和挑战:导入
    发表于 06-11 16:41

    大数据开发核心技术详解

    数据的核心是云技术和BI。关于大数据和云计算的关系人们通常会有误解,而且也会把它们混起来说,分别做一句话直白解释就是:云计算就是硬件资源的虚拟化;大数据就是
    发表于 07-26 16:26

    NLPIR系统KGB知识图谱技术助力大数据深度挖掘

      大数据时代的到来,意味着海量数据的产生,给我们现有的数据存储技术带来了巨大的挑战。而随着时代的进步,
    发表于 12-05 11:49

    阿里巴巴高级技术专家章剑锋:大数据发展的 8 个要点

    学习,实时更新机器学习模型目前以 Kafka,Flink 为代表的流处理计算引擎已经为实时计算提供了坚实的底层技术支持,相信未来在实时可视化数据以及在线机器学习方面会有更多优秀的产品涌现出来。当
    发表于 10-14 10:56

    什么是大数据大数据的特点有哪些

    大数据(big data)目录1什么是大数据2大数据的定义3大数据的特点[1]4大数据的作用[2]5大数
    发表于 07-12 06:52

    大数据技术与应用是学什么的?

    大数据技术与应用是学什么的?大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理数据集合。
    发表于 07-27 07:47

    云端海量大数据的安全防护

    云端海量大数据数据分析的基础,数据本身的安全性和准确性,对数据分析的结果有重要影响。针对云端大数据的特性,融合Hadoop的
    发表于 12-11 17:18 0次下载
    云端<b class='flag-5'>海量大数据</b>的安全防护

    大数据海量数据处理方法总结

    大数据海量数据处理方法总结。
    发表于 04-26 09:16 13次下载

    大数据技术主要学什么 大数据技术就业方向

    大数据技术专业主要包括以下方面的学习内容:   数据技术数据库是存储和管理数据的关键
    的头像 发表于 04-14 17:21 5478次阅读

    大数据技术有哪些 大数据前景

    大数据从字面意思来理解,就是海量数据的结合,从数据分析全流程的角度,大数据技术主要包括
    的头像 发表于 04-14 17:45 3784次阅读