0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

未来大数据时代,Hadoop会被Spark取代?

倩倩 来源:IT168 2020-03-20 14:12 次阅读

由雅虎为工程师和数据科学家打造的Apache Hadoop曾因巨大的潜力而备受称赞,但如今它却受到了更快的产品的影响,而这些产品往往来自于它本身的生态系统——Spark就是其中之一。今年早些,H20.ai的创始人Sri Ambati对Datanami 曾说:“Spark将会使Hadoop处于绝地”。

但在过去的几年中,Hadoop似乎并没有出现过任何衰退的迹象。在2015年Atscale的调查报告中显示:“在未来3个月内,已经有超过 76%的人使用Hadoop来做更多的工作。”这些受访者中大约有一半声称他们利用Hadoop工作中获得了一定的价值。Hadoop作为一个十多年的老品牌,在产品的采用方面并没有减缓下降的趋势,Spark也并没有做到真正取代Hadoop。空口无凭,下面我们从以下几个方面来分析一下Spark在未来的几年之内到底能不能真正的取代Hadoop。

按行业划分的市场渗透率

毫无疑问,为专家设计的产品一般都会停留在原来的轨道上,在其他方面不会有所涉及。但Spark在各个行业都存在一些有意义的分布,这可能要归功于各种市场上的大数据的泛滥。所以,虽然Spark可能有更广泛的应用,但Hadoop仍然支配着原本预期的用户群。

主要地理市场

在全球范围内,我们可以看到Informatica处于中心位置——在欧洲和美洲整体市场份额占比达32%。在两年半的时间里,我们跟踪了Informatica在云市场和工业领域的增长,结果显示达到了50%的增长,而且在高等教育领域也处于领先地位。上周, Informatica被Gartner评为主数据管理解决方案2017年魔力象限的领导者。而Hadoop仍然停留于过去成功的地理市场中。

公司规模的采用趋势

在企业客户中Spark也没有大范围的涉及。我们注意到世界上大多数公司规模较小,一般都为1-50名员工,所以Spark似乎并不是任何规模公司的唯一选择。对于那些已经使用Hadoop的人来说,这个产品也对企业和公司起到了一定的作用,而且 Hadoop并不仅限于一种用户。而Hadoop无论在何种规模的公司中,使用率相对于Spark还是非常高的。

写在最后

此外,在调查的过程中,传统的科技公司像eBay、Verizon、惠普和亚马逊等主流厂商已经开始使用Spark,但是Hadoop还没有被大规模的抛弃。相反,用户使用Spark作为系统的介绍,利用这个程序来突破Hadoop的障碍,两者的结合,使得工作更高效的完成。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Hadoop
    +关注

    关注

    1

    文章

    90

    浏览量

    15823
  • 大数据
    +关注

    关注

    64

    文章

    8631

    浏览量

    136568
收藏 人收藏

    评论

    相关推荐

    如何利用DPU加速Spark大数据处理? | 总结篇

    SSD速度通过NVMe接口得到了大幅提升,并且网络传输速率也进入了新的高度,但CPU主频发展并未保持同等步调,3GHz左右的核心频率已成为常态。 在当前背景下Apache Spark大数据处理工具中,尽管存储和网络性能的提升极大地减少了
    的头像 发表于 04-02 13:45 409次阅读
    如何利用DPU加速<b class='flag-5'>Spark</b><b class='flag-5'>大数据</b>处理? | 总结篇

    Spark基于DPU Snappy压缩算法的异构加速方案

    一、总体介绍 1.1 背景介绍 Apache Spark是专为大规模数据计算而设计的快速通用的计算引擎,是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些不同之处
    的头像 发表于 03-26 17:06 196次阅读
    <b class='flag-5'>Spark</b>基于DPU Snappy压缩算法的异构加速方案

    RDMA技术在Apache Spark中的应用

    背景介绍 在当今数据驱动的时代,Apache Spark已经成为了处理大规模数据集的首选框架。作为一个开源的分布式计算系统,Spark因其高
    的头像 发表于 03-25 18:13 1053次阅读
    RDMA技术在Apache <b class='flag-5'>Spark</b>中的应用

    基于DPU和HADOS-RACE加速Spark 3.x

    、Python、Java、Scala、R)等特性在大数据计算领域被广泛使用。其中,Spark SQL 是 Spark 生态系统中的一个重要组件,它允许用户以结构化数据的方式进行
    的头像 发表于 03-25 18:12 915次阅读
    基于DPU和HADOS-RACE加速<b class='flag-5'>Spark</b> 3.x

    米哈游大数据云原生实践

    近年来,容器、微服务、Kubernetes 等各项云原生技术的日渐成熟,越来越多的公司开始选择拥抱云原生,并开始将 AI、大数据等类型的企业应用部署运行在云原生之上。以 Spark 为例,在云上运行
    的头像 发表于 01-09 10:41 251次阅读
    米哈游<b class='flag-5'>大数据</b>云原生实践

    蓝牙会被取代?NFC、WiFi是潜在威胁

    电子发烧友网站提供《蓝牙会被取代?NFC、WiFi是潜在威胁.pdf》资料免费下载
    发表于 11-10 15:01 0次下载
    蓝牙<b class='flag-5'>会被</b><b class='flag-5'>取代</b>?NFC、WiFi是潜在威胁

    千兆光模块是否会被万兆光模块完全取代

    近年来,随着云计算和大数据等大规模应用的兴起,网络规模和带宽需求不断增加,万兆以太网技术应运而生。那么,在这个场景下,千兆光模块是否会被万兆光模块完全取代呢?
    的头像 发表于 10-30 11:32 221次阅读
    千兆光模块是否<b class='flag-5'>会被</b>万兆光模块完全<b class='flag-5'>取代</b>

    软磁铁氧体材料会被其他材料取代

    截止到目前所掌握的信息,软磁铁氧体材料在电子和电磁应用领域具有重要地位,但是否会被其他材料取代是一个复杂的问题,取决于多个因素,包括材料特性、应用需求、成本等。
    的头像 发表于 08-29 10:13 459次阅读

    NVIDIA 携手腾讯开发和优化 Spark UCX 实现性能跃升

    、稳定的大数据平台支撑和决策支持,是腾讯公司最大的离线数据处理平台。 Spark 业务所面临的挑战 Spark 网络目前的现状包括大规
    的头像 发表于 08-25 20:50 416次阅读
    NVIDIA 携手腾讯开发和优化 <b class='flag-5'>Spark</b> UCX 实现性能跃升

    网线会被光纤线取代吗?

    现如今随着云计算、大数据、5G等新型业务的不断涌现,数据中心规模不断的扩大,其架构与布线也越来越复杂,而光纤的轻量化及逐渐降低的成本,使得主干网设备对光纤的需求也越来越旺盛,在大型数据中心中光纤
    的头像 发表于 08-10 08:30 511次阅读
    网线<b class='flag-5'>会被</b>光纤线<b class='flag-5'>取代</b>吗?

    未来什么职业会被取代?#5G人工智能

    人工智能
    未来加油dz
    发布于 :2023年07月20日 01:10:25

    Hadoop特性和应用(3)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月11日 14:38:36

    Hadoop特性和应用(2)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月11日 14:38:11

    Hadoop特性和应用(1)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月11日 14:37:45

    Spark MLlib(1)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月11日 13:01:36