0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据分析将成为创新起源与企业核心能力

程序人生 来源:程序人生 作者:程序人生 2022-04-28 10:06 次阅读

据 Gartner 2022 年最新趋势分析,数据分析将成为创新起源与企业核心能力,数据越来越重要了。在更早前 IDC 和数据存储公司希捷的报告表示,我国产生的数据量从 2019 年的约 9.4ZB 将猛增至 2025 年的 48.6ZB。现在,数据工程师需要面对愈加繁杂和庞大的数据、离线场景/实时场景/流式场景等众多不同的分析场景、多个数据库技术栈并存和与之对应的存储计算成本,很多公司的数据团队往往会被这些海量数据与各类底层集群、基础设施的要求所淹没。

如何降本增效,打通数据分析与存储,提高数据分析的灵活性,同时降低底层资源的运维成本,成为了令技术团队头疼的问题。

智能湖仓,数据分析的下一站已到来

这个时代,驾驭数据的能力是所有决策者“技能清单”里最重要的一项。历史告诉我们,无论哪个行业,率先在行业中掌握新工具“利器”是多么重要。

最早的传统型、老式的纯数据仓库已经不适宜半 / 非结构化数据的处理;而单纯的数据湖虽然适合存储数据,但不支持事务处理,不保证数据质量,并且缺乏一致性与隔离性。

站在数据价值出口的角度来看,只有各类数据价值平台全面落地应用,大数据的潜能才会被进一步释放。为了实现数据湖和数据仓库之间的无缝流转,打通数据存储和计算的不同的层面,兼顾数据湖的灵活性和数据仓库的成长性,促进企业更有效的工具应用,像亚马逊科技就提出了“智能湖仓”架构,帮助企业客户加快大数据价值实现进程。

以创新技术厂商亚马逊云科技为例,2020 年在亚马逊云科技 re:Invent 大会上,亚马逊云科技针对数据分析等相关服务推出了“智能湖仓”架构,不过早在 2017 年,亚马逊就发布了 Amazon Redshift Spectrum,该功能使得 Amazon Redshift 在当时就具备了打通数据湖和数据仓库的能力,实现跨数据湖、数据仓库的数据查询。此外,在 2021 年 re:Invent 大会上,亚马逊云科技更进一步,在存算分离架构基础上,推出更多数据分析服务的无服务器(Severless)版。

b3bafcc4-c689-11ec-bce3-dac502259ad0.png

现在,无服务器架构(以 2014 年推出的 Amazon Lambda 为代表)已经是云原生中最热门的技术类别。无服务器应用程序是由事件驱动的,并通过与技术无关的 API 或消息收发进行松散耦合,可以让开发者更关注于构建产品中的应用,而不需要管理和维护底层堆栈。现在,数据分析服务借助无服务器的能力,可以让用户更便捷地构建数据存储、分析、智能应用解决方案,彻底实现无服务器的数据分析服务,完成底层庞杂数据的高效处理、流转与共享。

能够达到这样的技术水平和高度,离不开时间的沉淀和技术的积累。想要深刻理解“智能湖仓”,就需要了解它的过去与现在。我们能看到,亚马逊云科技所推出的无服务器数据分析服务,经历了几个阶段:

b3cc64aa-c689-11ec-bce3-dac502259ad0.png

(1)2006 年,亚马逊云科技正式推出 Amazon S3,其作为亚马逊第一个云产品,提供了多种经济高效的存储类和易于使用的管理功能,从而满足特定的业务、组织和合规性要求。如今“智能湖仓”就是基于 Amazon S3 构建数据湖,绕湖集成数据仓库、大数据处理、日志分析、机器学习等数据服务。Amazon S3 数据湖的可靠性和大容量的数据存储能力,是确保整个“智能湖仓”架构有效应用的基础。对于软件开发人员来说,现在已经是无服务器架构的 Amazon S3 可以很低的成本提供可扩展、可靠且延迟低的数据存储基础设施,让开发人员利用云计算的规模优势,以极低的前期资源投入换取稳定的数据基础设施,非常适合进行快速技术创新。

b3eefb32-c689-11ec-bce3-dac502259ad0.jpg

(2)Amazon Athena 是一种无服务器的交互式查询服务,用户能够轻松使用标准 SQL 分析 Amazon S3 中的数据。无需 ETL ,具备 SQL 技能的任何人都可以轻松快速地分析数据湖中的大规模数据集,这对技术人员的生产力是一种解放!当我们想使用 SQL 直接进行数据湖上的分析且不想管理任何集群时,Athena 无疑是一个敏捷且快速开始的选择。

(3)Amazon Redshift 使用 SQL 在数据仓库、运营数据库和数据湖间分析结构化和半结构化数据,专注于在急速获取洞察,并交付业务结果,无需考虑管理数据仓库等基础设施。而现如今,无服务器版的 Amazon Redshift Serverless 使得数据仓库更加敏捷,用户无需亲自设置和管理数据仓库基础设施,即可在几秒钟内轻松运行和扩展分析,实现 PB 级数据规模的数据分析。目前来说,已经有很多企业去选择 Amazon Redshift 来缩短他们获得洞察的时间,因为它易于使用,可在任何规模提供可靠的性能分析所有数据,也可能是因为 Amazon Redshift 提供比其他云数据仓库高 3 倍的性价比。Amazon Redshift Serverless 是非常适合难以预测计算需求的情况,例如可变工作负载、具有空闲时间的周期性工作负载以及具有峰值的稳态工作负载。这种方法也非常适合需要快速入门的临时分析需求以及测试和开发环境。

b4031aae-c689-11ec-bce3-dac502259ad0.jpg

(4)Amazon EMR 也推出了 Serverless 无服务器的版本。开发者可以使用无服务器的方式运行使用开源大数据框架(如 Apache Spark、Hive 和 Presto)构建的程序,在云中运行 PB 级数据分析,而无需配置、管理、优化或保护集群。用户无需猜测集群大小,Amazon EMR Serverless 具备自动细粒度扩缩,并且提供性能优化的运行时,速度是开源版本的两倍以上。另外,Amazon EMR 在安装 Spark、Hive、Presto 或 Trino 时可以默认安装 Hudi 组件,以实现开放格式(如 Apache Parquet 和 Apache Avro)维护 Amazon S3 或 HDFS 中的数据。举个例子,使用 Amazon EMR,技术人员可以将 Parquet 数据集转化为 Hudi 数据集,而无需重写数据集,快速将现有数据集迁移至 Apache Hudi 数据集,例如 Amazon S3 上 1TB 的 Parquet 数据集,引导执行的速度已经比批量插入快了五倍!

通过了解,CSDN 看到,上述这些仅仅只是亚马逊云科技中的一小部分数据服务及其无服务器版的发展变化。发布既是无服务器架构的云原生 NoSQL—Amazon DynamoDB,两年前即实现无服务器化的云原生关系型数据库Amazon Aurora Serverless v1(本周第二代v2也已上线),也都是值得挖掘的技术创新。

正是随着这些服务的升级与发展,“智能湖仓”也在向更敏捷,更智能的方向演变。也让技术界看到,数据分析的下一站已到来。

全栈式云原生数据分析服务,让数据真正“敏捷分析”

我们能看到,“智能湖仓”更强调架构,强调数据的自由流动和集中统一治理。“智能湖仓”架构不是简单地将湖与仓打通,而是将湖、仓与专门构建等数据服务连接成为一个整体,让数据在其间移动和访问,进一步实现数据在数据湖、数据仓库,以及在数据查询、数据分析、机器学习等各类专门构建等服务之间按需移动,从而形成统一且连续等整体,满足客户等各种需求。

亚马逊云科技的“智能湖仓”架构具有灵活扩展、专门构建、数据融合、敏捷分析、开源开放等特点。详细来说,背靠 Amazon S3 数据湖存储的高可靠和大容量,对于数据存储资源弹性伸缩扩展,在此之上,技术人员通过使用亚马逊云科技经验总结的具象产品实力,如交互式查询服务 Amazon Athena、云上大数据平台 Amazon EMR、云数据仓库 Amazon Redshift 等专门构建的数据分析服务,以及数据融合统一治理的架构之下,企业可以无需机器学习经验,使用 SQL 语句,甚至不编写代码,去进行数据分析。这种模式可以大大降低数据人员的技术门槛,让更多数据业务人员去拥抱数据,实现敏捷、快速、低成本的数据分析。

在“智能湖仓”架构下,云原生数据分析服务可以全面覆盖流数据分析、数据湖、Hadoop 等常用的分析场景,所有均无服务器化。无服务器的分析工具让客户无需配置、扩展或管理集群或服务器,也不必担心容量配置,从而可以最大程度地为客户减少无差别的繁琐工作,让数据真正实现全栈、敏捷地分析。

面对海量数据与细分环境,亚马逊云科技无服务器的“智能湖仓”架构则将易用、易扩展、高性能、专门构建、安全及智能等特性融于一体,打通数据湖和数据仓库,进一步将各种服务无缝集成,确保数据在不同服务之间顺畅流动,进而帮助客户尽可能最大程度地提高数据价值,加速创新,并成为数据驱动型组织。

从亚马逊的技术布局和发展路径,我们能看到,全栈、云原生的数据分析时代已经到来,智能化的湖仓将成为新一代数据平台架构。而借助智能湖仓,与数据相关的技术与业务人员,将可以摆脱对底层架构与数据处理技术的多个掣肘,专注于挖掘数据的创新性分析与应用,以发现并抓住任何一个创新的机遇。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据分析
    +关注

    关注

    2

    文章

    1352

    浏览量

    33732
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24349
  • 大数据
    +关注

    关注

    64

    文章

    8649

    浏览量

    136587

原文标题:全栈、云原生的数据分析时代已来,我们如何抓住机会?

文章出处:【微信号:coder_life,微信公众号:程序人生】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Get职场新知识:做分析,用大数据分析工具

    数据管理的。 随着原来越多的企业加入了数字化转型的队伍,大数据分析工具也越来越多地被应用于各行各业的业务数据分析中,直至今日,大数据分析工具
    发表于 12-05 09:36

    东软获国家数据管理能力成熟度四级认证

    作为东软数字化转型的核心引擎产品,东软数据中台持续践行自主技术的创新与研究,提供一体化数据融合能力数据
    的头像 发表于 11-30 17:29 651次阅读

    基于大数据分析的5G智能工厂如何实现

    随着科技的快速发展,大数据分析和5G智能工厂已经成为当今社会的热门话题。它们在很多领域都有着广泛的应用,如工业制造、医疗保健、交通运输等。在本文中,我们将探讨大数据分析和5G智能工厂的概念
    的头像 发表于 09-25 17:08 316次阅读

    Yonghong Desktop数据分析全解决?七大核心亮点分析

    “ 如今企业已经迈入业务数字化和数据资产化时代,如何将数据应用到业务中呢?Yonghong Desktop是一款装在笔记本的可视化分析工具,即装即用,让每位员工轻松实现业务
    的头像 发表于 09-12 10:29 186次阅读
    Yonghong Desktop<b class='flag-5'>数据分析</b>全解决?七大<b class='flag-5'>核心</b>亮点<b class='flag-5'>分析</b>

    别再埋头苦干了,标准化财务数据分析方案开箱即用!

    企业经营管理健康水平,掌握企业的盈利能力、还债能力、现金流情况等关键信息,辅助数字化运营决策。 奥威BI财务数据分析方案介绍 奥威BI财
    发表于 09-05 10:06

    财务数据分析?奥威BI数据可视化工具很擅长

    的智能财务指标计算功能,还拥有一套标准化、系统化的财务数据分析方案,无需测试,下载即可用! 奥威BI工具+智能财务方案:轻松完成智能财务数据可视化分析 奥威BI智能财务方案是一套针对企业
    发表于 08-29 09:44

    分享一套财务数据分析模板,零开发,更好用

    分析项目中摸索出一套系统化的财务数据分析模板,可令人在短时间内深度分析财务数据,掌握企业经营管理健康情况,为决策提供助力。 奥威BI财务
    发表于 08-15 10:47

    基于云平台的多维数据分析的研究与应用

      在现今不断发展的信息化社会中,企业产生了海量的数据资料。怎样利用和分析这些数据,使得决策人员能够以更简单易懂的方式看到查询结果和数据,为
    发表于 07-19 10:30 0次下载

    数据分析平台能为企业带来哪些好处

    数据分析平台是近年来迅速发展的一项关键技术,它利用先进的数据处理和分析技术,帮助企业从海量数据中提取有价值的信息和见解。对于
    的头像 发表于 07-14 17:23 653次阅读

    核心组件介绍(1)#大数据分析

    数据分析
    学习硬声知识
    发布于 :2023年07月11日 15:17:50

    电商数据分析攻略,让你轻松搞定数据分析

    核心业务分析主题的分析模型、BI电商数据分析报表。从电商多业务系统数据整合、清洗、电商分析指标
    发表于 06-27 09:22

    什么是大数据分析

    数据分析行业是最近这几年比较火,比较高薪的行业了,很多人都想分一杯羹,经常同学问我什么是大数据分析?什么是python?这些能学到什么技能?以后能学到什么知识?有太多的疑问,小编今天就简单写出来
    的头像 发表于 05-19 11:47 876次阅读

    数据分析到底是什么?_光点科技

    数据分析是当今信息时代中一个非常重要的概念。随着技术的不断发展和大数据的爆炸式增长,数据分析成为各行各业的关键工具。
    的头像 发表于 05-19 10:46 460次阅读

    事实证明,国产BI软件的财务数据分析性价比极高!

    ,低成本、低风险、高效率。综合这两大因素,企业所需投入的成本被大幅度缩减,但财务数据分析效果极好。 哪款国产BI软件最适合做财务数据分析? 当然是奥威BI软件。 1、使用成本、维护成本低 它支持按功能
    发表于 05-16 11:06

    数据分析的重要性

    数据分析有助于找到问题的解决方案,如降低成本,节省时间并降低决策风险。通过结合数据分析和机器学习,企业可以通过以下方式获益匪浅:
    的头像 发表于 05-10 15:34 669次阅读