0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据不可估量,亚马逊云科技开启云原生数仓新篇章

华夏大视野 来源:华夏大视野 作者:华夏大视野 2023-01-13 09:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2022年12月,在拉斯维加斯举办的2022亚马逊云科技re:Invent全球大会完美落幕,这一标志性的技术盛宴再一次给人们留下了无限的想象空间,等待大家在新的一年去持续探索和发掘。近日,亚马逊云科技中国巡演——广州、深圳站也如期举行,其间对re:Invent全球大会的很多项目进行解读,为中国企业提供更多的可能。

简化数据摄入工作

最好是没有

要想数据分析到位,首先要保证有稳定、可靠的数据摄入通道,来实现端到端的第一环(其实还有第零环,是业务在数据源侧的规划),而这一块也是大部分数据工程中遇到最头疼的问题之一。首先,数据源就包含很多种,最常见的数据源包括关系型数据库、数据湖和实时的流数据。其次,不管是手动还是自动的ETL流水线,都需要专业的数据工程团队来构建和维护,并且经常要处理或介入数据结构的变更等情况。这次,Redshift连发多个功能特性来帮助客户解决或者消除这类问题。

pYYBAGPAuMWAGTjzAAHgs-K_hI8026.png

首先是最常见的关系型数据库,也就是经典的OLTP向OLAP的数据传递。如果是为了更快或者更实时地获取线上业务的事务数据来做分析,通常可以通过开启数据库的binlog来捕捉CDC变更,然后再使用解析CDC的工具如Amazon DMS、Debezium等来实现,这些都需要客户进行不断的监控、配置和优化。此外,不同的数据库和数据表可能会有不同的需求,这样就再加倍了数量级的维护成本。

相信大家对Redshift印象最深的一个功能就是Zero ETL,帮助客户完成从1到0的过程!Redshift通过与Amazon Aurora数据库深度集成,在事务型数据写入Aurora后,数据在底层被持续地复制到Redshift,完成行式数据存储到列式数据存储的转换,彻底消除了自己构建和维护复杂数据管道的工作。没有Hybrid OLTP和OLAP,仍然是熟悉的Amazon Purpose-Build(Aurora还是 Aurora,Redshift还是Redshift)各司其职解决最实际的问题。同时,客户的应用程序架构保持不变,读写端点指向Aurora,分析端点指向Redshift,但是底层已经不再是一大串接一大串的数据抽取、转换和加载,直接无缝衔接并且达到近实时的效果。

然后是数据湖S3,Redshift开始支持从S3数据湖中自动复制,手动挡升级自动挡。之前,如果想要拷贝数据都需要手动或者定时执行COPY命令,现在Redshift新添加了COPY JOB命令自动检测指定路径的新文件,跳过已经加载完毕的旧文件。以前编写的定时任务脚本可以退役了,而且再也不用担心手抖重复执行,生活变得更美好了。

如果业务需求是实时的,那么通过S3作为Staging存储再COPY的方式就跟不上节奏了,所以,流数据也要拿下。re:Invent之前,Redshift流式摄入已经开始支持Amazon Kinesis Data Streams,这次发布更是添加了Amazon Managed Streaming for Apache Kafka(MSK),同时流式摄入也正式推出,告别预览。从上面的图中可以看出,流式摄入合并了数据消费的过程,直接在Redshift中实现并持续加载到数据仓库。在Redshift中,流式摄入是通过物化视图的方式实现的(查找官方文档是在物化视图章节),用户还可以在这个物化视图基础上再配合其他数据叠加物化视图提高查询效率。另外,别忘了还可以给流式摄入开启自动刷新功能。从此,客户可以更简单地完成实时数据分析,包括IoT物联网设备、点击流、应用程序监控、欺诈检测和游戏实时排行榜等。

以上,Redshift简化了各种最经典的数据源ETL方式,数据坐等分析。

更多数据分析的利器

来点火花

数据已经妥妥地进到了数据仓库的碗里来,接下来就请开始它的表演了。此时,数据工程师表示Redshift SQL很好,但是还有些更复杂业务数据逻辑更适合通过代码的方式进行操作和处理(而不是通过UDF)。开源大数据生态体系下有非常丰富的软件供组织采用了,其中功能完善、发展稳定的Apache Spark往往是一个优先的选择。在亚马逊云科技平台上使用Spark并不复杂,有托管服务EMR和Glue保驾护航,还有新发布的Amazon Athena for Apache Spark可以极速启动交互。但是,说到Spark和Redshift之间进行数据分析还是需要折腾一下的,或者是通过将Redshift中的数据导出到S3中,或者是使用各种第三方的Spark连接器,前者需要多走一步浪费时间和资源,后者没有多少人维护不说,性能和安全性都令人堪忧。因此,Amazon Redshift integration for Apache Spark应运而生。

poYBAGPAuMaAFeYeAAEKc7lY0kk657.png

这个内置集成模式基于一个之前的开源项目,提升了性能和安全性,相信后续亚马逊云科技仍将继续跟进这个开源项目,并将各种升级改造的好东西贡献给社区。目前,EMR、EMR on EKS、EMR Serverless和Glue(限定版本)都预置了打包好的连接器和JDBC驱动程序,客户完全可以直接开始编写代码(有爱好者迫不及待连夜在EMR Studio中使用EMR on EKS完成了对Redshift Serverless和集群模式的交互式读写测试,体验极佳),对Redshift中的数据进行处理。如果客户的数据分析工作负载以Spark为主,也可以通过Spark统一对各种数据源的分析。

审核编辑hhy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    4081

    浏览量

    68524
  • 开源
    +关注

    关注

    3

    文章

    4329

    浏览量

    46429
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    神州数码旗下神州鲲泰携手江苏纺知开启家纺产业智化新篇章

     神州鲲泰携手江苏纺知,以国产化算力底座融合家纺行业数据,破解家纺企业研发与品控关键环节痛点,单品开发效率提升10倍、验布效率提升3倍,开启家纺产业智化
    的头像 发表于 04-15 17:05 520次阅读

    国资入主联创电子开启企业发展崭新篇章

    冬日暖阳耀赣江,联创电子谱新章。2025年12月25日,联创电子科技股份有限公司(证券简称:联创电子,股票代码:002036)股票复牌,正式书写企业发展历程中的崭新篇章
    的头像 发表于 01-09 14:47 734次阅读

    Renesas MCK - RA6T3:开启电机控制新篇章

    Renesas MCK - RA6T3:开启电机控制新篇章 电子工程师在电机控制领域不断探索,寻找高效、精准且稳定的解决方案。Renesas的MCK - RA6T3电机控制评估套件,就像是一颗璀璨
    的头像 发表于 12-29 15:10 458次阅读

    迅为Hi3403开发板驱动教程全面上线,开启嵌入式Linux开发新篇章

    迅为iTOP-Hi3403开发板linux驱动教程全面上线,开启嵌入式Linux开发新篇章
    的头像 发表于 12-18 14:23 863次阅读
    迅为Hi3403开发板驱动教程全面上线,<b class='flag-5'>开启</b>嵌入式Linux开发<b class='flag-5'>新篇章</b>!

    广汽集团与华为数字能源开启深度协同新篇章

    和充电表现、整车驾乘体验提升,围绕动力域相关系统和整车产品的设计、制造、销售服务展开深入合作,开启深度协同新篇章
    的头像 发表于 11-11 15:22 701次阅读

    西班牙工程与技术公司携手FLIR开启高温检测新篇章

    在钢铁制造这一传统而充满挑战的领域,高温与恶劣环境如同两道难以逾越的鸿沟,横亘在提升生产效率与质量的道路上。然而,西班牙工程与技术先锋BcB Informatica y Control携手Flir公司,构建了创新的技术解决方案,正为这一行业注入智能化升级的新动力,开启高温检测的
    的头像 发表于 11-02 11:37 1047次阅读

    华为网络技术赋能上海院开启智慧建筑新篇章

    智慧建筑的实践者和推动者,也正在通过网络技术的创新应用,打造智慧、绿色的高品质万兆园区新标杆,以智力量共拓“城市更新”崭新篇章
    的头像 发表于 10-30 10:17 786次阅读

    具身智能破壁者Dexmal原力灵机,靠Dexbotic开启加速时代

    构筑统一底座,Dexmal原力灵机靠Dexbotic开启具身智能新篇章
    的头像 发表于 10-23 00:24 7815次阅读
    具身智能破壁者Dexmal原力灵机,靠Dexbotic<b class='flag-5'>开启</b>加速时代

    成都华微与具身科技开启四川具身智能产业新篇章

    人形机器人整机平台“天行者2号”,更迎来产业链多方战略合作的重大突破,成都华微电子科技股份有限公司(以下简称成都华微)作为核心硬件合作伙伴参与签约,共同开启四川具身智能产业新篇章
    的头像 发表于 09-30 11:48 1410次阅读

    盘古信息PCB解决方案:破译智造密码,开启智造新篇章

    。如何突破瓶颈,实现从“制造”向“智造”的华丽转身,成为PCB企业亟待破解的时代课题。广东盘古信息科技股份有限公司(以下简称:盘古信息)洞察行业痛点,以重构之力,打造出IMS MOM制造运营管理系统PCB行业解决方案,开启PCB智造新篇章。 盘古
    的头像 发表于 09-09 08:52 774次阅读

    台电机驱动:开启智能化时代的新篇章

    在科技飞速发展的今天,智能化已经渗透到我们生活的方方面面。而在众多科技领域中,台电机驱动技术正以其独特的魅力,开启着智能化时代的新篇章
    的头像 发表于 07-23 18:16 1122次阅读

    编码器线:精准连接,高效传动,引领科技新篇章

    在日新月异的科技时代,每一个微小的进步都可能成为推动行业变革的关键。编码器线,这一看似不起眼的组件,却在自动化、智能制造、机器人技术等众多高科技领域中扮演着至关重要的角色。今天,就让我们一起走进编码器线的世界,探索它如何以精准连接和高效传动,引领科技新篇章
    的头像 发表于 06-27 16:57 1116次阅读

    TECNO与非洲足球联合会开启合作新篇章

    的延续,这次合作进一步深化了TECNO在非洲市场的战略布局。TECNO将持续以科技创新赋能非洲消费者,携手非洲杯,共创新篇章
    的头像 发表于 06-11 11:38 1198次阅读

    恭贺全球购检测荣获CBTL资质,迈向国际检测认证新篇章

    恭贺全球通检测荣获CBTL资质!迈向国际检测认证新篇章赋能中国企业全球化近日,中国检测认证领域迎来里程碑时刻——全球通检测(GlobalTestingServices)正式通过国际电工
    的头像 发表于 05-27 10:41 405次阅读
    恭贺全球购检测荣获CBTL资质,迈向国际检测认证<b class='flag-5'>新篇章</b>!

    自动巡检环网柜局放监测方案:智能守护电网安全的新篇章

    、保障电网安全具有重要意义。为此,自动巡检环网柜局放监测方案应运而生,为电网安全守护开启新篇章。自动巡检,高效全面自动巡检环网柜局放监测方案的核心在于其自动化、智
    的头像 发表于 04-24 09:39 855次阅读
    自动巡检环网柜局放监测方案:智能守护电网安全的<b class='flag-5'>新篇章</b>