0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

实例详解对Serverless SQL大数据分析技术的应用

人工智能与大数据技术 来源:YXQ 2019-07-26 10:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近年来, Serverless作为一种新型的互联网架构直接或间接推动了云计算的发展,同时基于Serverless的轻量计算也成为了新的技术热点,而Serverless SQL大数据分析产品就在此背景下应运而生。

目前,国内云计算厂商UCloud推出的一款基于Serverless的SQL分析计算引擎USQL,可轻松完成面向海量数据的数据建模工作,SQL即可完成数据查询和分析,极大降低使用大数据的门槛,且无需数据库管理员和运维人员,大幅度改善企业对大数据工程师的依赖。

下面通过实例来对Serverless SQL大数据分析技术的应用做出详解:

爱普新媒是一家专注于移动互联网产品研发和新媒体整合营销的高新技术型公司,旗下拥有100余款精品软件,内容涵盖日常生活、效率工具、文章资讯等多个方面,主营以天气预报、快游等综合自媒体矩阵为载体的推广业务和以云魔方DSP移动互联网广告分发平台为基础的广告投放业务。

目前爱普新媒广告业务数据规模达到数百TB,日增长量为1TB左右,业务日常不固定的分析需求非常多。在现有的大数据处理方案下,数据部门每月需投入大数据工程师20个人/日,平均每次需求处理时长为1.8天,此外还需额外花费数千元维持一个数据仓库集群。基于已有架构,数据部门将广告日志数据压缩后存放于对象存储UFile中,接收到业务分析师不固定的数据需求后,再将用于分析的原始数据,临时加载到数据仓库UDW中,完成SQL分析后实施清除操作。

图:爱普新媒现有架构

在已有架构的模式下,爱普新媒面临着来自业务和数据分析部门极大的挑战:

业务部门:

(1)由于数据规模较大,业务分析师无法自主完成分析,必须极大程度依赖大数据工程师;

(2)任务处理周期长,若出现新的需求变更或分析结果未达预期的情况,需要重新走一遍处理流程;

(3)当对分析结果存有疑问时,无法查看原始数据进行校验。

数据部门:

(1)业务部门每月的不固定数据分析需求非常多,数据部门有限的技术人力资源难以支撑;

(2)需求变动返工次数多,导致大量重复性工作;

(3)随着数据日增长量的不断提升,用于临时存放不固定需求数据的GreenPlum成本不断在增加。

爱普新媒对业务改善的诉求便是:可支持数百TB规模的数据分析、业务分析师可独立完成不固定需求分析工作、具有较强的Ad-Hoc能力、可缩短每次需求处理时长、可降低计算成本投入和运维投入。

针对以上问题,UCloud使用USQL产品帮助爱普新媒对现有业务数据处理架构做出了改善。UCloud发现,爱普新媒现有架构中计算与存储是分离的状态,其原始数据并未与GreenPlum强耦合,这为更换分析引擎的方案实施提供了便利。

GreenPlum数据平滑切换至USQL

首先在新架构中使用USQL替换原先用于临时加载数据的GreenPlum,省去数据从UFile导入到GreenPlum的过程,使得业务分析师能够直接通过SQL分析UFile中海量数据,全程无需大数据工程师的参与。

图:爱普新媒新架构

USQL升级保障多格式数据支持

此外,数据对接中发现,爱普新媒的数据格式为JSON并通过GZIP格式压缩,UCloud了解后一周内完成USQL产品升级,得以支持这两种数据格式,减少对接上的障碍,并协助爱普新媒重新布局其现有数据,目前爱普新媒实际业务SQL已全部落地,同时完成产品培训以及现场演示。

图:实际业务SQL示例

最终,我们对应用了USQL的爱普新媒新数据平台与原平台进行了对比分析:

1、计算成本降低97.5%

相较于爱普新媒现在每月花费在传统数据仓库(用于临时存放数据)的数千元,处理同样的数据,USQL可将成本控制在每月几十元,因为USQL按照实际分析数据量计费,每GB数据分析价格极低,且不使用时不计费。

2、任务周期缩短55.6%

爱普新媒现有架构下,处理不固定的数据需求,数据导入与分析平均处理时长为1.8天,而USQL可省去数据导入的步骤,减少运维工作量,大幅度缩短每次任务完成时间。

3、分析效率提升5倍

爱普新媒所有真实业务SQL均已落地,其中最耗时的SQL分析时间可从600秒降至118秒,整体明显提高SQL分析效率。

4、大数据工程师投入降为0

目前每月需投入大数据工程师20个人日,使用USQL产品,业务分析师可直接通过SQL在对象存储UFile中完成数据分析,极大减少对工程师的依赖,有限的人力资源可得到更好的利用。

爱普新媒CTO牛德恒总结道:“使用USQL产品,用户在原有的数据文件基础上进行数据建模,即可使用SQL进行业务数据的快速查询,此种方式对原有数据文件改动较小,用户不用关注大数据分布式处理的过程,业务迁移方便。对比我们现有的大数据处理方案,节省80%的服务器成本,提升50%数据分析速度,同时也缩短了新业务的开发周期,值得推荐。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云计算
    +关注

    关注

    39

    文章

    8003

    浏览量

    143106
  • 大数据
    +关注

    关注

    64

    文章

    9029

    浏览量

    143071
  • serverless
    +关注

    关注

    0

    文章

    65

    浏览量

    4849

原文标题:提升效率50%+节约成本80%,Serverless SQL大数据分析的最佳实践

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    经营数据分析可以通过哪些方式

    在数聚股份看来,提起经营数据分析,大家往往会联想到一些密密麻麻的数字表格,或是高级的数据建模手法,再或是华丽的数据报表。其实,“ 分析 ”本身是每个人都具备的能力,对于业务决策者而言,
    的头像 发表于 12-05 16:31 360次阅读

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统

    数据,结合大数据分析、流程自动化及云边协同技术,实现电磁环境全生命周期管理。以下从五大维度精简解析: 应用案例 北京华盛恒辉、北京五木恒润研发的 EMC/EMI 智能管理系统已落地应用,成效显著,为系统推广提供有力支撑。 一、
    的头像 发表于 09-17 14:58 446次阅读

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统
    的头像 发表于 09-17 14:58 380次阅读
    电磁兼容与电磁干扰在电磁兼容性<b class='flag-5'>大数据分析</b>中的智能管理平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统
    的头像 发表于 09-17 14:42 592次阅读
    电磁兼容与电磁干扰在电磁兼容性<b class='flag-5'>大数据分析</b>中的智能管理系统

    如何有效利用高光谱成像技术提升数据分析效率

    随着人工智能和大数据技术的快速发展,高光谱成像技术作为一种融合光谱信息与空间影像的新兴技术,正日益成为提升数据分析效率的重要工具。在农业监测
    的头像 发表于 09-11 16:13 585次阅读
    如何有效利用高光谱成像<b class='flag-5'>技术</b>提升<b class='flag-5'>数据分析</b>效率

    AI数据分析仪设计原理图:RapidIO信号接入 平板AI数据分析

    AI数据分析仪, 平板数据分析仪, 数据分析仪, AI边缘计算, 高带宽数据输入
    的头像 发表于 07-17 09:20 498次阅读
    AI<b class='flag-5'>数据分析</b>仪设计原理图:RapidIO信号接入 平板AI<b class='flag-5'>数据分析</b>仪

    达梦数据库常用管理SQL命令详解

    达梦数据库常用管理SQL命令详解
    的头像 发表于 06-17 15:12 6574次阅读
    达梦<b class='flag-5'>数据</b>库常用管理<b class='flag-5'>SQL</b>命令<b class='flag-5'>详解</b>

    环网柜局放大数据分析方案:电力运维的“智慧大脑”

    放电现象。这种放电虽初期难以察觉,却会持续侵蚀绝缘性能,最终导致短路、停电等重大事故。传统的定期巡检模式难以捕捉早期微弱放电,而环网柜局放大数据分析方案的出现,为
    的头像 发表于 05-07 10:07 399次阅读
    环网柜局放<b class='flag-5'>大数据分析</b>方案:电力运维的“智慧大脑”

    大数据云计算都需要考什么证书?

    大数据和云计算领域包含多种专业证书,其中大数据领域涵盖数据分析类证书、大数据工程类证书、数据治理类证书。云计算领域领域涵盖云计算
    的头像 发表于 02-19 11:05 1194次阅读

    电力系统数据分析技术

    随着智能电网技术的发展和大数据时代的到来,电力系统数据分析技术已成为电力行业不可或缺的一部分。这些技术能够帮助电力公司更好地理解电网的运行状
    的头像 发表于 01-18 09:46 1224次阅读

    Devart: dbForge Compare Bundle for SQL Server—比较SQL数据库最简单、最准确的方法

      dbForge Compare Bundle For SQL Server:包含两个工具,可帮助您节省用于手动数据库比较的 70% 的时间 dbForge数据比较 帮助检测和分析
    的头像 发表于 01-17 11:35 865次阅读

    智能焊接数据分析设备提升工业效率与精度

    随着科技的不断进步,智能制造已经成为推动工业4.0发展的关键力量。在众多的智能制造技术中,智能焊接数据分析设备因其在提高生产效率和焊接质量方面的显著效果而受到广泛关注。本文将探讨智能焊接数据分析设备
    的头像 发表于 01-15 14:11 675次阅读

    NeuroBlade携手亚马逊EC2 F2实例,加速数据分析

    里程碑式的合作,标志着NeuroBlade的创新技术将与亚马逊云科技的先进计算资源强强联合,共同推动云原生数据分析工作负载的性能与效率迈向新高度。 据悉,Amazon EC2 F2实例融合了AMD
    的头像 发表于 12-31 11:37 815次阅读

    2023年度《中国公路货运运行大数据分析报告》发布

    伴随新一轮科技革命和产业变革加速演进,公路货运行业也正处于产业升级、结构调整、转型重构的总体发展阶段。在此趋势下,中交兴路联合长安大学等院校和机构,对公路货运行业的运行态势和变化特点持续关注和分析,迄今已连续六年编制《中国公路货运运行大数据分析报告》。在多方共同合作之下,
    的头像 发表于 12-29 16:31 1425次阅读
    2023年度《中国公路货运运行<b class='flag-5'>大数据分析</b>报告》发布

    Mathematica 在数据分析中的应用

    数据分析是现代科学研究和商业决策中不可或缺的一部分。随着数据量的爆炸性增长,对数据分析工具的需求也在不断增加。Mathematica,作为一种强大的计算软件,以其独特的符号计算能力和广泛的内置函数库
    的头像 发表于 12-26 15:41 1079次阅读