0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据分析技术架构的通用模块

h1654155282.3538 来源:加米谷大数据张衡 作者:加米谷大数据张衡 2020-10-29 15:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

对于企业而言,坐拥庞大的数据资源,想要实现大数据分析,首要的就是要搭建起自身的大数据系统平台,而每个公司都有自己特定的业务场景,因此在大数据平台上的需求是不一样的。今天我们仅从通用的角度,来聊聊大数据分析需要什么技术架构?

我们熟悉的以BAT为首的互联网大厂,都拥有自身的大数据系统平台,但是各自面临的业务场景是不同的,比如说腾讯,主要是社交业务场景;百度,主要是搜索业务场景;而阿里,主要是电商业务场景。

这样不同的业务场景下,需要根据实际的业务需求,选择适合自己的技术框架,来搭建自己的大数据架构体系。但是从技术架构体系的共性来说,是可以从通用的技术模块去理解,来帮助我们更好地学习和掌握大数据技术架构的。

数据收集模块:主要负责收集各种数据源的数据,包括日志文件、网络请求、数据库、消息队列等,并将这些数据转换为文件或者消息向后传递。

数据转存模块:主要负责将数据定时传递到分布式存储或者实时传递给下游的数据处理程序。

ETL模块:主要负责数据的清洗、格式和内容的处理和转换、数据分级分拣、加载至数据仓库等。

数据仓库模块:这是整个架构的核心,数据仓库是数据有组织的集中存储的地方,负责数据的存取和管理。

元数据管理模块:主要负责记录和约束数据仓库中数据的含义和格式,控制着数据的生命周期和数据质量。

分析引擎模块:数据分析师交互最多的模块,主要负责执行各种分析语句或代码,完成各种分析任务。

作业管理与调度模块:负责分析作业的管理和定时调度,包括作业的增删改查、查看修改历史、设置调度定时和执行引擎等。

资源分配与调度模块:主要负责在多作业同时运行的场景下,有效协调和分配集群的资源,使资源利用率最大化。
责任编辑人:CC

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大数据
    +关注

    关注

    64

    文章

    9093

    浏览量

    144047
  • 大数据分析
    +关注

    关注

    1

    文章

    151

    浏览量

    18065
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI 与大数据驱动的半导体制造时代:面向分析就绪的 FDC 技术

    大数据分析与人工智能已成半导体制造核心技术,行业核心挑战并非数据采集,而是获取可被大规模使用、分析并快速响应的就绪型数据。普迪飞JonHol
    的头像 发表于 04-21 16:03 89次阅读
    AI 与<b class='flag-5'>大数据</b>驱动的半导体制造时代:面向<b class='flag-5'>分析</b>就绪的 FDC <b class='flag-5'>技术</b>

    利用数据API构建实时数据分析与可视化报表系统

    API(涵盖销售统计、用户画像、流量分析等)进行高效的数据整合、分析,并实现 自定义报表生成 和 实时数据可视化 ,为商业决策提供强大支持。 一、
    的头像 发表于 04-02 15:56 158次阅读
    利用<b class='flag-5'>数据</b>API构建实时<b class='flag-5'>数据分析</b>与可视化报表系统

    API数据分析:淘宝流量来源分析,渠道优化!

    ​ 在电商领域,流量来源分析是优化营销策略的核心。淘宝作为中国领先的电商平台,其流量数据可通过API(应用程序接口)高效获取和分析。本技术帖将逐步指导您如何利用淘宝API进行流量来源
    的头像 发表于 01-23 13:42 369次阅读
    API<b class='flag-5'>数据分析</b>:淘宝流量来源<b class='flag-5'>分析</b>,渠道优化!

    经营数据分析可以通过哪些方式

    在数聚股份看来,提起经营数据分析,大家往往会联想到一些密密麻麻的数字表格,或是高级的数据建模手法,再或是华丽的数据报表。其实,“ 分析 ”本身是每个人都具备的能力,对于业务决策者而言,
    的头像 发表于 12-05 16:31 725次阅读

    电能质量分析软件可以提供哪些数据分析功能?

    电能质量分析软件通过对电力系统的实时数据采集和深度算法处理,可提供覆盖 “稳态指标评估、暂态事件溯源、故障预测诊断、合规性验证” 全链条的数据分析功能。以下结合行业标准与前沿工具(如福禄克、华盛昌
    的头像 发表于 10-10 17:12 935次阅读

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统

    数据,结合大数据分析、流程自动化及云边协同技术,实现电磁环境全生命周期管理。以下从五大维度精简解析: 应用案例 北京华盛恒辉、北京五木恒润研发的 EMC/EMI 智能管理系统已落地应用,成效显著,为系统推广提供有力支撑。 一、
    的头像 发表于 09-17 14:58 756次阅读

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统
    的头像 发表于 09-17 14:58 715次阅读
    电磁兼容与电磁干扰在电磁兼容性<b class='flag-5'>大数据分析</b>中的智能管理平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统
    的头像 发表于 09-17 14:42 1034次阅读
    电磁兼容与电磁干扰在电磁兼容性<b class='flag-5'>大数据分析</b>中的智能管理系统

    如何有效利用高光谱成像技术提升数据分析效率

    随着人工智能和大数据技术的快速发展,高光谱成像技术作为一种融合光谱信息与空间影像的新兴技术,正日益成为提升数据分析效率的重要工具。在农业监测
    的头像 发表于 09-11 16:13 972次阅读
    如何有效利用高光谱成像<b class='flag-5'>技术</b>提升<b class='flag-5'>数据分析</b>效率

    普迪飞 Exensio®数据分析平台 | 铸就良率提升与量产加速之路

    ManufacturingAnalytics(M-A)是Exensio数据分析平台中的四个核心模块之一。M-A模块旨在帮助集成器件制造商(IDM)、代工厂(Foundry)和无晶圆厂半导体公司
    的头像 发表于 08-19 13:53 1195次阅读
    普迪飞 Exensio®<b class='flag-5'>数据分析</b>平台 | 铸就良率提升与量产加速之路

    普迪飞 Exensio®数据分析平台 | Test Operations解锁半导体测试新纪元

    TestOperations是Exensio数据分析平台的四个主要模块之一。T-Ops模块旨在帮助集成器件制造商(IDM)、无晶圆厂半导体公司(Fabless)和外包半导体(产品)封测厂(OSAT
    的头像 发表于 08-19 13:53 1633次阅读
    普迪飞 Exensio®<b class='flag-5'>数据分析</b>平台 | Test Operations解锁半导体测试新纪元

    如何通过数据分析识别设备故障模式?

    通过数据分析识别设备故障模式,本质是从声振温等多维数据中提取故障特征,建立 “数据特征 - 故障类型” 的映射关系,核心可通过特征提取、模式匹配、趋势分析三步实现,精准定位故障根源与发
    的头像 发表于 08-19 11:14 1102次阅读
    如何通过<b class='flag-5'>数据分析</b>识别设备故障模式?

    构建自定义电商数据分析API

      在电商业务中,数据是驱动决策的核心。随着数据量的增长,企业需要实时、灵活的分析工具来监控销售、用户行为和库存等指标。一个自定义电商数据分析API(应用程序接口)可以自动化
    的头像 发表于 07-17 14:44 718次阅读
    构建自定义电商<b class='flag-5'>数据分析</b>API

    AI数据分析仪设计原理图:RapidIO信号接入 平板AI数据分析

    AI数据分析仪, 平板数据分析仪, 数据分析仪, AI边缘计算, 高带宽数据输入
    的头像 发表于 07-17 09:20 858次阅读
    AI<b class='flag-5'>数据分析</b>仪设计原理图:RapidIO信号接入 平板AI<b class='flag-5'>数据分析</b>仪

    环网柜局放大数据分析方案:电力运维的“智慧大脑”

    放电现象。这种放电虽初期难以察觉,却会持续侵蚀绝缘性能,最终导致短路、停电等重大事故。传统的定期巡检模式难以捕捉早期微弱放电,而环网柜局放大数据分析方案的出现,为
    的头像 发表于 05-07 10:07 747次阅读
    环网柜局放<b class='flag-5'>大数据分析</b>方案:电力运维的“智慧大脑”