0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么需要数据仓库?

智能感知与物联网技术研究所 来源:通信信号处理研究所 2020-05-13 15:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据仓库为组织了解其历史业务表现和推动持续运营提供了一个接入窗口,为数据分析师和业务用户提供了诸如客户行为、业务趋势、运营效率和销售等方面的信息。尽管出现了基于Hadoop和其他一些大数据技术的数据湖这一概念,但随着公司越来越需要从更多不同的源系统收集和分析业务数据,这使得数据仓库仍然具有其实用价值,甚至比以前更加重要。

但作为数据管理体系结构的一部分,在对数据仓库平台进行投资之前,首先还是要检查您的组织是否真的需要一个数据仓库平台,以及通过实施部署,组织可以借此获取哪些业务收益。相关的,您必须考虑不同的数据仓库部署情况——在企业范围内还是部门范围内,在本地还是在云中。

您还需要确定,通常存储在大数据系统中的非结构化和半结构化数据,是否会成为数据仓库环境的组成部分,并确定是否将用于BI、企业报告和在线分析处理(OLAP)等应用的传统数据仓库,与数据处理和大数据分析管理集成在一起。最后,您必须将您的数据仓库用例与最合适类型的数据仓库平台相匹配。

为什么需要数据仓库?

数据仓库的一般概念非常简单:从支持业务流程的操作系统中定期提取数据副本,并将其加载到单独的存储库中,在该存储库中,数据将被合并,然后可用于分析和报告。之后,业务用户和分析师可以通过BI和分析工具、仪表板、入口和准备好的报告来访问数据。

在下面这些情况下,数据仓库可能更容易发挥其价值:

·公司在做出有效的商业活动报告方面遇到了难题,因为所需要的数据不容易获得。

·不同部门和用户组会将业务数据复制到电子表格中以进行分析,而这些电子表格并非总是相互一致的。

·数据质量和准确性的不确定性,导致企业高管和业务经理会质疑报告的准确性。

·针对生产数据库的BI报告会每晚延迟,或在月底进行的交易数据处理,需要扩展处理窗口。

·在工作日对数据库运行临时查询会降低操作系统的速度,从而影响内部用户和客户、供应商以及其他外部用户。

一个正确数据仓库实施策略可以帮助您的组织准确地回答有关业务运营的问题,如发生了什么、为什么。数据仓库可将来自不同位置和来源的数据组合到中央存储库中,从而提高数据的可访问性。当数据移至数据仓库时,通常还会对其进行清理和转换,以使其与分析一致,这将有助于提高查询结果和报告中信息的质量。

此外,一旦数据仓库部署完成并得到积极使用,由于BI、报告和分析活动已从生产数据库中移出,运营工作流程可能会变得更有效率。

数据仓库的部署

各个组织之间的数据仓库环境可能会有很大差异。从体系结构的角度来看,部署可以遵循多个路径——如一个企业数据仓库(EDW),一组较小的数据集市,或这两种方法的组合。

EDW包含来自企业操作系统的所有相关数据,并且可能包含一些从外部数据源收集的数据。它是用于BI和分析数据的单个统一存储库,可以在所有部门和业务部门中使用。因此,建立EDW通常是一项艰巨的任务,尤其是在大型企业中。

在EDW架构中,组织还可以在其操作系统和企业数据仓库之间实施运营数据存储(ODS)作为过渡步骤。将运营数据复制到ODS,然后提取并加载到数据仓库中。ODS可以用作尚未经过转换的、无法用于分析的数据的暂存区,同时可以用于运行近实时的查询,这些查询需要最新的业务运营的详细相关数据,而不是数据仓库中可用的数据。

数据集市是小型化的数据仓库,专注于各个业务部门和职能领域。当需要满足部门对BI的特定需求时,组织通常会选择建立数据集市,并且优先考虑报告功能。数据集市不需要涵盖整个企业的庞大项目,而是更加集中,并且可以更快地提供业务收益。

因此,数据集市的方法使组织可以通过一次处理一个业务的各个部分——而不是构建整体的EDW——以迭代方式开发数据仓库体系架构。企业可以选择部署一个或多个数据集市,具体取决于组织的规模和结构。

然后,决定组合采用这两种方法的组织,可以将不同的数据集市彼此集成以创建虚拟EDW,或以物理方式填充一个EDW。另一种方式是,以EDW开始的组织可以将仓库数据的子集提供给后来建立的数据集市,以此分离业务运营。

本地与云数据仓库

每种可用的数据仓库平台类型都有不同的部署选项:数据库管理系统(DBMS)软件,通常基于关系数据库技术;专门的分析型DBMS;数据仓库设备将必要的硬件和DBMS软件捆绑在一个包装中;云数据仓库。

将云用于数据仓库已成为更可行的选择。有些供应商已经推出了特定于云的数据仓库平台,而且有些最初设定为本地安装的数据仓库数据库,其供应商现在也提供了基于云的版本。此类产品包括组织自己在云中运行的常规数据仓库系统,以及供应商为用户部署和管理的数据仓库即服务(DWaaS)技术。

与其他类型的云系统一样,与本地环境相比,云数据仓库可以减少部署时间,并提供更轻松的可伸缩性和更大的灵活性。还可以节省一定的成本——但这并不能保证,IT经理需要密切关注云中数据仓库的使用,以确保成本最终不会高于预期。同样,数据安全和隐私问题可能是决定是否在本地部署数据仓库的考虑因素。

数据湖与数据仓库

在Hadoop和其他大数据技术首次出现之后,关于它们是否会替代数据仓库,市场上充满了各种声音。但是在大多数组织中,数据仓库并没有消失。相反,它们和大数据系统通常并存,每种系统都支持不同类型的分析用例。

数据仓库平台通常基于关系DBMS,并包含源自组织的运营和交易处理系统的结构化数据。数据仓库主要由希望运行基于SQL的、基本BI查询的业务分析人员和执行人员,以及希望创建仪表板和报告以向业务用户提供分析信息的BI开发人员访问。

另一方面,大数据系统通常基于非关系技术,例如Hadoop、Spark和NoSQL数据库。它们包含的数据可以是结构化、非结构化或半结构化的,并且可以源自所有类型的内部系统,以及社交网络和其他外部数据源。大数据分析旨在发现模式、关联和类似的见解——例如,根据过去的活动预测未来趋势和客户行为。通常是由数据科学家和统计人员使用Python、R和Scala等语言开发的复杂分析模型完成的。

大数据技术还支持数据湖的概念,数据湖是来自各种来源的原始数据的存储库,可以按原样存储这些数据,然后根据需要对其进行过滤和分析准备。

最后,大数据系统并不能直接替代数据仓库和数据集市。实际上,数据仓库和数据湖之间存在协同作用。例如,可以将在数据湖中收集的结构化数据集移动到数据仓库中,以进行常规的OLAP存储和分析。供应商也已开始将大数据访问集成到数据仓库平台中,从而可以从一个位置访问存储在不同系统中的,不同格式的数据。

数据仓库用例和场景

下面我们介绍一些用例和方案,这可能会影响组织的数据仓库策略,以及决定为数据仓库项目部署哪种类型的平台。

初次VS长期数据仓库用户。希望扩展现有数据仓库的公司通常会很好地继续使用他们已经建立的数据仓库平台。对于第一次实施数据仓库的组织而言,数据仓库设备可能是一个不错的选择。供应商可能会与您一起确定适合的设备规格和配置,而且这些设备的交付是非常简易的。但是,所有数据仓库平台对于首次使用的用户都是可行的选择,您应该审查本部门中的其他用例,以开发您的特定要求和部署计划。

公司规模。大型公司可能会选择主流的关系DBMS、分析数据库或混合事务/分析处理(HTAP)系统。这些组织拥有成功使用此类技术的基础架构和人员。在HTAP方法中,相同的DBMS既可以用于处理业务交易,也可以用于BI和分析建模。为了支持HTAP,关系数据库引擎可以提供内置的列式访问或用于分析处理的附加设备。

另一方面,较小的组织应考虑使用数据仓库设备或云数据仓库服务。这两种选择都可以最大程度地减少管理需求:设备已预先配置,并且DWaaS环境提供的云中的数据仓库一般由云服务提供商进行设置和管理。

IT部门的规模。IT部门相对较小的大型组织往往拥有较少的数据库管理员和其他可以建设、调整和管理数据仓库系统的IT专业人员。对于他们来说,考虑使用数据仓库设备或DWaaS产品也很有意义。

云用例。如果您的组织在云中运行大量应用程序,则DWaaS部署或自我管理的云数据仓库平台可能是您的最佳选择。将生成和存储在云中的业务数据保存在云中以进行数据仓库和分析是一种符合逻辑的方法。

数据延迟要求。对于在分析应用程序中需要最小数据延迟的组织而言,优化的数据仓库设备可能最有价值。使用其他方法也不是说无法实现近实时的延迟,但是您可能需要使用其他高速硬件和软件来扩展数据仓库环境,以满足您的性能目标。

一旦您的组织决定需要建设一个数据仓库,并确定了最合理的部署方案,下一步就是研究购买数据仓库平台的可用技术选项。整个过程,往往需要经过万全的考虑。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据仓库
    +关注

    关注

    0

    文章

    63

    浏览量

    10911
  • 大数据
    +关注

    关注

    64

    文章

    9029

    浏览量

    143067

原文标题:大数据时代,数据湖并不能完全取代数据仓库

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    海微科技智能仓库2.0项目正式启动

    11月4日,海微智能仓库2.0项目启动会在海微智造举行。项目通过数字化仓库顶层设计与自动化技术的深度融合,实现了仓库从 “人力密集”到“智能无人”的跨越。
    的头像 发表于 11-07 15:15 184次阅读

    rfid仓储方案在仓库管理中如何应用

    在现代仓储管理领域,传统人工管理模式易出现盘点效率低、物料追踪难、信息滞后等问题,而rfid仓储方案的出现,为仓库管理带来了革命性的变革。作为高度自动化、智能化的无人值守仓库管理解决方案,rfid
    的头像 发表于 10-23 15:13 232次阅读
    rfid仓储方案在<b class='flag-5'>仓库</b>管理中如何应用

    从“传统仓库”到“智能仓库”,企业能获得哪些颠覆性改变?

    对于许多制造企业而言,仓库曾是成本中心和数据黑洞——依赖手工记账、寻找货物困难、库存不准、效率瓶颈突出。而向智能仓库的转型,绝非仅仅是引入一些新技术,而是对企业物流与信息流的一次彻底重塑,能带来多维
    的头像 发表于 09-28 15:02 250次阅读

    仓库物品计数远程监控系统方案

    某工厂设置有多个产品仓库分布到各个车间旁,库存容量都不一样。每天仓库管理人员需要前往各个仓库清点产品数量,存在工作量大、统计汇总困难等问题。现通过计数传感器实现自动计数,当库存未满时现
    的头像 发表于 09-16 14:11 353次阅读
    <b class='flag-5'>仓库</b>物品计数远程监控系统方案

    ERP仓库管理软件如何赢得企业的信赖

    在制造、贸易乃至电商领域,仓库早已不只是“堆放货物的地方”。从原材料入库到成品出库,每一个环节的数据准确性,都直接影响着生产安排、客户交付和财务结算。正因如此,越来越多企业开始关注ERP中的仓库管理
    的头像 发表于 08-29 09:40 395次阅读
    ERP<b class='flag-5'>仓库</b>管理软件如何赢得企业的信赖

    为更智能的移动仓库机器人提供动力

    程度上实现货物定位、拣选和包装流程的自动化,成为决定成功与否的关键。最初,工作人员需要手持条形码扫描仪穿梭于仓库中,找到订单中的商品,然后将它们运回发货区进行打包和发运。   为了加速这一过程,主要零售商投资引进了能够在仓库内搬
    的头像 发表于 07-21 16:29 3206次阅读
    为更智能的移动<b class='flag-5'>仓库</b>机器人提供动力

    仓库人车定位系统的优选之解

    在当代仓储物流的运作体系里,仓库管理的高效性与安全性占据着核心地位。而人车定位系统作为提升仓库管理效能的重要技术支撑,正逐渐成为行业聚焦的重点。新锐科创蓝牙+LoRa人车定位系统,借助其独特的技术
    的头像 发表于 07-04 16:54 387次阅读
    <b class='flag-5'>仓库</b>人车定位系统的优选之解

    工业路由器赋能仓库消防预警,智慧消防物联网解决方案

    在现代物流与仓储行业蓬勃发展的当下,仓库的规模与存储密度不断攀升,消防预警的重要性愈发凸显。传统消防系统在应对复杂仓库环境时,预警滞后、设备联动不畅、数据管理困难等弊端逐渐暴露。为了有效解决这些
    的头像 发表于 06-10 17:47 957次阅读
    工业路由器赋能<b class='flag-5'>仓库</b>消防预警,智慧消防物联网解决方案

    Helm仓库管理常用配置

    Helm 仓库(Repository)是存储 Helm 图表(Chart)的地方,类似于软件包管理器的仓库(如 apt、yum 仓库)。
    的头像 发表于 06-07 09:27 991次阅读

    物联网、AI与自动化驱动下的军用仓库信息化转型升级方案

    的胜负。 想象一下,“智慧仓库” 就像一个超级智能管家,它的目标是把物资管理得又快又准又安全。物资从送进仓库、存放保管,到最后送出去,全程都实现自动化和数字化。前线部队需要什么物资,仓库
    的头像 发表于 06-04 13:49 326次阅读
    物联网、AI与自动化驱动下的军用<b class='flag-5'>仓库</b>信息化转型升级方案

    部队仓库管理模式革新,RFID技术让仓库管理更高效

    在风雷激荡的现代战场,从弹药油料到被装口粮,每一件物资都关乎前线士兵的生命与战斗的成败。军用仓储管理系统正是这复杂物资生命线的神经中枢,将昔日沉寂的仓库转变为战场最敏锐的神经末梢。它超越传统仓库
    的头像 发表于 06-03 17:44 428次阅读
    部队<b class='flag-5'>仓库</b>管理模式革新,RFID技术让<b class='flag-5'>仓库</b>管理更高效

    支持二维码扫描的PDA数据采集器,用于仓库,出入库、库存管理

    在现代仓库管理中,支持二维码扫描的PDA数据采集器已成为不可或缺的工具。这种便携式的智能移动终端,凭借其高效、准确的数据采集能力,极大地提升了仓库管理的效率和精度。PDA
    的头像 发表于 02-19 15:48 805次阅读
    支持二维码扫描的PDA<b class='flag-5'>数据</b>采集器,用于<b class='flag-5'>仓库</b>,出入库、库存管理

    Henry Diaper计划在香港设立金属仓库

    近日,伦敦金属交易所(LME)认证的英国仓储运营商Henry Diaper宣布了一项重要计划。据该公司董事长John Harvey透露,Henry Diaper有意在香港设立金属仓库,并已与数家香港
    的头像 发表于 02-19 09:46 522次阅读

    戴尔数据湖仓助力企业数字化转型

    在数字化转型的浪潮下,企业正面临着前所未有的数据挑战。从传统的结构化数据到如今的非结构化数据、半结构化数据,每一种类型都对企业的存储和分析能力提出了更高的要求。面对这些变化,传统的
    的头像 发表于 12-20 09:31 770次阅读

    医药仓库温湿度监控系统应用

    。 医药仓库温湿度监控系统,结合物联网、无线通讯等技术,通过传感器全天候实时采集仓库内的温湿度数据,管理云平台对接收到的数据进行深入分析、处理,并以图表、曲线等形式直观展示温湿度变化趋
    的头像 发表于 12-17 16:16 1027次阅读