0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何利用智能虚拟化技术消除数据孤岛

lhl545545 来源:telecomstechnews 作者:佚名 2020-03-26 15:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在瞬息万变的信息时代,成功从数据中获取有价值信息的企业,将在竞争日益激烈的市场中保持其独有的竞争力。对于以数据为驱动力的企业来说,可能会对隐藏在海量数据中的业务和客户有着比较全面的认知,同时,这也是为什么智能虚拟化技术致力于消除数据孤岛的原因。

数据湖是大势所趋吗?

未来,数据只会变得更加多样化、动态化和分散化。许多企业试图收集他们全部的数据,并通过将全部数据抛入一个数据湖中来使其可访问,数据湖可以以其原始格式来保存数据,直到需要进行分析为止。

这种做法或多或少还是有说服力的,大部分公司是可以承担得起数据科学家收集,翻译并分析数据湖中各种类型数据的费用。

对数据即存即取的需求已日趋强烈!

企业间竞相收集和分析尽可能多的数据,旨在获得与同行相比哪怕是很微小的竞争优势。传统的数据湖无法处理新出现的数据源和正在创建的新的本地数据库。

查询必须匹配用户正在使用的特定数据库,因此用户拥有的数据库越多,就需要使用更多的查询语言。重要的是,在一个数据湖中集成不同的数据,仍然需要人工处理以使其具备可访问性和可读性,这项工程对于数据工程师和数据科学家来说是非常耗时的。

数据湖缺乏灵活性,在数据驱动的经济中将不再适用

因此,许多企业正在把目光转向数据虚拟化,以优化其分析和BI。BI和数据正连接他们所有的数据,并使其可从一个地方读取和访问。

并非所有的数据虚拟化都是相同的。

数据虚拟化创建了一个软件虚拟化层,该层集成了所有跨企业的数据。无论数据的格式是什么,或者数据驻留在哪一个筒仓、服务器或云中,数据都会被转换成一种通用的业务语言,并可以从单个门户访问。

从理论上讲,这赋予了组织一个共享的数据湖,所有不同的业务单位和业务用户都可以立即访问他们需要的数据。拥有快速访问权限,使企业能够为共享目的做出数据驱动的决策。

然而,很多数据虚拟化解决方案并没有达到分析的理想效果。这有几个关键原因:

01、专有格式

不少数据虚拟化供应商会将所有数据合并且转换成一种专有格式。虽然合并允许将数据集成到单个视图的单个位置,但供应商的专有格式常常将数据简化为最小的公共分母状态。

公共分母状态可能致使某些数据出现偏差,失去特定的功能,甚至在转换的过程中丢失。有些数据还可能要求其原始数据库的上下文是关联的。因此,用户可能会从错误的数据中汲取信息,并做出适得其反的商业决策。

02、BI工具不兼容

BI工具对于企业来说是一笔金额相当大的投资。大多数企业级公司在不同部门拥有几种不同类型的BI工具。例如,一个部门可能使用Tableau,而另一个部门可能使用MicrosoftPowerBI或Excel。

要让大数据分析在企业中充分发挥作用,前提是不管用户喜欢使用什么工具,数据都是易于发现,并能被所有的用户访问。

许多供应商使用的专用数据格式可能无法与公司已经投入的技术进行互操作。不同的工具使用不同的查询语言,显示数据的方式也各不相同。当定义不一致的数据被集成时,分析过程中可能会出现代价惨痛的失误。

选择合适的BI工具对于尽量减少业务中断,最大限度地提高用户的生产力至关重要。

03、查询限制

随着数据不断增长和技术的快速发展,查询会变得越来越复杂,这对于分析工作负载和处理大规模数据来说并不太理想。管理的数据源越多,就越需要更多的数据工程来支持快速、交互式的查询。

分布式连接移动大量数据并不适用于交互式查询。它给企业基础结构带来了不可预测和不可接受的压力,而简单的数据缓存对于动态查询环境和当今的数据大小来说是不够的。

当将BI和AI工作负载添加到混合工作负载中时,性能会迅速下降,从而促使最终用户寻找其他直接访问数据的路径,这就使数据虚拟化没有利好可言。

除了这些扩展缺陷之外,传统的虚拟化产品在解决分析用例方面表现的也很差强人意。

扩展大型且复杂的数据服务需要对细节有深入了解:有关数据的统计、所涉及的数据库、共享资源的负载、数据使用者的用例和意图、安全性约束等。

虚拟化解决方案需要为用户提供其数据的业务整体视图,包括层次结构、度量、维度、属性和时间序列。

数据虚拟化应该提供什么?

大多数数据虚拟化解决方案的发展步伐与今天的数据集和数据科学实践不同,仍然依赖于传统的数据联合方法和简单的缓存技术。然而,还有更多的下一代智能数据虚拟化专为当今复杂且对时间敏感的BI需求而设计。

如果你的数据虚拟化解决方案没有提供以下功能,那就说明它不够智能。

01、自主数据工程

人类永远不可能是完美的;幸运的是,计算机可以。

鉴于现代数据体系结构的复杂性,人类面对这一问题根本是就束手无策,至少不能以现在保持竞争力所需的速度进行运算。这就是数据虚拟化解决方案需要提供自主的数据工程的原因。

自主数据工程可以根据无数的连接和计算结果自动推断出优化结果,而这是人脑无法达到的。机器学习(ML)是用来剖析公司的所有数据并检查它是如何被查询并集成到整个组织的所有用户正在构建的数据模型中的。

自动化数据工程可尽可能节省大量的资金和资源,同时释放数据工程师来执行对组织更有价值的更复杂的任务。

02、加速结构

智能数据虚拟化还可以自动实现将数据放入特定的数据库,从而达到最佳的性能。

有许多类型的数据和不同的格式比较适合这些数据。

智能数据虚拟化可以基于生成最佳性能的位置自动决定将数据放在哪个平台上。不同的数据平台具有不同的优势。例如,如果用户的数据模型和查询正在处理时间序列数据,那么智能数据虚拟化将在数据库中放置一个针对时间序列数据进行优化的加速结构。从而自动获悉哪个数据库具有哪些优势,然后加以利用,不同数据库类型的可变性都能将其转化为优势。

加速度结构可节省大量云运营成本。根据用户正在使用的平台,可能会对数据库的存储大小、运行的查询数量、查询中正在移动的数据、问题中的行数、查询的复杂性或其他变量收取费用。

例如,使用GoogleBigQuery,需要支付的金额与数据库的大小以及查询的复杂程度成正比。

当用户自动使用加速结构进行性能和成本优化时,只对在加速聚合中使用的查询数据收取费用,而不是对整个数据库的大小。

03、自动数据建模

下一代数据虚拟化不仅提供对数据的转换和访问,智能数据虚拟化还可以自动获悉每个数据平台的功能和局限性。它会自动识别哪些信息是可用的,以及如何在建立模型时将其与其他数据合并和集成。

智能数据虚拟化可以对用于创建旧版报表的数据模型和查询进行逆向运作,因此用户可以继续使用相同的报表,而不必重新构建数据模型或查询。例如,如果用户在旧系统中创建了一个TPS报告,则仍然可以能够在新系统中检索到它。

有些查询可能是在旧数据基础上运行的,但它们仍然可以在新系统上运行,而无需任何重写。

04、支持自助服务

近年来,IT的很多方面变得“大众化”了--也就是说,技术的进步(尤其是云计算)使它们变得“大众化”。使得那些没有广泛技术基础的外行人也可以使用这些技术。虽然分析和商业智能已经落后于民主化趋势,但是BI工具现在越来越适合普通大众使用。

BI的使用引导了一种新的“自助服务”分析文化的发展,在这种文化中,业务用户可以使用自己喜欢的BI工具直接访问和分析数据,而不必依赖数据工程师或数据分析人员。

自助分析正迅速成为企业中优化大数据分析的必要手段。

例如,假设销售部门保存有关于前一年的支出的数据,但希望使用关于多个领域的客户行为模式的数据来进行补充。或者,营销部门需要发起一场基于账户的营销活动,目标是那些被认为最有可能更换供应商的公司。

通过自助服务分析,销售或营销部门的业务用户可以访问这些数据,并使用恰当的工具调用这些数据。自助分析被使用,而不是依赖于训练有素的数据工程师来为BI工具获取数据,以及数据科学家来建模和预测。

借助自助服务动态,组织中的每个部门都可以将自己的经验和专业知识应用于BI,从而实现全新的便利性。

智能数据虚拟化提供了一个业务逻辑层,它实际上将所有数据转换为一种公共业务语言,这种语言既与源无关,也与工具无关。有了逻辑层,就意味着业务用户可以使用他们喜欢的任何BI工具,且不必屈从于BI软件的单一标准。

无论用户使用什么工具或使用多少工具,所有数据都是可访问的,并且所有查询都将返回一致的答案。标准和逻辑的解释使企业具备共享数据智能和自助服务文化的能力,而这种文化在当今数据驱动的业务环境中变得越来越必要。

05、安全保障

在追求数据用户化的过程中,无论便利性和成本效益如何,都不能牺牲安全性和合规性。

众所周知,虚拟化层会带来安全风险。但是,使用下一代智能数据虚拟化,数据将继承了所有数据库的安全和治理策略。透明的管理过程意味着用户的权限和策略保持不变。

通过跟踪数据的源头和用户身份,将所有现有的安全和隐私信息保存到各个用户。

即使在使用具有不同的安全政策的多个数据库时,这些策略也可以被无缝地合并,并且自动应用于全局安全和遵从协议。在采用智能数据虚拟化之后,不需要采取其他步骤来确保安全性和遵从性。

数据虚拟化必须随着其他IT部门的发展而发展

对企业而言,拥有用户化的数据和拥有可读、可访问和可靠的数据同样重要,但现如今,不少公司都陷于海量数据的泥淖。越来越多的分布式模型以动态和多样化的格式和用例添加到数据中。(子午物联ziwuiot.com)如果用户无法快速找到并分析所需数据,并确信它们的准确性和最新性,BI质量就会下降,从而导致基于数据的决策不够理想。

因此,数据虚拟化需要不断发展以应对这些新的挑战和复杂性,这样它才能真正地用于大数据分析。

如果数据虚拟化解决方案不能提供自主的数据工程,加速结构,如自动数据建模,自助服务分析,就存在问题了。用户需要无后顾之忧的安全性和遵从性,或者是平台语言的多维语义层。如果没有这些流程,那么数据虚拟化解决方案就一定不够智能。
责任编辑;zl

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 虚拟化技术
    +关注

    关注

    1

    文章

    52

    浏览量

    13510
  • 大数据
    +关注

    关注

    64

    文章

    9114

    浏览量

    144175
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    为什么要做虚拟SIL测试?— 提效、省钱、降低风险#虚拟测试

    虚拟
    北汇信息POLELINK
    发布于 :2026年05月21日 17:39:18

    基于热管理闭环仿真系统的虚拟测试DEMO展示#vECU #虚拟测试

    虚拟
    北汇信息POLELINK
    发布于 :2026年05月14日 15:32:18

    虚拟数据恢复】ESXI虚拟机还原快照致数据丢失?完整恢复方案解析

    虚拟技术作为虚拟技术的一种,在现代信息技术领域扮演着重要角色。
    的头像 发表于 03-12 15:17 312次阅读
    【<b class='flag-5'>虚拟</b><b class='flag-5'>化</b><b class='flag-5'>数据</b>恢复】ESXI<b class='flag-5'>虚拟</b>机还原快照致<b class='flag-5'>数据</b>丢失?完整恢复方案解析

    企业级KVM虚拟平台搭建实战

    企业IT基础设施经历了从物理机时代到虚拟化时代的演进。传统数据中心中,每台物理服务器运行单一应用,资源利用率普遍不足20%。硬件采购周期长、扩容慢、运维成本高,难以满足业务快速发展的需求。虚拟
    的头像 发表于 03-11 09:38 846次阅读

    华为全场景Rural创新方案助力消除数字鸿沟

    在MWC26巴塞罗那期间,华为无线网络产品线副总裁曾创在TECH cares论坛上发表题为《华为全场景Rural解决方案,助力消除数字鸿沟》的主题演讲。
    的头像 发表于 03-04 11:08 746次阅读

    告别通信孤岛,拥抱数据驱动Modbus转Profinet让光伏电站跑在智能化的快车道上!

    “通信孤岛”。如何让这些 “孤岛” 接入智能管理网络?耐达讯自动Modbus 转 Profinet 网关技术,正是破解这一困局的密钥!
    的头像 发表于 11-07 11:12 748次阅读
    告别通信<b class='flag-5'>孤岛</b>,拥抱<b class='flag-5'>数据</b>驱动Modbus转Profinet让光伏电站跑在<b class='flag-5'>智能化</b>的快车道上!

    孤岛是什么?为什么要防孤岛?——守护电网安全,从了解防孤岛保护开始

    效应不仅可能危及维修人员的人身安全,还会对电力设备造成损坏。防孤岛保护就是针对这一风险而设计的重要安全措施。安科瑞 技术联系 152-167-512-08 01 孤岛效应的概念与危害 什么是
    的头像 发表于 10-30 13:14 1662次阅读
    防<b class='flag-5'>孤岛</b>是什么?为什么要防<b class='flag-5'>孤岛</b>?——守护电网安全,从了解防<b class='flag-5'>孤岛</b>保护开始

    车载软件vECU虚拟测试解决方案

    虚拟测试:利用虚拟技术,实现将真实域控制器转化为虚拟
    的头像 发表于 10-30 09:34 1855次阅读
    车载软件vECU<b class='flag-5'>虚拟</b><b class='flag-5'>化</b>测试解决方案

    智慧供热数字孪生平台:打通“源-网-站-户”数据,实现智能协同

    在城市供热向数字智能化升级的进程中,智慧供热数字孪生平台正成为破解行业管理痛点的关键技术载体。它通过构建供热系统的虚拟数字镜像,打通“源-网-站-户”全链路
    的头像 发表于 10-30 09:22 698次阅读
    智慧供热数字孪生平台:打通“源-网-站-户”<b class='flag-5'>数据</b>,实现<b class='flag-5'>智能</b>协同

    工业互联网如何破除“数据孤岛

    工业互联网通过技术融合、标准统一、生态协作和安全保障四大核心策略,系统性破解“数据孤岛”问题,实现数据在设备、系统、企业间的自由流动与价值挖掘。以下是具体解决方案及实践案例: 一、
    的头像 发表于 08-27 09:16 1158次阅读

    什么是服务器虚拟?一文读懂原理、优势与实战部署

    什么是服务器虚拟?当企业服务器CPU利用率长期低于15%,却仍需不断采购新硬件应对业务增长时,一场基础设施领域的革命早已悄然发生——服务器虚拟
    的头像 发表于 08-25 10:52 1516次阅读
    什么是服务器<b class='flag-5'>虚拟</b><b class='flag-5'>化</b>?一文读懂原理、优势与实战部署

    从“信息孤岛”到“数字海洋”:云翎智能卫星物联网赋能产业应用

    在数字浪潮中,传统行业因地理覆盖不足、数据孤岛林立而陷入发展瓶颈。云翎智能卫星物联网终端以“空天地一体
    的头像 发表于 08-06 20:39 1089次阅读
    从“信息<b class='flag-5'>孤岛</b>”到“数字海洋”:云翎<b class='flag-5'>智能</b>卫星物联网赋能产业应用

    工业智能网关:破解数据孤岛困局,驱动工业4.0全场景互联

    御控工业智能网关以“数据互联+场景应用”为核心,不仅解决了工业数据孤岛的痛点,更推动了教育数字
    的头像 发表于 08-04 10:44 603次阅读

    车用虚拟技术:域控融合的必经之路

    本文阐述了汽车电子架构从分布式向集中演进的趋势,黑芝麻智能分析了集中带来的安全隔离、实时性等关键挑战,并指出车用虚拟
    的头像 发表于 07-05 16:14 1512次阅读

    虚拟数据恢复—XenServer虚拟平台上VPS不可用的数据恢复案例

    系统,运行Web服务器。有系统盘 + 数据盘两个虚拟机磁盘。 虚拟故障: 机房断电导致XenServer服务器中一台VPS(XenServer
    的头像 发表于 05-30 11:35 874次阅读
    <b class='flag-5'>虚拟</b><b class='flag-5'>化</b><b class='flag-5'>数据</b>恢复—XenServer<b class='flag-5'>虚拟</b><b class='flag-5'>化</b>平台上VPS不可用的<b class='flag-5'>数据</b>恢复案例