0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何解决大数据带来关于预测技术的挑战

电子工程师 来源:网络整理 作者:工程师飞燕 2018-07-01 10:55 次阅读

大数据分析近年来逐渐成为预测分析技术的代名词。这使得越来越多的人以为,任何用于预测分析的系统都必定涉及大数据;而反过来,任何大数据系统自然也一定会支持预测建模。

而事实上,这两者并非一回事。尽管通过访问海量数据与新的数据类型,开发出更好的预测模型的能力会得到显著增强。但是分析管理人员与其团队需要更多考虑数据的构成,以及在大数据环境中如何管理这类基础性问题。

首先,让我们审视预测分析过程本身。在主流的预测分析过程中,会涉及到某些与业务应用相集成的统计分析与模式匹配,从而推动运营决策与操作。但是,预测模型的实时需要多项步骤,其中包括:

数据准备工作,清理、转换与重组数据,使其符合预测分析或机器学习算法所需的格式。包括分析数据、寻找异常、确定应用和待修复的数据质量标准类型、设计适合分析的数据模型,并执行转换,使数据集保持一致。

预测模型开发,包括创建试用数据集,选择特定算法进行处理,从而测试某些分析模式。这一步需要有计划地进行,将被分析的数据分为不同的子集,包括试用数据集和一份或多份测试数据集。

测试过程,即在各模型上运行测试数据集,对性能加以评估,从而确定哪种模型能够得到最佳效果。

集成与实施,选中的模型被纳入生产业务流程、实际上线、并产生真实的分析结果,以此采取行动。

调整所选的预测模型以确保其持续有效与准确,重复分析、不断更新。

大数据带来特定的挑战

接下来,让我们看看大数据环境中出名的3V数据——即容量,多样性和速度——并思考在大数据环境,预测分析过程中必须解决的一些特定挑战。

数据容量。除了那些显而易见的,与管理与海量数据有关的考量因素,包括数据获取、分段和防止延迟,你必须有精简的流程,从而支持各不同阶段的分析过程。例如,你需要能够提取到可以使用不同算法快速分析的试用数据集,也需要能够充分反映整体数据的那部分信息

数据的多样化。企业越来越多地得到各式各样的数据输入,从传统的结构化数据到日益增长的非结构化数据类型。而且,随着更多的非结构化数据流成为业务流程中不可或缺的组成部分,例如对推特信息流的持续监测可以识别客户情绪,非结构化数据正成为预测模型必不可少的数据源。这意味着你必须拥有一套非常强大的流程,用于扫描、分析和处理非结构化数据,以将其转化为可用作分析算法输入的数据集。

数据的速度。处理大量不同数据所带来的复杂性,与更快速的数据流输入速度叠加。使得你不仅必须能够处理输入速度更快的数据源,而且需要应对这些数据源的结构或格式可能会发生的变化。更要命的是,这种变化通常难以预测,因此迫切需要做好数据分析与准备工作。

智慧的分析策略

设计大数据系统预测分析策略能够应对上述挑战,以便你可以成功管理或优化流程中的关键点。

例如,考虑如何将庞大的数据集合转化为容量更为合理的试用数据块。在某些情况下,最佳实践是,不要随机选择试用数据集,而是通过过滤器来减少数据集合的大小,这样或许会消除特例的那部分记录。另外一些情况中,你的目标可能是增加大数据系统的计算资源,使分析算法有能力处理更大的训练集——并且无需过滤任何记录。

另一个例子是,解决数据在速度方面挑战或许意味着扩大系统对数据流的吞吐能力,从而可以让每个数据逐一进入预测模型;当然,你同样可以降低模型的复杂度,以便更快速地加以执行。

当涉及到设计、工程量、复杂性和成本这些问题时,每一次选择都意味着相应的取舍。一组更精确的预测模型可能需要更多的处理和存储资源,但分析带来的优势或许会超越所增加的成本。又或者,你所在的企业组织也许可以从并不复杂的模型中,以较少的处理资源,获得大数据应用中的预测分析能力。

预测分析必须与大数据处理相结合,从而为分析管理人员、甚至企业高层提供所期待的结果。要做到这一点,就必须弄清楚如何在预测分析带来的收益与大数据所需的性能和管理之间做出平衡。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 预测分析
    +关注

    关注

    0

    文章

    10

    浏览量

    6414
  • 大数据
    +关注

    关注

    64

    文章

    8643

    浏览量

    136585
收藏 人收藏

    评论

    相关推荐

    云计算、大数据处理技术交流

    云计算、大数据处理技术交流图形图像是数据处理量最大的版块之一,也是当今云计算的重要课题之一,图形图像处理大会给大家带来诸多名家方案,探究大数据
    发表于 09-16 14:18

    浅谈大数据视频图像处理系统技术

    浅谈大数据视频图像处理系统技术近年来,随着计算机、网络以及图像处理、传输技术的飞速发展,视频监控系统正向着高清化、智能化和网络化方向发展。视频监控系统的高清化、智能化和网络化为视频监控图像处理
    发表于 09-24 15:22

    探寻大数据时代的商业变革

    的多阶矩阵型连接,通过创造革新的商业模式,为社会生产力带来新的机遇,为企业带来新的发展空间。 在新经济新环境下,随着“大数据”的不断发展壮大,更多的数据或将
    发表于 05-27 17:11

    常见大数据应用有哪些?

    预测数据分析结果展示等,为做出正确决策提供依据,其数据级别通常在PB以上,以下是常用的大数据技术:一、
    发表于 03-13 16:50

    大数据运用的技术

    大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所
    发表于 04-08 16:50

    大数据专业技术学习之大数据处理流程

    随着互联网的发展,大数据也在逐渐彰显出自己的优势特点,那么关于大数据的处理流程,你是否了解?第一,数据采集定义:利用多种轻型数据库来接收发自
    发表于 06-11 16:41

    大数据开发核心技术详解

    数据的核心是云技术和BI。关于大数据和云计算的关系人们通常会有误解,而且也会把它们混起来说,分别做一句话直白解释就是:云计算就是硬件资源的虚拟化;
    发表于 07-26 16:26

    常用大数据技术课程内容

    关于大数据的概念,指的是无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。而大数据技术,是指从各种各样类型的
    发表于 07-26 16:27

    NLPIR系统KGB知识图谱技术助力大数据深度挖掘

      大数据时代的到来,意味着海量数据的产生,给我们现有的数据存储技术带来了巨大的挑战。而随着时代
    发表于 12-05 11:49

    何解决全双工通信带来的测试挑战

    何解决全双工通信带来的测试挑战
    发表于 06-17 06:46

    智能电网预测负荷波动的影响

    智能电网预测负荷波动和新能源出力方面在整个电网电量管理系统中,负荷所占据的比重极大,它对于整体运行安全性会带来直接影响。当前,电网数据采集范围正在持续扩大,它也充分涉及有关于气象信息、
    发表于 07-12 06:52

    什么是大数据大数据的特点有哪些

    大数据(big data)目录1什么是大数据2大数据的定义3大数据的特点[1]4大数据的作用[2]5大数
    发表于 07-12 06:52

    大数据技术与应用是学什么的?

    大数据技术与应用是学什么的?大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据
    发表于 07-27 07:47

    大数据技术原理与应用

    本文介绍了关于大数据的相关概念、大数据的结构、大数据的特点以及大数据技术的十大原理及详细的说明了
    发表于 12-19 14:29 10.7w次阅读
    <b class='flag-5'>大数据</b><b class='flag-5'>技术</b>原理与应用

    关于AI和大数据时代所带来的机遇与挑战

    任何一家公司都不可能独立面对AI和大数据时代所带来的机遇与挑战,这需要半导体行业整个生态链的合作。应用材料公司同样致力于与行业生态共同合作研发在人工智能时代提升PPACt所需的新技术
    的头像 发表于 06-30 17:42 4277次阅读