0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据分析的80%的时间都用在了哪里?

博世汽车电子事业部 来源:博世汽车电子事业部 2020-08-10 15:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

不可否认,大数据已经在 21 世纪掀起一场惊涛骇浪。很多人怀揣着成为数据科学家的梦想进入数据科学世界,上期我们提到了数据分析。其实,数据分析是一个数据消费的过程,在数据消费之前的数据准备工作,叫做数据工程。

数据是由许多数据源产生的,像生产执行系统MES,各种辅助生产的应用系统,产线的设备。这些数据源产生的数据我们把它叫做原始数据。

为了让业务决策者使用这些数据,需要对其进行采集,清理,转换,存储,组合,聚合,处理过后的数据才是有价值的数据。

设计和实现这些数据处理的过程叫做数据工程。

数据的采集,清洗,转换处理,是整个数据工程的关键,通常我们可以用ETL(Extract-Transform-Load)技术来实现。

随着工厂的发展,各生产线,各部门都会搭建自己的应用系统方便开展自己的业务,随着数字化建设的不断深入,由于业务系统之间各自为政,相互独立造成的数据孤岛现象尤为普遍,业务不集成,数据不共享,给工厂进行数据的报表开发,数据分析,数据挖掘带来了巨大困难。

通过ETL可以连接数据孤岛,将分离的业务数据整合在一起,统一的采集,处理,共享。

数据仓库是工厂的数据中心,所有系统产生的原始数据都流向数据仓库,数据的存储,标准化,组合都在数据仓库中完成,最终把有价值的数据提供给各大数据应用系统。

可以说数据仓库不产生数据,也不消费数据,只是数据的搬运工。

总的来说,如果把数据消费过程比作一盘美味的酸辣土豆丝,那数据工程就是个做菜的过程,土豆、葱姜蒜、干红辣椒、盐、糖、醋这些原材料就是原始数据;去菜场买菜就好比数据采集;数据清理就是洗土豆,削皮;数据转换就好比土豆切成丝,姜葱蒜切末,辣椒切断。然后准备工作做好以后就开始炒菜,放入葱姜蒜末,辣椒段和土豆丝,炒菜过程中会加入适量的醋,盐,糖调味,这就好比在对数据做组合,聚合处理。而这一切都是发生在数据仓库这个大厨房。最后呈现就是一盘美味的酸辣土豆丝啦!

据统计,一个数据分析的项目接近80%的时间会花在准备数据上,这就是数据工程的意义所在。

工业大数据时代,在制造业产品的全生命周期从市场规划、设计、制造、销售、维护等过程都会产生大量的结构化和非结构化数据。

而智能工厂利用物联网人工智能云计算、大数据技术提高服务和生产,其本质是实现了人、机器、设备、IT系统的通过数据互联互通。

产生的数据越来越多,数据采集和集成的需求也越来越多,负责数据采集和集成的数据工程在向智能工厂迈进的数字化转型中扮演着举足轻重的角色。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • MES
    MES
    +关注

    关注

    5

    文章

    1313

    浏览量

    33007
  • 数据处理
    +关注

    关注

    0

    文章

    654

    浏览量

    30080
  • 数据分析
    +关注

    关注

    2

    文章

    1523

    浏览量

    36360

原文标题:AE-CN专家月 | 数据分析80%的时间都用在了哪里?

文章出处:【微信号:AE_China_10,微信公众号:博世汽车电子事业部】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用数据API构建实时数据分析与可视化报表系统

    API(涵盖销售统计、用户画像、流量分析等)进行高效的数据整合、分析,并实现 自定义报表生成 和 实时数据可视化 ,为商业决策提供强大支持。 一、
    的头像 发表于 04-02 15:56 170次阅读
    利用<b class='flag-5'>数据</b>API构建实时<b class='flag-5'>数据分析</b>与可视化报表系统

    API数据分析:淘宝流量来源分析,渠道优化!

    优化渠道策略。我们将使用Python作为工具,结合数据分析和统计方法,确保过程真实可靠。 1. 理解淘宝流量来源 淘宝流量主要来自多个渠道,包括: 直接访问 :用户直接输入淘宝网址或从收藏夹访问。 搜索引擎 :如百度或淘宝内搜索,贡献
    的头像 发表于 01-23 13:42 390次阅读
    API<b class='flag-5'>数据分析</b>:淘宝流量来源<b class='flag-5'>分析</b>,渠道优化!

    利用拼多多用户API进行粉丝数据分析,有效提升用户粘性

    这些API进行粉丝数据分析,并基于分析结果制定增强用户粘性的策略。 一、 拼多多用户API概览 拼多多开放平台提供丰富的API接口,涵盖商品、交易、用户、物流等多个维度。对于粉丝数据分析
    的头像 发表于 12-30 10:38 368次阅读
    利用拼多多用户API进行粉丝<b class='flag-5'>数据分析</b>,有效提升用户粘性

    淘宝数据分析API:用户行为洞察,精准营销决策!

    ​ 在竞争激烈的电商领域,数据已成为驱动增长的核心引擎。淘宝作为国内领先的电商平台,其开放的数据分析API为商家提供强大的工具,能够深入挖掘用户行为,并基于这些洞察做出更精准、更有效的营销决策
    的头像 发表于 12-25 14:12 408次阅读
    淘宝<b class='flag-5'>数据分析</b>API:用户行为洞察,精准营销决策!

    经营数据分析可以通过哪些方式

    在数聚股份看来,提起经营数据分析,大家往往会联想到一些密密麻麻的数字表格,或是高级的数据建模手法,再或是华丽的数据报表。其实,“ 分析 ”本身是每个人都具备的能力,对于业务决策者而言,
    的头像 发表于 12-05 16:31 736次阅读

    广立微DE-G零断档重构智能数据分析

    近日,数据分析领域被一则消息推上风口浪尖:一家老牌软件巨头将撤出中国。在此背景下,其旗下以灵活著称的数据分析软件,在中国市场的未来将面临极大的不确定性。
    的头像 发表于 11-07 10:39 821次阅读

    【产品介绍】Altair RapidMiner数据分析与人工智能平台

    AltairRapidMiner赋能组织解锁数据洞察,运用数据分析和先进的人工智能自动化,提供可扩展的面向未来的解决方案。Altair数据分析和人工智能平台包括数据准备、
    的头像 发表于 09-18 17:56 1035次阅读
    【产品介绍】Altair RapidMiner<b class='flag-5'>数据分析</b>与人工智能平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统
    的头像 发表于 09-17 14:58 728次阅读
    电磁兼容与电磁干扰在电磁兼容性大<b class='flag-5'>数据分析</b>中的智能管理平台

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统

    电磁兼容与电磁干扰在电磁兼容性大数据分析中的智能管理系统
    的头像 发表于 09-17 14:42 1051次阅读
    电磁兼容与电磁干扰在电磁兼容性大<b class='flag-5'>数据分析</b>中的智能管理系统

    普迪飞 Exensio®数据分析平台 | 铸就良率提升与量产加速之路

    ManufacturingAnalytics(M-A)是Exensio数据分析平台中的四个核心模块之一。M-A模块旨在帮助集成器件制造商(IDM)、代工厂(Foundry)和无晶圆厂半导体公司
    的头像 发表于 08-19 13:53 1206次阅读
    普迪飞 Exensio®<b class='flag-5'>数据分析</b>平台 | 铸就良率提升与量产加速之路

    普迪飞 Exensio®数据分析平台 | Test Operations解锁半导体测试新纪元

    TestOperations是Exensio数据分析平台的四个主要模块之一。T-Ops模块旨在帮助集成器件制造商(IDM)、无晶圆厂半导体公司(Fabless)和外包半导体(产品)封测厂(OSAT
    的头像 发表于 08-19 13:53 1678次阅读
    普迪飞 Exensio®<b class='flag-5'>数据分析</b>平台 | Test Operations解锁半导体测试新纪元

    如何通过数据分析识别设备故障模式?

    通过数据分析识别设备故障模式,本质是从声振温等多维数据中提取故障特征,建立 “数据特征 - 故障类型” 的映射关系,核心可通过特征提取、模式匹配、趋势分析三步实现,精准定位故障根源与发
    的头像 发表于 08-19 11:14 1119次阅读
    如何通过<b class='flag-5'>数据分析</b>识别设备故障模式?

    构建自定义电商数据分析API

      在电商业务中,数据是驱动决策的核心。随着数据量的增长,企业需要实时、灵活的分析工具来监控销售、用户行为和库存等指标。一个自定义电商数据分析API(应用程序接口)可以自动化
    的头像 发表于 07-17 14:44 730次阅读
    构建自定义电商<b class='flag-5'>数据分析</b>API

    AI数据分析仪设计原理图:RapidIO信号接入 平板AI数据分析

    AI数据分析仪, 平板数据分析仪, 数据分析仪, AI边缘计算, 高带宽数据输入
    的头像 发表于 07-17 09:20 871次阅读
    AI<b class='flag-5'>数据分析</b>仪设计原理图:RapidIO信号接入 平板AI<b class='flag-5'>数据分析</b>仪

    如何使用协议分析仪进行数据分析与可视化

    采集器 + Grafana/Prometheus。 大数据分析:导入Elasticsearch/Splunk进行全文检索和聚合。 优化数据量: 避免长时间捕获全流量,采用轮询采样或触发式捕获(如检测
    发表于 07-16 14:16