0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据技术成为企业长远发展的驱动力量?

我快闭嘴 来源:精英数智科技股份有限公 作者:侯宇辉 2020-09-15 17:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在互联网领域,大数据应用十分广泛,尤其以企业为主,企业作为大数据应用的主体,数据采集、数据存储、数据可视化、数据特征提取、数据特征选择、数据清洗、数据分析、数据挖掘、数据仓库、数据安全等围绕大数据商业价值的利用焦点已备受关注。

一、数据采集

从数据采集层面来看,分为结构化数据、非结构化数据、半结构化数据,来源于物联网的设备采集数据由于成本低、获取方式容易,成为企业大数据采集数据的主要来源之一,实时性相对强,数据量从GB、TB、PB、ZB级扩增。然而对于中小企业或许会受困于没有数据却又想转型通过搭建大数据平台来提升竞争力,企业可以研发符合市场需求的产品,从新用户、活跃用户、粘性用户到留存用户,获取用户的行为数据之后可以进行数据分析。此外数据采集可以有网络爬虫、ETL抽取等。

二、数据存储

有了大量数据之后,对于数据存储方式也提出了要求。数据存储分为关系型数据库存储、分布式数据存储,数据级别较大时可以存储在分布式文件存储系统中。对于搭建大数据平台的企业来说,通常是对业务结果的数据存储于关系型系统,对于TB级及以上数据量存储至分布式系统中,这两种数据可以使用Sqoop等类似的工具进行数据导入导出。

三、数据可视化

在实际工业生产实践中,对于待处理的大数据,首先是数据特征探索阶段,也就是做数据可视化,对数据有个初步的了解,才会知道所拿到的数据能否解决面临的实际问题,适用于什么算法。对于无编程能力的人,只需要掌握数据分析和处理的能力,即可灵活使用可视化类工具如Tableau,通过拖拉拽形成联动,大大缩短数据分析流程。从连接数据源、建立工作表、构建各种图表、仪表板进行可视化展示,进行交叉分析。对于有编程能力的人可以使用R、Python进行数据可视化。

四、数据特征提取及清洗

数据可视化之后,需要对数据进行清洗,对数据中的噪声进行处理以支持后续数据建模。常见的比如进行降维,提取出对实际问题相关性较高的特征因子后,再回归到大数据,或者做相关性分析、主成分分析等。

五、数据分析及挖掘

数据统计及分析主要是基于存储的海量数据进行普通的分析和分类汇总,以满足大多数常见的分析需求。数据挖掘一般没有预先设定好的主题,主要是在现有数据上面进行基于各种算法的计算,从而起到预测的效果,实现高级别的数

据分析的需求,丰富的历史数据是数据挖掘的先决条件。比较典型的算法有回归、分类、聚类、关联分析。机器学习正是如此,分为监督式学习算法、无监督式学习算法、半监督式学习算法。

六、机器学习

监督式学习算法是从带标签(标注)的训练样本中建立的训练样本中建立模式,并依此推测新的数据标签的算法。比如回归、神经网络、决策树、支持向量机、贝叶斯、随机森林。无监督式学习算法是在学习时并不知道其分类结果,目的是去对原始资料进行分类,以便了解资料内部结构的算法。比如聚类、主成分分析、线性判别分析降维。半监督式学习算法是利用少量标注样本和大量未标注样本进行机器学习,利用数据分布上的模型假设,建立学习器对未标签样本进行标签。

机器学习正被广泛应用于计算机视觉语音识别、自然语言处理等方面。其中深度学习强调模型深度,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更容易准确,更能够刻画数据的丰富内在信息,其实际应用对象不仅包含语音、图像、视频,同样也包含文本、语言和语义信息。另外,卷积神经网络是神经网络的一种,为识别二维形状而特殊设计的多层感知器,擅长处理图像特别是大图像的相关机器学习问题,对图像平移、比例缩放、倾斜或者其他形式的变形具有高度不变性,它的布局更接近于实际的生物神经网络,被广泛应用。当前实现机器学习比较常见的两种主流方式是Spark和Tensorflow框架。机器学习作为人工智能的核心,是企业搭建大数据平台的重要节点,需要结合业务逻辑,按需选择合适的算法模型,不断调参调优,使机器学习服务于企业经营。

七、数据仓库

数据仓库是为了便于多维分析和多角度展示数据按特定模式进行存储所建立起来的关系型数据库。在商业智能系统的设计中,数据仓库的构建是关键,是商业智能系统的基础,承担对业务系统数据整合的任务,为商业智能系统提供数据抽取、转换和加载(ETL),并按主题对数据进行查询和访问,为联机数据分析和数据挖掘提供数据平台。海量的数据包括社交网络、移动设备和传感器等新渠道以及新技术使用所带来的半结构化或非结构化的数据。大数据技术架构可分为存储、处理、应用、展示以及整合5个部分,并可根据数据的结构化程度对相关技术进行选择和组合。每个部分包含一些技术要素,而某些要素又可根据结构化程度共同作用形成特定的功能。

从企业角度来说,无论是数据库、数据仓库还是大数据都是解决不同需求、处理不同级别数据量的技术,它们之间并无冲突。针对不同需求和现状进行技术选择,各种技术相互补充、相互协作。目前阶段对于大部分企业来说,想要开展一个全新的大数据项目似乎无从下手。从现有数据仓库建设理论和经验入手,引入部分大数据技术,特别是实现非结构化数据的收集、存储和处理是一种比较可行的方法。

基于云计算的Hadoop大数据框架,利用集群的威力高速运算和存储,实现了一个分布式运行系统,以流的形式提供高传输率来访问数据,适应了大数据的应用程序。将Hadoop技术应用于对数据的采集、ETL、存储、处理,开发提供给传统的数据仓库BI工具,其架构如图所示。利用Hadoop强大的数据处理能力,将各类数据处理成结构化数据,向上提供给传统BI工具,对数据进行分析和结果展示。

八、数据安全

大数据蕴藏着价值信息,但数据安全面临着严峻挑战。一方面,大数据本身的安全防护存在漏洞。虽然云计算对大数据提供了便利,但对大数据的安全控制力度不够,API访问权限控制以及密钥生产,存储和管理方面的不足都可能造成数据泄露。另一方面,在用数据挖掘和数据分析等大数据技术获取价值信息的同时,攻击者也在利用这些大数据技术进行攻击。

当然大数据也为数据安全的发展提供了机会,对海量数据的分析有助于更好的跟踪网络异常行为,对实时安全和应用数据结合在一起的数据进行预防性分析,可防止诈骗和黑客入侵。网络攻击行为留下的痕迹数据以数据的形式隐藏在大数据中,从大数据的存储,应用和管理方面把关,可以有针对性的应对数据安全威胁。企业需要将大数据技术和安全并行,大数据才可以真正成为企业长远发展的驱动力量。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2939

    文章

    47317

    浏览量

    407815
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136232
  • 大数据
    +关注

    关注

    64

    文章

    9029

    浏览量

    143062
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为数字技术推动交通高质量发展

    当前,人工智能(AI)浪潮席卷全球,成为新一轮科技革命和产业变革的重要驱动力量,将对全球经济社会发展和人类文明进步产生深远影响。传统的生产、生活与学习方式,将被深刻重构。千行万业的数智化进程,正在全面加速。
    的头像 发表于 10-30 11:15 502次阅读

    AI智能体:推动企业变革的核心驱动力

    在数字经济时代,AI智能体正成为推动企业变革的核心驱动力。作为融合人工智能技术与业务场景的数字化代理,AI智能体通过模拟人类认知与决策能力,为企业
    的头像 发表于 07-29 17:22 476次阅读
    AI智能体:推动<b class='flag-5'>企业</b>变革的核心<b class='flag-5'>驱动力</b>

    RFID无线测温技术:输配电设备智能升级的核心驱动力

    在数字化与智能化飞速发展的时代,智能升级已成为输配电领域的必然趋势。在这一过程中,RFID无线测温技术正崭露头角,成为推动输配电设备智能升级的核心
    的头像 发表于 07-09 15:31 365次阅读
    RFID无线测温<b class='flag-5'>技术</b>:输配电设备智能升级的核心<b class='flag-5'>驱动力</b>

    CES Asia 2025 低空经济专馆:思想碰撞,引领低空经济规则升级

    思想的碰撞,共同引领低空经济产业规则的升级,为产业的长远发展奠定坚实基础。 权威力量齐聚,构建产业规则创新引擎 CES Asia 2025 低空经济专馆成为各方权威力量汇聚的平
    发表于 07-04 17:04

    什么是嵌入式工业平板电脑?聚徽厂家带你一文读懂工业智能化的核心驱动力

    在当今科技飞速发展的时代,工业智能化已成为全球制造业转型升级的关键趋势。在这场智能化变革中,嵌入式工业平板电脑正崭露头角,成为推动工业智能化发展的核心
    的头像 发表于 06-25 17:26 518次阅读

    医疗保健领域数字化转型的核心驱动力与主要应用场景

    随着人工智能、大数据、云计算和物联网等技术的快速发展,医疗保健行业正经历深刻的数字化变革。传统医疗模式面临资源分配不均、诊疗效率低下、慢性病管理挑战等问题,而数字化技术的应用不仅提升了
    的头像 发表于 06-12 14:47 3290次阅读
    医疗保健领域数字化转型的核心<b class='flag-5'>驱动力</b>与主要应用场景

    轮边驱动电机专利技术发展

    ,具有较高的灵敏度。 本文主要以 DWPI 专利数据库以及 CNABS 数据库中的检索结果为分析样本,从专利文献的视角对轮边驱动电机的技术发展进行了全面的统计分析,总结了与轮边
    发表于 06-10 13:15

    英泰斯特入选湖北省数据要素型企业

    湖北省数据要素型企业评选旨在挖掘和培育以数据为核心驱动力的标杆企业,推动数据要素市场化配置改革,
    的头像 发表于 05-30 15:04 832次阅读

    工业电机行业现状及未来发展趋势分析

    引言:工业电机行业作为现代制造业的核心动力设备之一,具有广阔的发展前景和巨大的市场潜力。随着技术的不断进步和市场需求的持续增长,工业电机行业将迎来更多的发展机遇和挑战。以下是中研网通过
    发表于 03-31 14:35

    超结MOSFET升级至650V碳化硅MOSFET的根本驱动力分析

    随着BASiC基本半导体等企业的650V碳化硅MOSFET技术升级叠加价格低于进口超结MOSFET,不少客户已经开始动手用国产SiC碳化硅MOSFET全面取代超结MOSFET,电源客户从超结MOSFET升级至650V碳化硅MOSFET的根本
    的头像 发表于 03-01 08:53 977次阅读
    超结MOSFET升级至650V碳化硅MOSFET的根本<b class='flag-5'>驱动力</b>分析

    AI芯片:科技变革的核心驱动力

    近年来,人工智能(AI)的飞速发展对众多行业产生了深远影响,芯片领域也不例外。AI在芯片设计、制造及应用等方面带来了革新性的改变,成为推动芯片行业发展的关键力量
    的头像 发表于 02-18 17:45 1416次阅读

    如今AI在不断发展,做连接器行业的更应该注意什么?

    在这一浪潮中既面临着巨大的机遇,也迎来了前所未有的挑战。 因此作为蓬生电子的一员,很关注诸如此类的问题,如何能在人工智能时代抓住机遇,实现长远发展?是我们需要思考的问题。
    发表于 02-08 17:04

    解锁机器人数据中台:智能制造的“超级大脑”

    一、智能制造浪潮中的数据力量 在当今时代,智能制造正以前所未有的速度席卷全球,成为推动产业升级和经济发展的核心驱动力。从汽车制造到电子设备生
    的头像 发表于 02-05 17:47 632次阅读
    解锁机器人<b class='flag-5'>数据</b>中台:智能制造的“超级大脑”

    浪潮信息SATA SSD推动数据存储技术发展

    在全球数字化转型的浪潮中,数据成为驱动社会进步和创新的核心动力。随着互联网、人工智能、大数据技术
    的头像 发表于 01-22 18:02 1112次阅读

    开源技术加速金融行业创新发展

    在快速变化的数字时代,每一次技术革新都在深刻塑造人们的生活方式和各行各业的发展。金融行业,作为数字经济的驱动力量,正面临着一场深刻的结构性变革。传统金融模式正在被重新塑造,推进数字经济发展
    的头像 发表于 01-14 10:04 767次阅读