0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于物联网数据科学的具体特征

SSDFans 来源:未知 作者:李倩 2018-07-10 17:08 次阅读

根据Gartner公司的数据,到2020年将会有200亿台网络连接设备投入使用,这些设备每年将产生超过500 ZB(zettabytes)数据,也就是需要5000亿个1TB硬盘才能放下,随着科技的进步,预计这一数字将继续大幅增长。对于已经进入物联网行业的70%的组织来讲,这些数据代表了其独一无二的竞争优势。这些数据可以帮助企业获得有价值的信息用于开发创新的AI应用程序,这对于企业来说是一个巨大的机会。

事实证明,物联网数据令数据科学家、机器学习工程师和企业领导者一样兴奋。从医疗保健和农业到教育和交通,蓬勃发展的物联网领域和其他领域一样是多元化的,涵盖了新信息的发现和决策控制。物联网数据科学打开了创造新数据产品的大门。本文将讨论一些关于物联网数据科学的具体特征。

数据注意事项

目前,物联网成为了新数据的重要来源之一,物联网数据或许可以被看做大数据的缩影。如果我们只看一台设备产生的数据,那么我们只需要处理很少的数据就可以了(即使这些数据也一直在变化)。但无数的分布式设备会产生连续的数据流,所以物联网会产生大量的数据。物联网设备可以收集从音频传感器数据等各种类型的信息,并全面覆盖整体数据格式的多样化。

但是物联网数据也存在一些独一无二的特性,使其开发具有挑战性。由于采集和传输过程中出现错误往往会产生噪音,这使得构建、清理和验收数据的过程成为机器学习算法发挥的关键步骤。本质上来讲,物联网数据也是高度可变的,这是因为跨各种数据收集组件的数据流中存在巨大的不一致性,而且存在时间模式。不仅如此,数据本身的价值在很大程度上取决于底层机制,数据捕获的频率以及处理方式。即使来自特定设备的数据被认为是值得信赖的,我们仍需要考虑到即使在相似条件下不同设备的行为也可能不同。因此在收集培训数据时捕捉所有可能的情景在实践中是不可行的。

半监督学习

然而,物联网数据的一个最显著的特征在于其粗糙性:因为物联网设备通过各种复杂的传感器收集数据,所产生的数据通常非常原始。这意味着,在提取业务价值并构建强大的AI应用程序之前,主要的数据处理是必要的。实际上,将有意义的信号从噪声中分离出来并将这些非结构化数据流转化为有用的结构化数据,是构建智能物联网应用程序最重要的一步。

大量物联网应用需要使用监督机器学习,这是一类机器学习算法,需要在模型可以被训练之前标记数据。由于手动标记大型数据集是一项耗时、容易出错且价格昂贵的任务,因此机器学习专业人员通常首先转向标记为开源的数据集,或者从少量数据开始标记。然而,物联网数据的难点来自其特殊性:因为这些数据通常是独一无二的,所以不能保证现有的开源数据集随着可获得,并且工程师们有必要标记他们自己的数据。这正是高品质,适应性强的众包标签平台所能提供的帮助。

但是,归因于物联网数据的可变性,标记一个小的随机样本可能不够。考虑到这一点,这些是在算法训练中利用标记和未标记数据的半督查学习策略的完美环境。特别是主动学习是一种非常合适的方法,允许机器学习科学家获得类似的算法精确度,其中算法被允许向群众查询智能选择的训练实例的子集的标签,是标签成本的一小部分。

群体感知

在机器学习方面,物联网发展的一个非常有趣的方面是群体感知的出现。群体感知包括两种形式:自愿的,当用户自愿提供信息时,以及在没有明确干预用户的情况下自动收集数据。这是物联网数据不仅可以促进物联网应用程序的开发或改进的一种方式,而且还可以用作其他非物联网应用程序的输入。

物联网实际上允许以前所未有的方式收集非常独特的数据集。由于每个设备生成的数据通常都是人为的,因此用户可以标记或验证它。收集最接近用户位置的数据也变得可能:这正是Google要求用户拍摄他们正在用餐的餐厅的照片,或者回答关于便利设施的一些问题的目的。这是第一次可以以大数据规模收集人工生成的数据。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2867

    文章

    41578

    浏览量

    358246
  • 机器学习
    +关注

    关注

    66

    文章

    8105

    浏览量

    130541

原文标题:物联网机器学习的机遇和挑战

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何采用mqtt协议实现联网模块消息推送?

    如何采用mqtt协议实现联网模块消息推送
    发表于 11-03 06:55

    联网专业前景怎么样?

    联网专业前景怎么样? 联网专业在当今技术发展迅速的背景下具有广阔的前景。以下是联网专业的
    发表于 10-20 09:48

    基于飞腾派的边缘联网

    本帖最后由 zhh763984017 于 2023-9-21 16:53 编辑 今天给大家分享一个飞腾派的一个应用场景——边缘联网关。边缘联网关可以连接各种
    发表于 09-21 16:50

    电池联网应用MCU都用哪些型号的?

    电池联网应用MCU都用哪些型号的
    发表于 09-20 07:57

    阿里云联网平台基础概念讲解

    产品 设备的集合,通常指一组具有相同功能的设备。联网平台为每个产品颁发全局唯一的ProductKey。每个产品下可以有成千上万的设备。 设备 归属于某个产品下的具体设备。
    发表于 09-11 07:41

    联网简介

    联网(IoT)是由物理设备、车辆等组成的网络,家用电器和嵌入有电子设备、软件、传感器等的其他物品,致动器,以及使这些物体能够连接和交换数据
    发表于 09-11 07:18

    ARM联网整体解决方案-数据

    ARM联网整体解决方案提供了一种独特的基于解决方案的方法,将最新的专业处理能力与先进的软件和工具相结合。 ARM联网整体解决方案可随时实施或构建,从而简化您的设计流程和产品开发。
    发表于 08-29 06:06

    新唐对应四大联网安全攻击的保护措施

    ,智能家居及娱乐等则会发生个人信息被窃取的风险。因此如何从装置本身就做好安全防护是联网产品在设计规划初期就必须审慎思考的项目。 联网设备安全必须保护系统、网络和数据免受广泛的
    发表于 08-21 08:14

    浅谈工业联网平台

    工业互联网平台 工业互联网平台的本质是在传统云平台的基础上叠加联网、大数据、人工智能等新兴技术,搭建对工业
    发表于 08-10 15:45

    【华秋推荐】联网入门学习模块 ESP8266

    随着全球信息技术的不断进步和普及,联网成为当今备受关注的技术热点之一。通过物理和数字设备之间的连接来实现自动化和互联互通的网络。无线传感器、云计算和大数据分析等技术,
    发表于 08-04 11:27

    消防物联网特征有哪些?

    消防物联网是一种基于物联网技术的消防安全管理系统,在传统消防系统的基础上,通过智能化、网络化和信息化技术的应用,实现了对消防设备、环境和人员的实时监测、数据采集、分析和预警,从而增强了消防安全的管理和应急响应能力。其主要
    的头像 发表于 06-15 09:39 702次阅读

    基于机智云联网平台的智能种树小车

    过程的信息传递、发送命令等,联网机智云模块可以实时上报种植数据至云平台。制作了装置模型样机,试验测试结果表明:该装置完成一棵树的种植时间需要约8.45 s,完成区域10 m×10 m的土地种植时间需要
    发表于 05-31 19:38

    联网无线通信技术比较

    相应的大数据采集以及云端应用形成联网大生态(下图为示意图)。   以大家常见的手环为例:通过加速度传感器,脉搏传感器,血氧传感,血压传感等等,加上蓝牙应用层协议(Profiles)和蓝牙内置的MCU,便可
    发表于 05-15 15:57

    新的Blynk联网平台现在支持ESP8266吗?

    Blynk 最近推出了一个新的联网平台,对 ESP8266 提供开箱即用的支持,具有许多很酷的功能,包括设备配置和管理、云中的数据托管、固件无线更新、用户和组织管理、数据分析、各种自
    发表于 04-28 06:15

    帮忙解答联网题目,感谢

    联网专业菜鸟,劳请哪位大神帮忙试做此道题目。
    发表于 04-26 13:51