0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面向工程师和科学家的大数据

星星科技指导员 来源:嵌入式计算设计 作者:Dave Oswill 2022-10-06 07:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

使用大数据正迅速成为科学发现和工程过程中的关键步骤。随着智能传感器物联网IoT) 等技术能够从科学仪器、制造系统、联网汽车和飞机中收集大量详细数据,这种情况正在发生。

这些数据具有重要价值,因为它可以显示重要的物理现象或提供有关系统运行环境、效率和健康状况的信息。借助适当的工具和技术,这些数据可用于进行快速的科学发现,并在您的产品、服务和制造过程中开发和整合更多智能。这可以使您的公司以性能更好的产品或服务脱颖而出,并有助于符合法规要求(例如满足发动机燃油效率标准或提供辅助驾驶能力)。

获得访问权和使用数据可能听起来很有趣,但也很艰巨。由于这些数据的价值和大小,它通常在大型文件共享、数据库或 Hadoop 或 Spark 等大数据系统中存储和管理。不久前,为了将机器学习等先进技术应用于大量数据,具有 IT 系统经验的计算机科学家将与工程和科学专家一起工作。该团队将共同支持一个工作流程,其中包括:

访问文件、数据库或 Hadoop 分布式文件系统 (HDFS) 中的大数据

在专门的计算集群上探索、处理和分析这些数据

创建用于嵌入式系统、业务应用程序和其他服务的算法

如今,MATLAB等软件分析和建模工具已通过处理大数据的新功能得到增强。这使具有领域知识和经验的工程师和科学家能够利用这些数据做出设计和业务决策。然后,工程师和科学家无论身在何处都可以方便地访问这些数据,并使用熟悉的语法和功能轻松使用它。

让我们看一个工程师如何使用大数据的实际示例。贝克休斯的工程师为石油和天然气运营商提供服务的供应商,需要开发一种预测性维护系统,以降低泵设备成本和石油和天然气开采卡车的停机时间。如果活动现场的卡车出现泵故障,贝克休斯必须立即更换卡车以确保连续运行。向每个站点发送备用卡车会使公司损失数千万美元的收入,如果它们在另一个站点积极使用,这些收入可能会在其他地方产生。无法准确预测阀门和泵何时需要维护是其他成本的基础。过于频繁的维护会浪费精力,并导致零件在仍然可用时被更换,而过于不频繁的维护可能会损坏泵而无法修复。

从石油和天然气开采卡车上收集了数 TB 的数据,这些数据用于开发一个应用程序,该应用程序可以预测设备何时需要维护或更换。MATLAB 为 Baker Hughes 的工程师提供了开发预测模型和将多种数据(包括来自专有文件格式的传感器数据)合并到一个分析应用程序中所需的功能。

访问大量数据

处理大数据的第一个挑战是确定如何访问大型数据集,因为它们有多种不同的形式并存储在各种类型的系统中。

文件

许多大型工程和科学数据集由大量中小型文件组成,尽管文件变得越来越大,并且无法放入单台计算机的内存中。这些文件通常位于共享驱动器上的一个或多个目录中,可能包含分隔文本、电子表格、图像、视频和各种专有格式。

数据库

有多种数据库类型可用于存储和管理大量数据:

关系型 (SQL):广泛用于业务应用程序,在 IT 开发人员中很受欢迎。

数据仓库:基于关系 (SQL) 数据库,存储关键业务数据,并为关键业务应用程序提供分析能力和快速访问。

NoSQL:针对不适合关系数据库的数据进行了优化。

数据历史学家:针对通常从工业设备收集的基于时间的生产和过程数据进行了优化。

物联网数据聚合器:通常包括基于云的服务,用于聚合来自连接的传感器和设备的时间序列数据。这些服务通常通过 Web 服务调用来访问。

Hadoop

Hadoop是一种基于分布式计算和存储原理的大数据集存储和处理系统。它由在计算服务器集群上共存的两个主要子系统组成:

HDFS:一种大型、抗故障的文件系统,称为 Hadoop 分布式文件系统。

YARN:管理在 Hadoop 上运行的应用程序,包括批处理框架,例如 MapReduce 和 Spark,以及 SQL 接口,例如 Hive 和 Impala。

为了有效地利用大数据的优势,工程师和科学家需要一个可扩展的工具,例如 MATLAB,以提供对用于存储和管理数据的各种系统和格式的访问。这在可能使用不止一种类型的系统和格式的情况下尤其重要。存储在共享驱动器文件中的传感器或图像数据可能需要与存储在数据库中的元数据相结合;就贝克休斯而言,许多不同格式的数据必须一起使用,以了解系统的行为并开发预测模型。

处理大数据的能力正迅速成为科学发现和工程的一个重要方面。这些数据集中包含宝贵的数据,提供了区分您的产品和服务的方法。作为科学家或工程师,您拥有使用这些数据做出设计和业务决策的领域知识和经验,但可能需要易于使用的软件分析和建模工具。使用 MATLAB 等工具可提供可扩展性和效率,同时为您的公司提供在全球市场上的竞争优势。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2574

    文章

    54382

    浏览量

    786141
  • matlab
    +关注

    关注

    189

    文章

    3018

    浏览量

    237609
  • 大数据
    +关注

    关注

    64

    文章

    9029

    浏览量

    143072
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国际类脑计算科学家Yulia Sandamirskaya教授加盟时识科技

    近日,国际类脑计算与神经形态机器人领域知名科学家Yulia Sandamirskaya 教授,作为科学家顾问正式加入时识科技(SynSense)。
    的头像 发表于 10-13 13:50 448次阅读

    硬件工程师面试必会:10个核心考点#硬件设计 #硬件工程师 #电路设计 #电路设计

    硬件工程师
    安泰小课堂
    发布于 :2025年09月23日 18:00:33

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验
    发表于 09-17 11:45

    半导体工程师升级指南:从 “懂工艺” 到 “玩数据”,你只差这一步!

    分析,懂行的工程师却供不应求。PDF如何破解这一困境?关键在于赋能制造业领域专家转型为“公民数据科学家(CitizenDataScientists,缩写CDS)”
    的头像 发表于 08-20 09:32 1014次阅读
    半导体<b class='flag-5'>工程师</b>升级指南:从 “懂工艺” 到 “玩<b class='flag-5'>数据</b>”,你只差这一步!

    数字信号处理,科学家工程师指南(664页)

    数字信号处理入门书籍,非常全面,清晰易懂 获取完整文档资料可下载附件哦!!!! 如果内容有帮助可以关注、点赞、评论支持一下哦~
    发表于 07-11 14:59

    做了电子工程师之后,最好拍的视频出现了#硬件设计 #电子DIY #电子工程师

    电子工程师
    安泰小课堂
    发布于 :2025年06月24日 17:45:57

    (仰天长啸)为什么受伤的总是硬件工程师...#MDD#MDD辰达半导体 #电子工程师

    电子工程师
    MDD辰达半导体
    发布于 :2025年04月27日 18:21:47

    问,成为硬件工程师需要几只手?#硬件工程师 #YXC晶振 #扬兴科技 #搞笑

    硬件工程师
    扬兴科技
    发布于 :2025年04月25日 17:15:37

    硬件工程师:回答我!#回答我 #硬件工程师 #YXC晶振 #扬兴科技

    硬件工程师
    扬兴科技
    发布于 :2025年03月25日 18:46:59

    一招拿捏电子工程师#被AI拿捏了 #电子工程师 #电子电工

    电子工程师
    安泰小课堂
    发布于 :2025年03月25日 17:30:51

    西湖大学:科学家+AI,科研新范式的样本

    研究,创新科研新范式。这一点在西湖大学的科研项目中已得到体现。 成立于2018年的西湖大学是由施一公院士领衔创办的、聚焦前沿科学研究的研究型大学,该校鼓励科学家们探索AI与各学科交叉融合,为科研创新提速。为此,西湖大学在浪潮信息等企业助力下打造
    的头像 发表于 12-12 15:59 850次阅读
    西湖大学:<b class='flag-5'>科学家</b>+AI,科研新范式的样本