0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面向工程师和科学家的大数据平台及应用

星星科技指导员 来源:嵌入式计算设计 作者:Dave Oswill 2022-10-02 07:41 次阅读

许多组织已经意识到从其产品、服务和运营中收集的数据的价值。他们设立了新的行政职位,例如首席信息官 (CIO),其主要关注点是正确使用和保护这一新的大数据资源。CIO 随后邀请信息技术 (IT) 团队实施新的数据政策和流程,其中包括:

治理:通过控制数据的存储、访问和处理来确保数据的完整性。

访问:向工程、运营、保修、质量、营销和销售团队提供数据。

处理:如果数据足够大,则需要专门的处理平台来消除传输数据的延迟并减少处理数据的时间。

为了满足这些新要求,IT 组织正在采用新技术和平台来存储和管理这些庞大且不断增长的数据集。因此,您需要与 IT 团队更紧密地合作,以便获得访问权限并设置一个工作流,使您能够处理数据。在这个新环境中,使用与您的 IT 团队用于存储、管理和处理大数据的系统以及您熟悉的系统一起使用的软件分析和建模工具,使您能够有效地使用这些数据在日常活动中。

大数据平台及应用

IT 组织正在采用许多平台来存储和管理大数据。这些平台不仅提供了存储大数据的基础设施,还支持用于以不同方式处理大数据的各种应用程序。这些应用程序可以大致分为两类:大型历史数据集的批处理,以及从设备连续收集的数据的实时或近实时处理。第二种情况通常称为流式传输,在大多数物联网 (IoT) 应用程序中都可以找到。

Hadoop

Hadoop 是围绕分布式存储和分布式计算原则设计的。它由在服务器集群上共存的两个主要子系统组成,使其能够支持大型数据集。

HDFS:Hadoop 分布式文件系统 (HDFS) 提供了一个用于存储数据的大型容错系统。

YARN:Yet Another Resource Negotiator (YARN) 管理运行 Hadoop 集群和处理存储在 HDFS 中的数据的高度可扩展的应用程序。

批处理应用程序和创建模型

批处理应用程序通常用于分析和处理在很长一段时间内或跨许多不同设备或系统收集的历史数据。拥有使用这些批处理应用程序的能力,您可以在数据中寻找趋势并开发在过去使用大量数据时无法实现的预测模型。

在 Hadoop 上运行的两个比较流行的批处理应用程序包括:

Spark:一种更通用的框架,可优化内存中的操作,使其非常适合机器学习应用程序。

MapReduce:一个高度结构化的框架,由 map 和 reduce 函数组成,适用于大数据分析和数据转换应用。

流应用程序和模型集成

使用从历史数据集开发的模型以及 Kafka 或 Paho 等流应用程序可以为您的产品和服务添加更多智能和自适应功能。这些差异化功能的示例包括: 预测性维护,这大大减少了不必要的维护以及计划外停机时间;调整船舶、机车和商用车辆等重型设备的服务,以在其运行环境中更好地运行,从而实现更好的燃油经济性和增强的运行;和楼宇自动化系统,以尽可能低的成本运行楼宇系统,同时仍保持舒适的环境。

Mondi Gronau的工程师创建了一个统计过程控制 (SPC) 应用程序,其中包含使用 MATLAB 开发的预测模型。该系统不仅允许他们的机器操作员监控其许多复杂生产线的操作,而且还提供警报以指示机器何时趋向于故障状态。这些警报允许操作员在超出任何制造公差之前进行调整,从而减少原材料的损失。

在许多情况下,这类服务通常是与企业应用程序开发人员和系统架构师一起开发的。但挑战在于如何以有效的方式将您的模型集成到这些系统中。将模型移植到另一种语言既费时又容易出错,每次对模型进行更新时都需要大量工作。用典型的 IT 语言开发预测模型很困难。拥有开发这些模型所需的领域专业知识的工程师和科学家不熟悉这些语言,而且这些语言并不总是包含充分处理和从工程和科学数据创建模型所需的功能。

企业应用程序开发人员应该寻找一种数据分析和建模工具,它不仅为他们的工程师和科学家所熟悉,而且还提供了他们需要的特定领域的工具。这些工具还必须扩展以使用基于 Hadoop 的系统开发模型和大型数据集,这些系统提供高度稳健的应用程序服务器和代码生成等功能,从而为将模型部署到企业应用程序中提供直接路径。

其他数据访问应用程序

还有许多其他允许访问正在采用的大数据的应用程序。其中一些包括允许使用数据库类型语义访问存储在 HDFS 中的数据的接口。Hive 和 Impala 就是两个这样的应用程序,它们允许使用结构化查询语言 (SQL) 访问和处理数据。这是一种成熟且广泛使用的语言,用于处理关系数据库中的数据。

NoSQL 数据库的架构旨在支持不同的大数据用例,也正在被采用。很多时候,这些数据库支持 SQL 语言的子集来访问和处理数据,但也可能具有传统数据库不提供的附加接口功能。

科学家、工程师和 IT

如上所述,各种系统用于存储、管理和处理大数据。通过与您的 IT 团队密切合作并利用 MATLAB 等工具,您可以创建熟悉的工作流程,使您能够轻松高效地工作,同时从大量数据中获得洞察力。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • matlab
    +关注

    关注

    175

    文章

    2917

    浏览量

    228409
  • 大数据
    +关注

    关注

    64

    文章

    8632

    浏览量

    136568
  • nosql
    +关注

    关注

    0

    文章

    38

    浏览量

    9917
收藏 人收藏

    评论

    相关推荐

    企业老工程师和高校老师有啥区别

    电子工程师硬件
    电子发烧友网官方
    发布于 :2024年02月28日 17:50:00

    如何搞崩一个硬件工程师心态?试试对ta说这几句

    硬件工程师
    扬兴科技
    发布于 :2024年02月20日 18:05:49

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 189次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50
    的头像 发表于 01-19 19:22 1067次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越<b class='flag-5'>工程师</b>” 称号

    释放积极信号!“国家工程师奖”首次开评

    近期,国家卓越工程师及卓越工程师团队拟定表彰名单颁布,共包含83位获选为国家卓越工程师、50家团队荣获国家卓越工程师团队称号。从本年度起,首次设立“国家
    的头像 发表于 12-11 11:02 441次阅读

    FPGA工程师需要具备哪些技能?

    工程师需要能够产生正确的测试数据集,以确保设计的准确性和性能。 在综合方面,FPGA工程师需要使用工具将HDL语言转化为更低级别的代码。这样,他们就能够顺利地将代码映射到可编程逻辑设备中
    发表于 11-09 11:03

    华为辟谣3.2万名科学家移籍

    华为辟谣3.2万名科学家移籍 对于近期网络传言的华为3.2万名科学家移籍华为方面表示,造谣者毫无根据、无中生有。 华为辟谣3.2万名科学家移籍以及其他的一些网络传言,比如“华为孟晚舟宣布23万亿
    的头像 发表于 08-22 16:51 991次阅读
    华为辟谣3.2万名<b class='flag-5'>科学家</b>移籍

    科学家呼吁开展气候合作

    三位研究人员介绍了建立地球数字孪生的计划,该计划旨在帮助人们了解全球变暖的影响并做出应对。 三位顶尖科学家正在帮助带领计算史上最雄心勃勃的项目之一:打造地球的 数字孪生 。 Peter Bauer
    的头像 发表于 07-06 20:10 286次阅读
    <b class='flag-5'>科学家</b>呼吁开展气候合作

    踏歌智行创始人、首席科学家余贵珍教授登榜“2023科创家”

    “一群跨越了科学与商业边界的人”这是科创媒体36氪对科创企业家的定义。近日, 踏歌智行创始人、首席科学家余贵珍教授从全赛道中脱颖而出, 登榜首届“2023科创家”榜单。此次共有15位教授荣登榜单
    的头像 发表于 06-16 19:15 2246次阅读
    踏歌智行创始人、首席<b class='flag-5'>科学家</b>余贵珍教授登榜“2023科创家”

    电子工程师必看书籍推荐#知识分享 #知识科普 #交流#硬声创作季

    电子工程师
    也许吧
    发布于 :2023年05月24日 10:47:34

    科学向新,共创未来--科兰通讯受邀参加第二十一届中国科学家论坛

    万物复苏、芳芽吐蕊,最美人间四月天。值此美好时节,第二十一届中国科学家论坛如约而至,将和我国各领域顶尖专家学者、高新企业倾情相约。 该论坛创办于2002年,是由著名科学家、时任全国人大常委会副委员长
    的头像 发表于 05-04 11:11 287次阅读

    科学家用银线团搭建「纳米线网络」,触电就像大脑一样运作

    这也是如今不少AI科学家们梦寐以求的特性。最近,来自悉尼大学和日本国家材料科学研究所的科学家们在自然通讯上发表论文,试着通过使用纳米线网络(NWN)来模拟人类大脑在受到电激时的反应,实验效果还不错。
    的头像 发表于 05-04 09:30 415次阅读
    <b class='flag-5'>科学家</b>用银线团搭建「纳米线网络」,触电就像大脑一样运作