0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

工业通过MATLAB处理大数据的相关分析和介绍

MATLAB 来源:djl 2019-09-18 15:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大数据指的是创建的数据和供分析的数据的数量与速率迅速增加。

大数据使分析师和数据专家有机会获得更好的见解,进行更明智的决策,但是它同时也会带来许多的挑战:可用的内存可能无法足以处理大数据集,可能需要花太久的时间进行处理或可能流动太快而无法存储。标准算法通常不能以合理的时间或内存来处理大数据集等等。

目前没有任何一种单一方法可以处理大数据。为此,MATLAB 提供了许多工具来解决这些挑战。

在 MATLAB 中处理大数据

1. 64 位计算。

64 位版本的 MATLAB 可迅速增加内存中可保留的数据量——通常可达到任意 32 位程序的 2000 倍。32 位程序限制您只能使用 2 GB 的内存,而 64 位 MATLAB 的内存可以达到操作系统的物理内存限制。对于 Windows 8,台式机内存为 500 GB,Windows Server 内存为 4 TB。

2. 内存映射的变量。

借助 MATLAB 中的memmapfile函数,您可以将文件或文件的一部分映射到内存中的 MATLAB 变量。这样,您就可以高效访问磁盘上由于太大而无法保留在内存中或需要花太长时间而无法加载的大数据集。

3. 磁盘变量。

matfile函数使您可以直接从磁盘上的 MAT 文件访问 MATLAB 变量(使用 MATLAB 索引命令),无需将全部变量加载到内存。这使您可以在大数据集上进行块处理,这些大数据集因为太大而无法保存在内存中。

4. 内在的多核数学。

MATLAB 中的许多内置数学函数,如fft、inv和eig都是多线程的。通过并行运行,这些函数充分利用计算机的多核,提供高性能的大数据集计算。

5. GPU 计算。

如果您正在使用 GPU,Parallel Computing Toolbox中的GPU 优化的数学函数可以为大数据集提供更高的性能。

6. 并行计算。

Parallel Computing Toolbox提供并行 for 循环 , 该循环在多核计算机上并行运行您的 MATLAB 代码和算法。如果您使用MATLAB Distributed Computing Server,则可以在机器群集上并行执行,这些机器可扩展到数千台计算机。

7. 云计算

对于数百或数千台计算机的按需并行处理,您可以在 Amazon Elastic Computing Cloud(亚马逊弹性计算云)(EC2) 上使用MATLAB Distributed Computing Server并行运行 MATLAB 计算。借助云计算,您无需购买或维护您自己的群集或数据中心就可以处理大数据。

8. 分布式阵列。

使用Parallel Computing Toolbox和MATLAB DistributedComputing Server,您可以处理分布在计算机群集内存中的矩阵和多维数组。使用此方法,您可以针对因太大而无法由单台计算机内存处理的大数据集,进行存储和执行计算。

9。 流式算法。

使用系统对象,您可以对因太大或太快而无法保留在内存中的数据传入流执行流式处理。此外,您还可以使用MATLAB Coder通过 MATLAB 算法生成嵌入式 C/C++ 代码,并针对高性能实时系统运行产生的代码。

10. 图像块处理。

使用Image Processing Toolbox中的blockproc函数,您可以处理特别大的图像,方法是每次以模块的形式高效处理它们。与Parallel Computing Toolbox一起使用时,在多核和 GPU 上并行运行计算。

11. 机器学习

机器学习有助于通过大数据集提取见解和开发预测性模型。广泛的机器学习算法,包括Statistics and Machine Learning Toolbox和Neural Network Toolbox中提供的促进式 (boosted) 和袋装 (bagged) 决策树、K 均值和分层聚类、k-最近邻搜索、高斯混合、期望最大化算法、隐马尔可夫模型和神经网络

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92692
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
  • 大数据
    +关注

    关注

    64

    文章

    9030

    浏览量

    143080
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    经营数据分析可以通过哪些方式

    系统的、科学的、符合商业规律的数据分析知识。这些数据分析都要基于数据质量,所以通常我们还会需要有个数据质量管理的
    的头像 发表于 12-05 16:31 364次阅读

    AI时代大数据背后的网络力量-上海兆越100G核心工业交换机

    AI大数据与云计算的全球普及,让海量数据实时传输处理成为各行业数字化转型的核心挑战,工业通信网络面临巨大数据压力。
    的头像 发表于 11-18 17:33 2290次阅读
    AI时代<b class='flag-5'>大数据</b>背后的网络力量-上海兆越100G核心<b class='flag-5'>工业</b>交换机

    组态大数据平台是什么?有什么功能?

    组态大数据平台是融合 组态技术 与 大数据处理能力 的综合性平台,通过图形化、可配置的方式实现数据采集、存储、分析、可视化及远程控制,适用于
    的头像 发表于 10-30 11:29 93次阅读
    组态<b class='flag-5'>大数据</b>平台是什么?有什么功能?

    【产品介绍】Altair HyperView用于仿真和CAE分析的后处理数据可视化

    AltairHyperView通过用于仿真和CAE分析的高级后处理数据可视化解锁工程洞察力AltairHyperView是用于高保真后处理
    的头像 发表于 09-19 17:02 533次阅读
    【产品<b class='flag-5'>介绍</b>】Altair HyperView用于仿真和CAE<b class='flag-5'>分析</b>的后<b class='flag-5'>处理</b>和<b class='flag-5'>数据</b>可视化

    工业智能网关在水处理设备数据采集中的作用

    工业智能网关在水处理设备数据采集中的作用可归纳为 协议解析与设备互联、多参数实时采集、边缘计算与数据处理、安全可靠的
    的头像 发表于 09-18 10:38 423次阅读
    <b class='flag-5'>工业</b>智能网关在水<b class='flag-5'>处理</b>设备<b class='flag-5'>数据</b>采集中的作用

    御控工业物联网大数据解决方案:排水设备远程监控与大数据统计系统

    御控工业物联网推出排水设备远程监控与大数据统计系统,通过物联网、大数据、云计算等技术构建“感知-传输-分析-决策”闭环管理体系,助力排水行业
    的头像 发表于 09-12 10:04 501次阅读

    工业用烟气测量仪的优点有哪些?点开看看就懂了

    功能,如自动校准、数据存储与分析、远程传输等。操作人员只需按照简单的步骤进行操作,就可以完成测量工作,并通过仪器自带的软件对数据进行处理
    发表于 06-09 15:38

    普源示波器如何连接MATLAB实现数据采集与分析

    普源示波器(Rigol)作为国内知名的测试测量仪器品牌,广泛应用于电子工程、科研实验、教学等领域。为了进一步扩展其功能,用户常需将示波器与MATLAB数据分析平台连接,实现自动化测试、实时信号处理
    的头像 发表于 05-29 09:34 712次阅读

    工业电机行业现状及未来发展趋势分析

    引言:工业电机行业作为现代制造业的核心动力设备之一,具有广阔的发展前景和巨大的市场潜力。随着技术的不断进步和市场需求的持续增长,工业电机行业将迎来更多的发展机遇和挑战。以下是中研网通过大数据分析
    发表于 03-31 14:35

    大数据与云计算是干嘛的?

    大数据与云计算是支撑现代数字化技术的两大核心。大数据专注于海量数据的采集、存储、分析与价值挖掘;云计算通过虚拟化资源池提供弹性计算、存储及服
    的头像 发表于 02-20 14:48 1273次阅读

    大数据云计算都需要考什么证书?

    大数据和云计算领域包含多种专业证书,其中大数据领域涵盖数据分析类证书、大数据工程类证书、数据治理类证书。云计算领域领域涵盖云计算技术类证书、
    的头像 发表于 02-19 11:05 1195次阅读

    DAC39J84最大数据速率指的是数字信号的输入上限吗?超过1.25GSPS的数字输入就无法处理啦?

    本人才买的DAC39J84,发现datasheet上有两个和速率相关的参数,最大采样率2.8GSPS,和最大输入数据速率1.25GSPS。 是不是最大数据速率指的是是数字信号的输入上限,超过1.25GSPS的数字输入就无法
    发表于 12-31 08:24

    缓存对大数据处理的影响分析

    缓存对大数据处理的影响显著且重要,主要体现在以下几个方面: 一、提高数据访问速度 在大数据环境中,数据存储通常采用分布式存储系统,数据量庞大
    的头像 发表于 12-18 09:45 1120次阅读

    Simulink与 MATLAB 的结合使用 Simulink中的信号处理方法

    在工程和科学研究中,信号处理是一个重要的领域,涉及到信号的采集、分析处理和生成。MATLAB 提供了丰富的信号处理工具箱,而 Simuli
    的头像 发表于 12-12 09:25 2208次阅读

    绝缘电阻测试仪数据分析处理

    绝缘电阻测试仪主要用于检查电气设备或电气线路对地及相间的绝缘电阻。将所测得的结果与有关数据比较,这是对实验结果进行分析判断的重要方法。以下是对绝缘电阻测试仪的数据分析处理方法的
    的头像 发表于 12-10 15:00 1523次阅读