0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

工业通过MATLAB处理大数据的相关分析和介绍

MATLAB 来源:djl 2019-09-18 15:55 次阅读

大数据指的是创建的数据和供分析的数据的数量与速率迅速增加。

大数据使分析师和数据专家有机会获得更好的见解,进行更明智的决策,但是它同时也会带来许多的挑战:可用的内存可能无法足以处理大数据集,可能需要花太久的时间进行处理或可能流动太快而无法存储。标准算法通常不能以合理的时间或内存来处理大数据集等等。

目前没有任何一种单一方法可以处理大数据。为此,MATLAB 提供了许多工具来解决这些挑战。

在 MATLAB 中处理大数据

1. 64 位计算。

64 位版本的 MATLAB 可迅速增加内存中可保留的数据量——通常可达到任意 32 位程序的 2000 倍。32 位程序限制您只能使用 2 GB 的内存,而 64 位 MATLAB 的内存可以达到操作系统的物理内存限制。对于 Windows 8,台式机内存为 500 GB,Windows Server 内存为 4 TB。

2. 内存映射的变量。

借助 MATLAB 中的memmapfile函数,您可以将文件或文件的一部分映射到内存中的 MATLAB 变量。这样,您就可以高效访问磁盘上由于太大而无法保留在内存中或需要花太长时间而无法加载的大数据集。

3. 磁盘变量。

matfile函数使您可以直接从磁盘上的 MAT 文件访问 MATLAB 变量(使用 MATLAB 索引命令),无需将全部变量加载到内存。这使您可以在大数据集上进行块处理,这些大数据集因为太大而无法保存在内存中。

4. 内在的多核数学。

MATLAB 中的许多内置数学函数,如fft、inv和eig都是多线程的。通过并行运行,这些函数充分利用计算机的多核,提供高性能的大数据集计算。

5. GPU 计算。

如果您正在使用 GPU,Parallel Computing Toolbox中的GPU 优化的数学函数可以为大数据集提供更高的性能。

6. 并行计算。

Parallel Computing Toolbox提供并行 for 循环 , 该循环在多核计算机上并行运行您的 MATLAB 代码和算法。如果您使用MATLAB Distributed Computing Server,则可以在机器群集上并行执行,这些机器可扩展到数千台计算机。

7. 云计算

对于数百或数千台计算机的按需并行处理,您可以在 Amazon Elastic Computing Cloud(亚马逊弹性计算云)(EC2) 上使用MATLAB Distributed Computing Server并行运行 MATLAB 计算。借助云计算,您无需购买或维护您自己的群集或数据中心就可以处理大数据。

8. 分布式阵列。

使用Parallel Computing Toolbox和MATLAB DistributedComputing Server,您可以处理分布在计算机群集内存中的矩阵和多维数组。使用此方法,您可以针对因太大而无法由单台计算机内存处理的大数据集,进行存储和执行计算。

9。 流式算法。

使用系统对象,您可以对因太大或太快而无法保留在内存中的数据传入流执行流式处理。此外,您还可以使用MATLAB Coder通过 MATLAB 算法生成嵌入式 C/C++ 代码,并针对高性能实时系统运行产生的代码。

10. 图像块处理。

使用Image Processing Toolbox中的blockproc函数,您可以处理特别大的图像,方法是每次以模块的形式高效处理它们。与Parallel Computing Toolbox一起使用时,在多核和 GPU 上并行运行计算。

11. 机器学习

机器学习有助于通过大数据集提取见解和开发预测性模型。广泛的机器学习算法,包括Statistics and Machine Learning Toolbox和Neural Network Toolbox中提供的促进式 (boosted) 和袋装 (bagged) 决策树、K 均值和分层聚类、k-最近邻搜索、高斯混合、期望最大化算法、隐马尔可夫模型和神经网络

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    6649

    浏览量

    84511
  • 机器学习
    +关注

    关注

    66

    文章

    8122

    浏览量

    130556
  • 大数据
    +关注

    关注

    64

    文章

    8649

    浏览量

    136587
收藏 人收藏

    评论

    相关推荐

    大数据技术是干嘛的 大数据核心技术有哪些

    的核心技术,包括数据采集、存储与管理、处理分析等方面。 一、大数据技术背景和概念 1.1 背景 随着互联网技术的迅猛发展,人们可以通过各种
    的头像 发表于 01-31 11:07 758次阅读

    开源工业物联网大数据分论坛圆满举办

    物联网与大数据技术的快速发展,为工业数字化提供了技术支撑。推进新型工业化建设过程中,工业复杂场景离不开底层操作系统、物联网数据采集、
    的头像 发表于 12-20 09:40 352次阅读

    Get职场新知识:做分析,用大数据分析工具

    综合分析。但现在有了大数据分析工具,一切问题都可迎刃而解。 大数据分析工具,顾名思义就是专门为分析海量数据而开发的一类工具。这类工具具有极强
    发表于 12-05 09:36

    基于大数据分析的5G智能工厂如何实现

    、应用和未来的发展前景,以及它们如何相互结合,推动智能制造的未来发展。 大数据分析是指通过对海量数据进行分析,挖掘出其中有价值的信息和知识,以指导业务决策和创新的过程。与传统
    的头像 发表于 09-25 17:08 316次阅读

    工业物联网之“设备数据采集与控制+大数据存储分析+APP无代码应用开发”

    网关采集的设备数据用起来? KMM工业智能网关支持网口、WiFi、4G等上网方式,将工业智能网关接入工业现场,通过网口、串口实现设备
    发表于 08-07 20:53

    MATLAB语言编程方法 MATLAB实现信号通过系统的仿真

    实现信号通过系统的仿真方法。  实验任务  1、利用MATLAB指令完成对图三系统的频域分析,结合实验三所得xinhao1信号的频谱特征,说明它对xinhao1信号的处理作用。  2、
    发表于 07-18 16:51 0次下载

    数据分析的工具与介绍(2)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月13日 18:20:45

    数据分析的工具与介绍(1)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月13日 18:19:59

    数据分析介绍(2)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月13日 18:17:45

    数据分析介绍(1)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月13日 18:17:02

    HDFS的相关概念(2)(1)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月11日 14:45:21

    HDFS的相关概念(1)(1)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月11日 14:44:23

    大数据处理流程(2)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月11日 13:20:10

    大数据处理流程(1)#大数据分析

    大数据分析
    学习硬声知识
    发布于 :2023年07月11日 13:19:23

    大数据是什么 大数据存储的概念 大数据应用场景有哪些

    大数据的成功管理取决于几个方面,例如数据的收集、存储、处理分析和可视化。在大数据处理过程中,
    发表于 05-03 09:23 2805次阅读