0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

List和Numpy Array有什么区别

科技绿洲 来源:Python实用宝典 作者:Python实用宝典 2023-10-30 10:49 次阅读

Numpy 是Python科学计算的一个核心模块。它提供了非常高效的数组对象,以及用于处理这些数组对象的工具。一个Numpy数组由许多值组成,所有值的类型是相同的。

Python的核心库提供了 List 列表。列表是最常见的Python数据类型之一,它可以调整大小并且包含不同类型的元素,非常方便。

那么List和Numpy Array到底有什么区别?为什么我们需要在大数据处理的时候使用Numpy Array?答案是性能。

Numpy数据结构在以下方面表现更好:

1.内存大小—Numpy数据结构占用的内存更小。

2.性能—Numpy底层是用C语言实现的,比列表更快。

3.运算方法—内置优化了代数运算等方法。

下面分别讲解在大数据处理时,Numpy数组相对于List的优势。

1.内存占用更小

适当地使用Numpy数组替代List,你能让你的内存占用降低20倍。

对于Python原生的List列表,由于每次新增对象,都需要8个字节来引用新对象,新的对象本身占28个字节(以整数为例)。所以列表 list 的大小可以用以下公式计算:

64 + 8 * len(lst) + len(lst) * 28 字节

图片

而使用Numpy,就能减少非常多的空间占用。比如长度为n的Numpy整形Array,它需要:

96 + len(a) * 8 字节

图片

可见,数组越大,你节省的内存空间越多。假设你的数组有10亿个元素,那么这个内存占用大小的差距会是GB级别的。

2.速度更快、内置计算方法

运行下面这个脚本,同样是生成某个维度的两个数组并相加,你就能看到原生List和Numpy Array的性能差距。

import time
import numpy as np

size_of_vec = 1000

def pure_python_version():
    t1 = time.time()
    X = range(size_of_vec)
    Y = range(size_of_vec)
    Z = [X[i] + Y[i] for i in range(len(X)) ]
    return time.time() - t1

def numpy_version():
    t1 = time.time()
    X = np.arange(size_of_vec)
    Y = np.arange(size_of_vec)
    Z = X + Y
    return time.time() - t1


t1 = pure_python_version()
t2 = numpy_version()
print(t1, t2)
print("Numpy is in this example " + str(t1/t2) + " faster!")

结果如下:

0.00048732757568359375 0.0002491474151611328
Numpy is in this example 1.955980861244019 faster!

可以看到,Numpy比原生数组快1.95倍。

如果你细心的话,还能发现,Numpy array可以直接执行加法操作。而原生的数组是做不到这点的,这就是Numpy 运算方法的优势。

我们再做几次重复试验,以证明这个性能优势是持久性的。

import numpy as np
from timeit import Timer

size_of_vec = 1000
X_list = range(size_of_vec)
Y_list = range(size_of_vec)
X = np.arange(size_of_vec)
Y = np.arange(size_of_vec)

def pure_python_version():
    Z = [X_list[i] + Y_list[i] for i in range(len(X_list)) ]

def numpy_version():
    Z = X + Y

timer_obj1 = Timer("pure_python_version()",
                   "from __main__ import pure_python_version")
timer_obj2 = Timer("numpy_version()",
                   "from __main__ import numpy_version")

print(timer_obj1.timeit(10))
print(timer_obj2.timeit(10)) # Runs Faster!

print(timer_obj1.repeat(repeat=3, number=10))
print(timer_obj2.repeat(repeat=3, number=10)) # repeat to prove it!

结果如下:

0.0029753120616078377
0.00014940369874238968
[0.002683573868125677, 0.002754641231149435, 0.002803879790008068]
[6.536301225423813e-05, 2.9387418180704117e-05, 2.9171351343393326e-05]

可以看到,第二个输出的时间总是小得多,这就证明了这个性能优势是具有持久性的。

所以,如果你在做一些大数据研究,比如金融数据、股票数据的研究,使用Numpy能够节省你不少内存空间,并拥有更强大的性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据处理
    +关注

    关注

    0

    文章

    509

    浏览量

    28247
  • Array
    +关注

    关注

    93

    文章

    18

    浏览量

    15852
  • python
    +关注

    关注

    51

    文章

    4675

    浏览量

    83467
收藏 人收藏

    评论

    相关推荐

    SPI和QSPI什么区别

    SPI和QSPI什么区别
    发表于 02-06 06:12

    proteus和protle什么区别

    proteus和protle什么区别
    发表于 06-21 09:55

    mspG2553中 TimerA和TimerB什么区别?TA1和TA0什么区别

    mspG2553中 TimerA和TimerB什么区别?TA1和TA0什么区别
    发表于 05-15 22:39

    0603、0805和1206的电容什么区别?0603、0805和1206的电感什么区别

    0603、0805和1206的电容什么区别?0603、0805和1206的电感什么区别
    发表于 04-19 22:17

    预定义和不预定义什么区别

    0x01#define down_array0x02#define clear_array 0x03#define function_array 0x04#define null0类似这种预定义和不预定义
    发表于 02-25 06:35

    DAC芯片什么区别

    我想选一款16位、4通道DAC芯片,在选定的一些芯片中,发现Architecture区别,分别是R-2R和Sting,请问它们什么区别,谢谢
    发表于 06-18 10:16

    请问CCS5调试时CORE reset和restart什么区别

    你好! 1.请问下,在用CCS5调试LM4F的时候,一个“CORE reset”和“restart”,这两个什么区别? 2. 在SECTIONS[ .intvecs:> APP_BASE
    发表于 09-02 11:05

    RISC和CISC什么区别

    RISC vs CISC什么区别
    发表于 04-02 06:27

    List中的ArrayList和LinkedList什么区别

    明白 List 中 ArrayList 和 LinkedList 什么区别,这简直太遗憾了,这两者其实都是数据结构中的基础内容,这篇文章会从基础概念开始,分析两者在 Java 中的具体源码实现,寻找
    发表于 12-23 07:21

    什么是EEPROM?和FLASH什么区别

    什么是EEPROM?和FLASH什么区别
    发表于 01-24 06:48

    IDF AT Bin和Qcloud IoT AT什么区别

    IDF AT Bin 和 Qcloud IoT AT 什么区别?ESP8266 RTOS SDK和NONOS SDK什么区别? 如果我安装例如 RTOS SDK,它是否也会升级 A
    发表于 05-12 06:50

    STM32的FSMC和FMC什么区别

    STM32的FSMC和FMC什么区别呢? 有的系列,比如F103是FSMC,有的系列,M4就是FMC了。这两者什么区别呢?
    发表于 09-26 06:17

    rdram和sdram什么区别

    在电脑上拆到2条rdram内存条,这个和sdram内存条什么区别,可以兼容吗
    发表于 10-08 09:01

    哈希与加密什么区别

    哈希与加密什么区别
    发表于 10-09 06:29

    openCV和openMV什么区别

    两个什么区别,我们常用的视觉库是哪个
    发表于 10-11 07:02