Python的矩阵传播机制-电子发烧友网

一、Python的矩阵传播机制（Broadcasting）

我们知道在深度学习中经常要操作各种矩阵（matrix）。

回想一下，我们在操作数组（list）的时候，经常习惯于用**for循环（for-loop）**来对数组的每一个元素进行操作。例如：

my_list = ［1，2，3，4］

new_list = ［］

for each in my_list：

new_list.append（each*2）

print（new_list） # 输出［2，3，4，5］

如果是矩阵呢：

my_matrix = ［［1，2，3，4］，

［5，6，7，8］］

new_matrix = ［［］，［］］

for i in range（2）：

for j in range（4）：

new_matrix［i］.append（my_matrix［i］［j］*2）

print（new_matrix）# 输出［［2， 4， 6， 8］，［10， 12， 14， 16］］

实际上，上面的做法是十分的低效的！数据量小的话还不明显，如果数据量大了，尤其是深度学习中我们处理的矩阵往往巨大，那用for循环去跑一个矩阵，可能要你几个小时甚至几天。

Python考虑到了这一点，这也是本文主要想介绍的**“Python的broadcasting”即传播机制**。

先说一句，python中定义矩阵、处理矩阵，我们一般都用numpy这个库。

二、下面展示什么是python的传播机制

import numpy as np# 先定义一个3×3矩阵 A：

A = np.array（

［［1，2，3］，

［4，5，6］，

［7，8，9］］）

print（“A：

”，A）

print（“

A*2：

”，A*2） # 直接用A乘以2print（“

A+10：

”，A+10） # 直接用A加上10

运行结果：

A：

［［1 2 3］

［4 5 6］

［7 8 9］］

A*2：

［［ 2 4 6］

［ 8 10 12］

［14 16 18］］

A+10：

［［11 12 13］

［14 15 16］

［17 18 19］］

接着，再看看矩阵×（+）矩阵：

#定义一个3×1矩阵（此时也可叫向量了）

B = np.array（［［10］，

［100］，

［1000］］）

print（“

B：

”，B）

print（“

A+B：

”，A+B）

print（“

A*B：

”，A*B）

运行结果：

B：

［［ 10］

［ 100］

［1000］］

A+B：

［［ 11 12 13］

［ 104 105 106］

［1007 1008 1009］］

A*B：

［［ 10 20 30］

［ 400 500 600］

［7000 8000 9000］］

可见，虽然A和B的形状不一样，一个是3×3，一个是3×1，但是我们在python中可以直接相加、相乘，相减相除也可以。

也许看到这，大家都对broadcasting有感觉了。

用一个图来示意一下：

所谓“传播”，就是把一个数或者一个向量进行“复制”，从而作用到矩阵的每一个元素上。

有了这种机制，那进行向量和矩阵的运算，就太方便了！理解了传播机制，就可以随心所欲地对矩阵进行各种便捷的操作了。

利用numpy的内置函数对矩阵进行操作：

numpy内置了很多的数学函数，例如np.log（），np.abs（），np.maximum（）等等上百种。直接把矩阵丢进去，就可以算出新矩阵！示例：

print（np.log（A））

输出把A矩阵每一个元素求log后得到的新矩阵：

array（［［0. ， 0.69314718， 1.09861229］，

［1.38629436， 1.60943791， 1.79175947］，

［1.94591015， 2.07944154， 2.19722458］］）

再比如深度学习中常用的ReLU激活函数，就是y=max（0，x），

也可以对矩阵直接运算：

X = np.array（［［1，-2，3，-4］，［-9，4，5，6］］）Y = np.maximum（0，X）print（Y）

得到：

［［1 0 3 0］［0 4 5 6］］

更多的numpy数学函数，可以参见文档：https://docs.scipy.org/doc/numpy-1.13.0/reference/routines.math.html

三、定义自己的函数来处理矩阵

其实这才是我写下本文的目的。。。前面扯了这么多，只是做个铺垫（/ω＼）

我昨天遇到个问题，就是我要对ReLU函数求导，易知，y=max（0，x）的导函数是：y’ = 0 if x《0y’ = 1 if x》0但是这个y’（x）numpy里面没有定义，需要自己构建。即，我需要将矩阵X中的小于0的元素变为0，大于0的元素变为1。搞了好久没弄出来，后来在StackOverflow上看到了解决办法：

def relu_derivative（x）：

x［x《0］ = 0

x［x》0］ = 1

return x

X = np.array（［［1，-2，3，-4］，

［-9，4，5，6］］）

print（relu_derivative（X））

输出：

［［1 0 1 0］

［0 1 1 1］］

**居然这么简洁就出来了！！！**ミﾟДﾟ彡（ﾟДﾟ#）

这个函数relu_derivative中最难以理解的地方，就是**x［x》0］**了。于是我试了一下：

X = np.array（［［1，-2，3，-4］，

［-9，4，5，6］］）

print（X［X》0］）

print（X［X《0］）

输出：

［1 3 4 5 6］

［-2 -4 -9］

它直接把矩阵X中满足条件的元素取了出来！原来python对矩阵还有这种操作！

震惊了我好久~

所以可以这么理解，X［X》0］相当于一个“选择器”，把满足条件的元素选出来，然后直接全部赋值。

用这种方法，我们便可以定义各种各样我们需要的函数，然后对矩阵整体进行更新操作了！

四、综上

可以看出，python以及numpy对矩阵的操作简直神乎其神，方便快捷又实惠。其实上面忘了写一点，那就是计算机进行矩阵运算的效率要远远高于用for-loop来运算，

不信可以用跑一跑：

# vetorization vs for loop# define two arrays a， b：

a = np.random.rand（1000000）

b = np.random.rand（1000000）

# for loop version：

t1 = time.time（）

c = 0

for i in range（1000000）：

c += a［i］*b［i］

t2 = time.time（）

print（c）

print（“for loop version：”+str（1000*（t2-t1））+“ms”）

time1 = 1000*（t2-t1）

# vectorization version：

t1 = time.time（）

c = np.dot（a，b）

t2 = time.time（）

print（c）

print（“vectorization version：”+str（1000*（t2-t1））+“ms”）

time2 = 1000*（t2-t1）

print（“vectorization is faster than for loop by ”+str（time1/time2）+“ times！”）

运行结果：

249765.8415288075

for loop version:627.4442672729492ms

249765.84152880745

vectorization version:1.5032291412353516ms

vectorization is faster than for loop by 417.39762093576525 times！

可见，用for方法和向量化方法，计算结果是一样，但是后者比前者快了400多倍！

因此，在计算量很大的时候，我们要尽可能想办法对数据进行Vectorizing，即“向量化”，以便让计算机进行矩阵运算。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

for

for

+关注

关注
0

文章
44

浏览量
15513
python

python

+关注

关注
51

文章
4677

浏览量
83473
深度学习

深度学习

+关注

关注
73

文章
5239

浏览量
119913

原文标题：消灭 for 循环！Python 的矩阵传播机制和矩阵运算

文章出处：【微信号：LinuxHub，微信公众号：Linux爱好者】欢迎添加关注！文章转载请注明出处。

矩阵led扫描频率怎么调

矩阵LED扫描频率是指LED矩阵在单位时间内刷新显示的次数。LED矩阵是由多个发光二极管（LED）组成的显示设备，通过扫描控制来实现各个LED的亮灭，从而显示出不同的图像或信息。调整矩阵

发表于 01-02 17:30 •519次阅读

python shell怎么用

Python Shell是一种交互式解释器，可以通过命令行直接运行Python代码。在Shell中，可以输入一行代码并立即得到结果，非常适合于测试、尝试新代码或进行简单的任务。本文将详细介绍

发表于 11-29 14:36 •372次阅读

python第三方库有哪些

Python） NumPy 是 Python 中最重要且最常用的科学计算库之一。它提供了支持大型、多维数组和矩阵运算的高性能数学函数和计算工具。NumPy 的使用极为广泛，尤其在数据处理、数值计算

发表于 11-29 14:31 •821次阅读

如何运行Python程序

运行Python程序非常简单。Python是一种解释型语言，这意味着可以直接通过解释器来执行代码。下面我将详细介绍如何运行Python程序。一、安装Python 在运行

发表于 11-24 09:31 •708次阅读

Python2与Python3的差异

Python2与Python3是两个不同的版本，它们在语法、功能和性能等方面存在一些差异。下面是对Python2和Python3的详尽、详实、细致的比较，分为以下几个方面：语法差异

发表于 11-23 16:48 •353次阅读

Python自带的命令窗口

Python自带的命令窗口，也称为Python交互式解释器，是Python编程语言的一个重要工具，它允许用户在命令行界面中输入和执行Python代码。不同于编写脚本并保存为文件后再执行

发表于 11-22 14:02 •431次阅读

python写完程序之后怎么运行

Python是一门简洁、易学的编程语言，被广泛应用于数据分析、人工智能等领域。在学习Python编程的过程中，了解程序的运行机制是至关重要的。本文将详尽解析Python程序的运行过程，

发表于 11-22 11:10 •657次阅读

用Python实现矩阵与线性变换

矩阵是向量的集合，把多个向量组织在一起就构成了一个矩阵。例如在三维空间内，有A、B、C三个向量。

发表于 11-01 11:19 •507次阅读

Python SDK包的使用

Shodan Web端非常好用，但如果我们有从 Python 搜索的需求怎么办？没关系，Shodan 官方也提供了 Python SDK 包，下面就来讲讲这个 SDK 包的使用。 1.准备开始

发表于 10-30 15:51 •428次阅读

Manim：一个Python数学动画开发模块

Manim 是3b1b开源的一个特别漂亮的数学动画模块。我们能够基于Manim绘制许多解释性的动画，比如下面这个：也支持函数图像：甚至是一些3D视图和矩阵变换，Manim都可以轻易实现：如果

发表于 10-17 11:21 •749次阅读

卷积神经网络python代码

的卷积操作，将不同层次的特征进行提取，从而通过反向传播算法不断优化网络权重，最终实现分类和预测等任务。在本文中，我们将介绍如何使用Python实现卷积神经网络，并详细说明每一个步骤及其原理。第一步：导入必要的库在开始编写代码前，我们需要先导入一些必要的

发表于 08-21 16:41 •691次阅读

python数据挖掘与机器学习

用的数据挖掘和机器学习工具。一、数据挖掘数据挖掘是指从大量数据中自动或半自动地发现潜在的关系、规律或模式的过程。Python中有许多数据挖掘工具可供使用，以下是其中一些常用的工具： 1. NumPy和Pandas NumPy是一个Python库，用于处理数组和

发表于 08-17 16:29 •889次阅读

Python2与Python3中对字符串的支持

其实Python3中对字符串支持的改进，不仅仅是更改了默认编码，而是重新进行了字符串的实现，而且它已经实现了对UNICODE的内置支持，从这方面来讲Python已经和JAVA一样优秀。下面我们来看

发表于 07-05 16:15 •529次阅读

PyTorch教程5.3之前向传播、反向传播和计算图

电子发烧友网站提供《PyTorch教程5.3之前向传播、反向传播和计算图.pdf》资料免费下载

发表于 06-05 15:36 •0次下载

Python中的异常机制（一）

前言哈喽, 大家好, 我是了不起! 欢迎大家来观看了不起的冒险之旅. 为了方便起见, 文中以小知为名. 讲述了不起在Python异世界的冒险之旅. 白天冒险, 晚上学习. 小知可是身体和心理没有

发表于 05-11 18:17 •587次阅读