0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何知道你的代码是否线程安全

科技绿洲 来源:Python实用宝典 作者:Python实用宝典 2023-11-01 11:42 次阅读

在并发编程时,如果多个线程访问同一资源,我们需要保证访问的时候不会产生冲突,数据修改不会发生错误,这就是我们常说的 线程安全

那什么情况下,访问数据时是安全的?什么情况下,访问数据是不安全的?如何知道你的代码是否线程安全?要如何访问数据才能保证数据的安全?

本篇文章会一一回答你的问题。

1. 线程不安全是怎样的?

要搞清楚什么是线程安全,就要先了解线程不安全是什么样的。

比如下面这段代码,开启两个线程,对全局变量 number 各自增 10万次,每次增量 1。

from threading import Thread, Lock

number = 0

def target():
    global number
    for _ in range(1000000):
        number += 1

thread_01 = Thread(target=target)
thread_02 = Thread(target=target)
thread_01.start()
thread_02.start()

thread_01.join()
thread_02.join()

print(number)

正常我们的预期输出结果,一个线程自增100万,两个线程就自增 200 万嘛,输出肯定为 2000000 。

可事实却并不是你想的那样,不管你运行多少次,每次输出的结果都会不一样,而这些输出结果都有一个特点是,都小于 200 万。

以下是执行三次的结果

1459782
1379891
1432921

这种现象就是线程不安全,究其根因,其实是我们的操作 number += 1 ,不是原子操作,才会导致的线程不安全。

2. 什么是原子操作?

原子操作( atomic operation ),指不会被线程调度机制打断的操作,这种操作一旦开始,就一直运行到结束,中间不会切换到其他线程。

它有点类似数据库中的 事务

Python 的官方文档上,列出了一些常见原子操作

L.append(x)
L1.extend(L2)
x = L[i]
x = L.pop()
L1[i:j] = L2
L.sort()
x = y
x.field = y
D[x] = y
D1.update(D2)
D.keys()

而下面这些就不是原子操作

i = i+1
L.append(L[-1])
L[i] = L[j]
D[x] = D[x] + 1

像上面的我使用自增操作 number += 1,其实等价于 number = number + 1,可以看到这种可以拆分成多个步骤(先读取相加再赋值),并不属于原子操作。

这样就导致多个线程同时读取时,有可能读取到同一个 number 值,读取两次,却只加了一次,最终导致自增的次数小于预期。

当我们还是无法确定我们的代码是否具有原子性的时候,可以尝试通过 dis 模块里的 dis 函数来查看

图片

当我们执行这段代码时,可以看到 number += 1 这一行代码,由两条字节码实现。

  • BINARY_ADD :将两个值相加
  • STORE_GLOBAL:将相加后的值重新赋值

每一条字节码指令都是一个整体,无法分割,他实现的效果也就是我们所说的原子操作。

当一行代码被分成多条字节码指令的时候,就代表在线程线程切换时,有可能只执行了一条字节码指令,此时若这行代码里有被多个线程共享的变量或资源时,并且拆分的多条指令里有对于这个共享变量的写操作,就会发生数据的冲突,导致数据的不准确。

为了对比,我们从上面列表的原子操作拿一个出来也来试试,是不是真如官网所说的原子操作。

这里我拿字典的 update 操作举例,代码和执行过程如下图

图片

从截图里可以看到,info.update(new) 虽然也分为好几个操作

  • LOAD_GLOBAL:加载全局变量
  • LOAD_ATTR:加载属性,获取 update 方法
  • LOAD_FAST:加载 new 变量
  • CALL_FUNCTION:调用函数
  • POP_TOP:执行更新操作

但我们要知道真正会引导数据冲突的,其实不是读操作,而是写操作。

上面这么多字节码指令,写操作都只有一个( POP_TOP ),因此字典的 update 方法是原子操作。

3. 实现人工原子操作

在多线程下,我们并不能保证我们的代码都具有原子性,因此如何让我们的代码变得具有 “ 原子性 ” ,就是一件很重要的事。

方法也很简单,就是当你在访问一个多线程间共享的资源时,加锁可以实现类似原子操作的效果,一个代码要嘛不执行,执行了的话就要执行完毕,才能接受线程的调度。

因此,我们使用加锁的方法,对例子一进行一些修改,使其具备“ 原子性 ”。

from threading import Thread, Lock


number = 0
lock = Lock()


def target():
    global number
    for _ in range(1000000):
        with lock:
            number += 1

thread_01 = Thread(target=target)
thread_02 = Thread(target=target)
thread_01.start()
thread_02.start()

thread_01.join()
thread_02.join()

print(number)

此时,不管你执行多少遍,输出都是 2000000.

4. 为什么 Queue 是线程安全的?

Python 的 threading 模块里的消息通信机制主要有如下三种:

  1. Event
  2. Condition
  3. Queue

使用最多的是 Queue,而我们都知道它是线程安全的。当我们对它进行写入和提取的操作不会被中断而导致错误,这也是我们在使用队列时,不需要额外加锁的原因。

他是如何做到的呢?

其根本原因就是 Queue 实现了锁原语,因此他能像第三节那样实现人工原子操作。

原语指由若干个机器指令构成的完成某种特定功能的一段程序,具有不可分割性;即原语的执行必须是连续的,在执行过程中不允许被中断。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6511

    浏览量

    87600
  • 函数
    +关注

    关注

    3

    文章

    3868

    浏览量

    61309
  • 代码
    +关注

    关注

    30

    文章

    4555

    浏览量

    66771
  • 线程安全
    +关注

    关注

    0

    文章

    13

    浏览量

    2440
收藏 人收藏

    评论

    相关推荐

    知道最短最高效的代码是什么?

    知道最短最高效的代码是什么?我先公布我的答案,是下面这个代码片: #include int main() { printf(“Hello world!”) } 就是这个,是它
    发表于 12-01 17:16

    XC32源码和字符串线程安全

    我正在尝试我的项目的FrReTOS迁移,我想了解哪些字符串处理函数是线程安全的,或者不是线程安全的。特别是,我想看看StrudStruts,Strutk,还有一些其他的源
    发表于 11-26 16:03

    是否知道量程选择的原理呢?

    是否知道量程选择的原理呢?
    发表于 04-29 06:16

    Linux下的线程安全是什么

    Linux下的线程安全原文结构有点乱线程安全:多个执行流对临界资源进行争抢访问,而不会造成数据二义性和逻辑混乱,成这段代码的过程是
    发表于 07-01 13:34

    什么是线程安全?如何去实现线程安全

    什么是线程安全?如何去实现线程安全?互斥实现的技术是什么?有哪些注意事项?同步实现的技术是什么?其操作流程有哪些?
    发表于 07-23 09:57

    有没有人知道rt-thread的dfs+uffs是否线程安全

    有没有人知道,dfs+uffs是否线程安全?1、如A线程写A文件,同时B线程读B文件
    发表于 04-20 11:37

    A线程如何在线程本身识别变量是否改变

    阻塞获取可以解决但是这个B线程是别人代码写的。不好修改不想再增加一个线程去循环读取变量X是否改变,再释放信号量需求A线程如何在
    发表于 11-02 11:02

    带有Arduino IDE的ESP8266是否支持多线程同时运行多个任务/功能?

    亲爱的,想知道带有 Arduino IDE 的 ESP8266 是否支持多线程同时运行多个任务/功能?如果是这样,请帮助提供工作示例代码
    发表于 02-22 08:13

    线程池技术简介与Apollo线程池类源代码分析

    线程并发数量过多,抢占系统资源从而导致阻塞。 我们知道线程会共享系统资源,如果同时执行的线程数量过多,可能会导致系统资源不足而产生操作卡顿甚至出现假死现象,运用
    的头像 发表于 06-05 14:30 3878次阅读
    <b class='flag-5'>线程</b>池技术简介与Apollo<b class='flag-5'>线程</b>池类源<b class='flag-5'>代码</b>分析

    什么是线程安全 如何实现线程安全代码

    相信有很多同学在面对多线程代码时都会望而生畏,认为多线程代码就像一头难以驯服的怪兽,你制服不了这头怪兽它就会反过来吞噬你。
    的头像 发表于 05-17 12:45 1430次阅读

    什么是线程线程池中线程实现复用的原理

    一般建议自定义线程工厂,构建线程的时候设置线程的名称,这样就在查日志的时候就方便知道是哪个线程执行的代码
    发表于 01-29 13:44 1342次阅读

    如何理解线程安全

    本次分享线程安全的基础知识。
    的头像 发表于 05-08 15:03 655次阅读
    如何理解<b class='flag-5'>线程</b><b class='flag-5'>安全</b>?

    什么是线程安全?如何理解线程安全

    在多线程编程中,线程安全是必须要考虑的因素。
    的头像 发表于 05-30 14:33 1506次阅读
    什么是<b class='flag-5'>线程</b><b class='flag-5'>安全</b>?如何理解<b class='flag-5'>线程</b><b class='flag-5'>安全</b>?

    线程安全怎么办

    线程安全一直是多线程开发中需要注意的地方,可以说,并发安全保证了所有的数据都安全。 1 线程
    的头像 发表于 10-10 15:00 196次阅读
    <b class='flag-5'>线程</b><b class='flag-5'>安全</b>怎么办

    如何实现一个多读多写的线程安全的无锁队列

    在ZMQ无锁队列的原理与实现一文中,我们已经知道了ypipe可以实现一线程写一线程读的无锁队列,那么其劣势就很明显了,无法适应多写多读的场景,因为其在读的时候没有对r指针加锁,在写的时候没有对w指针
    的头像 发表于 11-08 15:25 447次阅读
    如何实现一个多读多写的<b class='flag-5'>线程</b><b class='flag-5'>安全</b>的无锁队列