当前位置：移动技术网 > IT编程>脚本编程>Python > python线程中的同步问题

python线程中的同步问题

2019年08月24日 | 移动技术网IT编程 | 我要评论

地板公司,反腐倡廉小说,蕃茄种子

多线程开发可能遇到的问题

假设两个线程t1和t2都要对num=0进行增1运算，t1和t2都各对num修改1000000次，num的最终的结果应该为2000000。但是由于是多线程访问，有可能出现下面情况：

from threading import thread
import time

num = 0

def test1():
    global num
    for i in range(1000000):
        num += 1

    print("--test1--num=%d" % num)


def test2():
    global num
    for i in range(1000000):
        num += 1

    print("--test2--num=%d" % num)


if __name__ == '__main__':
    thread(target=test1).start()
    thread(target=test2).start()
    print("num = %d" % num)
"""
num = 134116
--test1--num=1032814
--test2--num=1166243
"""

运行结果可能不一样，但是结果往往不是2000000。问题产生的原因就是没有控制多个线程对同一资源的访问，对数据造成破坏，使得线程运行的结果不可预期。这种现象称为“线程不安全”。

线程同步——使用互斥锁

如果多个线程共同对某个数据修改，则可能出现不可预料的结果，为了保证数据的正确性，需要对多个线程进行同步。
使用 thread 对象的 lock 和 rlock 可以实现简单的线程同步，这两个对象都有 acquire 方法和 release 方法，对于那些需要每次只允许一个线程操作的数据，可以将其操作放到 acquire 和 release 方法之间。

使用互斥锁实现上面的例子：

from threading import thread, lock
import time

num = 0


def test1():
    global num
    # 上锁
    mutex.acquire()
    for i in range(1000000):
        num += 1
    # 解锁
    mutex.release()
    print("--test1--num=%d" % num)


def test2():
    global num
    mutex.acquire()
    for i in range(1000000):
        num += 1
    mutex.release()
    print("--test2--num=%d" % num)


start_time = time.time()  # 开始时间
# 创建一把互斥锁，默认没有上锁
mutex = lock()
p1 = thread(target=test1)
p1.start()

# time.sleep(3)   # 取消屏蔽之后 再次运行程序，结果会不一样，，，为啥呢？

p2 = thread(target=test2)
p2.start()
p1.join()
p2.join()
end_time = time.time()  # 结束时间
print("num = %d" % num)

print("运行时间:%fs" % (end_time - start_time))  # 结束时间-开始时间

"""
输出结果：
--test1--num=1000000
--test2--num=2000000
num = 2000000
运行时间:0.287206s
"""

把锁放在for里面：

from threading import thread, lock
import time

num = 0


def test1():
    global num

    for i in range(1000000):
        # 上锁
        mutex.acquire()
        num += 1
        # 解锁
        mutex.release()
    print("--test1--num=%d" % num)


def test2():
    global num
    for i in range(1000000):
        # 上锁
        mutex.acquire()
        num += 1
        # 解锁
        mutex.release()
    print("--test2--num=%d" % num)


start_time = time.time()  # 开始时间
# 创建一把互斥锁，默认没有上锁
mutex = lock()
p1 = thread(target=test1)
p1.start()

# time.sleep(3)   # 取消屏蔽之后 再次运行程序，结果会不一样，，，为啥呢？

p2 = thread(target=test2)
p2.start()
p1.join()
p2.join()
end_time = time.time()  # 结束时间
print("num = %d" % num)

print("运行时间:%fs" % (end_time - start_time))  # 结束时间-开始时间
"""
输出结果：
--test1--num=1890838
--test2--num=2000000
num = 2000000
运行时间:4.694896s
"""

最后的结果都是正确的，但是它们的执行时间确有很大的区别，使用互斥锁的范围应该尽可能大一些，以减少cpu资源争抢的次数。

同步的应用——多个线程有序执行

from threading import lock, thread
from time import sleep


class task1(thread):
    def run(self):
        while true:
            # 判断是否上锁成功，返回值为bool类型
            if lock1.acquire():
                print("--task1--")
                sleep(0.5)
                lock2.release()


class task2(thread):
    def run(self):
        while true:
            if lock2.acquire():
                print("--task2--")
                sleep(0.5)
                lock3.release()


class task3(thread):
    def run(self):
        while true:
            if lock3.acquire():
                print("--task3--")
                sleep(0.5)
                lock1.release()

if __name__ == '__main__':    
    # 创建一把锁
    lock1 = lock()
    
    # 创建一把锁，并且锁上
    lock2 = lock()
    lock2.acquire()
    
    # 创建一把锁，并且锁上
    lock3 = lock()
    lock3.acquire()
    
    t1 = task1()
    t2 = task2()
    t3 = task3()
    
    t1.start()
    t2.start()
    t3.start()
"""
--task1--
--task2--
--task3--
--task1--
--task2--
--task3--
--task1--
--task2--
...
"""

生产者与消费者模式

为什么要使用生产者和消费者模式

在线程世界里，生产者就是生产数据的线程，消费者就是消费数据的线程。在多线程开发当中，如果生产者处理速度很快，而消费者处理速度很慢，那么生产者就必须等待消费者处理完，才能继续生产数据。同样的道理，如果消费者的处理能力大于生产者，那么消费者就必须等待生产者。为了解决这个问题于是引入了生产者和消费者模式。

什么是生产者消费者模式

生产者消费者模式是通过一个容器来解决生产者和消费者的强耦合问题。生产者和消费者彼此之间不直接通讯，而通过阻塞队列来进行通讯，所以生产者生产完数据之后不用等待消费者处理，直接扔给阻塞队列，消费者不找生产者要数据，而是直接从阻塞队列里取，阻塞队列就相当于一个缓冲区，平衡了生产者和消费者的处理能力。

python的queue模块中提供了同步的、线程安全的队列类，包括fifo（先入先出)队列queue，lifo（后入先出）队列lifoqueue，和优先级队列priorityqueue。这些队列都实现了锁原语（可以理解为原子操作，即要么不做，要么就做完），能够在多线程中直接使用。可以使用队列来实现线程间的同步。

用fifo队列实现上述生产者与消费者问题的代码如下：

import threading
import time
from queue import queue


class producer(threading.thread):
    def run(self):
        global queue
        count = 0
        while true:
            if queue.qsize() < 1000:
                for i in range(100):
                    count += 1
                    msg = "生成产品" + str(count)
                    queue.put(msg)
                    print(msg)
            time.sleep(0.5)


class consumer(threading.thread):
    def run(self):
        global queue
        while true:
            if queue.qsize() > 100:
                for i in range(3):
                    msg = self.name + "消费了" + queue.get()
                    print(msg)
            time.sleep(0.5)


if __name__ == '__main__':
    queue = queue()

    for i in range(500):
        queue.put("初始产品" + str(i))
    # 创建2个生产线程
    for i in range(2):
        p = producer()
        p.start()
    # 创建5个消费线程
    for i in range(5):
        c = consumer()
        c.start()

threadlocal

在多线程环境下，每个线程都有自己的数据。一个线程使用自己的局部变量比使用全局变量好，因为局部变量只有线程自己能看见，不会影响其他线程，而全局变量的修改必须加锁。
threadlocal解决了参数在一个线程中各个函数之间互相传递的问题

import threading
"""
⼀个threadlocal变量虽然是全局变量，但每个线程都只能读写⾃⼰线程的独
⽴副本，互不⼲扰。
"""
# 创建全局threadlocal对象:
local_school = threading.local()


def process_student():
    # 获取当前线程关联的student:
    std = local_school.student
    print('hello, %s (in %s)' % (std, threading.current_thread().name))


def process_thread(name):
    # 绑定threadlocal的student:
    local_school.student = name
    process_student()


t1 = threading.thread(target=process_thread, args=('dongge',), name="thread-a")
t2 = threading.thread(target=process_thread, args=('⽼王',), name="thread-b")
t1.start()
t2.start()

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

python dict乱码如何解决

定义字典并直接输出，结果输出结果中文是乱码展示d={'name':'lily','age':18,'sex':'女','no':1121}print d输出结果... [阅读全文]
如何写python的配置文件

一、创建配置文件在d盘建立一个配置文件，名字为：test.ini内容如下：[baseconf]host=127.0.0.1port=3306user=rootp... [阅读全文]
使用Python FastAPI构建Web服务的实现

fastapi 是一个使用 python 编写的 web 框架，还应用了 python asyncio 库中最新的优化。本文将会介绍如何搭建基于容器的开发环境，... [阅读全文]
Python过滤掉numpy.array中非nan数据实例

代码需要先导入pandasarr的数据类型为一维的np.arrayimport pandas as pdarr[~pd.isnull(arr)]补充知识：pyt... [阅读全文]
python求numpy中array按列非零元素的平均值案例

输入：numpy的array输出：一个一维的平均值arrayimport numpy as np def non_zero_mean(np_arr): exis... [阅读全文]
Python如何向SQLServer存储二进制图片

需求是需要用python往 sqlserver中的image类型字段中插入二进制图片核心代码，研究好几个小时的代码：安装pywin32，adodbapiimag... [阅读全文]
python numpy实现rolling滚动案例

相比较pandas，numpy并没有很直接的rolling方法，但是numpy 有一个技巧可以让numpy在c代码内部执行这种循环。这是通过添加一个与窗口大小相... [阅读全文]
python opencv 实现读取、显示、写入图像的方法

opencv是一个强大的图像处理和计算机视觉库，实现了很多实用算法，值得学习和深究下。opencv包安装·　　这里直接安装opencv-python包（非官方）... [阅读全文]
python thrift 实现单端口多服务的过程

thrift 是一种接口描述语言和二进制通信协议。以前也没接触过，最近有个项目需要建立自动化测试，这个项目之间的微服务都是通过 thrift 进行通信的，然后写... [阅读全文]
Python while true实现爬虫定时任务

记得以前的windows 任务定时是可以的正常使用的，今天试了下，发现不能正常使用了，任务计划总是挂起。接下来记录下python 爬虫定时任务的几种解决方法。今... [阅读全文]

网友评论


验证码：