如何在Python中关闭线程？

Question

14 浏览2023年4月24日

匿名的 2023年4月24日

0 Comments

我有一些未完成的线程问题。

我认为队列命令.join()只是关闭队列，并不会关闭使用它的线程。

在我的脚本中，我需要检查280k个域名，并为每个域名获取其MX记录列表，如果有的话，获取服务器的IPv6地址。

我使用了线程，感谢它们，脚本运行速度提高了很多。但是有个问题，尽管队列有join()方法，但活动线程的数量仍在增长，直到出现错误，提示无法创建新线程（操作系统的限制？）。

当我从数据库中检索新域名时，如何在每个For循环结束后终止/关闭/停止/重置线程？

线程类定义...

class MX_getAAAA_thread(threading.Thread):
    def __init__(self,queue,id_domain):
        threading.Thread.__init__(self)
        self.queue = queue
        self.id_domain = id_domain
    def run(self):
        while True:
            self.mx = self.queue.get()
            res = dns.resolver.Resolver()
            res.lifetime = 1.5
            res.timeout = 0.5
            try:
                answers = res.query(self.mx,'AAAA')
                ip_mx = str(answers[0])
            except:
                ip_mx = "N/A"
            lock.acquire()
            sql = "INSERT INTO mx (id_domain,mx,ip_mx) VALUES (" + str(id_domain) + ",'" + str(self.mx) + "','" + str(ip_mx) + "')"
            try:
                cursor.execute(sql)
                db.commit()
            except:
                db.rollback()
            print "MX" , '>>' , ip_mx, ' :: ', str(self.mx)
            lock.release()
            self.queue.task_done()

使用的线程类...

（主要的For循环不在这里，这只是它的一部分）

try:
    answers = resolver.query(domain, 'MX')
    qMX = Queue.Queue()
    for i in range(len(answers)):
        t = MX_getAAAA_thread(qMX,id_domain)
        t.setDaemon(True)
        threads.append(t)
        t.start()
    for mx in answers:
        qMX.put(mx.exchange)
    qMX.join()
except NoAnswer as e:
    print "MX - Error: No Answer"
except Timeout as etime:
    print "MX - Error: dns.exception.Timeout"
print "end of script"

我尝试在队列完成后使用以下代码：

for thread in threads:
            thread.join()

但是thread.join()永远不会停止等待，尽管没有必要等待，因为当queue.join()执行时，线程没有要执行的任务。

0

3 答案

匿名的 · Answer 1 · 2023-06-07T00:41:15+00:00

问题的原因是线程没有从运行循环中退出，导致join方法一直阻塞。此外，没有设置超时的Queue.get方法也会一直阻塞。

解决方法是在循环中设置一个停止标志，当标志被设置时，跳出循环或从run方法返回。可以使用passive approach的方法，即在MX_getAAAA_thread线程中设置一个停止标志，并在循环的不同点检查其值。如果被设置了，就跳出循环或从run方法返回。

以下是代码示例：


import threading
import queue
stop_flag = threading.Event()  # 创建一个事件对象作为停止标志
class MyThread(threading.Thread):
    def __init__(self, queue):
        super().__init__()
        self.queue = queue
    def run(self):
        while not stop_flag.is_set():
            try:
                item = self.queue.get(timeout=1)  # 设置超时时间，避免无限阻塞
                # 处理item的逻辑
            except queue.Empty:
                pass  # 队列为空时的处理逻辑
    def stop(self):
        stop_flag.set()  # 设置停止标志
# 创建队列和线程
my_queue = queue.Queue()
my_thread = MyThread(my_queue)
# 启动线程
my_thread.start()
# 执行一些操作...
# 停止线程
my_thread.stop()
# 等待线程结束
my_thread.join()

匿名的 · Answer 2 · 2023-06-05T21:26:28+00:00

问题的原因是，在处理线程中的无限循环时，如何优雅地关闭线程。解决方法是在循环中添加一个可以从外部控制的条件，通过改变条件的值来终止线程。

在这种情况下，可以将循环条件设置为一个可以从外部控制的属性keepRunning，并在每次循环检查条件时判断该属性的值。当keepRunning为False时，线程将会优雅地终止。

另一种解决方法是重用线程。可以通过在队列中提供一个唯一标识符id_domain来让线程独立于每次迭代，从而实现线程的重用。当线程从队列中取出任务时，可以通过id_domain标识符来判断任务的唯一性，从而实现线程的独立和重用。