线程池到底是什么神仙操作
在开发中,为了提升效率,我们需要将一些业务采用多线程的方式去执行,但是,如果每次异步操作或者多线程操作都需要新创建一个线程,使用完毕后,线程再被销毁,这样的话,对系统造成一些额外的开销。在处理过程中到底由多线程处理了多少个任务,以及每个线程的开销无法统计和管理,所以咱们需要一个线程池机制来管理这些内容。线程池的概念和连接池类似,都是在一个Java的集合中存储大量的线程对象,每次需要执行异步操作或者多线程操作时,不需要重新创建线程,直接从集合中拿到线程对象直接执行方法就可以了。JDK提供了多种创建线程池的方式,实际中常使用ThreadPoolExecutor来自定义构建线程池。以下内容涉及ThreadPoolExecutor的源码分析,可能有点长,还请耐心看完。
ThreadPoolExecutor应用实战
创建线程池可不是随便new一下就完事了!看一下ThreadPoolExecutor提供的七个核心参数:
public ThreadPoolExecutor(
int corePoolSize, // 核心工作线程(当前任务执行结束后,不会被销毁)
int maximumPoolSize, // 最大工作线程(代表当前线程池中,一共可以有多少个工作线程)
long keepAliveTime, // 非核心工作线程在阻塞队列位置等待的时间
TimeUnit unit, // 非核心工作线程在阻塞队列位置等待时间的单位
BlockingQueue<Runnable> workQueue, // 任务在没有核心工作线程处理时,任务先扔到阻塞队列中
ThreadFactory threadFactory, // 构建线程的线程工作,可以设置thread的一些信息,比如线程名前缀
RejectedExecutionHandler handler) { // 当线程池无法处理投递过来的任务时,执行当前的拒绝策略
}
其中的拒绝策略,当线程池无法处理任务时,jdk提供了以下几种策略:
- AbortPolicy 直接抛异常
- CallerRunsPolicy 将任务交给调用者处理
- DiscardPolicy 什么也不做(即任务被丢弃)
- DiscardOldestPolicy 将队列中最早的任务丢弃掉,将当前任务再次尝试交给线程池处理
- 自定义策略实现RejectedExecutionHandler
ThreadPoolExecutor源码解析
ThreadPoolExecutor核心属性
// 核心属性,高3位表示线程池的状态,低29位表示工作线程的个数
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
// 声明了一个常量:COUNT_BITS = 29
private static final int COUNT_BITS = Integer.SIZE - 3;
// 00000000 00000000 00000000 00000001
// 1左移29位
// 0010_0000_0000_0000_0000_0000_0000_0000
// 1左移29位后减一,低29位全为1,
// 0001_1111_1111_1111_1111_1111_1111_1111
// CAPACITY就是当前工作线程能记录的工作线程的最大个数
private static final int CAPACITY = (1 << COUNT_BITS) - 1;
// runState is stored in the high-order bits
// 线程池的状态表示
// 111...0000:代表RUNNING状态,RUNNING可以处理任务,并且处理阻塞队列中的任务
private static final int RUNNING = -1 << COUNT_BITS;
// 000...000:代表SHUTDOWN状态,不会接收新任务,正在处理的任务正常进行,阻塞队列的任务也会做完
private static final int SHUTDOWN = 0 << COUNT_BITS;
// 001...000:代表STOP状态,不会接收新任务,正在处理任务的线程会被中断,阻塞队列的任务一个不管
private static final int STOP = 1 << COUNT_BITS;
// 010...000: 代表TIDYING状态,这个状态是SHUTDOWN或者STOP转换过来的,代表当前线程池马上关闭,就是过渡状态
private static final int TIDYING = 2 << COUNT_BITS;
// 011...000: 代表TERMINATED状态,这个状态是TIDYING状态转换过来的,转换过来只需要执行一个terminated方法
private static final int TERMINATED = 3 << COUNT_BITS;
// Packing and unpacking ctl
// 基于&运算的特点,保证只会拿到ctl高三位的值
private static int runStateOf(int c) { return c & ~CAPACITY; }
// 基于&运算的特点,保证只会拿到ctl低29位的值
private static int workerCountOf(int c) { return c & CAPACITY; }
private static int ctlOf(int rs, int wc) { return rs | wc; }
线程池的状态的特点及转换方式
ThreadPoolExecutor的execute方法
public void execute(Runnable command) {
if (command == null)
throw new NullPointerException();
// 获取核心属性ctl
int c = ctl.get();
if (workerCountOf(c) < corePoolSize) {
// 工作的线程数小于核心线程数, 添加核心工作线程
if (addWorker(command, true))
return;
// 说明线程池状态或者是工作线程个数发生了变化,导致添加失败,重新获取一次ctl
c = ctl.get();
}
//添加核心工作线程失败,走这里的逻辑
// 判断线程池状态是否是RUNNING,如果是,正常基于阻塞队列的offer方法,将任务添加到阻塞队列
if (isRunning(c) && workQueue.offer(command)) {
//如果任务在扔到阻塞队列之前,线程池状态突然改变了,这里重新获取一下状态二次校验
int recheck = ctl.get();
// 如果线程池的状态不是RUNNING,将任务从阻塞队列移除
if (! isRunning(recheck) && remove(command))
// 执行拒绝策略
reject(command);
else if (workerCountOf(recheck) == 0)
// 这里阻塞队列中已经将任务加进去了
// 如果工作线程为0个,需要添加一个非核心工作线程去处理阻塞队列中的任务
addWorker(null, false);
}
// 任务添加到阻塞队列失败,添加非核心线程
else if (!addWorker(command, false))
// 添加非核心线程失败,执行拒绝策略
reject(command);
}
提交任务至线程池的整个逻辑总结如下:
addWorker(Runnable firstTask, boolean core)源码解析:
addWorker方法主要分为两大块:
- 第一块,校验线程池状态及工作线程个数
- 第二块,添加工作线程并启动工作线程
先看校验线程池状态及工作线程个数
private boolean addWorker(Runnable firstTask, boolean core) {
// retry是给外层for循环添加一个标记,是为了方便在内层for循坏跳出外层for循环
retry:
// 外层for循环校验线程池状态
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
// Check if queue empty only if necessary.
// 如果线程池状态不是RUNNING,此时再去判断队列是否为空
if (rs >= SHUTDOWN &&
//如果这三个条件都满足,就代表是要添加非核心工作线程去处理阻塞队列任务
! (rs == SHUTDOWN &&
firstTask == null &&
! workQueue.isEmpty()))
return false;
// 内层for循环校验工作线程个数
for (;;) {
int wc = workerCountOf(c);
// 如果工作线程个数大于最大值了,不可以添加了,返回false
if (wc >= CAPACITY ||
wc >= (core ? corePoolSize : maximumPoolSize))
return false;
// 针对ctl进行 + 1,采用CAS的方式
if (compareAndIncrementWorkerCount(c))
// CAS成功后,直接退出外层循环,代表可以执行添加工作线程操作了
break retry;
c = ctl.get(); // Re-read ctl
//重新判断获取到的ctl中,表示的线程池状态跟之前的是否有区别
// 如果状态不一样,说明有变化,重新的去判断线程池状态
if (runStateOf(c) != rs)
continue retry;
// else CAS failed due to workerCount change; retry inner loop
}
}
// 此处省略添加工作线程及启动工作线程的代码
}
再看添加工作线程及启动工作线程
private boolean addWorker(Runnable firstTask, boolean core) {
// 此处省略线程池状态及工作线程个数的校验代码
boolean workerStarted = false;
boolean workerAdded = false;
Worker w = null;
try {
w = new Worker(firstTask);
final Thread t = w.thread;
//判断Thread是否不为null,在new Worker时,内部会通过给予的ThreadFactory去构建Thread交给Worker
// 一般如果为null,代表ThreadFactory有问题
if (t != null) {
final ReentrantLock mainLock = this.mainLock;
//加锁,保证使用workers成员变量以及对largestPoolSize赋值时,保证线程安全
mainLock.lock();
try {
// Recheck while holding lock.
// Back out on ThreadFactory failure or if
// shut down before lock acquired.
int rs = runStateOf(ctl.get());
// 如果线程池状态是RUNNING
//或者线程池状态为SHUTDOWN,并且firstTask为null,添加非核心工作处理阻塞队列任务
if (rs < SHUTDOWN ||
(rs == SHUTDOWN && firstTask == null)) {
// worker没添加成功之前不能自己启动线程,如果启动了,抛出异常
if (t.isAlive()) // precheck that t is startable
throw new IllegalThreadStateException();
workers.add(w);
int s = workers.size();
// largestPoolSize在记录最大线程个数的记录
// 如果当前工作线程个数,大于最大线程个数的记录,就赋值
if (s > largestPoolSize)
largestPoolSize = s;
// 添加worker成功
workerAdded = true;
}
} finally {
mainLock.unlock();
}
if (workerAdded) {
// 如果添加worker成功则启动worker的线程
t.start();
workerStarted = true;
}
}
} finally {
//做补偿操作,如果工作线程启动失败,将这个添加失败的工作线程处理掉
if (! workerStarted)
addWorkerFailed(w);
}
return workerStarted;
}
工作线程启动失败,需要补偿操作
private void addWorkerFailed(Worker w) {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
if (w != null)
// 如果w不为null,从workers将worker移除
workers.remove(w);
//同时对ctl进行 - 1,代表去掉了一个工作线程个数
decrementWorkerCount();
// 因为工作线程启动失败,判断一下状态的问题,是不是可以走TIDYING状态最终到TERMINATED状态了
tryTerminate();
} finally {
mainLock.unlock();
}
}
ThreadPoolExector的Worker
Worker对象主要包含了两个内容
- 工作线程及线程要执行的任务
- 工作线程可能会被中断,控制中断
private final class Worker
extends AbstractQueuedSynchronizer
implements Runnable
{
/** Thread this worker is running in. Null if factory fails. */
// 线程工厂构建的线程
final Thread thread;
/** Initial task to run. Possibly null. */
// 线程要执行的任务
Runnable firstTask;
/** Per-thread task counter */
// 记录当前工作线程处理完的任务数
volatile long completedTasks;
Worker(Runnable firstTask) {
// 将State设置为-1,代表当前不允许中断线程
setState(-1); // inhibit interrupts until runWorker
this.firstTask = firstTask;
this.thread = getThreadFactory().newThread(this);
}
//当thread执行start方法时,调用的是Worker的run方法
public void run() {
// 调用ThreadPoolExector的runWorker
runWorker(this);
}
protected boolean isHeldExclusively() {
return getState() != 0;
}
protected boolean tryAcquire(int unused) {
if (compareAndSetState(0, 1)) {
setExclusiveOwnerThread(Thread.currentThread());
return true;
}
return false;
}
protected boolean tryRelease(int unused) {
setExclusiveOwnerThread(null);
setState(0);
return true;
}
public void lock() { acquire(1); }
public boolean tryLock() { return tryAcquire(1); }
public void unlock() { release(1); }
public boolean isLocked() { return isHeldExclusively(); }
void interruptIfStarted() {
Thread t;
// 只有Worker中的state >= 0的时候,可以中断工作线程
if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) {
try {
t.interrupt();
} catch (SecurityException ignore) {
}
}
}
}
ThreadPoolExector的runWorker方法
runWorker就是让工作线程拿到任务去执行,并且在内部也处理了在工作线程正常结束和异常结束时的处理方案,并且设计了任务执行前和执行后的钩子函数,钩子函数默认无实现,如果需要在线程池执行任务前后做一些额外的处理,可以重写钩子函数
final void runWorker(Worker w) {
Thread wt = Thread.currentThread();
Runnable task = w.firstTask;
w.firstTask = null;
//将Worker中的state置位0,代表当前线程可以中断的
w.unlock(); // allow interrupts
// 判断工作线程是否是异常结束,默认就是异常结束
boolean completedAbruptly = true;
try {
// 如果第一个任务为null,去阻塞队列中获取任务
while (task != null || (task = getTask()) != null) {
//执行了Worker的lock方法,当前在lock时,shutdown操作不能中断当前线程,因为当前线程正在处理任务
w.lock();
// If pool is stopping, ensure thread is interrupted;
// if not, ensure thread is not interrupted. This
// requires a recheck in second case to deal with
// shutdownNow race while clearing interrupt
// 这里其实就是做了一个事情,如果线程池状态 >= STOP,确保线程中断了
if ((runStateAtLeast(ctl.get(), STOP) ||
(Thread.interrupted() &&
runStateAtLeast(ctl.get(), STOP))) &&
!wt.isInterrupted())
wt.interrupt();
try {
// 前置钩子
beforeExecute(wt, task);
Throwable thrown = null;
try {
// 执行任务
task.run();
} catch (RuntimeException x) {
thrown = x; throw x;
} catch (Error x) {
thrown = x; throw x;
} catch (Throwable x) {
thrown = x; throw new Error(x);
} finally {
// 后置钩子
afterExecute(task, thrown);
}
} finally {
//任务执行完,丢掉任务
task = null;
// 当前工作线程处理的任务数+1
w.completedTasks++;
//执行unlock方法,此时shutdown方法才可以中断当前线程
w.unlock();
}
}
completedAbruptly = false;
} finally {
processWorkerExit(w, completedAbruptly);
}
}
工作线程退出时,执行这个方法
// 工作线程退出时,执行这个方法
private void processWorkerExit(Worker w, boolean completedAbruptly) {
if (completedAbruptly) // If abrupt, then workerCount wasn't adjusted
decrementWorkerCount(); // 如果任务异常结束,扣掉一个工作线程
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
//前工作线程处理的任务个数累加到线程池处理任务的个数属性中
completedTaskCount += w.completedTasks;
// 将工作线程从hashSet中移除
workers.remove(w);
} finally {
mainLock.unlock();
}
// 只要工作线程结束了,查看是不是线程池状态改变
tryTerminate();
int c = ctl.get();
// 如果线程池状态为RUNNING或者SHUTDOWN
if (runStateLessThan(c, STOP)) {
if (!completedAbruptly) {
// 如果任务正常结束
// 如果核心线程允许超时,min = 0,否则就是核心线程个数
int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
if (min == 0 && ! workQueue.isEmpty())
// 如果min == 0,并且阻塞队列非空(有任务没有线程处理)
// 至少要有一个工作线程处理阻塞队列任务
min = 1;
if (workerCountOf(c) >= min)
//如果工作线程个数 大于等于min,不怕没线程处理,正常return
return; // replacement not needed
}
// 异常结束,为了避免出现问题,添加一个空任务的非核心线程来填补上刚刚异常结束的工作线程
addWorker(null, false);
}
}
ThreadPoolExector的getTask方法
工作线程在去阻塞队列获取任务前,要先查看线程池状态
如果状态没问题,去阻塞队列take或者是poll任务
private Runnable getTask() {
//timeOut默认值是false
boolean timedOut = false; // Did the last poll() time out?
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
// Check if queue empty only if necessary.
// 如果线程池状态是STOP,没有必要处理阻塞队列任务,直接返回null
// 如果线程池状态是SHUTDOWN,并且阻塞队列是空的,直接返回null
if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
decrementWorkerCount();
return null;
}
// 拿到工作线程个数
int wc = workerCountOf(c);
// Are workers subject to culling?
// 核心工作线程允许超时或者工作线程个数大于核心线程数,timed为true,后面会用到
boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
if ((wc > maximumPoolSize || (timed && timedOut))
&& (wc > 1 || workQueue.isEmpty())) {
if (compareAndDecrementWorkerCount(c))
return null;
continue;
}
// 从阻塞队列获取任务
try {
// timed 为true 走poll方法,拿任务,等待一会,为false 走take拿任务,死等
// 核心线程不允许超时时就是死等队列的任务,线程不会被回收
Runnable r = timed ?
workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
workQueue.take();
if (r != null)
return r;
// 说明当前线程没拿到任务,将timeOut设置为true,在上面就可以返回null退出了
timedOut = true;
} catch (InterruptedException retry) {
timedOut = false;
}
}
}
ThreadPoolExector的shutdown方法
将线程池状态从RUNNING状态转变为SHUTDOWN
shutdown状态下,不会中断正在干活的线程,而且会处理阻塞队列中的任务
public void shutdown() {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
checkShutdownAccess();
// 里面是一个死循环,将线程池状态修改为SHUTDOWN
advanceRunState(SHUTDOWN);
// 中断空闲线程
interruptIdleWorkers();
onShutdown(); // hook for ScheduledThreadPoolExecutor
} finally {
mainLock.unlock();
}
//尝试结束线程
tryTerminate();
}
ThreadPoolExector的shutdownNow方法
将线程池状态从RUNNING状态转变为STOP
shutdownNow不会处理阻塞队列的任务,将任务全部给你返回了
实际中不要使用
public List<Runnable> shutdownNow() {
List<Runnable> tasks;
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
checkShutdownAccess();
// 里面是一个死循环,将线程池状态修改为STOP
advanceRunState(STOP);
// 直接中断工作线程
interruptWorkers();
// 将阻塞队列的任务全部扔到List集合中
tasks = drainQueue();
} finally {
mainLock.unlock();
}
tryTerminate();
return tasks;
}
使用原则
- 核心参数配置
线程池的使用难度不大,难度在于线程池的参数并不好配置,主要难点在于任务类型无法控制,比如任务有CPU密集型,还有IO密集型,以及混合型,因为IO咱们无法直接控制,所以很多时间按照一些书上提供的一些方法,是无法解决问题的。想调试出一个符合当前任务情况的核心参数(核心线程数,最大线程数,队列容量),最好的方式就是测试。
- 异常处理机制
线程池默认会吞掉任务抛出的异常,需在Runnable/Callable内部通过try-catch捕获异常或重写ThreadPoolExecutor.afterExecute钩子方法处理。
- 线程泄漏预防
1,避免重复创建线程池(如每次请求新建线程池),应复用全局线程池实例,笔者曾在这里犯过错误
2,使用ThreadLocal时需在任务完成后手动清除,防止线程复用导致内存泄漏
- 优雅关闭
调用shutdown()平滑关闭(等待已提交任务完成)
- 线程池隔离
不同类型任务(如高/低优先级、长/短耗时)应使用独立线程池,避免相互影响
- 线程命名与调试
自定义ThreadFactory为线程设置有意义名称,便于日志排查问题