关于线程阻塞的问题，留着看了

2024-11-25 来源：个人技术集锦

线程在执行中如果遇到（I/O 操作）如磁盘读写或网络通信，通常要耗费较长的时间，这时会剥夺这个线程的 CPU 控制权，使其暂停执行，同时将资源让给其他的工作线程，这种线程调度方式称为阻塞。当 I/O 操作完毕时，操作系统将这个线程的阻塞状态解除，恢复其对CPU的控制权，令其继续执行。这种 I/O 模式就是通常的同步式 I/O（Synchronous I/O）或阻塞式 I/O（Blocking I/O）。

非阻塞

非阻塞是这样定义的，当线程遇到 I/O 操作时，不会以阻塞的方式等待 I/O 操作的完成或数据的返回，而只是将 I/O 请求发送给操作系统，继续执行下一条语句。当操作系统完成 I/O 操作时，以事件的形式通知执行 I/O 操作的线程，线程会在特定时候处理这个事件。

对比阻塞与非阻塞

阻塞模式下，一个线程只能处理一项任务，要想提高吞吐量必须通过多线程。

非阻塞模式下，一个线程永远在执行计算操作，这个线程所使用的 CPU 核心利用率永远是 100%，I/O 以事件的方式通知。

在阻塞模式下，多线程往往能提高系统吞吐量，因为一个线程阻塞时还有其他线程在工作，多线程可以让 CPU 资源不被阻塞中的线程浪费。

而在非阻塞模式下，线程不会被 I/O 阻塞，永远在利用 CPU。多线程带来的好处仅仅是在多核 CPU 的情况下利用更多的核。

同步和异步、阻塞和非阻塞这是两组概念，说的是不同的事情，同步和阻塞没有必然的联系，异步和非阻塞也没有必然的联系。同步和异步是只跟IO操作过程中进程的状态变化有关。阻塞和非阻塞就是进程的两种状态。比如你去银行，排除的话就是一种同步的方式，叫号的话就是异步的方式。排队必须自己看着什么时候轮到自己，而叫号则不必，轮到你的时候会触发一个事件，或者说你会收到一个信号，别人会叫你。不管是排除还是叫号，如果你在等待的过程中不能做其他事情，那就是阻塞模式，否则就是非阻塞模式。同步的时候可以有阻塞和非阻塞，异步的时候也可以有阻塞和非阻塞。

阻塞 I/O

Linux下的I/O操作默认是阻塞I/O，即open和socket创建的I/O都是阻塞I/O。当读写操作没有完成时，函数就不会返回，进程一直阻塞在那里。

非阻塞I/O

非阻塞模式的使用并不普遍，因为非阻塞模式会浪费大量的CPU资源。

网络编程时listen,recvfrom,connect都会引起阻塞。非阻塞IO通常应用于网络编程中，IO请求时加上O_NONBLOCK一类的标志位，函数立刻返回，IO没有就绪会返回错误，需要请求进程主动轮询不断发IO请求直到返回正确
比如调用recvfrom时，如果系统还没有接收到网络数据，内核马上返回一个 EWOULDBLOCK的错误。

当一个应用程序使用了非阻塞模式的套接字，它需要使用一个循环来不停地测试是否一个文件描述符有数据可读(称做 polling(轮询))。应用程序不停的 polling 内核来检查是否 I/O操作已经就绪。这将是一个极浪费 CPU资源的操作。这种模式使用中不是很普遍。

I/O多路复用

针对批量IP操作时，使用I/O多路复用，非常有好。

在使用 I/O 多路技术的时候，我们调用 select()函数和 poll()函数或epoll函数(2.6内核开始支持)，在调用它们的时候阻塞。

当我们调用 select函数阻塞的时候，select 函数等待数据报套接字进入读就绪状态。当select函数返回的时候，也就是套接字可以读取数据的时候。这时候我们就可以调用 recvfrom函数来将数据拷贝到我们的程序缓冲区中。

IO复用同非阻塞IO本质一样，不过利用了新的select系统调用，由内核来负责本来是请求进程该做的轮询操作。看似比非阻塞IO还多了一个系统调用开销，不过因为可以支持多路IO，才算提高了效率。多路复用的高级之处在于: 它能同时等待多个文件描述符，而这些文件描述符（套接字描述符）其中的任意一个进入读就绪状态，select()函数就可以返回。

异步I/O

当我们运行在异步 I/O 模式下时，我们如果想进行 I/O 操作，只需要告诉内核我们要进行 I/O 操作，然后内核会马上返回。具体的 I/O 和数据的拷贝全部由内核来完成，我们的程序可以继续向下执行。当内核完成所有的 I/O 操作和数据拷贝后，内核将通知我们的程序。

还有一个生动的例子解释同步、异步、阻塞和非阻塞：http://www.cnblogs.com/jogger/archive/2012/09/27/2705386.html