# 1 基本概念
# 1.1 并发、进程、线程
# 1.1.1 并发
并发是指两个或者更多的任务(独立的活动)同时发生(进行):一个程序同时执行多个独立的任务。
以往的计算机通常是单核cpu,某一个时刻只能执行一个任务,此时由操作系统调度实现并发,即每秒钟进行多次所谓的“任务切换”,造成并发的假象,这种切换(上下文切换)存在时间开销,比如操作系统需要保存切换时的各种状态、执行进度等信息,并且切换回来时好需要复原这些信息。
随着硬件的发展,出现了多处理器计算机,用于服务器和高新能计算领域,比如一块芯片上有个核心(cpu):双核、4核、8核等等,它们能实现真正的并行执行多个任务(硬件并发)。
使用并发的目的:可以同时干多个事,提高性能。
# 1.1.2 进程
在了解进程之前,首先需要知道什么叫程序,程序是指令、数据及其组织形式的描述,而进程就是程序的实体。
简单理解,一个可执行程序运行起来了,就叫创建了一个进程。进程就是运行起来的可执行程序。
# 1.1.3 线程
每个进程,都有唯一的一个主线程。执行可执行程序产生一个进程后,这个主线程就随着这个进程默默启动起来了。
线程:是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。
简单理解,线程就是用来执行代码的,可以理解为一条代码的执行通路。
/* 主线程启动时执行main()函数 */
int main()
{
/* 各种代码 */
return 0;
}
/*
* 主线程执行完main()函数return后,表示整个进程允许完毕,
* 此时主线程结束运行,整个进程也结束运行。
*/
主线程由系统创建,除了它之外,可以通过写代码来创建其他线程,其他线程走的是别的道路,甚至去不同的地方。
每创建一个新线程,就可以在同一时刻,多干一个不同的事(多走一条不同的代码执行路径)。
程序中同时运行多个线程时,即实现了并发,但线程并不是越多越好,每个线程,都需要一个独立的堆栈空间,线程之间的切换要保存很多中间状态,会耗费本该属于程序运行的时间。
# 1.2 并发的实现方法
实现并发的手段:
- 通过多个进程实现并发
- 在一个进程中,创建多个线程实现并发
# 1.2.1 多进程并发
- 比如账号服务器一个进程,游戏服务器一个进程,二者之间存在通信;
- 服务器进程之间存在通信,比如同一电脑下的管道,文件,消息队列,共享内存等;不同电脑下的 socket 通信等。
# 1.2.2 多线程并发
线程:感觉像是轻量级的进程。每个进程有自己独立的运行路径,但一个进程中的所有线程共享地址空间(共享内存),全局变量、全局内存、全局引用都可以在线程之间传递,所以多线程开销远远小于多进程,但这也会引入一个新问题:数据一致性问题。
多进程并发和多线程并发可以混合使用,但通常优先考虑多线程技术。
备注:使用多线程并发时,创建线程的数量最大不建议超过 200-300个,至于多少合适,需要根据实际项目情况进行调整,有时线程数量过多反而会导致效率降低。
# 1.2.3 总结
和进程比,线程的优点如下:
- 线程启动速度更快,更轻量级;
- 系统资源开销更少,执行速度更快,比如共享内存这种通信方式比任何其他的通信方式都快。
缺点:使用有一定难度,要小心处理数据的一致性问题。
# 1.3 C++11新标准线程库
以往的多线程代码通常调用系统平台提供的接口实现,不能跨平台运行,比如在 Windows 平台创建线程使用 CreateThread() 接口,但 Linux 平台则使用 pthread_create() 接口。
当然,使用 POSIX thread(pthread)库也可以实现跨平台,但需要在不同的平台上进行配置,用起来也不是特别方便。
从 C++ 11 标准开始,C++语言本身增加了对多线程的支持,意味着增强了可移植性(跨平台),减少了开发人员的工作量。
# 2 C++线程基本用法
# 2.1 线程运行的开始和结束
- 程序运行起来,生成一个进程,该进程所属的主线程开始自动运行;当主线程从main()函数返回,则整个进程执行完毕。
- 主线程从main()开始执行,那么我们自己创建的线程,也需要从一个函数开始运行(初始函数),一旦这个函数运行完毕,线程也结束运行。
- 整个进程是否执行完毕的标志是主线程是否执行完,如果主线程执行完毕就代表整个进程执行完毕了,此时如果其他子线程还没有执行完,也会被强行终止。
准备工作:
- 添加头文件 thread.h。
- 添加 std 命名空间。
- 定义一个线程入口函数。
#include <iostream>
#include <thread>
using namespace std;
/* 线程入口函数 */
void myThreadEntry()
{
cout << "My thread start!!!" << endl;
/* 线程执行代码 */
cout << "My thread end!!!" << endl;
}
# 2.1.1 thread()
创建一个线程对象:
int main()
{
/* 创建一个thread对象, 并以myThreadEntry()作为线程入口函数 */
/* 其中myThreadEntry是可执行对象(函数指针) */
thread newThread(myThreadEntry);
return 0;
}
备注:线程类(thread类)参数是一个可调用对象。一组可执行的语句称为可调用对象,C++中的可调用对象可以是函数、函数指针、lambda表达式、bind创建的对象或者重载了函数调用运算符的类对象。
# 2.1.2 join()
等待线程执行执行完毕:
int main()
{
thread newThread(myThreadEntry);
/* 阻塞主线程,等待子线程执行完毕 */
/* 当myThreadEntry执行完毕,join()就执行完毕,主线程继续往下执行 */
newThread.join();
cout << "Hello World!" << endl;
return 0;
}
输出结果:
My thread start!!!
My thread end!!!
Hello World!
# 2.1.3 detach()
传统多线程程序主线程必须等待子线程执行完毕后,自己才能最终退出,但 C++11 中提供了 detach() 接口,它用于分离主线程和子线程,即主线程不必等待子线程运行结束,主线程是否退出不影响子线程的运行。
一旦 detach() 之后,与主线程关联的thread对象就会失去与主线的关联(变成孤儿),此时这个子线程就会驻留在后台运行,这个子线程就相当于被C++运行时库接管了,当这个子线程运行完成后,由运行时库负责清理该线程相关的资源(守护线程)。
int main()
{
thread newThread(myThreadEntry);
/* 分离主线程与子线程 */
/* 子线程驻留在后台运行,被C++运行时库接管 */
newThread.detach();
cout << "Hello World!" << endl;
cout << "Hello World!" << endl;
cout << "Hello World!" << endl;
cout << "Hello World!" << endl;
cout << "Hello World!" << endl;
cout << "Hello World!" << endl;
cout << "Hello World!" << endl;
cout << "Hello World!" << endl;
cout << "Hello World!" << endl;
cout << "Hello World!" << endl;
return 0;
}
输出结果:
Hello World!
Hello World!
Hello World!
Hello World!
Hello World!
Hello World!
Hello World!
My thread start!!!
Hello World!
My thread end!!!
Hello World!
Hello World!
备注:主线程和子线程分离后,输出结果交替打印,且每次运行的输出结果都不一样。
一旦调用 detach(),就不能对子线程使用 join() 了。detach() 使我们完全失去了对子线程的控制,因此不建议这样用,还是调用 join() 正常等待子线程退出更加安全可靠谱。
# 2.1.4 joinable()
判断是否可以成功使用 join() 或者 detach()。
int main()
{
thread newThread(myThreadEntry);
/* 如果返回true,证明可以调用join()或者detach() */
if (newThread.joinable()) {
cout << "1.joinable() == true" << endl;
} else {
cout << "1.joinable() == false" << endl;
}
newThread.detach();
/* 如果返回false,证明调用过join()或detach(),二者都不能再调用了 */
if (newThread.joinable()) {
cout << "2.joinable() == true" << endl;
} else {
cout << "2.joinable() == false" << endl;
}
return 0;
}
输出结果:
1.joinable() == true
2.joinable() == false
# 2.2 其他创建线程的方法
# 2.2.1 用类
定义一个TA类型,并重载一个无参数的()操作,让其变成一个可调用对象:
#include <iostream>
#include <thread>
using namespace std;
/* 定义TA类 */
class TA {
public:
void operator()() { /* 重载()操作(无参数) */
cout << "My thread start!!!" << endl;
/* 线程执行代码 */
cout << "My thread end!!!" << endl;
}
};
int main()
{
TA ta; /* 声明TA类对象 */
thread newThread(ta); /* ta:可调用对象 */
newThread.join(); /* 等待newThrad执行完毕 */
cout << "Hello World!" << endl;
return 0;
}
输出结果:
My thread start!!!
My thread end!!!
Hello World!
一个使用 detach() 的坑:
#include <iostream>
#include <thread>
using namespace std;
class TA {
public:
int &m_i; /* 定义一个应用 */
TA(int &i) :m_i(i) {} /* 创建TA对象时需传入一个引用值 */
void operator()() {
/* 主线程结束后,局部变量my_i值已被释放 */
/* 而m_i是my_i的引用,此时将产生不可预料的后果 */
cout << "1.m_i = " << m_i << endl;
cout << "2.m_i = " << m_i << endl;
cout << "3.m_i = " << m_i << endl;
cout << "4.m_i = " << m_i << endl;
cout << "5.m_i = " << m_i << endl;
cout << "6.m_i = " << m_i << endl;
}
};
int main()
{
int my_i = 6;
TA ta(my_i); /* 声明TA类对象 */
thread newThread(ta); /* ta:可调用对象 */
newThread.detach(); /* 分离主线程和子线程 */
return 0;
}
问题一:调用detach()分离了主线程与子线程后,它们将分别独立运行,当主线程结束后,,局部变量 my_i 将被回收释放,此时子线程中的 m_i 引用了 my_i,这个值就是个无效的值,无法预料会有什么结果。
问题二:在主线程中,ta也是局部变量,主线程运行完毕,按常理来说,ta对象也被释放了,为什么调用detach()后子线程还能正常运行呢?
首先,主线程运行完毕后,ta对象肯定是不在了,但是这个对象不在了也没关系,因为这个对象实际上是被复制到线程中去的,所以执行完主线程后,ta对象会被销毁,但是所复制的ta对象依旧存在。
只要TA类对象里没有引用、没有指针,那么就不会产生问题。
验证代码:
#include <iostream>
#include <thread>
using namespace std;
class TA {
public:
int &m_i;
TA(int &i) :m_i(i) {
cout << "TA()构造函数被执行" << endl;
}
TA(const TA &ta) :m_i(ta.m_i){
cout << "TA()拷贝构造函数被执行" << endl;
}
~TA(){
cout << "~TA()析构函数被执行" << endl;
}
void operator()() {
cout << "1.m_i = " << m_i << endl;
cout << "2.m_i = " << m_i << endl;
cout << "3.m_i = " << m_i << endl;
cout << "4.m_i = " << m_i << endl;
cout << "5.m_i = " << m_i << endl;
cout << "6.m_i = " << m_i << endl;
}
};
int main()
{
int my_i = 6;
TA ta(my_i); /* 调用TA构造函数 */
thread newThread(ta); /* 调用TA拷贝构造函数 */
newThread.detach(); /* 分离主线程和子线程 */
cout << "Hello World!" << endl;
return 0;
}
输出结果:
TA()构造函数被执行
TA()拷贝构造函数被执行
Hello World!
~TA()析构函数被执行
将 detach() 换成 join() 之后的输出结果:
TA()构造函数被执行
TA()拷贝构造函数被执行
1.m_i = 6
2.m_i = 6
3.m_i = 6
4.m_i = 6
5.m_i = 6
6.m_i = 6
~TA()析构函数被执行
Hello World!
~TA()析构函数被执行
可以看出 join() 中释放了深度拷贝到子线程中的 ta 对象。
# 2.2.2 用lambda表达式
使用lambda表达式创建线程的示例代码如下:
#include <iostream>
#include <thread>
using namespace std;
int main()
{
auto myLamThread = [] {
cout << "My thread start!!!" << endl;
/* 线程执行代码 */
cout << "My thread end!!!" << endl;
};
thread newThread(myLamThread); /* myLamThread:可调用对象 */
newThread.join(); /* 等待线程结束 */
cout << "Hello World!" << endl;
return 0;
}
输出结果:
My thread start!!!
My thread end!!!
Hello World!