C++ 并发：内存序、可见性与指令重排 | 极客日志

C++

C++ 并发：内存序、可见性与指令重排

探讨 C++ 并发编程中的内存模型核心概念。内容涵盖 CPU 缓存一致性、指令重排机制以及 C++11 内存模型下的 happens-before 关系。详细解析了 std::atomic 的不同 memory_order 语义（relaxed, acquire, release, seq_cst），并通过双重检查锁定等实战案例说明如何正确使用原子变量避免数据竞争。文章还介绍了性能考量、调试工具（如 TSan）及工程实践清单，旨在帮助开发者编写高效且安全的并发代码。

忘忧发布于 2026/3/30更新于 2026/7/2053 浏览

C++ 并发：内存序、可见性与指令重排

本文面向有一定 C++ 并发基础的读者（知道线程、互斥量、基本的 std::atomic 用法），但想把'为什么这样'弄清楚。我们会从 std::atomic 的语义出发，讲清 CPU cache coherence、内存屏障（fence）、指令重排 和 happens-before 的关系——不是空洞的定义，而是大量实战例子、容易踩的坑和调试技巧。

1. 为什么要理解内存模型？一个小实验

先给你一个看起来简单但会'出错'的例子：

int x = 0, y = 0;
void thread1(){
    x = 1; // A
    int r1 = y; // B
}
void thread2(){
    y = 1; // C
    int r2 = x; // D
}

直觉会告诉你 r1 == 0 && r2 == 0 不可能同时成立：因为若两个线程都先写后读，总有一个先写早于另一个后读。但在现实的多核处理器上，如果没有同步，两个读取同时得到 0 是可能的——因为写入对其他核可见需要时间，或编译器/CPU 做了重排。

这就是为什么我们不能把并发程序的正确性只交给直觉：你需要明确'一个操作对另一个操作是否可见'的约定，也就是 happens-before。

2. 可见性、顺序与一致性：先把名词搞清楚

三个最常见的术语：

可见性（visibility）：一个线程对某个内存写入何时能被另一个线程观察到。
顺序（ordering）：在执行流中的操作顺序，分为程序顺序（程序编写的顺序）、一致顺序（在某种语义下保证的顺序）。
一致性（consistency）：当多线程都观察到内存时，是否满足我们期待的全局一致性（例如线性一致性/顺序一致性）。

硬件保证的通常是 缓存一致性（cache coherence）——同一地址的不同副本（存在于多个 cache 层）最终会保持一致。但这并不自动保证操作间的全局顺序性，也不防止编译器在不破坏单线程语义的前提下重排指令。

3. CPU 的缓存一致性（cache coherence）到底保不保底？

现代多核 CPU 通常实现 MESI（或其变体）协议来维护缓存一致性。

MESI（Modified, Exclusive, Shared, Invalid）定义了缓存行在不同核心缓存间的状态转换，保证写入最终传播到其他核心。换句话说，CPU 层面把'同一地址不会无限分歧'这一事保证住了。

重要的限制：

Cache coherence 是对单个内存地址的保证，而不是多个地址间的原子复合保证；
它并不提供跨地址的全序写可见性；也不约束指令重排。

举例：当线程 A 在地址 p 写 1，线程 B 立刻读，并不一定马上得到 1；缓存一致性保证最终能看到 1，但在没有内存屏障或原子操作的情况下'最终'可能对短时间窗口无保证。

相关免费在线工具

Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online
JSON美化和格式化
将JSON字符串修饰为友好的可读格式。在线工具，JSON美化和格式化在线工具，online

p

a = 1;
int t = b;

std::atomic<int> x{0}, y{0};
int r1 = 0, r2 = 0;
// Thread 1
x.store(1, std::memory_order_relaxed);
r1 = y.load(std::memory_order_relaxed);
// Thread 2
y.store(1, std::memory_order_relaxed);
r2 = x.load(std::memory_order_relaxed);

Singleton* instance = nullptr;
Singleton* get(){
    if(instance == nullptr){
        std::lock_guard<std::mutex> lk(mutex);
        if(instance == nullptr) instance = new Singleton();
    }
    return instance;
}

std::atomic<Singleton*> inst{nullptr};
Singleton* get(){
    Singleton* tmp = inst.load(std::memory_order_acquire);
    if(tmp == nullptr){
        std::lock_guard<std::mutex> lk(mutex);
        tmp = inst.load(std::memory_order_relaxed);
        if(tmp == nullptr){
            tmp = new Singleton();
            inst.store(tmp, std::memory_order_release);
        }
    }
    return tmp;
}

C++ 并发：内存序、可见性与指令重排

C++ 并发：内存序、可见性与指令重排

1. 为什么要理解内存模型？一个小实验

2. 可见性、顺序与一致性：先把名词搞清楚

3. CPU 的缓存一致性（cache coherence）到底保不保底？

更多推荐文章

相关免费在线工具

4. 指令重排：编译器与 CPU 的双重魔术

5. C++ 内存模型与 `std::atomic`：happens-before 是怎样建立的

6. `memory_order` 详解：relaxed / acquire / release / seq_cst

7. 内存屏障（fence）的作用与实现

8. 实战：双重检查锁定（DCLP）与原子变量

9. 常见坑与误解（实例与修复）

坑 1：错误地以为 `atomic` 保证顺序

坑 2：不当使用 `memory_order_relaxed`

坑 3：误用 `seq_cst` 以为一劳永逸

坑 4：把 `std::atomic<T>` 当作'更快的锁'来替代锁

10. 性能考量：何时用原子，何时用锁

11. 调试并发问题的工具与方法

12. 工程实践清单与 Code Review 检查点

13. 总结：把并发从'神秘'变成'可管理'

更多推荐文章

相关免费在线工具

C++ 并发：内存序、可见性与指令重排

C++ 并发：内存序、可见性与指令重排

1. 为什么要理解内存模型？一个小实验

2. 可见性、顺序与一致性：先把名词搞清楚

3. CPU 的缓存一致性（cache coherence）到底保不保底？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4. 指令重排：编译器与 CPU 的双重魔术

5. C++ 内存模型与 std::atomic：happens-before 是怎样建立的

6. memory_order 详解：relaxed / acquire / release / seq_cst

7. 内存屏障（fence）的作用与实现

8. 实战：双重检查锁定（DCLP）与原子变量

9. 常见坑与误解（实例与修复）

坑 1：错误地以为 atomic 保证顺序

坑 2：不当使用 memory_order_relaxed

坑 3：误用 seq_cst 以为一劳永逸

坑 4：把 std::atomic<T> 当作'更快的锁'来替代锁

10. 性能考量：何时用原子，何时用锁

11. 调试并发问题的工具与方法

12. 工程实践清单与 Code Review 检查点

13. 总结：把并发从'神秘'变成'可管理'

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

5. C++ 内存模型与 `std::atomic`：happens-before 是怎样建立的

6. `memory_order` 详解：relaxed / acquire / release / seq_cst

坑 1：错误地以为 `atomic` 保证顺序

坑 2：不当使用 `memory_order_relaxed`

坑 3：误用 `seq_cst` 以为一劳永逸

坑 4：把 `std::atomic<T>` 当作'更快的锁'来替代锁