iceoryx 附录：C++ 内存模型与原子操作详解 | 极客日志

C++算法

iceoryx 附录：C++ 内存模型与原子操作详解

综述由AI生成档深入讲解 C++11 内存模型与原子操作，重点阐述 acquire/release 语义及 happens-before 关系。内容涵盖六种内存序类型、生产者 - 消费者模式实例、数据竞争防范及 ABA 问题解决方案。结合 iceoryx 中间件实践，分析了引用计数器、通知机制中的内存序选择策略，对比了 relaxed 与 seq_cst 的性能差异。介绍了 ThreadSanitizer 等调试工具，并提供了性能基准测试代码。旨在帮助开发者理解无锁编程原理，优化高性能并发系统。

观心发布于 2026/3/23更新于 2026/4/276K 浏览

附录 A: C++ 内存模型与原子操作详解

在深入 iceoryx 的无锁通知机制之前，我们需要理解 C++ 原子操作和内存序（Memory Order）的概念。

A.1 为什么需要内存序？

问题 1：编译器和 CPU 会重排序指令

// 源代码顺序
int data = 0;
bool ready = false;

void producer(){
    data = 42; // 语句 1
    ready = true; // 语句 2
}

void consumer(){
    if(ready){ // 语句 3
        process(data); // 语句 4
    }
}

可能的问题：

编译器可能将语句 1 和 2 重排序（如果认为它们无依赖）
CPU 也可能乱序执行这两条指令
结果：consumer 看到 ready == true，但 data 仍是 0

A.2 C++ 内存序类型

C++11 引入了 6 种内存序（定义在 <atomic>）：

namespace std {
enum class memory_order{
    memory_order_relaxed,      // 最弱：无同步，仅保证原子性
    memory_order_consume,      // 数据依赖顺序（很少用）
    memory_order_acquire,      // 获取语义（读操作）
    memory_order_release,      // 释放语义（写操作）
    memory_order_acq_rel,      // 获取 + 释放（读 - 修改 - 写）
    memory_order_seq_cst       // 最强：顺序一致性（默认）
};
}

各内存序的语义表

内存序	适用操作	保证	性能	典型用途

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

// ❌ 错误：数据竞争（Data Race）
int data = 0;
bool ready = false;

void producer(){
    data = 42; // 非原子写
    ready = true; // 非原子写
}

void consumer(){
    while(!ready) // 非原子读
        ;
    assert(data == 42); // 可能失败！
}

// ✅ 正确：使用 acquire-release 内存序
std::atomic<int> data{0};
std::atomic<bool> ready{false};

void producer(){
    // 步骤 1：写入数据（使用 relaxed 即可）
    data.store(42, std::memory_order_relaxed);
    // 步骤 2：发布标志（使用 release）
    ready.store(true, std::memory_order_release);
    // ↑ release 语义保证：
    // - 之前的所有写操作（包括 data.store）不会被重排到这条语句之后
    // - 这条写入对执行 acquire 的线程可见时，之前的写入也必然可见
}

void consumer(){
    // 步骤 3：等待标志（使用 acquire）
    while(!ready.load(std::memory_order_acquire))
        ;
    // ↑ acquire 语义保证：
    // - 之后的所有读操作不会被重排到这条语句之前
    // - 能看到 producer 在 release 之前的所有写入
    
    // 步骤 4：读取数据（使用 relaxed 即可）
    int value = data.load(std::memory_order_relaxed);
    assert(value == 42); // ✅ 一定成功！
}

时间	Producer 线程	Consumer 线程	同步效果
T1	`data.store(42, relaxed)`		写入数据
T2	↓ (release 栅栏阻止重排)		🚧 不能跨越
T3	`ready.store(true, release)`		发布标志
T4			⚡ 同步点
T5		`ready.load(acquire)`	获取标志
T6		↓ (acquire 栅栏阻止重排)	🚧 不能跨越
T7		`data.load(relaxed)` → 看到 42	✅ 保证可见

// ✅ 正确：使用默认的 seq_cst（顺序一致性）
std::atomic<int> data{0};
std::atomic<bool> ready{false};

void producer(){
    data.store(42); // 默认 memory_order_seq_cst
    ready.store(true); // 默认 memory_order_seq_cst
    // seq_cst 提供最强保证：所有线程看到相同的操作顺序
}

void consumer(){
    while(!ready.load()) // 默认 memory_order_seq_cst
        ;
    assert(data.load() == 42); // ✅ 一定成功
}

特性	acquire-release（示例 1）	seq_cst（示例 2）
正确性	✅ 保证正确	✅ 保证正确
性能	更快（~20-30% 优势）	较慢
理解难度	需要理解 release/acquire 语义	最简单（全局顺序）
适用场景	性能关键路径	原型开发、复杂逻辑
x86 指令	MOV + 编译器屏障	MOV + MFENCE

// 实际代码位置：iceoryx_posh/source/mepoo/shared_chunk.cpp
class SharedChunk{
private:
    ChunkManagement* m_chunkManagement;

    // 增加引用（订阅者获取 chunk 时）
    void incrementReferenceCounter() noexcept{
        if(m_chunkManagement != nullptr){
            m_chunkManagement->m_referenceCounter.fetch_add(1U, std::memory_order_relaxed);
            // ^^^^^^^^^^^^^^^^^^^^^^^^^
            // relaxed：仅需保证原子性，不需要同步语义
        }
    }

    // 减少引用（订阅者释放 chunk 时）
    void decrementReferenceCounter() noexcept{
        if((m_chunkManagement != nullptr) && (m_chunkManagement->m_referenceCounter.fetch_sub(1U, std::memory_order_relaxed) == 1U)){
            // ^^^^^^^^^^^^^^^^^^^^^^^^^
            // relaxed：仅需保证原子性
            // 当返回值为 1 时，表示这是最后一个引用
            // 回收内存
            MemoryManager::freeChunk(*m_chunkManagement);
            m_chunkManagement = nullptr;
        }
    }
};

方面	iceoryx 的设计	传统设计（如 std::shared_ptr）
数据同步方式	通过 ChunkQueue 的 push/pop 同步	通过引用计数器的 acquire/release 同步
引用计数作用	仅用于跟踪使用者数量	既跟踪数量又同步数据访问
内存序需求	`relaxed` 即可	需要 `acquire`/`release`
性能	更快（~2ns/op）	较慢（~3-5ns/op）

// 传统 shared_ptr：引用计数承担数据同步责任
std::shared_ptr<Data> ptr;
// 线程 1：写数据
ptr = std::make_shared<Data>();
ptr->value = 42;
// ↑ 这个写入通过引用计数的 release 同步到其他线程

// 线程 2：读数据
auto local_ptr = ptr;
// 拷贝时 fetch_add(acquire)
// ↑ 确保能看到 value = 42

// iceoryx：引用计数不承担数据同步责任
// 数据同步由 ChunkQueue 的 push/pop 保证

// 发布者 publisher.loan()
// 获取 chunk，此时引用计数=1.
publish(); // push 到 ChunkQueue（内部使用 release）
// ↑ 这里已经同步了数据

// 订阅者 subscriber.take()
// pop 从 ChunkQueue（内部使用 acquire）
// ↑ 这里已经能看到完整数据
// 然后引用计数 +1

// ❌ 错误示例：试图用引用计数同步数据
std::atomic<int> ref_count{0};
Data* data = nullptr;

void thread1(){
    data = new Data();
    data->value = 42; // 写数据
    ref_count.fetch_add(1, std::memory_order_release); // 需要 release
}

void thread2(){
    while(ref_count.load(std::memory_order_acquire) == 0){}
    // 需要 acquire
    // ↑ 确保能看到 data->value = 42
    process(data->value);
}

// ✅ iceoryx 的做法：用专门的同步机制
ChunkQueue queue;

void publisher(){
    auto chunk = allocate();
    chunk->value = 42; // 写数据
    queue.push(chunk); // push 内部用 release 同步
}

void subscriber(){
    auto chunk = queue.pop(); // pop 内部用 acquire 同步
    // ↑ 确保能看到 chunk->value = 42
    process(chunk->value);
    // 引用计数只用于跟踪有多少订阅者，用 relaxed 即可
}

class ConditionNotifier{
private:
    ConditionVariableData* m_condVarData;
    uint64_t m_notificationIndex;
public:
    void notify() noexcept{
        // release：确保之前的数据写入对等待者可见
        // 具体包括：
        // 1. ChunkQueue::push() 中将 chunk 指针写入队列的操作
        // 2. chunk 指针所指向的共享内存中的实际数据（如 sample->timestamp, sample->value）
        // 3. chunk 的元数据（ChunkManagement、引用计数等）
        // 通过 release-acquire 配对，确保订阅者在看到此标志位为 true 时，
        // 能看到发布者在 push() 之前对 chunk 数据的所有修改
        m_condVarData->m_activeNotifications[m_notificationIndex].store(true, std::memory_order_release);
        
        // relaxed：仅用于快速检测，真正的同步依赖上面的 release 和信号量
        m_condVarData->m_wasNotified.store(true, std::memory_order_relaxed);
        m_condVarData->m_semaphore->post();
    }
};

class ConditionListener{
private:
    ConditionVariableData* m_condVarData;
public:
    bool wasNotified() const noexcept{
        // relaxed：仅用于快速检测是否有通知
        // 真正的同步在 wait() 中通过信号量和 acquire 完成
        return m_condVarData->m_wasNotified.load(std::memory_order_relaxed);
    }
};

发布者线程 订阅者线程
─────────────────────────────────────────────────────────────────
T1: sample->timestamp = 12345
    sample->value = 36.5
    ↓
T2: publisher.loan().publish()
    ↓
T3: ChunkQueue::push(chunk) // 将 chunk 指针写入无锁队列
    ↓
T4: ConditionNotifier::notify()
    ↓
T5: m_activeNotifications[i].store( true, memory_order_release)
───────────────→ [同步点] // release 栅栏：确保 T1-T3 的所有写入
    ↓ // 不会被重排到这条语句之后
    ↓
    ↓
T6: m_semaphore->post()
    ↓
    ↓
╎ T7: m_semaphore->wait() 唤醒
╎ ↓
╎ T8: m_activeNotifications[i].load(
╎     memory_order_acquire)
╎ // acquire 栅栏：确保后续读取
╎ // 不会被重排到这条语句之前
╎ ↓
╎ T9: ChunkQueue::pop()
╎ // 从队列取出 chunk 指针
╎ ↓
╎ T10: 读取 sample->timestamp (看到 12345)
╎     读取 sample->value (看到 36.5)
╎ // ✅ 保证能看到 T1 的写入！

// 发布者线程的完整调用链
void publishData(){
    // 步骤 1：在函数外写入数据
    sample->timestamp = 12345; // ← 这些写入在 notify() 函数外
    sample->value = 36.5;      // ← 但仍被 release 保护！
    
    // 步骤 2：调用 publish
    publisher.publish();
    ↓
    ChunkQueue::push(chunk);   // ← 这里的写入也被保护
    ↓
    ConditionNotifier::notify(){
        // 步骤 3：release 操作
        m_activeNotifications[i].store(true, memory_order_release);
        // ^^^^^^^^^^^^^^^^^^^^^^^
        // 这个 release 是当前线程的"栅栏"：
        // - 阻止**所有之前的写入**（包括步骤 1、2）被重排到这里之后
        // - 不仅仅是函数内的语句，而是整个线程执行流的所有写入
    }
}

内存序	作用范围	保护对象
`release`	当前线程的所有之前操作	所有在此之前执行的写入，无论在哪个函数
`acquire`	当前线程的所有之后操作	所有在此之后执行的读取，无论在哪个函数

仓库操作（发布者线程）：
1. [上午] 打包商品 A ← 在 notify() 函数外
2. [中午] 打包商品 B ← 在 ChunkQueue::push() 中
3. [下午] 打包商品 C ← 在 notify() 函数内
4. [傍晚] 发货确认（release）← notify() 中的 release 操作

客户收货（订阅者线程）：
5. [第二天] 收到发货通知（acquire）
6. [第二天] 拆箱验货 ← 保证看到所有商品 A、B、C

关键点：发货确认（release）保证了**之前所有打包操作**对客户可见，
不管这些操作是在仓库的哪个区域（哪个函数）完成的。

// 源代码顺序
sample->value = 36.5; // 语句 1（在 notify 外）
ChunkQueue::push(chunk); // 语句 2（在 notify 外）
notify(){
    m_active[i].store( // 语句 3（release）
        true, memory_order_release);
}

// 没有 release 时，编译器/CPU 可能重排为：
// 语句 3 // 先设置标志
// 语句 1 // 后写数据 ← 错误！订阅者可能看到标志但看不到数据
// 语句 2

// 有 release 时，保证顺序：
// 语句 1 // 必须在 release 之前
// 语句 2 // 必须在 release 之前
// 语句 3 // release 栅栏：之前的所有写入不能跨越到这里之后

// 可以在任何位置写入数据，release 都能保护
void example(){
    int data = 0;
    std::atomic<bool> flag{false};
    
    std::thread t1([&](){
        data = 42; // 写入 1：在很早的地方
        doSomeWork(); // 中间可能有很多操作
        doMoreWork();
        flag.store(true, memory_order_release); // release 栅栏
        // release 保证：data=42 不会被重排到 flag.store 之后
        // 无论 data=42 在函数的哪个位置，在哪个调用栈深度
    });
    
    std::thread t2([&](){
        while(!flag.load(memory_order_acquire)) // acquire
            ;
        assert(data == 42); // ✅ 必然成功！
        // 因为 acquire 看到 flag==true 时，
        // release 之前的所有写入（包括 data=42）都可见
    });
    
    t1.join();
    t2.join();
}

// 实际应用：一个订阅者监听多个发布者
WaitSet waitset;
waitset.attachEvent(subscriber1); // 事件源 #0
waitset.attachEvent(subscriber2); // 事件源 #1
waitset.attachEvent(subscriber3); // 事件源 #2
// ... 可能有几十个甚至上百个事件源

// 订阅者等待："哪些源有新数据？"
auto notificationVector = waitset.wait();
// 返回所有有通知的源

concurrent::Atomic<bool> m_activeNotifications[128];

// 每次检查都要遍历整个数组
bool hasNotification(){
    for(int i = 0; i < 128; i++){
        if(m_activeNotifications[i].load(memory_order_acquire)){
            return true;
        }
    }
    return false; // 遍历完了，没有任何通知
}

// 全局快速检测标志（只用 1 位）
concurrent::Atomic<bool> m_wasNotified{false};

// 精确的通知源数组（128 位）
concurrent::Atomic<bool> m_activeNotifications[128];

bool hasNotification(){
    // 第一级过滤：快速检查（1ns，relaxed）
    if(!m_wasNotified.load(memory_order_relaxed)){
        return false; // 快速返回：肯定没有通知
    }
    
    // 第二级检查：精确定位（只在可能有通知时执行）
    for(int i = 0; i < 128; i++){
        if(m_activeNotifications[i].load(memory_order_acquire)){
            return true;
        }
    }
    return false;
}

变量	职责	内存序	作用
`m_wasNotified`	全局标志	`relaxed`	"有没有任何通知"（不关心是哪个源）快速过滤，避免遍历数组
`m_activeNotifications[i]`	位图索引	`release/acquire`	"哪个源发出了通知"（精确定位）建立同步关系，确保数据可见性

// 发布者端（源 #5 发送通知）
void notify(){
    // 步骤 1：设置精确位（release）—— 这是同步点！
    m_activeNotifications[5].store(true, std::memory_order_release);
    // ↑ 确保之前的数据写入（chunk->data = 42）对订阅者可见
    
    // 步骤 2：设置全局标志（relaxed）—— 这只是性能提示
    m_wasNotified.store(true, std::memory_order_relaxed);
    // ↑ 可以不准确，不影响正确性
    
    // 步骤 3：唤醒等待者
    m_semaphore->post();
}

// 订阅者端
void checkForNotifications(){
    // 快速过滤（relaxed，1ns）
    if(!m_wasNotified.load(memory_order_relaxed)){
        return; // 快速退出：肯定没有通知
    }
    
    // 精确检查（acquire，512ns）
    for(int i = 0; i < 128; i++){
        if(m_activeNotifications[i].load(memory_order_acquire)){
            // ↑ acquire 与发布者的 release 配对
            // 确保能看到 chunk->data = 42
            processNotification(i);
        }
    }
}

// 场景 1：m_wasNotified 误读为 false（漏掉通知）
if(!m_wasNotified.load(memory_order_relaxed)){
    return; // 错过了这次通知
}
// 没关系！因为：
// 1. 信号量会唤醒我们（不会永久阻塞）
// 2. 下次循环会再次检查
// 3. m_activeNotifications[i] (acquire) 保证最终正确性

// 场景 2：m_wasNotified 误读为 true（误报）
if(m_wasNotified.load(memory_order_relaxed)){
    // 遍历数组...发现实际没有通知
}
// 也没关系！只是多做了一次检查（性能损失小）

订阅者每次循环检查
↓
┌──────────────────────┐
│ 第一级：粗粒度过滤 │ ← m_wasNotified (relaxed, 1ns)
│ "可能有通知吗？" │
└──────────────────────┘
↓ No (99%) 直接返回 ←────────── 省下 500ns！
↓ Yes (1%)
┌──────────────────────┐
│ 第二级：精细检查 │ ← m_activeNotifications (acquire, 512ns)
│ "哪些源通知了？" │
└──────────────────────┘
↓
处理通知

方案	有通知时开销	无通知时开销	平均开销	CPU 占用	性能提升
只用数组（方案 A）	512ns	512ns	512ns	51.2%	基准
双层过滤（方案 B）	512ns	1ns	6ns	0.6%	85x

// ❌ 错误：存在数据竞争
class UnsafeQueue{
    uint32_t m_size = 0; // 非原子
public:
    void push(Chunk* chunk){
        // 线程 A：读 m_size
        if(m_size < capacity){
            // 线程 B 可能同时修改 m_size
            m_size++; // 数据竞争！
        }
    }
};

// ✅ 正确：使用原子操作
class SafeQueue{
    std::atomic<uint32_t> m_size{0};
public:
    void push(Chunk* chunk){
        uint32_t oldSize = m_size.load(std::memory_order_relaxed);
        if(oldSize < capacity){
            // 使用 compare_exchange 避免竞争
            while(!m_size.compare_exchange_weak(
                oldSize, oldSize + 1, std::memory_order_release, std::memory_order_relaxed)){
                if(oldSize >= capacity) break;
            }
        }
    }
};

时刻 T0：线程 A 读取指针 ptr，值为 A
时刻 T1：线程 B 将 ptr 改为 B
时刻 T2：线程 B 又将 ptr 改回 A（可能是不同的对象，但地址相同）
时刻 T3：线程 A 执行 compare_exchange(ptr, A, C)
↑ 成功！但实际上 A 已经不是原来的 A

// ❌ 错误：存在 ABA 问题
struct Node{
    int value;
    Node* next;
};

class LockFreeStack{
    std::atomic<Node*> m_head;
public:
    bool pop(int& result){
        Node* oldHead = m_head.load(std::memory_order_acquire);
        if(!oldHead) return false;
        
        Node* newHead = oldHead->next;
        // 问题：oldHead 可能已被删除又重新分配到相同地址
        if(m_head.compare_exchange_strong(oldHead, newHead, std::memory_order_release, std::memory_order_acquire)){
            result = oldHead->value;
            delete oldHead; // 危险！可能 double-free
            return true;
        }
        return false;
    }
};

// ✅ 解决：使用版本号
struct TaggedPointer{
    Node* ptr;
    uint64_t tag; // 版本号
};

class SafeLockFreeStack{
    std::atomic<TaggedPointer> m_head;
public:
    bool pop(int& result){
        TaggedPointer oldHead = m_head.load(std::memory_order_acquire);
        if(!oldHead.ptr) return false;
        
        TaggedPointer newHead;
        newHead.ptr = oldHead.ptr->next;
        newHead.tag = oldHead.tag + 1; // 递增版本号
        
        // 即使地址相同，版本号不同也会失败
        if(m_head.compare_exchange_strong(oldHead, newHead, std::memory_order_release, std::memory_order_acquire)){
            result = oldHead.ptr->value;
            delete oldHead.ptr;
            return true;
        }
        return false;
    }
};

// ✅ 解决：使用风险指针（简化版）
class HazardPointer{
    static thread_local Node* s_hazardPtr;
public:
    static void protect(Node* ptr){
        s_hazardPtr = ptr;
        std::atomic_thread_fence(std::memory_order_seq_cst);
    }
    static void clear(){
        s_hazardPtr = nullptr;
    }
    static bool isProtected(Node* ptr){
        return s_hazardPtr == ptr;
    }
};

class SaferLockFreeStack{
    std::atomic<Node*> m_head;
public:
    bool pop(int& result){
        while(true){
            Node* oldHead = m_head.load(std::memory_order_acquire);
            if(!oldHead) return false;
            
            // 标记为"正在使用"
            HazardPointer::protect(oldHead);
            
            // 重新检查（可能已被其他线程修改）
            if(m_head.load(std::memory_order_acquire) != oldHead){
                continue; // 重试
            }
            
            Node* newHead = oldHead->next;
            if(m_head.compare_exchange_strong(oldHead, newHead, std::memory_order_release, std::memory_order_acquire)){
                result = oldHead->value;
                HazardPointer::clear(); // 安全删除（确保无其他线程使用）
                safeDelete(oldHead);
                return true;
            }
        }
    private:
        void safeDelete(Node* node){
            if(!HazardPointer::isProtected(node)){
                delete node;
            } else {
                // 延迟删除
                m_retireList.push(node);
            }
        }
    };
};

// iceoryx 的设计
class ChunkManagement{
    // 1. 内存池：Chunk 地址在生命周期内不变
    MemPool m_mempool;
    
    // 2. 引用计数：确保使用中的 Chunk 不被回收
    std::atomic<uint32_t> m_referenceCounter;
    
    // 3. 序列号：检测 Chunk 重用
    std::atomic<uint64_t> m_sequenceNumber;
public:
    bool isValid(uint64_t expectedSequence) const{
        // 检查序列号，防止访问已回收的 Chunk
        return m_sequenceNumber.load(std::memory_order_acquire) == expectedSequence;
    }
};

#include <atomic>
#include <chrono>
#include <iostream>

constexpr uint64_t ITERATIONS = 100'000'000;

void benchmark_relaxed(){
    std::atomic<uint64_t> counter{0};
    auto start = std::chrono::high_resolution_clock::now();
    for(uint64_t i = 0; i < ITERATIONS; ++i){
        counter.fetch_add(1, std::memory_order_relaxed);
    }
    auto end = std::chrono::high_resolution_clock::now();
    auto duration = std::chrono::duration_cast<std::chrono::nanoseconds>(end - start).count();
    std::cout << "relaxed: " << duration / ITERATIONS << " ns/op\n";
}

void benchmark_seq_cst(){
    std::atomic<uint64_t> counter{0};
    auto start = std::chrono::high_resolution_clock::now();
    for(uint64_t i = 0; i < ITERATIONS; ++i){
        counter.fetch_add(1, std::memory_order_seq_cst);
    }
    auto end = std::chrono::high_resolution_clock::now();
    auto duration = std::chrono::duration_cast<std::chrono::nanoseconds>(end - start).count();
    std::cout << "seq_cst: " << duration / ITERATIONS << " ns/op\n";
}

relaxed: ~2 ns/op
acquire: ~3 ns/op
release: ~3 ns/op
seq_cst: ~5 ns/op

场景	推荐内存序	理由
简单计数器（无依赖）	`relaxed`	最快，仅需原子性
发布数据	`release` (写) + `acquire` (读)	平衡性能与正确性
锁实现	`acquire` (加锁) + `release` (解锁)	标准做法
不确定/复杂场景	`seq_cst`	最安全，易推理
引用计数递减	`acq_rel` (fetch_sub)	读 - 修改 - 写操作

# 编译时启用 TSan
g++ -fsanitize=thread -g my_code.cpp -o my_program

# 运行
./my_program

# 输出示例
================== WARNING: ThreadSanitizer: data race (pid=12345)
Write of size 4 at 0x7fff12345678 by thread T1:
#0 producer() my_code.cpp:42
Previous read of size 4 at 0x7fff12345678 by main thread:
#0 consumer() my_code.cpp:58

valgrind --tool=helgrind ./my_program

// 验证内存序的影响
void test_memory_order(){
    std::atomic<int> x{0}, y{0};
    
    std::thread t1([&](){
        x.store(1, std::memory_order_relaxed); // 测试不同内存序
        y.store(1, std::memory_order_relaxed);
    });
    
    std::thread t2([&](){
        while(y.load(std::memory_order_relaxed) == 0){}
        assert(x.load(std::memory_order_relaxed) == 1); // 可能失败！
    });
    
    t1.join();
    t2.join();
}

iceoryx 附录：C++ 内存模型与原子操作详解

附录 A: C++ 内存模型与原子操作详解

A.1 为什么需要内存序？

A.2 C++ 内存序类型

更多推荐文章

相关免费在线工具

A.3 实例：生产者 - 消费者

A.4 iceoryx 中的内存序使用

引用计数器（Reference Counter）

通知机制（Notification Mechanism）

A.5 数据竞争（Data Race）

A.6 ABA 问题

A.7 内存序性能对比

A.8 调试内存序问题的工具

A.9 小节总结

A.9 参考资料

标准文档

深入阅读

实践指南

iceoryx 相关

工具文档

更多推荐文章

相关免费在线工具

iceoryx 附录：C++ 内存模型与原子操作详解

附录 A: C++ 内存模型与原子操作详解

A.1 为什么需要内存序？

A.2 C++ 内存序类型

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

A.3 实例：生产者 - 消费者

A.4 iceoryx 中的内存序使用

引用计数器（Reference Counter）

通知机制（Notification Mechanism）

A.5 数据竞争（Data Race）

A.6 ABA 问题

A.7 内存序性能对比

A.8 调试内存序问题的工具

A.9 小节总结

A.9 参考资料

标准文档

深入阅读

实践指南

iceoryx 相关

工具文档

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具