Linux内核中的内存屏障详解

张

张建站

2026/4/11 22:38:08

10分钟阅读

Linux内核中的内存屏障详解引言内存屏障Memory Barrier是Linux内核中用于解决内存操作重排序问题的重要机制。在多处理器系统中CPU可能会对内存操作进行重排序以提高性能但这可能导致并发代码出现不可预期的行为。本文将深入探讨内存屏障的原理、类型和应用。内存重排序1. 重排序的原因编译器优化编译器为了提高性能会对指令进行重排序CPU执行优化CPU的乱序执行和流水线技术缓存一致性多处理器系统中的缓存同步延迟2. 重排序的影响// 可能的重排序问题 int a 0, b 0; int x, y; // 线程1 void thread1(void) { a 1; // 操作1 y b; // 操作2 } // 线程2 void thread2(void) { b 1; // 操作3 x a; // 操作4 } // 可能的结果x0, y0 // 这在顺序执行中是不可能的3. 内存序模型强内存序所有操作按程序顺序执行弱内存序允许一定程度的重排序宽松内存序最大程度的重排序内存屏障类型1. 编译屏障编译屏障防止编译器对指令进行重排序。#include linux/compiler.h // 编译屏障 barrier(); // GCC内建函数 __asm__ __volatile__ ( ::: memory);2. 内存屏障内存屏障防止CPU对内存操作进行重排序。#include linux/kernel.h // 通用内存屏障 mb(); // 写内存屏障 wmb(); // 读内存屏障 rmb(); // 数据依赖屏障 read_barrier_depends();3. SMP屏障#include linux/smp.h // SMP内存屏障 smp_mb(); smp_wmb(); smp_rmb(); smp_read_barrier_depends();原子操作与内存屏障1. 原子操作中的内存屏障#include linux/atomic.h // 带内存屏障的原子操作 atomic_t v ATOMIC_INIT(0); // 带内存屏障的操作 atomic_set(v, 42); // 隐含写屏障 int val atomic_read(v); // 隐含读屏障 atomic_add(1, v); // 隐含全屏障 // 不带内存屏障的操作 atomic_set_release(v, 42); // 仅写屏障 val atomic_read_acquire(v); // 仅读屏障2. 内存序参数// C11原子操作 #include stdatomic.h atomic_int v; // 内存序 atomic_store_explicit(v, 42, memory_order_release); int val atomic_load_explicit(v, memory_order_acquire);内存屏障的应用1. 锁的实现struct spinlock { atomic_t lock; }; void spin_lock(struct spinlock *lock) { while (atomic_xchg(lock-lock, 1)) ; smp_mb(); // 确保后续操作在锁获取后执行 } void spin_unlock(struct spinlock *lock) { smp_mb(); // 确保之前操作在锁释放前完成 atomic_set(lock-lock, 0); }2. 无锁数据结构struct node { int value; struct node *next; }; struct node *head; void push(int value) { struct node *new_node kmalloc(sizeof(*new_node), GFP_KERNEL); new_node-value value; smp_wmb(); // 确保数据初始化在指针更新前完成 new_node-next head; while (!atomic_compare_exchange_strong( (atomic_t *)head, (unsigned long *)new_node-next, (unsigned long)new_node)) ; } int pop(void) { struct node *old_head, *new_head; int value; do { old_head head; if (!old_head) return -1; smp_rmb(); // 确保指针读取在数据读取前完成 value old_head-value; new_head old_head-next; } while (!atomic_compare_exchange_strong( (atomic_t *)head, (unsigned long *)old_head, (unsigned long)new_head)); kfree(old_head); return value; }3. RCU实现struct rcu_data { struct rcu_head *head; }; void rcu_read_lock(void) { smp_read_barrier_depends(); } void rcu_read_unlock(void) { smp_mb(); } void synchronize_rcu(void) { // 等待宽限期 smp_mb(); }内存屏障的性能影响1. 性能开销编译屏障几乎无开销内存屏障会导致CPU流水线刷新有一定开销SMP屏障在多处理器系统中有开销2. 优化策略最小化屏障使用只在必要时使用内存屏障选择合适的屏障类型根据需要选择读/写/全屏障利用原子操作原子操作通常隐含适当的内存屏障3. 性能测试# 测试不同屏障的性能 time ./barrier_test # 分析屏障开销 perf stat -e cycles,instructions ./barrier_test实际案例分析1. 内核中的内存屏障// 网络协议栈 void netif_rx(struct sk_buff *skb) { smp_mb(); // 确保skb初始化完成 // 处理skb... } // 块设备驱动 void blk_start_request(struct request *req) { smp_wmb(); // 确保请求设置完成 // 开始IO... } // 进程调度 void schedule(void) { smp_mb(); // 确保调度前状态更新 // 调度... }2. 自定义内存屏障应用#include linux/module.h #include linux/kernel.h #include linux/init.h #include linux/kthread.h #include linux/sched.h #include linux/smp.h static int a 0, b 0; static int x, y; static struct task_struct *thread1, *thread2; static int thread1_func(void *data) { a 1; smp_wmb(); // 防止写重排序 y b; printk(KERN_INFO Thread1: y %d\n, y); return 0; } static int thread2_func(void *data) { b 1; smp_wmb(); // 防止写重排序 x a; printk(KERN_INFO Thread2: x %d\n, x); return 0; } static int __init barrier_demo_init(void) { printk(KERN_INFO Barrier demo starting\n); thread1 kthread_run(thread1_func, NULL, thread1); thread2 kthread_run(thread2_func, NULL, thread2); wait_for_completion(thread1-completion); wait_for_completion(thread2-completion); printk(KERN_INFO Final values: x %d, y %d\n, x, y); return 0; } static void __exit barrier_demo_exit(void) { printk(KERN_INFO Barrier demo exiting\n); } module_init(barrier_demo_init); module_exit(barrier_demo_exit); MODULE_LICENSE(GPL); MODULE_AUTHOR(Demo); MODULE_DESCRIPTION(Memory barrier demo);结论内存屏障是Linux内核中解决并发问题的重要工具它通过防止内存操作的重排序确保了多线程代码的正确性。理解内存屏障的原理和使用方法对于开发高性能、可靠的并发代码至关重要。在实际应用中应该根据具体场景选择合适的内存屏障类型以平衡正确性和性能。

CompressO 3大突破：告别臃肿文件，5分钟掌握高效压缩

CompressO 3大突破：告别臃肿文件，5分钟掌握高效压缩【免费下载链接】compressO Convert any video/image into a tiny size. 100% free & open-source. Available for Mac, Windows & Linux. 项目地址: https://gitcode.com/gh_mirrors/co/co…...

2026/4/11 22:37:50 阅读更多 →

避坑指南：在华为昇腾服务器上，用Docker部署Qwen模型时最容易踩的5个坑

避坑指南：在华为昇腾服务器上，用Docker部署Qwen模型时最容易踩的5个坑部署AI模型时，技术栈的复杂性往往会让开发者陷入各种意想不到的困境。特别是在华为昇腾服务器上使用Docker部署Qwen模型，从硬件适配到容器配置，每…...

2026/4/11 22:37:22 阅读更多 →

WarcraftHelper插件：5大场景让魔兽争霸III焕发第二春

WarcraftHelper插件：5大场景让魔兽争霸III焕发第二春【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为经典魔兽争霸III在新电脑上卡顿…...

2026/4/11 22:37:05 阅读更多 →

Snyk 依赖性安全漏洞扫描工具实战指南：从安装到多语言项目扫描

1. Snyk工具与依赖安全漏洞扫描基础第一次听说Snyk是在去年参与一个金融项目时，我们的技术负责人突然要求所有依赖包必须通过安全扫描才能上线。当时团队里没人知道该怎么操作，直到发现了这个神器。Snyk本质上是个"依赖包安检仪"，…...

2026/4/12 0:00:10 阅读更多 →

mbed OS 6+ 嵌入式TFTP服务器设计与实现

1. TFTPServer项目概述TFTPServer 是一个面向 ARM mbed OS 平台的轻量级 TFTP（Trivial File Transfer Protocol）服务器实现，专为嵌入式以太网设备设计。其核心目标是在资源受限的 MCU（如 STM32F4/F7/H7、NXP LPC1768/LPC54608、Re…...

2026/4/12 0:01:48 阅读更多 →

Windows效率神器PowerToys：30+免费工具让你的电脑生产力翻倍

Windows效率神器PowerToys：30免费工具让你的电脑生产力翻倍【免费下载链接】PowerToys Microsoft PowerToys is a collection of utilities that supercharge productivity and customization on Windows 项目地址: https://gitcode.com/GitHub_Trending/po/Powe…...

2026/4/12 0:07:14 阅读更多 →

RX63N驱动SSD1963显示控制器的HAL级配置指南

1. 项目概述Display_shield_config是为 Renesas GR-PEACH 开发板配套的显示扩展板（Display Shield）所设计的一套底层配置资源集合。GR-PEACH 是基于 Renesas RX63N 微控制器的高性能嵌入式开发平台，主频高达 100 MHz，内置 1 MB Fl…...

2026/4/12 0:14:29 阅读更多 →