从网卡到协议栈：一张图看懂Linux内核里的GSO/GRO，以及它们和TSO/LRO到底啥关系

张

张建站

2026/5/29 4:18:01

10分钟阅读

从网卡到协议栈：一张图看懂Linux内核里的GSO/GRO，以及它们和TSO/LRO到底啥关系

从网卡到协议栈Linux内核中的GSO/GRO与TSO/LRO全景解析在Linux网络性能优化的工具箱里GSO/GRO和TSO/LRO这两组技术经常让开发者感到困惑。它们看似功能相似却又在不同的层级发挥作用它们可以协同工作又可能相互排斥。理解这些offload机制的本质差异和协作原理对于诊断网络性能瓶颈、优化虚拟化环境下的吞吐量至关重要。1. 网络数据处理的效率革命Offload技术概览现代网络接口的带宽已经从千兆发展到万兆甚至更高但CPU的处理能力却无法线性增长。当10Gbps的网络流量需要处理时每个数据包只有约67纳秒的处理时间假设1500字节MTU。这种时间压力催生了各种offload技术——将原本由CPU完成的工作卸载到专用硬件或更高效的软件路径上。硬件offload的代表是TSOTCP Segmentation Offload和LROLarge Receive OffloadTSO允许网卡将大块TCP数据自动分割成符合MTU的小包LRO则让网卡能够将多个连续的小TCP包合并成大块数据软件offload的代表GSOGeneric Segmentation Offload和GROGeneric Receive Offload则是内核中的通用方案// 内核中GSO相关的关键数据结构简化 struct sk_buff { __u16 gso_size; // 分段后每个段的大小 __u16 gso_segs; // 分段数量 __u16 gso_type; // 协议类型标志 };硬件与软件offload的典型工作层次对比技术类型发送端处理位置接收端处理位置典型延迟硬件offload网卡芯片网卡芯片纳秒级软件offload内核协议栈内核协议栈微秒级无offload应用层CPU应用层CPU毫秒级注意硬件offload虽然高效但受限于具体网卡型号和驱动实现。而软件方案具有更好的兼容性可以看作硬件功能的降级替补。2. 发送路径深度解析TSO与GSO的协作舞蹈当应用程序通过socket发送大量数据时内核会尝试构建尽可能大的数据包可能远超过MTU。在没有offload的情况下协议栈需要自己完成分片工作这会消耗大量CPU资源。现代Linux内核在这里实现了精妙的分层处理策略。TSO的工作流程硬件offload内核创建大于MTU的sk_buff例如64KB检查网卡驱动支持的TSO最大分段大小ethtool -k设置sk_buff的gso相关字段后直接交给网卡驱动网卡硬件按需进行TCP分片和IP分片GSO的降级路径当硬件不支持TSO时内核同样创建大尺寸的sk_buff在dev_hard_start_xmit()函数中检查网卡能力通过内核的GSO引擎如tcp4_gso_segment进行分片将分片后的小包逐个交给网卡驱动# 查看和配置TSO/GSO状态的实用命令 $ ethtool -k eth0 | grep -E tcp-segmentation-offload|generic-segmentation-offload $ ethtool -K eth0 gso off # 临时禁用GSO进行故障排查虚拟化环境中的特殊考量在KVM虚拟机中virtio-net驱动实现了虚拟的TSO支持容器网络如veth设备通常依赖GSO而非硬件TSO云服务商的虚拟网卡可能限制某些offload功能3. 接收路径解密GRO与LRO的包重组艺术接收路径上的包重组比发送端的分片更为复杂因为需要处理乱序到达、重复包等各种异常情况。LRO作为早期的硬件方案存在明显的局限性而GRO则发展成为Linux网络栈的核心组件。LRO的局限性仅支持TCP协议重组规则过于宽松可能导致上层应用看到失序的数据不同厂商实现差异大调试困难GRO的优势特性支持TCP、UDP、VXLAN等多种协议严格的包匹配规则包括序列号、时间戳等可通过ethtool精细控制超时参数// GRO的典型匹配条件net/core/gro.c static struct sk_buff *gro_match_skb(struct sk_buff *skb, struct list_head *head, gro_match_func match) { // 检查协议类型、源/目的IP、端口等关键字段 // 验证序列号连续性 // 检查时间戳选项 }接收路径上的offload层次硬件LRO如果可用且启用网卡芯片识别TCP流合并连续的小包为大包提交给驱动时已经完成重组GRO处理在NAPI轮询中驱动将原始sk_buff提交给内核GRO引擎根据流特征进行匹配合并符合条件的sk_buff最终提交给协议栈的是重组后的大包无offload路径每个小包独立通过协议栈处理高吞吐场景下CPU负载显著增加4. 实战指南调优与故障排查理解这些offload技术的交互关系后我们可以针对不同场景制定优化策略。以下是几个典型场景的操作建议性能调优检查表[ ] 确认物理网卡支持的offload能力ethtool -k[ ] 在虚拟化环境中检查virtio或vhost的offload配置[ ] 监控/proc/net/softnet_stat观察GRO处理统计[ ] 对于UDP高流量场景考虑调整gro_flush_timeout常见问题排查步骤网络吞吐不达预期$ ethtool -k eth0 # 检查offload状态 $ ethtool -S eth0 | grep -i error # 查看网卡错误计数 $ sar -n DEV 1 # 观察实际吞吐与包量TCP重传异常增高$ ethtool -K eth0 lro off # 临时禁用LRO测试 $ tcpretrans -i eth0 # 监控重传事件虚拟化环境中的性能陡降# 在KVM宿主机上检查 $ virsh domiflist VM | awk {print $1} | xargs -I {} virsh domif-getlink {} $ bridge link show | grep -A10 vnet_interface高级配置示例调整GRO参数# 查看当前GRO设置 $ sysctl net.core.gro_flush_timeout $ sysctl net.core.gro_normal_batch # 优化大数据流处理 $ echo 50 /sys/module/gro/parameters/gro_flush_timeout $ echo 32 /sys/module/gro/parameters/gro_normal_batch在云计算和容器化环境中这些offload技术的表现可能与传统物理服务器不同。例如在Kubernetes集群中CNI插件可能会修改veth设备的offload设置而服务网格的sidecar代理又增加了额外的协议栈处理层次。理解底层机制能帮助我们在复杂环境中准确定位性能瓶颈。

Docker 网络入门：桥接、自定义与主机网络

IT策士 10余年一线大厂经验，专注 IT 思维、架构、职场进阶。我会在各个平台持续发布最新文章，助你少走弯路。在前面几篇文章中，我们已经能把 Flask Redis 计数器应用跑起来，也学会了用 Volume 持久化数据。但有一个问题我们一直…...

2026/5/29 4:16:53 阅读更多 →

12v24v转0-1000v2000v3000v4000v5000v6000v7000v连续可调高压电源模块

产品工作效率高达 72%  输出电压通过 Vadj 线性连续超宽范围可调  输出恒压恒流双环控制，最大恒流输出功率可达 4.5W  Vadj 控制端输入阻抗＞10MΩ  Vadj 具备过压保护功能，防止输出过压  输出电压稳定性高，较低的时漂和…...

2026/5/29 4:16:52 阅读更多 →

层次化分类系统设计：从HAN模型到工程实践

1. 项目概述：为什么我们需要层次化分类？ 在信息爆炸的时代，每天都有海量的文本内容产生，从新闻、研报到社交媒体帖子。对于机器来说，理解一篇文章不仅仅是给它贴上一个“体育”或“科技”的标签那么简单。我们常常需要…...

2026/5/29 4:13:02 阅读更多 →

【限时解密】Claude 3.5 Sonnet专属编程模式：仅开放给前500家企业的上下文感知补全协议

更多请点击： https://kaifayun.com 第一章：Claude 3.5 Sonnet编程辅助的核心能力边界与适用场景 Claude 3.5 Sonnet 在编程辅助领域展现出显著的推理深度与上下文理解能力，但其本质仍是基于大规模语言模型的生成式系统，不具备实时…...

2026/5/28 15:08:49 阅读更多 →

RMAN 增量备份（Incremental Backup）

1、概念RMAN 增量备份是指 RMAN 只备份自上次备份以来发生过更改的数据块，而不是备份整个数据库的所有数据块。它是 Oracle 为解决大型数据库全量备份时间长、占用空间大的问题而设计的核心特性，也是现代企业级备份策略的基础。简单类比：全库…...

2026/5/27 0:57:50 阅读更多 →

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧【免费下载链接】ProperTree Cross platform GUI plist editor written in python. 项目地址: https://gitcode.com/gh_mirrors/pr/ProperTree 想要轻松编辑macOS和iOS的配置文件却苦于复杂的XML语法…...

2026/5/27 16:46:38 阅读更多 →

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件【免费下载链接】ScriptHookV An open source hook into GTAV for loading offline mods 项目地址: https://gitcode.com/gh_mirrors/sc/ScriptHookV ScriptHookV是一个专为《侠盗猎车手V》&…...

2026/5/27 17:17:05 阅读更多 →