从VGG到ResNet-152：图解经典网络进化史，看“跳连接”如何开启深度学习新篇章

张

张建站

2026/5/10 23:39:33

10分钟阅读

从VGG到ResNet-152：图解经典网络进化史，看“跳连接”如何开启深度学习新篇章

从VGG到ResNet-152经典网络架构的进化逻辑与技术突破2014年的ImageNet竞赛领奖台上VGG团队捧起了冠军奖杯。台下的研究者们却陷入沉思当网络深度突破19层后准确率不升反降。这个看似反常的现象直接催生了深度学习史上最具革命性的架构创新——残差连接Residual Connection。我们今天习以为常的跳连接Skip Connection当年是如何打破深度神经网络的训练魔咒的1. 深度网络的瓶颈从VGG的辉煌到困境2014年的VGG-16和VGG-19凭借整齐的3×3卷积堆叠在ImageNet上将Top-5错误率降至7.3%。这种更深更规整的设计哲学迅速成为业界标准。但当我们尝试将这种架构推向极致时问题开始显现# 典型的VGG块结构示例 def vgg_block(in_channels, out_channels, num_convs): layers [] for _ in range(num_convs): layers [ nn.Conv2d(in_channels, out_channels, kernel_size3, padding1), nn.ReLU() ] in_channels out_channels layers [nn.MaxPool2d(kernel_size2, stride2)] return nn.Sequential(*layers)实验数据显示当网络超过19层时训练误差和测试误差同时上升梯度消失问题在反向传播时愈发严重参数调优的边际效益急剧下降注意这种现象被后来的研究者称为退化问题(Degradation Problem)与过拟合有本质区别——即便在训练集上深层网络的性能也会劣化。2. 残差学习的革命性突破2015年MSRA团队发表的ResNet论文中首次提出了残差学习框架。其核心思想可以用一个简单的数学公式表达H(x) F(x) x其中x是输入特征F(x)是需要学习的残差映射H(x)是期望的底层映射这种设计带来了三个关键优势梯度高速公路跳跃连接为反向传播创建了直达浅层的梯度高速公路有效缓解了梯度消失恒等映射保底即使新增层没有学到有效特征网络性能也不会低于浅层版本特征复用机制深层可以直接利用浅层提取的初级特征下表对比了传统网络与残差网络的关键差异特性传统网络 (如VGG)残差网络深层架构可行性20层左右达到瓶颈可稳定训练1000层梯度传播效率逐层衰减跨层直达参数利用率低效高效典型应用场景中等规模视觉任务超大规模视觉/跨模态任务3. ResNet家族的技术演进路线ResNet并非单一模型而是一个完整的架构家族。其演进过程体现了深度学习工程化的精妙之处3.1 基础架构设计原始ResNet论文提出了五种典型配置ResNet-18/34使用基础残差块BasicBlockResNet-50/101/152使用瓶颈残差块Bottleneck# 瓶颈残差块结构示例 class Bottleneck(nn.Module): expansion 4 def __init__(self, in_channels, out_channels, stride1): super().__init__() self.conv1 nn.Conv2d(in_channels, out_channels, kernel_size1) self.bn1 nn.BatchNorm2d(out_channels) self.conv2 nn.Conv2d(out_channels, out_channels, kernel_size3, stridestride, padding1) self.bn2 nn.BatchNorm2d(out_channels) self.conv3 nn.Conv2d(out_channels, out_channels*self.expansion, kernel_size1) self.bn3 nn.BatchNorm2d(out_channels*self.expansion) self.shortcut nn.Sequential() if stride ! 1 or in_channels ! out_channels*self.expansion: self.shortcut nn.Sequential( nn.Conv2d(in_channels, out_channels*self.expansion, kernel_size1, stridestride), nn.BatchNorm2d(out_channels*self.expansion) ) def forward(self, x): out F.relu(self.bn1(self.conv1(x))) out F.relu(self.bn2(self.conv2(out))) out self.bn3(self.conv3(out)) out self.shortcut(x) return F.relu(out)3.2 关键改进方向后续研究对原始ResNet进行了多维度优化宽度调整Wide ResNet通过增加每层滤波器数量提升性能深度扩展ResNet-1000探索超深层网络的训练可行性结构优化ResNeXt引入分组卷积提高参数效率应用扩展3D ResNet适配视频分析任务4. 残差连接的现代应用与启示残差思想的影响力远超计算机视觉领域已成为深度学习架构设计的通用范式自然语言处理Transformer中的残差连接生成模型Diffusion模型中的跳跃连接多模态学习CLIP等跨模态架构的基础组件实际工程中的最佳实践建议对于图像分类任务ResNet-50仍是性价比最优的选择当计算资源充足时ResNet-101/152能提供约1-2%的准确率提升使用预训练模型时建议冻结浅层参数只微调顶层在部署ResNet系列模型时我们常遇到的一个实际问题是如何平衡深度与推理速度经过多次AB测试发现在边缘设备上经过适当剪枝的ResNet-34往往能达到最佳性价比——这或许正是技术演进的有趣之处最初的解决方案在经过多次迭代后又以新的形式焕发生机。

RecursiveCharacterTextSplitter 核心参数 chunk_size 与 chunk_overlap 原理、应用场景、调优技巧及实战开发全解析

前言在大语言模型飞速发展的当下，检索增强生成（RAG）、长文本智能摘要、文档知识抽取、企业私有知识库搭建、智能客服问答系统等应用已成为 AI 落地的主流形态。而在整套 RAG 工程链路中，长文本切分是承上启下的核心前置环节&#…...

2026/5/10 23:37:55 阅读更多 →

2026年OpenClaw新手小白部署图文教程

2026年如何集成OpenClaw？还在为部署OpenClaw到处找教程踩坑吗？别再瞎折腾了！OpenClaw一键部署攻略来了，无需代码、只需两步，新手小白也能轻松拥有专属AI助理！ 一、先搞懂：OpenClaw是什么&#x…...

2026/5/10 23:35:20 阅读更多 →

2025最权威的五大降AI率方案推荐榜单

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在当今这个人工智能生成内容被广泛运用的时代，“降AI”已经成为内容创作者以及运…...

2026/5/10 23:34:03 阅读更多 →

OpenClaw智能模型路由：基于任务复杂度与成本约束的动态调度实践

1. 项目概述：一个聪明的AI模型调度器如果你正在使用OpenClaw，并且手头同时接入了多个不同能力、不同成本的AI模型（比如Kimi、GPT、Claude等），那么你很可能遇到过这样的困扰：一个简单的文本总结任务&#xf…...

2026/5/10 0:01:34 阅读更多 →

机器学习的数据合成（二）

原文：annas-archive.org/md5/9d5ab593b867c3a47f27572d629020aa 译者：飞龙协议：CC BY-NC-SA 4.0 第十四章：合成到真实领域自适应本章向您介绍了一个常见的问题，通常限制了合成数据的使用性，称为领域差距…...

2026/5/10 0:10:18 阅读更多 →

cann/catlass MX FP8批量矩阵乘

MXFP8BatchMatmulTla Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 功能介绍演示 Ascend 950 上的 MX FP8 矩阵乘：A、B …...

2026/5/10 0:14:33 阅读更多 →