一、学习内容概述本周系统学习了卷积神经网络CNN的基本原理与典型结构主要包括以下内容卷积层Convolutional Layer卷积核滤波器与特征图的概念。局部连接、参数共享、平移不变性等关键特性。步长stride、填充padding、多通道输入输出。激活函数与非线性ReLU 及其变体Leaky ReLU、ELU的作用与优势。Sigmoid / Tanh 在深层网络中的梯度饱和问题。池化层Pooling Layer最大池化、平均池化。降维、增加感受野、缓解过拟合。全连接层与输出层将高维特征图展平后连接。Softmax 用于分类均方误差或交叉熵作为损失函数。反向传播与参数更新卷积层的梯度计算链式法则。权值初始化Xavier, He初始化与批标准化Batch Normalization。典型卷积网络架构LeNet-5手写数字识别AlexNetReLU、Dropout、数据增强VGGNet小卷积核、深层堆叠ResNet残差连接解决梯度消失二、关键收获理解了卷积操作如何提取图像局部特征并通过多层堆叠获得全局语义信息。掌握了特征图尺寸计算公式HoutHin2p−ks1Hout​sHin​2p−k​1其中 HinHin​ 为输入尺寸kk 为卷积核大小pp 为填充ss 为步长。认识到池化层没有可训练参数但能显著降低计算量并提高平移不变性。残差网络ResNet通过“跳跃连接”使网络可轻松达到上百层是解决梯度消失的关键创新。批标准化BN可加速收敛、允许更大学习率并起到一定正则化作用。三、典型结构对比网络特点参数量适用场景LeNet-5单卷积池化全连接输出约6万手写数字识别AlexNet双GPU并行ReLUDropout约6000万大规模图像分类VGG163×3卷积堆叠结构规整约1.38亿迁移学习常用骨干ResNet50残差模块BN更深的网络约2500万图像识别、目标检测四、实践与代码使用PyTorch / TensorFlow搭建了一个简单的 CNN 用于CIFAR-10分类两层卷积32→64通道 池化 两层全连接。最终测试准确率达到约 75%。尝试了不同的激活函数、池化方式与优化器Adam、SGD观察对收敛速度与精度的影响。加载了预训练的ResNet18并在自定义小数据集上微调验证迁移学习的效果。