[具身智能-276]:卷积核的权重,是固定的,还是学习获得的?
在深度学习如 YOLO、ResNet 等中卷积核的权重绝对不是固定的而是通过数据自动学习获得的。这正是深度学习区别于传统图像处理如 Photoshop 滤镜的核心所在。为了让你彻底明白这个过程我们可以从以下三个维度来拆解1. 核心区别人工设计 vs. 自动学习表格特性传统图像处理 (固定权重)深度学习 (学习权重)权重来源人工设计。数学家根据经验算出数值。数据驱动。模型从成千上万张图片中自己总结学习探索找出哪些抽象特征对最终的结果有决定性的影响。典型例子Sobel 算子边缘检测、高斯模糊。YOLO 的 Backbone、VGG、ResNet。灵活性死板。只能处理特定任务如只用来检测边缘。灵活。能学会识别猫耳、车轮、文字等复杂特征。本质它是工具像一把固定的尺子。它是智能像一个会成长的侦探。2. 学习过程从“随机噪声”到“特征专家”卷积核的权重并不是一开始就完美的它的进化过程非常有趣就像是一个“淘金”的过程随机初始化出生在训练刚开始时卷积核里的数字完全是随机的通常符合高斯分布。这时候的卷积核就像一堆杂乱的噪点什么都看不懂提取出的特征也是乱七八糟。前向传播尝试网络用这些随机的权重去处理图片进行卷积运算最后给出一个预测结果比如把“猫”预测成“狗”。计算损失挨打损失函数如交叉熵计算预测结果与真实标签的差距。差距越大损失值越高。反向传播与梯度下降修正这是最关键的一步算法会根据误差计算出梯度。梯度会告诉每一个权重“你刚才那个数值太大了导致误差变大你要减小一点”或者“你需要增大一点”。更新公式WnewWold−学习率×梯度迭代进化成熟经过成千上万次迭代原本随机的数值逐渐稳定下来。有的卷积核学会了横向排列检测横线有的学会了中心高四周低检测斑点深层的卷积核甚至学会了组合这些线条形成眼睛、轮胎等复杂形状。卷积核的进化反应来了大脑神经网络的适应性3. 特殊情况什么时候权重是“固定”的虽然训练过程中权重是变化的但在以下两种情况下它们会表现为“固定”推理阶段部署后当你把训练好的YOLO 模型放到摄像头或手机上使用时权重已经训练完毕被冻结了。此时它们不再更新变成了固定的参数专门用来执行任务。迁移学习冻结层如果你想用自己的数据训练一个模型通常会加载一个预训练模型如在 COCO 数据集上训练好的权重。为了节省算力我们通常会冻结前面的卷积层不让它们更新因为特征提取的方法是一致的差别在于提取出的实际特征所代表的内涵不同只训练最后几层。此时前面的卷积核权重就是固定的充当通用的特征提取器。总结卷积核的权重本质上是模型对世界的一种理解方式。它始于随机一无所知经由梯度下降不断试错》试错、学习、收敛的过程完全取决于数据本身终于收敛成为专家。》试错、学习、收敛的过程完全取决于数据本身所以当你看到一个训练好的卷积核时你看到的不是冷冰冰的数字矩阵而是无数张图片“喂养”出来的智慧结晶它赋予了原始图片一定的语义与内涵