一、为什么轻量化又成了焦點?2025-2026年,计算机视觉领域出现了一个明显的趋势:模型不再单纯追求精度,而是追求“精度-效率-部署可行性”三者之间的最优平衡。根据 Ultralytics 在 YOLO 2025(YV25)大会上的官方发布,YOLO26 被明确设计为“轻量化、紧凑型和高速运行”的模型,专为现实世界中实时视觉 AI 应用的实际运行需求而打造,内置原生端到端推理功能。这一信号表明,即便是目标检测领域的标杆框架,也在将轻量化作为核心设计哲学。然而,当下主流的轻量化卷积方案存在一个隐蔽但致命的矛盾:许多网络通过深度可分离卷积(DWConv)或组卷积(GConv)在纸面上大幅降低了 FLOPs,但实际推理延迟却远高于纸面数字。根据论文Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks的分析,ShuffleNet、MobileNet、GhostNet 等经典轻量级骨干网络正是因为 DWConv 或 GConv 带来的频繁内存访问,导致实际 FLOPS(每秒浮点运算次数)显著降低。FLOPs 是理论计算量,FLOPS 是实际执行速度——两者的差距可能高达数倍。本文将从这一问题出发,提出一种双阶轻量卷积的极限压缩思路:将 FasterNet 的PConv(部分卷积)与 GhostNet 的Ghost 模块深度融合,分别在“