一、从产线调试说起上周在工厂部署视觉质检系统,遇到个头疼问题:产线上工人装配动作不规范,传统目标检测只能框出人体,却判断不了手臂是否抬到指定位置。甲方指着屏幕问:“能不能像手机人脸解锁那样,把关节位置也标出来?”——这句话直接点醒了我们:该上关键点检测了。YOLOv11本身是目标检测框架,但它的骨干网络和特征融合机制,其实很适合扩展成关键点检测任务。今天我们就聊聊怎么在YOLOv11基础上,加上人体姿态估计和人脸关键点检测这两个实用功能。二、关键点检测的本质关键点检测和目标检测核心区别在于输出形式。目标检测输出边界框和类别,关键点检测要输出一组坐标(x,y)及其可见性。比如人体姿态估计常用COCO的17个关键点(鼻子、左右眼、左右肩等),人脸关键点可能是68点或98点模型。在YOLO框架里加关键点,本质上是在检测头旁边并联一个关键点头。这个头不预测框,而是预测热图(heatmap)或直接回归坐标。热图法更准但计算量大,直接回归速度快但精度略低。工业部署时得权衡。三、给YOLOv11加关键点头假设你已经跑通了YOLOv11的检测代码,下面是在检测头旁加关键点头的示例结构:classKeypointHead