五、深度学习视觉应用1、数据集常用数据集包括MNIST、Fashion-MNIST、CIFAR-10、PASCAL VOC、MS COCO、ImageNet、JFT-300M等。2、任务评价指标1精确率P与召回率RPTP/(TPFP) 表示“挑剔”的程度RTP/(TPFN 表示“通过”的程度。召回率越高准确度越低。精度(TPTN)/(TPFPTNFN)其中TP:正确划分为正例的个数 FP错误划分为正例的个数FN错误划分为负例的个数 TN正确划分为负例的个数。召回率和准确率之间的关系如图2平均准确率AP其中N表示测试集中所有图片个数P(k表示能识别出k个图时的P值Δr(k)表示识别图片数从k-1变到k时的R的变化情况。3、目标检测与YOLO对于给定的图片找到物体所在的位置并标注出物体的类别。1yolo v1输入448*448*3的彩色图片输出是7*7*30的张量。损失函数包括位置误差、置信度误差、类别概率损失2yolo v2相对于v1v2有更大的分辨率使用DarkNet网络没有fc全连接层经过5次降采样输入图片大小必须是32的倍数。4、全卷积网络与语义分割FCN是语义分割的经典方法DeepLab v3是广泛使用的语义分割方法。