Yolov1
Yolov1是Yolo 系列的开山之作,论文中给出了具体的损失函数。
其思想本质也极为简单暴力,把目标检测问题看成是一个回归问题,
坐标,宽高,分类,置信度(有目标置信度,没有目标置信度)损失都采用SSE损失函数,一顿狂怼,依赖平台算力把目标检测出来,没有什么特别的技巧。。
其输出向量形式为7 * 7 * (2 * 5 + 20) = 7 * 7 * 30
损失函数定义如下:

Yolov2
Yolov2是Yolov1的升级版,
- 使用K-mean聚类的方法产生anchor box的数目,聚类采用1—IOU(box,centriod)作为距离度量,然后在模型复杂度和召回率之间作了一个权衡,确定了K=5。
此外,Yolov1是基于单元格进行预测,所以一个单元格只能预测一个目标。yoloV2每个单元格有5个anchor box,且单元格编码方式改变了,编码基于单元格的anchor bo一个单元格可以同时预测多个类别。 - 所有卷积层都应用BN,加快收敛和减少过拟合。
- 输入多尺度训练(因为只有卷积层和Pooling层,可以随时改变尺寸,每10epoch改变一次输入尺寸)。
- feature map网格划分是 13 * 13,其输出向量编码形式是 13 * 13 * 5 * (C + 5) ,得到更精细的特征,适应小目标检测。
Yolov2的损失函数跟Yolov1差别不大,唯一的差别就是关于bbox的w和h的损失去掉了根号,作者认为根号没有必要,即

Yolov3
Yolov3 采用了类FPN的特征融合的思想,将深层的语义特征和浅层的细节特征进行融合,使预测精度得到进一步提升。
- YOLO3延续Yolov2聚类得到先验框的这种方法,为每种下采样尺度设定3种先验框,总共聚类出9种尺寸的先验框。在COCO数据集这9个先验框是:(10x13),(16x30),(33x23),(30x61),(62x45),(59x119),(116x90),(156x198),(373x326)。

- 对象分类由so

6548

被折叠的 条评论
为什么被折叠?



