YOLO 系列损失函数

最新推荐文章于 2026-05-11 15:06:45 发布

原创

最新推荐文章于 2026-05-11 15:06:45 发布 · 8.2k 阅读

·

4

·

标签

#计算机视觉 #深度学习

Yolov1

Yolov1是Yolo 系列的开山之作，论文中给出了具体的损失函数。
其思想本质也极为简单暴力，把目标检测问题看成是一个回归问题，
坐标，宽高，分类，置信度（有目标置信度，没有目标置信度）损失都采用SSE损失函数，一顿狂怼，依赖平台算力把目标检测出来，没有什么特别的技巧。。
其输出向量形式为7 * 7 * （2 * 5 + 20） = 7 * 7 * 30
损失函数定义如下：
在这里插入图片描述

Yolov2

Yolov2是Yolov1的升级版，

使用K-mean聚类的方法产生anchor box的数目，聚类采用1—IOU（box，centriod）作为距离度量，然后在模型复杂度和召回率之间作了一个权衡，确定了K=5。
此外，Yolov1是基于单元格进行预测，所以一个单元格只能预测一个目标。yoloV2每个单元格有5个anchor box,且单元格编码方式改变了，编码基于单元格的anchor bo一个单元格可以同时预测多个类别。
所有卷积层都应用BN，加快收敛和减少过拟合。
输入多尺度训练（因为只有卷积层和Pooling层，可以随时改变尺寸，每10epoch改变一次输入尺寸）。
feature map网格划分是 13 * 13，其输出向量编码形式是 13 * 13 * 5 * （C + 5），得到更精细的特征，适应小目标检测。
Yolov2的损失函数跟Yolov1差别不大，唯一的差别就是关于bbox的w和h的损失去掉了根号，作者认为根号没有必要，即

Yolov3

Yolov3 采用了类FPN的特征融合的思想，将深层的语义特征和浅层的细节特征进行融合，使预测精度得到进一步提升。

YOLO3延续Yolov2聚类得到先验框的这种方法，为每种下采样尺度设定3种先验框，总共聚类出9种尺寸的先验框。在COCO数据集这9个先验框是：(10x13)，(16x30)，(33x23)，(30x61)，(62x45)，(59x119)，(116x90)，(156x198)，(373x326)。
对象分类由so

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。