yolo introduction.pptx

YOLO系列时间线
《You Only Look Once: Unified,
Real-Time Object Detection》
2015年
YOLOv1
YOLOv2
2016年
《YOLO9000: Better, Faster,
Stronger》
《YOLOv3: An Incremental
Improvement》
2018年
YOLOv3
YOLOv4
2020.04
Alexey Bochkovskiy
《YOLOv4: Optimal Speed and
Accuracy of Object Detection》
Ultralytics公司
2020.06
YOLOv5算法

YOLOv1
1）YOLO系列目标检测流程

YOLOv1
• Resize输入为448*448
• 数据增强
• 对原始图像进行20%的随机缩放和平移
• 在HSV颜色空间中调整曝光和饱和度，最多调整1.5倍
训练

YOLOv1
Loss 函数
判断第i个网格中的第j个bbox是否含有object：有则为1，没有为0
判断方法：与object的ground true的IOU最大的bbox负责预测该object
判断第i个网格中的第j个bbox是否含有object：没有为1，有为0
4：x,y,w,h
1个C：
20个类别pi:

YOLOv2
• Batch normalization
• High Resolution Classifier
• Convolutional With Anchor Boxes
• Dimension Clusters
• Direct location prediction
• New network：Darknet-19
• Fine-Grained Features
• Multi-state training

Batch normalization
• Batch Normalization可以提升模型收敛速度，而且可以起到一定正
则化效果，降低模型的过拟合。在YOLOv2中，每个卷积层后面都
添加了Batch Normalization层，并且不再使用droput。使用Batch
Normalization后，YOLOv2的mAP提升了2.4%。

High Resolution Classifier
• 在ImageNet分类数据集上预训练模型的主干（224*224）
• 使用448*448在ImageNet上fine-tune（10 epochs）

Convolutional With Anchor Boxes
• 去掉了全连接层
• 检测时将输入缩减为416*416
• YOLOv1只能预测7*7*2=98个目标框
• YOLOv2可以预测13*13*num_anchors个目标框

Dimension Clusters
• Anchor boxes
• 在VOC数据集和COCO数据集上聚类分析的结果：

Direct location prediction
• YOLOv1直接预测目标框的中心点和长宽：x,y,w,h
• YOLOv2预测先验框和目标框的偏移值：tx, ty, tw, th

Fine-Grained Features（细粒度特征）
• 13*13对于检测大物体是足够的，但无法准确地检测小物体
• 通过passthrough层来获取更精细的特征图
• 26*26*512->13*13*2048

YOLOv2
• 训练时的三个阶段

参考内容
• YOLOv1-v4论文
• https://github.com/ultralytics/yolov5
• https://blog.csdn.net/wfei101/article/details/79398563
• https://zhuanlan.zhihu.com/p/35325884
• https://github.com/bubbliiiing/yolov4-pytorch
• https://www.jiangdabai.com/

yolo introduction.pptx

Recommended

Recommended

More Related Content

Featured

Featured (20)

yolo introduction.pptx

Editor's Notes