1. 与 YOLOv2 不同的是,YOLOv3 在 Darknet-19 里加入了 ResNet 残差连接,改进之后的模型叫 Darknet-53。在 ImageNet上 实验发现 Darknet-53 相对于 ResNet-152 和 ResNet101,不仅在分类精度上差不多,计算速度还比 ResNet-152 和 ResNet-101 快多了,网络层数也比它们少。
2. YOLOv3 在三个不同的尺度上对框进行预测。使用类似于特征金字塔网络的概念从这些尺度上提取特征。
1. (1) 没有采用最大池化层,转而采用步长为 2 的卷积层进行下采样。 (2) 为了防止过拟合,在每个卷积层之后加入了一个 BN 层和一个 Leaky ReLU。 (3) 引入了残差网络的思想,目的是为了让网络可以提取到更深层的特征,同时避免出现梯度消失或爆炸。 (4) 将网络的中间层和后面某一层的上采样进行张量拼接,达到多尺度特征融合的目的。
2. (1) YOLOv3 使用的是 logistic 分类器,而不是之前使用的 softmax。 (2) 在 YOLOv3 的训练中,使用了 Binary Cross Entropy ( BCE, 二元交叉熵) 来进行类别预测。
3. 在 YOLOv3 中,利用逻辑回归来预测每个边界框的客观性分数( object score ),也就是 YOLOv1 论文中说的 confidence :
Q2:为什么存在忽略样本?
由于 YOLOv3 采用了多尺度的特征图进行检测,而不同尺度的特征图之间会有重合检测的部分。例如检测一个物体时,在训练时它被分配到的检测框是第一个特征图的第三个 bounding box,IOU 为 0.98,此时恰好第二个特征图的第一个 bounding box 与该 ground truth 对象的 IOU 为 0.95,也检测到了该 ground truth 对象,如果此时给其 confidence score 强行打 0,网络学习的效果会不理想。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo8.com 版权所有 湘ICP备2023022238号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务