先选择一个红色的点产生两种候选框,置信度比较高的才能确定是一个物体,对两个候选框选择iou比较大的那个
卷积之后得到一个771024的特征图
7730 ------> 7*7的格子,30结果得到的是什么(5猫+5虎+20狗)
加上左边的这几点,map值上升很多
经过5次采样变为h/32,w/32.
eg : 416/32=13
优势:
①全是卷积的,不需要全链接
②所有卷积和都比较小,使我们感受会比较大
k=5
多了一个候选框,map值基本不变,但recall(查全率)增加了7个百分点,之前没检测到的东西,现在可以检测到了。
原始输入特征值比较多,将多个特征值浓缩成一个点。F1中的每个点都是对原始图像的特征提取。
感受野:最后一个图上的点能看到原始图像的多大区域。
右图,把5*5的图浓缩成了一个点
感受野需要既要大的又要小的,把2626512转化为41313*512的