醋醋百科网

Good Luck To You!

论文赏析|ICCV2025|梯度不稳定是小目标检测的老大难?

论文题目:《Uncertainty-Aware Gradient Stabilization for Small Object Detection》

作者:Huixin Sun, Yanjing Li, Linlin Yang, Xianbin Cao1, Baochang Zhang

作者单位:北京航天航空大学,中关村实验室,媒体融合生产技术与系统国家重点实验室

论文地址:
https://iccv.thecvf.com/virtual/2025/poster/1099

亮点(摘要)

尽管通用物体检测取得了进展,但在检测小物体方面与常规尺寸物体相比,仍然存在性能差距 。论文揭示了传统物体定位方法因损失曲率更陡峭,在小物体上会遭受梯度不稳定的问题,从而导致收敛挑战 。为解决此问题,论文提出了不确定性感知梯度稳定(Uncertainty-Aware Gradient Stabilization, UGS),该框架将物体定位重构为分类任务以稳定梯度 。UGS将连续标签量化为区间非均匀的离散表示 。在基于分类的目标下,定位分支生成有界且由置信度驱动的梯度,从而缓解了不稳定性 。此外,UGS集成了一个不确定性最小化(UM)损失以减少预测方差,以及一个不确定性引导优化(UR)模块,该模块通过扰动来识别并优化高不确定性区域 。在四个基准上的评估表明,UGS能够持续提升基于锚框(anchor-based)、无锚框(anchor-free)以及领先的小物体检测器的性能 。特别地,UGS在VisDrone数据集上将DINO-5scale的性能提升了2.6 AP,超越了之前的最优结果。

不确定性感知梯度稳定(UGS)所提出的方法(COIN)的整体概括如图1所示:

图1 论文整体概括图

不确定性感知梯度稳定的详细定义

小目标检测的主要挑战之一是由于像素输入有限(小于32×32),难以提取具有判别性的前景特征。在杂乱环境中,遮挡、背景噪声和低信噪比等问题会使特征更加模糊,导致通用检测器产生特征偏差。此外,从图2和图3可见,传统目标定位方法在小目标上还存在梯度不稳定的问题,这是因为其损失曲率更陡峭,导致收敛困难。

图2 从定位特征生成的梯度幅度图,显示小目标在12个epoch后仍然有显著梯度

图3 小目标和正常尺度目标的梯度量化图,可见小目标的梯度在第12个epoch时仍然显著

作者还分析了常见于目标检测中的基于l2范数的定位方法和基于IoU的定位方法的梯度不确定性。通过求取对应损失函数的海森矩阵,可以清楚地发现其中Lipschitz常数与锚点大小的平方成反比。对于分配有较小锚点的小目标,Lipschitz常数增加,导致损失曲率更陡峭,陡峭的损失曲率可能导致不稳定的更新,容易在最小值附近振荡或发散,从而造成收敛挑战。

算法细节

为解决小目标定位中的梯度不稳定问题,作者提出不确定性感知梯度稳定(UGS)方法,如图1所示。UGS集成了三个组件:基于分类的定位目标,用于生成有界且由置信度驱动的梯度;不确定性最小化损失,以进一步稳定优化;不确定性引导细化模块,利用对抗扰动识别并细化高不确定性区域。

  1. 基于分类的定位损失函数,基于GFL V1,作者提出一种基于分类的目标定位损失函数,将连续回归目标量化为区间非均匀离散网格表示。具体而言,每个目标值T的连续回归范围被划分为n+1个等间距区间,得到离散网格集。真实值使用双热软目标映射到相邻网格和:

对于小目标,回归目标分布在有限范围内。当转换为软目标时,目标分布的头部范围占据的网格较少,导致类别不平衡和无效训练。此外,在基于偏移的标签系统中,目标值随着训练而减小,经过一些迭代后不断分配到相同的网格区间,进一步阻碍优化。为解决这些问题,作者通过了指数网格间距设计区间非均匀(IN)标签。

为进行优化,该框架最小化预测分布与真实值之间的交叉熵损失:

作者证明基于分类的定位目标的梯度既是有界的又是由置信度驱动的。

这表明交叉熵损失关于对数几率的梯度幅值在所有目标尺度上都限制在[0,1]内,减轻了小目标的不稳定性。此外,梯度幅值与置信度差异成正比,并实现置信度驱动的学习,其中较大的差异导致更积极的更新,较小的差异导致精细的细化,有助于精确的定位。

  1. 不确定性最小化,为进一步稳定训练,作者明确建模并最小化置信度分布中的预测不确定性:

通过最小化熵,该损失可以抑制放大梯度方差的不确定预测,并减少坐标预测方差,从而稳定优化。

  1. 不确定性引导细化,受先前有益噪声学习工作的启发,作者提出不确定性引导细化(UR)模块,利用从不确定性最小化损失(LUM)导出的扰动来识别和细化高不确定性区域。这种方法还增强了特征鲁棒性,并稳定了小目标的优化过程。

对于FPN层的每一层特征根据UR公式建立了一个最小 - 最大目标:

遵循相关研究,作者在L2范数下推导了封闭形式的扰动:

其中扰动针对LUM对激活变化表现出高敏感性的区域,表明这些区域具有高不确定性。引入的扰动可以放大对这些不确定区域的细化,同时在高置信度区域保持稳定的更新。

实验

基准数据集的性能

作者在多个数据集上对UGS方法进行了评估,包括VisDrone、SODA - A、COCO 2017和PASCAL VOC。实验结果表明,UGS在各种基线检测器和最先进的小目标检测器上均表现出一致的提升。

图4 实验结果图

训练成本对比

作者在每次迭代中使用2的批量大小和1333×800的输入分辨率对基线模型和UGS进行测试。如图5所示,UGS引入了15%、0.6%、13%的训练时间、计算和内存成本增加,这是适度的。

图5 训练成本对比

消融实验

作者采用Faster R-CNN结合ResNet-50作为基线模型,在VisDrone验证集上进行组件消融实验,验证了UGS框架各部分的有效性。实验结果显示,基线L2损失的AP为21.3%,通过替换为分类-based定位目标(LCE)提升至22.1%,添加间隔非均匀(IN)标签进一步升至22.5%,结合不确定性最小化损失(LUM,λ=0.5)达到22.9%,最终完整UGS(包括不确定性引导细化UR,γ=0.5,ρ=0.5)实现24.2% AP,比基线提升2.9%,特别是在小目标APs上从12.8%增至15.8%;与其他梯度稳定方法如Smooth-L1、IoU损失和Bayesian YOLO相比,UGS改进更显著,证明了其在缓解小目标梯度不稳定方面的优越性。同时分别测试范围参数α、IN调制器β和网格数n的影响,进行参数敏感性消融实验。结果表明,RPN阶段α=2、β=1.0、n=10时AP达21.9%,R-CNN阶段α=5、β=1.0、n=5时AP为22.5%,性能对参数变化鲁棒;较小β值有利于零附近密集网格,适合小目标精细定位,中等α和适中n确保最佳优化,整体验证UGS参数选择灵活且稳定,提升小目标检测精度

图7 消融实验

总结

总的来说,论文的主要贡献有三方面:

  1. 进行了梯度分析以研究小目标检测(SOD)挑战,分析表明传统目标定位在小目标上存在不稳定梯度,导致收敛困难。我们提出了一种新颖的不确定性感知梯度稳定(UGS)方法,以提高梯度稳定性并促进更好的收敛。
  2. 2. UGS集成了三个关键组件:基于分类的定位目标,用于生成有界且置信驱动的梯度;不确定性最小化损失,显式建模并最小化小目标的预测不确定性;以及不确定性引导的优化模块,利用对抗性扰动识别和优化高不确定性区域。
  3. 3. UGS在基线检测器和最先进的小目标检测器上表现出持续的性能提升,证明了其在地形分析中的有效性。

感谢阅读!

论文地址:
https://iccv.thecvf.com/virtual/2025/poster/1099

Github地址:稍等

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言