本技术涉及小目标检测的联合优化方法、装置、设备和介质。方法包括:通过获取训练样本集,将训练样本集输入检测器,得到各训练样本的分类输出结果与边界框回归输出结果;根据分类标签与分类输出结果计算每个训练样本的分类得分;根据真值框与边界框回归输出结果计算每个训练样本的边界框回归得分;根据分类得分与边界框回归得分,计算正样本权重与负样本权重;然后根据正样本权重与负样本权重得到联合优化损失;通过联合优化损失反向传播给检测器进行优化训练,得到训练好的检测器,通过训练好的检测器进行小目标检测。本发明能够很好的平衡分类预测和回归预测,提升小目标的检测率。
背景技术
随着技术的发展,近年来人工智能(AI)应用逐渐渗透到日常生活的各个方面,其中目标检测成为应用最广泛的技术之一。与传统方法相比,神经网络和深度学习的出现显著提升了检测的准确性和处理速度。特别是,残差网络的发展使得更深、更复杂的神经网络的高效训练成为可能,从而带来了精度上的大幅提升。最近提出的检测器,如Co-DETR和MoCaE在MS COCO 2017数据集上展现了最先进的性能。
尽管通用目标检测技术取得了显著进展,微小目标检测仍然是计算机视觉领域的一大难题。一些文献指出,微小目标检测有三大主要挑战:信息丢失、噪声干扰以及训练样本不足。因此,将通用目标检测器直接应用于微小目标检测任务时,往往会导致准确率的显著下降。经分析发现,小目标检测中有两个关键因素会对检测效果产生较大影响。
首先,众所周知,模型训练的核心过程是反向传播,它直接影响参数更新。而这一过程的基础是模型的损失函数。因此,对于在总损失函数中损失值所占比例较大的目标,模型更倾向于准确预测他们。这也是微小目标检测准确率远低于较大目标的主要原因之一。
其次,大多数现有检测器在训练过程中直接将分类损失和边界框回归损失相加起来,并且每个样本的分类损失和边界框回归损失的权重均为1,一些针对损失函数的改进方法大多仅专注于分类损失和回归损失其中之一,例如Focal Loss只改进了分类损失函数,而没有对边界框回归损失函数进行优化,IoU Loss只改进了边界框回归损失函数,但是并没有对分类损失进行修改,这可能导致分类预测和回归预测出现不平衡的问题,例如某些预测样本定位精确但分类错误,或者某些预测样本分类准确但定位不精确。
实现思路