本技术涉及图像检测领域,尤其涉及一种基于改进注意力机制的无人机目标检测方法。通过将无人机采集的待检测图像输入目标检测模型,获取待检测图像的目标检测结果;其中,所述目标检测模型通过包括改进注意力模块的骨干模型进行特征提取;本发明提出的改进注意力模块对输入特征图进行三维度空间注意和通道注意融合提取,通过逐层提取跨通道交互特征并结合不同维度的全局均值池化与一维卷积,逐步生成三个维度的注意力特征图。本发明有效提升了目标检测的精度与鲁棒性,同时降低了计算复杂度和资源消耗,能够自适应地聚焦于图像中的关键区域,增强对小目标和复杂背景的识别能力,同时优化了目标检测模型计算资源的分配。
背景技术
随着人工智能和机器学习技术的迅速发展,无人机已广泛应用于军事侦察、环境监测、灾害救援、农业管理、智慧城市等多个领域。在这些应用中,无人机目标检测成为了一项至关重要的技术,它直接影响到无人机执行任务的效率和准确性。无人机目标检测旨在从无人机拍摄的高清或低分辨率图像、视频中自动识别并定位出感兴趣的目标,如车辆、行人、建筑物或其他特定物体。
传统的无人机目标检测方法多依赖于图像处理技术和手工设计的特征提取算法,如背景差分法、光流法、SIFT特征匹配等。然而,这些方法在面对复杂多变的自然环境和动态变化的场景时,往往表现出较大的局限性。特别是当目标较小、遮挡严重或背景复杂时,传统方法的检测效果往往不尽如人意。近年来,随着深度学习技术的飞速发展,基于卷积神经网络(CNN)的目标检测方法在无人机目标检测领域取得了显著进展。深度学习方法通过自动学习图像中的层次化特征表示,能够有效提高目标检测的精度和鲁棒性。虽然深度学习方法在整体性能上优于传统方法,但无人机在执行目标检测时,往往需要处理大量的图像特征,直接使用传统的卷积神经网络(CNN)可能无法充分捕捉图像中有意义的部分,因为许多背景信息或无关物体也会影响模型的判断。通过引入注意力机制,无人机目标检测可以更好地捕捉图像中的重要特征,增强模型对环境变化的适应能力,提高检测的准确性和鲁棒性,提升计算效率,并降低内存和计算资源的消耗。
然而,现有的注意力机制在通道注意力的提取上未能有效融合空间与通道的注意力信息,使得无人机目标检测的精度降低。如SE方法虽然能够捕捉通道间的交互,但仅仅考虑了通道维度而忽略了空间维度的信息,导致性能不够完善。卷积块注意模块(CBAM)则通过引入空间和通道维度的语义依赖,促进了跨维度的信息传递,但其最大值池化操作可能对模型的泛化能力产生负面影响,且空间注意力的提取方式并不高效。CA注意力机制对空间注意力的提取优化了通道降维比例,但其方式仍然没有完全发挥空间和通道注意力的潜力。此外,ECA方法虽然通过一维卷积替代降维操作,减小了模型复杂度并提升了推理速度,但它同样未能充分考虑通道注意力的综合利用。此外,无人机通常需要在动态、复杂的环境中进行目标检测,这要求系统能够快速处理传感器输入,进行实时决策,然而,在加入注意力机制时,往往会增加模型的参数量和计算复杂度,使得现有方法难以在精度和复杂度之间取得良好的平衡,进而影响目标的检测效果。
实现思路