本技术提出了一种融合多尺度特征与增强语义的遥感目标识别方法,具体步骤如下:S1.利用主干网络从输入的遥感图像中提取特征,并生成多尺度的特征图;S2.收集并分析这些特征图,以挖掘深层次的语义信息。
背景技术
随着遥感观测技术的快速发展,世界各地的许多高分辨率遥感卫星获取了大量多地貌、多维度、高分辨率的遥感图像。高分辨率遥感图像中包含了丰富的地物细节特征,具有更加丰富的空间结构和拓扑关系。如今遥感图像已经被广泛应用于气象、农业、环境和灾害监测等领域,具有广泛的实用价值。近年来,深度学习的快速发展,为遥感图像智能信息提取提供有利的技术支撑。为了有效促进基于深度学习的遥感图像目标检测方法,许多机构和研究人员也公开发布了多种大规模遥感图像识别相关的数据集。
与常见的自然场景相比,遥感和航空图像通常是从俯视角度捕获任意水平或方向的物体,再加上不同的拍摄角度和成像条件,这使得针对多场景遥感图像目标的检测仍具有挑战性。具体来说,存在以下两个主要挑战需要解决。
复杂的背景干扰问题:遥感图像中前景目标通常所占比例较小,容易受到周围复杂背景如建筑群、植被的干扰,使得目标物体的特征模糊,不利于算法识别。
目标的大尺度变化问题:遥感图像通常是从具有宽视野的卫星或无人机上捕获的,因此目标尺度跟随图像分辨率而变化,巨大的尺度变化往往阻碍了精确的目标检测。
针对复杂背景对于前景目标的干扰问题,当前很多工作聚焦于探索不同的方法利用语义信息提高检测的性能。语义信息有助于建模遥感图像中的物体和背景之间的关系,减轻复杂背景对于精确目标特征的影响。目前许多方法通过特征融合、语义编码或者注意力机制提取语义信息,然而,这些方法没有考虑到相邻特征层的语义差距较小,可以通过聚合相邻层的显著特征补充当前输出层的语义信息。
针对目标的大尺度变化问题,目前大多数研究主要围绕特征金字塔及其变体结构,空间和通道注意力和跨尺度特征融合等方面来获取多尺度信息。但是采用特征金字塔结构的网络中路径数量过多,非相邻层之间只能间接交互,导致跨层信息交互时出现信息丢失,阻碍网络更好地进行信息融合。
实现思路