本技术公开了基于语义先验和融合空间定位的变化检测方法,涉及图像处理技术领域,包括首先,在有监督的遥感提取任务上,对BPNet网络进行预训练,充分利用遥感提取任务中的先验知识;然后,对预训练后的BPNet网络进行微调,采用共享权重的孪生网络结构扩展编码器和解码器结构,并引入空间一致性注意力模块,通过结合自注意力机制和大卷积核分解技术,对双时态图像进行特征信息提取和融合,从而获取遥感影像目标变化信息。因此,采用基于语义先验和融合空间定位的变化检测方法,通过空间一致性注意力模块,有助于深度编码器扩展有效感受野,增强了长距离依赖关系的建模能力,同时能够有效捕捉双时态变化细节信息,获取更精准的特征图。
背景技术
变化检测(CD),旨在通过分析同一地理区域不同时间拍摄的多时相遥感影像、来识别地面变化。二进制变化检测(BCD)是指在已知二进制标签的前提下,识别感兴趣的已更改对象的过程。其中,建筑物变化检测是一种专注于建筑物的二进制变化检测任务,广泛应用于城市发展监测、灾害评估、土地利用规划等各个领域。
CD技术的发展与地球观测技术的进步、信息技术(IT)的演进和人工智能的兴起密切相关。最初传统的CD主要有两种方法:基于像素的方法和基于对象的方法。基于像素的变化检测(PBCD)方法主要通过逐像素进行运算来获取变化图,然后通过设置阈值来确定变化区域。基于对象的变化检测(OBCD)方法利用光谱、纹理和空间上下文信息来捕捉对象级别的变化。然而,这些方法仍面临一些挑战。PBCD方法虽然重视每个像素的语义信息,但忽略了像素之间的空间关系。OBCD方法则对对象分割算法的选择非常敏感,同时缺乏对像素语义的有效建模,难以区分伪变化。此外,这些方法在面对场景变化时表现出有限的适应性,需要依赖大量的人工调整,且其准确性也容易受到质疑。
随着大规模遥感数据的涌现和深度学习技术的快速发展,深度学习在遥感领域变化检测任务中展现出了巨大潜力。全卷积孪生网络被认为是第一个用于变化检测的深度学习方法,开启了深度学习在这一领域的广泛应用。当前的变化检测方法包括基于CNN的方法(如Changer、SGSLN),基于Transformer的方法(如ChangeFormer、BiT),以及基于状态空间模型的方法(如RSM-CD)。虽然这些深度学习方法取得了不错的效果,但由于高质量标注数据的缺乏,它们的性能提升受到了限制。另外,在建筑物变化检测任务中,获取和精确配准同一区域的遥感图像往往需要大量的人力资源。由于传感器的差异或环境条件的变化,配准过程可能会产生误差,进而限制了可用影像对的数量。这种数据稀缺性容易导致深度学习算法的性能达到瓶颈。相比之下,单时相任务的数据集规模要大得多,如WHU建筑物数据集、Massachusetts建筑物数据集、Inria建筑物数据集以及自然影像数据集(如ImageNet和MSCOCO)。这种数据规模的不平衡直接影响了模型在变化检测领域的训练效果,因此如何有效利用相似任务的数据成为当前研究的关键问题。
在大规模数据集上进行预训练可以为模型提供丰富的遥感图像先验知识,从而在后续的目标数据集上微调时提高其表现。这是一种有效的策略,能够缓解目标域数据稀缺的问题。例如,一些研究通过在MillionAID等大规模遥感场景分类数据集上进行有监督预训练,以优化模型性能。其他研究在SAMRS数据集上进行了多任务预训练,涵盖场景分类、语义分割、实例分割及旋转对象检测。也有研究采用无监督预训练方法,如在MillionAID或fMoW Sentinel多光谱数据集上使用MAE模型。此外,遥感影像与自然影像之间的领域差距也会限制变化检测性能,传统的预训练数据集缺乏遥感视角下的语义特征(如建筑物、道路和树木等),难以迁移至遥感任务。可见,现有的研究在预训练阶段尚未充分利用与建筑物变化检测任务相同视觉域的语义分割图像数据,如何扩展这些模型以支持双输入功能仍是一个值得探索的问题。
因此,亟需一种整合预训练和微调两个阶段的方法,以适应多时相图像变化识别,提升捕获双时态图像时序关系的敏感性,同时解决数据稀缺性的问题,为处理复杂遥感任务提供有效的框架。
实现思路