本技术方案涉及图像处理、人工智能和航空监控技术,旨在通过预处理视频、红外和雷达等多模态数据,并运用自适应加权融合技术与多模态深度学习模型,实现对航空视频流中目标的高效识别与处理。
背景技术
随着无人机、航空侦察和监控系统的广泛应用,实时且精确的目标识别技术对航空安全和任务执行至关重要。现有技术(中国发明申请,公开号:CN116630849A,名称:一种航空视频流目标识别算法性能提升方法)主要依赖于深度学习算法,如卷积神经网络(CNN)用于从图像中提取特征并识别目标。然而,在航空场景中,由于目标通常较小、弱信号(低信噪比)、以及多模态数据的复杂性,现有技术面临着以下不足:
现有技术对弱小目标的检测能力有限,特别是在复杂背景中,容易漏检或误检;现有技术在面对航空场景中动态环境和多模态数据时,缺乏足够的鲁棒性;许多算法由于步骤复杂、依赖大量计算资源,难以在资源有限的场景(如卫星或移动设备)上应用;现有技术常需针对特定的场景或数据重新训练模型,缺乏即插即用的灵活性。
实现思路