本技术属于雷达信号处理领域,公开了一种基于强化学习的联合资源调度与传输置零化方法及系统。本发明考虑收发分置的MIMO雷达网络中,多个发射节点和多个接收节点协同执行目标跟踪任务的场景中,针对传统雷达资源配置方法缺乏动态实时调整能力以及缺乏对雷达系统资源长期性能综合考虑的问题,首先,考虑了传输置零和资源调度进行联合优化,以节点的发射波形、驻留时间和功率分配为优化变量,其次,同时考虑累积信噪比约束和整个任务的低截获概率,并提出一个最小化截获概率的优化模型,最后,针对上述的优化模型,采用了基于强化学习的算法进行求解,具体采用了PPO算法,最后提高低截获概率和资源管理效率。
背景技术
随着现代战争形态的演变和信息化作战需求的提升,雷达系统作为获取战场态势感知的关键装备,其性能的优劣直接关系到作战的成败。特别是在复杂的电子对抗环境中,传统的雷达系统面临着严峻的挑战。这些挑战主要来自于敌方的先进干扰技术、隐身技术和多目标跟踪需求,使得雷达系统必须具备更高的探测精度、更强的抗干扰能力以及更优的资源管理策略。传统的雷达系统通常采用固定的波形、功率和扫描模式,这种静态的资源配置方式在多变的战场环境中显得力不从心。特别是在对抗隐身目标和电子干扰时,传统方法往往难以有效降低被敌方探测和干扰的概率,同时保证对目标的高精度探测。此外,随着作战任务的多样化,雷达系统需要在保持低截获概率(LPI)的同时,实现对多目标的快速、准确跟踪,这对雷达资源的动态调度提出了更高的要求。近年来,基于人工智能的雷达资源管理技术受到了广泛关注。其中,强化学习作为一种有效的机器学习方法,通过与环境的交互学习,不断优化策略,以实现在复杂环境中的决策优化。然而,现有的基于强化学习的雷达资源调度研究大多集中于单一的资源优化,如波形设计或功率分配,没有考虑在低截获雷达中的应用,尤其缺乏对雷达系统资源的综合调度策略,特别是在联合考虑传输置零和资源调度方面的研究。传输置零技术是提高雷达LPI性能的重要手段之一,它通过在雷达波束形成中创建零点,以降低对特定方向的辐射强度,从而减少被敌方探测系统截获的概率。然而传统的方法往往需要大量的计算资源和时间,难以满足实时性要求。此外,这些方法通常只根据当前环境进行优化,没有考虑雷达资源调度对长期性能的影响,导致任务整体性能的提升有限。
通过上述分析,现有技术存在的问题及缺陷为:
传统雷达资源配置方法缺乏动态实时调整能力,难以适应复杂多变的电子对抗环境。现有的雷达资源调度研究多集中于单一资源优化,缺乏对雷达系统资源长期性能的综合考虑。
实现思路