本技术介绍了一种利用深度强化学习的无人机群航迹欺骗技术。该技术涉及构建单无人机航迹欺骗模型、无人机智能体、深度强化学习奖励函数,并采用集中式训练与分布式执行策略。
背景技术
组网雷达的出现和应用使得雷达系统的抗干扰特性得到大幅提升,简单的距离欺骗、角度欺骗、速度欺骗难以对敌方组网雷达实施有效干扰。无人机集群航迹欺骗技术作为一种结合了上述欺骗方式的综合欺骗技术得到了广泛关注。无人机通过对截获的敌方雷达信号进行调制和延迟转发,使敌方雷达接收到一个或多个比该目标真实距离更远的假目标信号,多个具有动力学特征的连续的假目标即可构成一条虚假航迹,完成对敌方雷达的航迹欺骗。然而,组网雷达采用秩K准则进行信息融合,假目标需要在同一时刻同时被多部雷达所检测才可被认定为真实目标。因此,在采用主瓣航迹欺骗时,需要无人机时刻位于各部雷达的视线(Line of Sight,LOS)中转发欺骗信号,所以需要对无人机航迹和欺骗信号进行合理设计,使无人机集群实施协同航迹欺骗。
目前,国内外诸多学者对无人机集群航迹欺骗技术进行了较为深入的研究,然而传统算法多采用优化方法对无人机航迹进行规划,无人机集群智能化程度较低,难以应对突发情况,且迭代优化算法耗时较长,难以实现实时最优航迹规划。
实现思路