本技术提供了一种基于分层深度强化学习框架的无人机空战目标追踪方法,属于无人机空战对抗技术领域,解决了在未知环境下己方无人机对敌方无人机难以快速、合理分配目标并实施追踪的技术问题。其技术方案为:包括以下步骤:S1:建立无人机相对运动模型,为后续追踪不同目标提供位置信息;S2:设计约束模型以及奖励函数;S3:利用上层控制器分配追踪目标;S4:基于下层控制器控制己方无人机对敌方无人机进行追踪。本发明的有益效果为:本发明实现为己方无人机较为快速合理地分配目标无人机,并给出追踪的不确定性,增强模型的鲁棒性。
背景技术
实现思路