本技术公开了一种考虑保障设备劣化的航母舰面无人装备智能调度方法,包括:采集舰载机甲板作业无人调度的相关信息包括甲板布局、与舰载机配合工作设备的位置坐标、舰面无人装备的数量以及舰载机的作业流程;设定保障设备的劣化的假设条件和舰面无人装备的约束条件并建立舰面无人装备数学模型;基于马尔科夫决策过程模型在马尔科夫决策框架下,对Q学习中ε‑greedy探索策略进行改进,增强探索效率与策略的适应性;采用最终迭代的Q值表对状态和动作进行选择,获得考虑保障设备劣化的舰载机甲板作业无人调度的最优调度序列。
背景技术
航母在现代海战中扮演着至关重要的角色,其强大的舰面无人装备群和完善的作战系统使其能够在远离陆地的情况下迅速部署并执行多样化的作战任务,这不仅提升了海军的远程作战能力,还为制海权的争夺提供了坚实支撑。随着智能技术的不断发展,未来航母将进一步融合智能无人系统,以应对复杂多变的战场环境。由于航母的持续作战能力取决于舰面无人装备的出动频率,而影响出动频率的主要因素是舰面无人装备甲板作业调度的效率,因此舰面无人装备甲板作业智能无人调度成为未来海军发展的重要方向,即航母可以在没有人员直接操作的情况下进行舰面无人装备调度,从而降低人员风险,增强作战灵活性,提高作战效率。
舰面无人装备甲板作业调度是一种复杂的优化问题,需要根据舰面无人装备的出动计划和保障需求,安全高效地为舰面无人装备分配保障资源,最大限度地减少保障作业的时间开销,提高舰面无人装备的出动架次率。近些年来国内外学者对该问题进行了大量的研究工作,常用的方法包括数学规划方法、排队论方法、建模仿真方法、启发式算法、强化学习方法等。Q学习算法作为典型的强化学习方法,不需要事先知道环境的转移概率或者奖励函数,只需要与环境进行交互,学习如何做出最优的动作,以达到最大的累积奖励,从而得到最优策略。然而,探索与利用的平衡和收敛速度仍是该算法需要解决的问题。
对于舰面无人装备甲板作业智能无人调度而言,上述方法未考虑在实际调度过程中,由于保障设备持续运行而产生劣化的情况,这种劣化可能会导致保障设备在任务过程中发生故障。为了延长使用寿命并减少劣化程度,当保障设备的劣化状态达到一定阈值时,可以安排保障设备的维修或更换。然而,频繁的维修可能会导致总时间成本的增加。因此,合理地平衡舰面无人装备的调度时间及保障设备的劣化程度之间的关系,可以最大限度地减低保障设备的故障率,从而提高调度任务的效率。
实现思路