本技术提出了一种基于PPO算法的多无人机协同避障控制技术,包括构建智能体并部署于每架无人机,每个智能体包含策略网络和价值网络。该技术通过智能体的协同工作,实现无人机间的有效避障和路径规划,提高了无人机在复杂环境中的自主性和安全性。
背景技术
在当今世界,无人机技术的发展日新月异,其应用领域也日益广泛。特别是在复杂环境中,如森林、城市峡谷等,多无人机的自主导航和路径规划能力显得尤为重要。在这样的环境中,无人机需要具备高度的自主性和灵活性,以便在执行任务时能够避开障碍物,同时保持高效的飞行路径。
在这样的背景下,随着人工智能技术的快速发展,基于深度强化学习(DRL) 的控制方法引发了广泛的关注。基于深度强化学习算法的多无人机穿梭密集障碍物环境的运动规划成为了一个研究热点。
现有研究成果在多无人机集群编队避障过程中主要着眼于二维平面运动规划,同时强化学习训练连续运动的多无人机集群效果不理想,并且连续三维多无人机集群环境训练不稳定,这样使得多无人机编队执任务的有效性不高。
实现思路