本技术介绍了一种空天任务处理方法和装置,该方法和装置运用了移动边缘计算技术。首先,通过目标多智能体深度强化学习模型处理无人机状态,得出任务卸载比例决策。随后,基于这些决策构建中心卫星状态,并利用目标单智能体深度强化学习模型处理中心卫星状态,以确定无人机卸载至天基网络的任务量分配比例。该方法通过分解任务部署问题,简化了空天任务处理的复杂性,降低了智能体动作空间的维度,提高了处理效率和收敛性能。
背景技术
随着5G的不断发展,6G已经被提出,旨在将地面移动通信网络扩展到天空,构建一个连接天、空、海和陆地的超宽带移动通信系统。空天地集成网络已成为6G网络的核心研究架构之一。此外,在地面通信网络中,移动边缘计算为各种物联网应用程序提供了一个新的范式,与云计算相比,提供了更低的延迟和更安全的传输。空天一体边缘计算作为一种将边缘计算与空基网络相结合的新兴范例,由于其在动态环境中支持需要低延迟和高吞吐量的各种应用程序的潜力而引起了广泛的关注。然而,高效的资源管理,包括任务分配和计算卸载,仍然是空天一体边缘计算系统的一个关键挑战。
深度强化学习结合了深度学习的感知能力与强化学习的决策能力,实现了端到端的学习,可以解决现实场景中的各类复杂问题,引起了人们的广泛关注。近年来,很多研究将深度强化学习应用于基于空天一体的边缘计算场景中。然而,随着优化问题变得越来越复杂,代理的状态和动作空间可能会大幅增长,导致维数地狱问题,并带来算法收敛和效率的挑战。综上,现有技术中空天一体任务处理方法存在收敛难度大和处理效率低下的技术问题。
实现思路