分层强化学习在空天任务处理中的应用
2025-01-19 17:36
No.1330593111600275456
技术概要
PDF全文
本技术介绍了一种空天任务处理方法和装置,该方法和装置运用了移动边缘计算技术。首先,通过目标多智能体深度强化学习模型处理无人机状态,得出任务卸载比例决策。随后,基于这些决策构建中心卫星状态,并利用目标单智能体深度强化学习模型处理中心卫星状态,以确定无人机卸载至天基网络的任务量分配比例。该方法通过分解任务部署问题,简化了空天任务处理的复杂性,降低了智能体动作空间的维度,提高了处理效率和收敛性能。
背景技术
随着5G的不断发展,6G已经被提出,旨在将地面移动通信网络扩展到天空,构建一个连接天、空、海和陆地的超宽带移动通信系统。空天地集成网络已成为6G网络的核心研究架构之一。此外,在地面通信网络中,移动边缘计算为各种物联网应用程序提供了一个新的范式,与云计算相比,提供了更低的延迟和更安全的传输。空天一体边缘计算作为一种将边缘计算与空基网络相结合的新兴范例,由于其在动态环境中支持需要低延迟和高吞吐量的各种应用程序的潜力而引起了广泛的关注。然而,高效的资源管理,包括任务分配和计算卸载,仍然是空天一体边缘计算系统的一个关键挑战。 深度强化学习结合了深度学习的感知能力与强化学习的决策能力,实现了端到端的学习,可以解决现实场景中的各类复杂问题,引起了人们的广泛关注。近年来,很多研究将深度强化学习应用于基于空天一体的边缘计算场景中。然而,随着优化问题变得越来越复杂,代理的状态和动作空间可能会大幅增长,导致维数地狱问题,并带来算法收敛和效率的挑战。综上,现有技术中空天一体任务处理方法存在收敛难度大和处理效率低下的技术问题。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
吴胜  纪哲  魏于婷  丁峰
技术所属: 北京邮电大学
相关技术
一种用于风场环境和地面圆形轨道的无人机中继通信方法 一种用于风场环境和地面圆形轨道的无人机中继通信方法
一种基于人员定位的智能巡检系统 一种基于人员定位的智能巡检系统
车载网关跨总线信号拆分和选择性转发方法及系统 车载网关跨总线信号拆分和选择性转发方法及系统
一种多天线无人机通信能耗最小化方法及系统 一种多天线无人机通信能耗最小化方法及系统
基于USB接口适配器的设备数据处理方法及相关装置 基于USB接口适配器的设备数据处理方法及相关装置
一种基于多智能体强化学习的TSN-5G列车通信网络异步调度方法 一种基于多智能体强化学习的TSN-5G列车通信网络异步调度方法
一种基于强化学习的联合资源调度与传输置零化方法及系统 一种基于强化学习的联合资源调度与传输置零化方法及系统
患者体位监测方法、系统及介质 患者体位监测方法、系统及介质
一种可检测女巫攻击的高效动态路边单元部署方法及系统 一种可检测女巫攻击的高效动态路边单元部署方法及系统
基于多核卷积神经网络的卫星通信恶意干扰识别方法 基于多核卷积神经网络的卫星通信恶意干扰识别方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利