一种基于多智能体强化学习的TSN-5G列车通信网络异步调度方法

123技术园

首页 / 技术内容

2025-02-28 14:36

No.1345042124307177472

技术概要

PDF全文

本技术提供的一种基于多智能体强化学习的TSN‑5G列车通信网络异步调度方法。该方法包括:基于列车TSN‑5G异构场景的拓扑结构利用图神经网络构建马尔可夫模型，定义马尔可夫模型的状态空间、动作空间和奖励函数，将TSN‑5G异构网络中的待处理的数据流信息输入到列车TSN‑5G多智能体强化学习异步调度算法中，列车TSN‑5G多智能体强化学习异步调度算法将每个基站与交换机作为独立智能体，通过迭代运算对马尔可夫模型中的状态空间、动作空间进行更新，输出待处理的数据流的调度方案。本发明提出了一种综合方案，结合TSN‑5G中有线与无线信道的利用率与端到端抖动性能，达到优化数据传输的目的，以实现对整车网络的端到端时延和抖动进行最优控制。

背景技术

交换机在入端口根据标识符等信息对帧进行识别与分类。得到不同优先级的流：TT流(Time-Triggerd)、AVB流(音视频流)和BE(Best Effort)。通过流整形限制流的速率。流调度和抢占决定流的调度顺序。最后在交换机出端口转发流量到目标设备或者下一个交换机。整形目的减轻网络拥塞和降低分组丢包率。实现手段就是限制突发流量的速率并缓存，控制流以相对均匀的速率发出。目前常见的整形技术为时钟同步场景下的基于信用的整形(Credit-Based Shaper，CBS)和异步场景下的ATS(Asynchronous TrafficShaping，异步流量整形)。流调度保证流转发时的有序性并降低网络拥塞，主要考察指标为时延和抖动。 (1)时间感知整形器(Time-Aware Shaper，TAS) IEEE 802.1Qbv制定了TAS和门控列表技术。TAS给每个传输窗口分配不同的传输时隙，减少不同数据流之间的干扰。使用门控结构控制数据帧的传输。门控表记录某时刻所有队列门开门关的情况。 (2)循环排队和转发(Cyclic Queuing and Forwarding，CQF) IEEE 802.1Qch引入了CQF机制。允许交换机以循环的方式实现帧的同步传输。以下简单介绍CQF过程：假设有两个传输队列和一个循环周期。在偶数周期中，队列1积累来自交换机接收端口的帧，队列2传输奇数周期积累的帧。在奇数周期中，队列1发送偶数周期积累的帧，队列2接收来自交换机接收端口的帧。只要循环周期设置合理，就保证任何对于时延敏感的数据流都能在循环周期内完成调度传输。目前，现有技术中的流调度技术方案包括：根据是否时钟同步，分为同步和异步场景下的调度算法。时钟同步场景下的调度算法同步场景下有关调度算法的研究包括TSN和TSN-5G融合场景下的。 (1)交换机队列长度预测使用增强长短期记忆网络(Long Short-Term Memory，LSTM)预测每个交换机中排队队列的长度。LSTM是循环神经网络(Recurrent Neural Network，RNN)的变体，可以有效处理时间、空间序列数据。相比于RNN，LSTM通过门控转置可以实现选择性的存储信息。在此方案中，模型使用网络拓扑、流量类型和排队队列长度作为输入，排队队列长度作为输出，实现一个预测任务。即根据网络当前状况和交换机排队帧的个数预测未来排队帧的个数。以此作为网络拥塞情况的指标。再根据预测的结果调整路由策略，实现动态路由。然而，用排队队列长度作为网络拥塞情况的代表过于片面，并不能最大化减小端到端延迟和抖动。 (2)TSN-5G粒子群强化学习算法提出集成的工业TSN-5G网络架构。提出双Q学习粒子群优化算法(Double Q-Learning Hierarchical Particular Swarm Optimization，DQHPSO)。粒子群优化算法，模拟一群粒子在多维空间中的搜索行为，每个粒子代表一个潜在的解决方案，通过粒子个体和群体的历史最佳位置来更新自己的位置和速度。以调度成功率作为优化目标，每个交换机能在传输窗口内将数据传输出即为调度成功，即满足CQF循环周期。以此保证了最终的时延和抖动指标。 (3)TSN-5G联合调度考虑5G信道此方法考虑5G时隙利用情况以及SINR信噪比也就是信号质量对数据传输的影响，使用强化学习算法去提升信号利用率。5G采用毫秒级时隙，此方法引入微小时隙，以提高信道利用率。上述现有技术中的流调度技术方案的缺点包括：在现有的TSN-5G同步或异步网络联合调度方法中，部分研究关注抖动的影响，而另一些则着重于提升信道利用率以优化延迟性能。然而，单独考虑抖动可能导致延迟的显著增加，而仅关注信道利用率则可能引发较大的数据帧传输抖动。在实际的列车通信场景中，数据传输需要同时满足低延迟和低抖动的双重要求，以确保通信的效率与确定性。现有针对TSN-5G异构场景的强化学习方法多基于单智能体架构，但在此类场景中，每个基站与每个交换机作为独立的调度单元，面临不同的调度任务，同时基站与基站、基站与交换机、交换机与交换机之间存在协同与制约关系。因此，本发明设计了一种基于多智能体强化学习的调度方法，适用于TSN-5G异构网络场景，旨在构建一个更加全面、协同的调度模型，从而提升系统整体性能。现有的TSN-5G异构场景中强化学习方法在考虑网络拓扑相关性角度，往往仅通过强化学习加速优化算法的收敛过程，而未充分考虑网络拓扑对调度结果的潜在影响。由于网络拓扑结构的差异，会直接影响网络流量负载、调度决策和带宽资源的占用情况。针对这一问题，本发明引入了图神经网络，旨在构建更加精确的网络拓扑模型，从而提升调度方法在不同拓扑结构下的性能表现。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

张尧政刘真张瑞丰王岩楠耿冲

技术所属：北京交通大学

相关技术

一种用于风场环境和地面圆形轨道的无人机中继通信方法  一种用于风场环境和地面圆形轨道的无人机中继通信方法 
 本发明公开了一种用于风场环境和地面圆形轨道的无人机中继通信方法。针对全双工放大转发固定翼无人中继通信系统，根据风场环境中的风速和其对应的水平风速角和垂直风速角，为无人机选择合适的飞行空速、仰角、飞行时间和地面圆形轨道半径，然后，确定无人机每个飞行时刻的航线角、地速和偏航角，通过无人机的航向改变角和滚转角的调整使得无人机能够沿着预定的地面圆形轨道飞行，在此基础上，给出适用于风场环境和地面圆形轨道的无人机中继通信方法，使得无人机中继能够以最小的能量消耗，为两个地面用户提供所需的数据转发服务。仿真实验表明，本发明方法能满足设计目标要求，并且正确性更高、能耗更低。
一种基于人员定位的智能巡检系统  一种基于人员定位的智能巡检系统 
 本发明公开了一种基于人员定位的智能巡检系统，包括就位信息确认模块、作业信息确认模块、风险分析模块、评估检验模块、预警提示模块，就位信息确认模块采集智能巡检系统的就位反馈信息，作业信息确认模块采集智能巡检系统的作业环境反馈信息，风险分析模块将就位反馈信息和作业环境反馈信息进行综合分析，建立巡检风险模型，运用逻辑回归方法计算智能巡检系统的延迟平衡指数，评估检验模块根据计算所得的延迟平衡指数与预设延迟平衡指数进行比对，根据比对结果对智能巡检系统的运行状态进行信号分类，预警提示模块根据智能巡检系统的信号类型进行预警处理，能够有效提高巡检效率，降低工作人员负担。
车载网关跨总线信号拆分和选择性转发方法及系统  车载网关跨总线信号拆分和选择性转发方法及系统 
 本发明公开了车载网关跨总线信号拆分和选择性转发方法及系统，涉及车载网络通信技术领域，包括:网关ECU接收网络信号消息，对网络信号消息进行解析，得到解析后的网络信号，其中，所述网络信号为通过从CAN网络或CAN‑XL网络获取得到的；对解析后的网络信号进行选择与拆分，选择需要转发的网络信号，对不需要转发的网络信号进行过滤拆分处理，得到处理后的网络信号；基于网络信号消息设定多个优先级梯度，基于多个优先级梯度生成多个队列，将处理后的网络信号输入至队列内；设定基于时间的触发条件，当队列中的信号达到基于时间的触发条件后，将队列中的信号打包成新的CAN消息或CAN‑XL消息，将新的CAN消息或CAN‑XL消息发送至网关ECU，并清空队列，从而实现信号拆分和选择性转发。
一种多天线无人机通信能耗最小化方法及系统  一种多天线无人机通信能耗最小化方法及系统 
 本发明涉及无人机通信技术领域，具体公开了一种多天线无人机通信能耗最小化方法及系统，首先构建基于多天线旋翼无人机的空中视频监控系统，允许多天线UAV(无人机)同时为多个GU(地面用户)提供服务，然后通过联合优化UAV的飞行轨迹、飞行时间和发射波束成形，在满足用户QoS要求的前提下，以最小化UAV的总能耗为优化目标构建优化问题，进一步对该优化问题进行求解。为了求解该优化问题，首先采用路径离散化方法结合黄金分割搜索法以确定UAV的飞行时间和飞行轨迹，从而最小化UAV的推进能耗，然后最小化UAV的通信能耗。仿真结果显示，该方法及系统在能耗方面显著优于现有基准方案，展现出较高的效率和实用性。
基于USB接口适配器的设备数据处理方法及相关装置  基于USB接口适配器的设备数据处理方法及相关装置 
 本申请涉及数据处理技术领域，公开了一种基于USB接口适配器的设备数据处理方法及相关装置。所述方法包括:通过USB Type‑C接口适配器进行设备发现，得到多个目标非鸿蒙OS设备；创建第一设备数据通信软总线框架；进行路由规划与分配，得到目标传输数据集以及路由状态监控数据集；计算数据传输性能特征向量和路由状态监控特征向量，并进行向量拼接，得到性能状态融合特征向量；通过双层规划模型和非支配排序遗传算法进行设备数据通信策略优化求解，得到目标设备数据通信优化策略并进行设备数据通信拓扑优化，得到第二设备数据通信软总线框架，本申请采用USB接口适配器实现了对非鸿蒙OS设备的兼容并提高设备数据处理的准确率。
一种基于多智能体强化学习的TSN-5G列车通信网络异步调度方法  一种基于多智能体强化学习的TSN-5G列车通信网络异步调度方法 
 本发明提供的一种基于多智能体强化学习的TSN‑5G列车通信网络异步调度方法。该方法包括:基于列车TSN‑5G异构场景的拓扑结构利用图神经网络构建马尔可夫模型，定义马尔可夫模型的状态空间、动作空间和奖励函数，将TSN‑5G异构网络中的待处理的数据流信息输入到列车TSN‑5G多智能体强化学习异步调度算法中，列车TSN‑5G多智能体强化学习异步调度算法将每个基站与交换机作为独立智能体，通过迭代运算对马尔可夫模型中的状态空间、动作空间进行更新，输出待处理的数据流的调度方案。本发明提出了一种综合方案，结合TSN‑5G中有线与无线信道的利用率与端到端抖动性能，达到优化数据传输的目的，以实现对整车网络的端到端时延和抖动进行最优控制。
一种基于强化学习的联合资源调度与传输置零化方法及系统  一种基于强化学习的联合资源调度与传输置零化方法及系统 
 本发明属于雷达信号处理领域，公开了一种基于强化学习的联合资源调度与传输置零化方法及系统。本发明考虑收发分置的MIMO雷达网络中，多个发射节点和多个接收节点协同执行目标跟踪任务的场景中，针对传统雷达资源配置方法缺乏动态实时调整能力以及缺乏对雷达系统资源长期性能综合考虑的问题，首先，考虑了传输置零和资源调度进行联合优化，以节点的发射波形、驻留时间和功率分配为优化变量，其次，同时考虑累积信噪比约束和整个任务的低截获概率，并提出一个最小化截获概率的优化模型，最后，针对上述的优化模型，采用了基于强化学习的算法进行求解，具体采用了PPO算法，最后提高低截获概率和资源管理效率。
患者体位监测方法、系统及介质  患者体位监测方法、系统及介质 
 本发明涉及一种患者体位监测方法、系统及介质，该方法包括:安装UWB定位基站和UWB定位标签；UWB定位标签在固定的时隙内发送超宽带信号，各UWB定位基站截获此信号后获得接收信号的时间差；通过LoRa技术将时间差以无线方式传送至数据集中器；由数据集中器通过以太网传输到定位服务器；由定位服务器调用优化TDOA定位算法对UWB定位标签进行精确定位；根据UWB定位标签的定位坐标，推算出UWB定位标签之间的角度信息。本发明可以避免通过病床角度间接了解患者体位的局限性，实现了体位的直接精准监测。
一种可检测女巫攻击的高效动态路边单元部署方法及系统  一种可检测女巫攻击的高效动态路边单元部署方法及系统 
 本发明公开了一种可检测女巫攻击的高效动态路边单元部署方法及系统，包括搜集地理信息，评估部署区域的路边单元服务覆盖、重叠范围与事故信息初始扩散速度，建立可检测女巫攻击的RSU部署约束；基于粒子群优化与改进模因算法构建RSU部署方案；获取运输与重建RSU开销，基于二分图匹配算法得到最小RSU调整成本；采集各RSU工作负载，基于帕累托最优原则构建启发式RSU最小成本调整方案。本发明在可检测女巫攻击的约束下，通过构建启发式的RSU高效部署与低成本调整方案，提高了RSU部署中服务有效覆盖范围、事故信息初始扩散速度，最小成本地实现RSU之间负载均衡并具备检测女巫攻击的能力，解决了传统RSU部署方案综合性能低、无法检测女巫攻击的问题。
基于多核卷积神经网络的卫星通信恶意干扰识别方法  基于多核卷积神经网络的卫星通信恶意干扰识别方法 
 本发明公开了基于多核卷积神经网络的卫星通信恶意干扰识别方法，属于卫星通信技术领域。其包括:对卫星通信传输链路的接收信号进行模数转换，得到待处理数据；从不同维度对数据进行变换处理，设定处理维度为；构建多核卷积神经网络干扰识别模型，并以有监督方式对模型进行迭代训练；使用训练好的多核卷积神经网络干扰识别模型进行卫星通信链路恶意干扰的识别，获得识别结果。该方法可在卫星通信链路的干信比和干噪比较低时，获得相对较高的干扰识别准确率，能够有力支撑天基电磁态势感知等应用。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工