本技术涉及数据传输技术领域,本发明公开了一种时间敏感网络跨域流量调度方法、系统、介质及设备,包括:对于当前时间步,在状态下,通过主网络和贪婪策略进行动作选择后,计算动作执行后的奖励和下一时间步状态;将当前时间步的状态、动作、奖励和下一时间步状态作为一个转移,存储到重放记忆,当重放记忆中转移的个数达到阈值,则从重放记忆中采样多个转移;对于采样的每个转移,通过目标网络和Munchausen机制,计算每个分支的时间差目标值;通过主网络,计算每个分支的预测Q值;计算得到均方误差,基于均方误差更新主网络的参数;每间隔若干时间步,将主网络的参数赋值给目标网络。保证了流量调度的实时性和路由选择的可靠性。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
现有的时间敏感网络(Time-Sensitive Networking,TSN)技术已经广泛应用于工业自动化、智能交通、物联网等领域,为实现低延迟、高可靠性的数据传输提供了保障。
然而,随着网络规模的不断扩大和工业自动化系统的复杂化,多个TSN域之间的协同工作和流量调度问题日益凸显。特别是在多域环境中,现有的流量调度与路由优化算法难以有效应对跨域时间同步、流量拥塞和资源调度问题,导致端到端延迟增加、数据包丢失和网络资源利用率低。
实现思路