本申请提供一种基于Q学习的联合信道和路由选择跨层决策方法,方法包括:获取坐标;每个路由节点周期性的广播用来发现、建立、保活邻居关系的报文;当邻居节点接收到Hello包后反馈确认报文,建立好邻居关系;当源节点有数据需要传输时,源节点按照选择策略选择出下一跳节点和信道传输数据包,数据包中包含选择的下一跳节点的地址;邻居点判断数据包是否应该由自己转发;下一跳节点通过控制链路向源节点回复,回复信息中包含估计的信干比和自己最新的Q表;源节点根据反馈的信干比和前期获得的位置用来计算奖励值;源节点根据奖励值更新Q表和节点选择策略。本方法提高了网络传输速率和抗干扰性能,减少了端到端的时延、跳数。
背景技术
由于自组织网络的无线传输特性,它能提供的网络带宽相对有线信道低很多,且容易受到干扰机的干扰。然而,目前自组织网络的抗干扰手段主要集中在单一的物理层或网络层,导致抗干扰效果有限。物理层方法大多基于所学习的干扰模式来调整信道或传输功率。然而,在自组织网络中,当路由节点或传输链路受到外界干扰时,会导致路由失败。
在这种情况下,仅仅调整信号或功率是不可行的,需要重新规划路径。网络层抗干扰研究主要集中在多径传输、网络编码和重路由,但这些方法难以应当动态干扰,并且通常需要大量额外开销。当前少量的的跨层抗干扰研究主要集中在利用已知的拓扑信息找到源节点到目的节点的路由子集,然后根据当前环境动态调整策略,然而这种方法需要先验信息多,并且需要很高的维护开销。
因此,确定一种策略,仅需要较少的信息交换就能够实现有效抗干扰和良好网络性能的策略成为目前的研究重点。
实现思路