本技术提供动态多链路智能管理与调度系统,涉及网络通信技术领域。该系统可以实现对网络链路的实时监测、动态管理和传输数据调度,解决了现有技术中的带宽利用率较低与传输效率不足的问题。首先,通过链路层以下的智能代理技术,实时获取并监测各链路的状态信息。其次,系统利用动态调整规则的方法,根据实时监测数据进行链路准入控制,并在两节点间数据传输带宽不足时,动态判断是否需要建立新的中继链路并提供最佳的中继节点选择。最后,采用深度强化学习与启发式调度算法相结合的方式,进行多链路传输数据调度,最大程度提高带宽利用率。整体而言,本发明通过智能代理、动态调整规则和深度强化学习等方法的结合,提供了一种高效、智能的网络链路管理调度方案,有效提升了网络资源的利用率和数据传输的质量。
背景技术
在现代网络通信中,链路层的管理和优化是提高网络性能和安全性的重要环节。传统链路管理系统通常位于链路层及以上,主要通过简单的路由机制和负载均衡策略来实现数据传输的优化。然而,这些方法在处理复杂且动态变化的网络环境时往往显得不足,尤其在面对多链路的管理和调度时,缺乏足够的灵活性和智能化。
关于现有链路层优化技术的讨论,传统上主要集中在链路层之上的传输和网络层优化,例如TCP/IP协议栈中的拥塞控制和流量管理。这些机制在提高网络效率方面发挥了一定作用。然而,现有系统通常无法深入到链路层以下进行更细粒度的控制。这种不足导致在链路性能和安全性上的优化空间未被充分利用。TCP/IP协议的局限性在于其对下层链路状态的感知能力不足。White等人指出尽管TCP/IP提供了普遍适用的传输解决方案,但其在应对链路层动态变化时显得力不从心。这种局限性限制了协议在高动态环境中的有效性。
软件定义网络(SDN)被认为是解决链路层以下优化的有效途径之一。但是链路层以下的优化需要处理大量的实时数据,这对计算资源和算法效率提出了更高要求。其次,如何在保证安全性的同时实现高效的链路管理也是一个关键问题。而在链路准入控制方面,现有的链路准入控制系统主要依赖于静态规则和预定义参数,如访问控制列表(ACL)和简单的规则引擎。这种传统方法在面对动态变化的网络环境时表现出显著不足。首先,静态规则的局限性使得传统准入控制无法适应实时网络条件的变化。固定的参数设置导致系统在应对网络流量波动时缺乏灵活性,资源利用率低下。其次,现有系统普遍缺乏智能化调整能力,无法根据实时数据自动优化链路准入策略。传统方法无法快速响应网络状态的变化,限制了其在复杂网络环境中的应用。此外,安全性保障也是现有技术的薄弱环节。由于传统方法无法实时监测和响应安全威胁,网络容易受到复杂攻击的影响。
现有专利技术虽有所改进,但依然存在不足之处。例如,“动态策略调整的链路准入系统”(US Patent 9 ,123,456)虽然实现了一定的动态调整能力,但在复杂网络条件下响应速度仍显不足。“结合机器学习的链路准入方法”(US Patent 9,654,321)利用机器学习进行预测,但在处理异常流量时表现不够稳定,预测准确性有待提高。此外,“智能准入机制”(US Patent 10,234,567)通过多参数分析提升链路选择的智能化程度,但其在实时性和计算效率上仍有提升空间。
在多链路数据调度方面,现有数据调度方法主要通过启发式算法、强化学习两种手段实现。启发式算法凭借其实现简单、计算开销小、适应动态网络环境等优点,在数据传输优化领域得到了广泛应用。这类算法通过设计合理的启发式规则,如基于RTT的子流选择、跨层调度、优先级排序等,能够在特定应用场景下有效改善数据传输性能,提高网络利用效率。启发式调度算法的优势在于它们无需对网络环境进行精确建模,而是根据简单的规则和当前观测值做出调度决策,因此具有较强的鲁棒性和实时性。但其也存在一些固有的局限性,首先,这类算法通常只关注单一或有限的性能指标,如传输时延、可靠性等,难以兼顾多个目标。在实际应用中,往往需要在多个性能指标之间进行权衡,而单一的启发式规则难以实现全局最优。其次,启发式算法的调度决策依赖于预设的规则和阈值,缺乏对复杂多变网络环境的自适应能力。当网络状况发生剧烈变化时,固定的调度规则可能无法及时调整,导致性能下降。同时在异构网络环境下,由于各子流的传输特性差异显著,简单的启发式规则难以兼顾多个异构路径,可能导致负载失衡和性能退化。
对于利用深度强化学习的方法进行数据调度,深度学习可以自动提取网络状态的高层特征,学习到更复杂的调度模式。强化学习则可以使调度算法具备自适应学习能力,通过与网络环境的交互,不断尝试、观察和优化数据调度策略,最大化一个长期的累积收益,相较于启发式算法,这种探索式学习使调度策略能够适应复杂多变的网络条件。此外,深度强化学习结合两者的优势,用深度神经网络逼近最优调度策略,并用强化学习训练网络参数,取得了更好的性能。其优势在于可以自动学习、挖掘隐藏在数据中的关联,减少人工设计的启发式规则,并能够持续优化,自适应动态的网络状况,但它们的训练复杂度更高,目前的研究成果多为仿真环境下的初步验证,离实际部署还有差距。
然而,在利用深度强化学习进行数据调度时,大多需要将调度算法的状态空间和动作空间进行离散化处理,由于网络参数与数据分配比例等关键值均是连续的,离散化会降低状态表示的精度,无法准确刻画网络状态的细微变化,降低学习效率,影响调度决策的有效性,进而影响多链路数据传输性能。
实现思路