本技术提出了一种创新的混合动力汽车生态驾驶策略,采用多智能体强化学习方法,区别于传统单一智能体的强化学习方案。该策略通过构建多智能体协同训练框架,有效规避了传统方法的局限性,提升了驾驶效率和节能环保性能。
背景技术
在城市交通网络中,受信号灯控制的影响,不同方向的车辆在交叉路口处进行加速和减速,因而极易发生拥堵,也是导致驾驶舒适性降低以及车辆能耗增加的重要诱因。智能网联汽车通过车路协同技术(V2I),能够实时接收信号灯的时序信息和绿灯剩余时间,有助于优化车流的行进速度并缓解拥堵。现有针对混合动力汽车在信号交叉口的生态驾驶策略通常采用基于优化的方法,主要可分为全局最优和瞬时最优两类。其中,全局最优方法假设车辆的驾驶环境和未来条件是完全已知的,动态规划算法是全局最优方法的代表,适合用来处理信号灯等高度非线性约束。然而,由于交通环境尤其是交叉路口处始终保持变化和较高的复杂性,难以实现对未来驾驶条件的完全预知,加之动态规划算法计算量大、计算时间长,因而无法满足实际应用的要求。针对这一问题,基于瞬时最优的生态驾驶方法应运而生,模型预测控制算法(MPC)作为瞬时最优方法的代表,通过滑动短期驾驶预测来代替全局驾驶循环,并逐次优化预测时域以实现实时控制。然而,MPC的性能高度依赖于状态转换预测的准确性,而交通状况的高度不确定性则会限制预测精度,从而影响其控制效果。
实现思路