本技术涉及一种电网热稳定性动态优化方法及系统,该方法通过训练强化学习小模型实现电网热稳定性的动态调整。系统在检测到电网运行状态异常时,依据电网当前状态,利用小模型进行快速决策,以实现电网热稳定性的优化。
背景技术
近年来,随着分布式新能源比例的扩大和不断深化的市场化改革,电网的拓扑结构和运行状态的控制变得越来越复杂;同时,随着系统负荷水平、运行方式的不断变化以及规模的增大,电网的未知因素带来的影响也显得较为复杂,因此电网的运行将面临着更大的挑战。由于电网中电源和负荷的不断扩展,以及线路的改造与新建,导致了电网系统的运行状态和运行方式都有了较大的变化。随着分布式电源比例的提升和受电端功率的加大,送电设施的负载率也在加大,在这种情况下,当一条线路的功率达到热稳极限或因为故障而退出运行时,会继而导致其他线路过载退出运行,引起连锁反应。因此需要根据系统当前的运行状态采取措施,使系统维持在安全稳定的运行状态,通常一般采用强化学习法。
强化学习法的基本思想为智能体感知环境的状态,根据当前环境的状态采取一定的动作,改变环境的状态,环境状态改变后给予智能体一定的反馈(奖励),智能体根据奖励来修改策略,反复迭代找到一个策略,使得从初始状态开始,累积的期望奖励最大化。然而,这种传统的强化学习方法无法利用电力系统大量的文本类数据,无法针对调规和调整目标中的要求拟合模型,从而导致数据利用率低、决策偏差大的问题。
实现思路