本技术涉及一种利用联邦学习技术的多线路转向架故障诊断方案,包括方法、装置、设备和存储介质。该方案整合了故障诊断与联邦学习技术,通过联邦蒸馏架构,实现跨线路模型知识的共享与优化。
背景技术
高速列车作为铁路运输的重要工具,必须首先保证其安全运营。影响列车安全运行的因素有很多,其中最主要因素之一是转向架的运维。转向架作为高速列车结构中最重要的部件之一,主要由轮对、转向架框架、一次悬架、二次悬架和基础制动设备等组成。它具有机械结构复杂、部件数量多、运行工况多样的特点,提供列车动力的同时也负载着车体的重量,为列车的安全稳定运行提供重要保障。由于高速列车会受到长大坡道、桥隧占比、气候条件等不同运行环境和工况的影响,随着高速列车在轨运行时间的增长,这些影响通过转向架各部件的直接激励和轨道的间接激励耦合作用,往往导致轮对磨耗速度加快、一系悬挂和二系悬挂系统性能退化程度加深、车体和转向架系统冲击振动加剧等一系列问题。转向架系统作为复杂度极高、耦合度极强的系统,任何部件发生故障都有可能引起连锁反应,影响整车运行的可靠性。因此,准确的转向架故障诊断对于保证高速铁路安全稳定运行至关重要。
基于深度学习的故障诊断算法表现取决于大量的高质量标签数据,然而在实际列车运维现场,往往难以对数据进行精细的人工标注,使得高质量标签数据获取困难,导致个体数据不充足,样本类型不均衡,信息维度不全,难以单独建立完备模型。
同时,在实际工业场景中,由于铁路的运行环境不同,线路的路况不同,针对在不同运营线路上的高速列车,其转向架通常包含体现自身常发故障的特征数据,且故障数据是小规模且碎片化的,只通过单一线路训练得到的模型只适用于本条线路,泛化能力差。因此,如果集合不同线路的转向架数据进行统一训练,会获得泛化能力非常强的模型,理论上该模型可以准确识别参与训练线路的所有故障工况。
然而,如果直接聚集多条不同线路高速列车转向架的数据,会极大得增加经济成本,另外,对于一些数据敏感性高易泄露的领域,如金融、医疗等,数据通常被严格保护,无法离开当地存储设备,同时企业间可能存在数据垄断,导致数据共享合作变得难以实行。特别地,数据安全问题现在得到越来越多人的关注,保护数据隐私的国家政策也已经出台。这使得数据驱动的方法在实际工业环境中诊断故障存在一定的局限性。因此,如何有效挖掘数据中蕴藏的智能而不侵害数据本身的隐私和安全,是现如今亟待解决的一个难题。
可行的思路是基于联邦学习联合多条运行环境和工况不同的线路共同建模。将模型知识在多条线路间进行迁移复用,还能保证数据的隐私安全,就可以实现互利共赢。然而,高速列车在实际运维中,受到实际设备运行状态和数据采集实施的限制,当将多条线路按照联邦学习的分布式学习架构进行部署时,线路的高速列车转向架数据往往呈现非独立同分布的特点,数据的不平衡会导致各方线路模型的不平衡,这不利于多方合作建立一个泛化能力强的模型,最终会严重影响到诊断模型的训练及检测。
特别地,目前经典联邦学习框架中各个线路间持有相同权重的平等地位,在模型聚合时也会对多个本地模型进行平均化处理。然而,拥有少量数据的线路也可能会包含更有价值的故障信息,通过模型的直接聚合可能会掩盖自身数据的差异性,小样本线路的模型漂移导致每个客户端不能有效学习到其他客户端的信息。因此,当多方数据不平衡时,多方线路在架构流程上被赋予相同的优先级可能并不会对模型的优化带来积极的效果,革新现有的模型聚合流程在某些场景中会提高联邦学习的整体训练效率。
其次,由于联邦学习联合多个数据持有方建模,往往面临高计算开销的问题,导致训练效率低下,难以在实际场景中实施。
从上述背景中可以清晰地得到在联合多线路高速列车实施联邦建模时,如何在多线路转向架数据呈现不均衡的情况下,高效、准确地实现联邦学习框架下的故障诊断成为了一个亟待解决的问题。
实现思路