本技术公开一种具有可解释性的水文时间序列预测模型构建方法,涉及智能预测及可解释机器学习技术领域。首先获取进行水文预测相关的监测数据;再对监测数据进行数据预处理;通过不同的特征选择方法对所述目标数据集进行特征选择寻优,得到多组最佳特征子集;再对所得到的几组最佳特征子集分别训练并进行综合评分得到目标预测模型;最后利用SHAP解释工具对所述目标预测模型进行全局解释和局部解释。本发明在关注模型预测准确度的基础上,同时关注模型的解释性能问题,在保证模型预测快速准确的同时还能掌握每个特征对模型预测结果的重要性,以及不同特征之间的相互作用关系。
背景技术
洪水灾害一直是威胁人类生存与社会发展最主要的自然灾害之一,我国地处东亚季风区,夏季暴雨频发且分布广泛,可形成华南前汛期暴雨、江淮梅雨期暴雨、北方盛夏期暴雨、华南后汛期暴雨、华西秋雨期暴雨、西北暴雨等区域性暴雨。
水文现象是时变现象,这一变化过程称为水文过程,对水文过程的离散记录就是水文数据,根据其描述的物理量(如水位、流量、降雨量等)分为各种类型的水文时间序列,水文时间序列是随着时间推移观测到的水文要素的离散有序集合。水文时间序列具有随机性、模糊性、非线性、非平稳性、多尺度变化等多种特性,其特性复杂多变,组成成分也极其复杂。研究水文时间序列的特性和预测方法,尤其是利用观测的水文序列进行水文预测,对于水文中长期预报具有重要的现实意义。
水文预报是根据已知信息(监测或分析得到的),对未来即将发生的水文要素进行预测的一门应用科学,其预报结果将为决策者提供科学的依据,水文模型又是洪水预报的核心工具。洪水灾害预报预警研究是实施洪水灾害防御工作的重要科学支撑,构建预报精度高、适用能力强、计算简单且易于推广的洪水预报模型是洪水灾害预报预警研究的一项关键技术。机器学习是实现人工智能的方法之一,而深度学习是实现机器学习的主流技术,深度学习的爆发式发展给诸多研究领域带来了创新和突破,其也将成为推动解决洪水预报难题的途径之一。然而,深度神经网络是一个具有高度非线性的复杂结构,本质上可以将其视为一个“黑箱”模型。显然,这种不透明建模技术在许多领域无法得到信任,严重限制了深度学习模型在许多敏感或高风险领域的使用。因此水文预报领域深度学习模型可解释性也亟待提高,研究深度学习模型的决策结果如何被人类理解以及如何使深度学习模型尽可能透明变得迫在眉睫。
实现思路