近日,我院黄金良教授课题组在国际期刊Water Research上在线发表了题为“A coupled model to improve river water quality prediction towards addressing non-stationarity and data limitation”的研究论文。研究构建了“小波分析-深度学习LSTM模型-迁移学习”的耦合建模方法,展现其解决河流水质预测中的非稳态模式和数据受限难题的潜力。
研究背景
在人类活动和气候变化的双重扰动下,地表水水质不断退化,并变得更加不稳定。在以往作为水环境管理基础的稳态假设不再适用的情况下,稳健的水质预测既有助于制定遏制水质恶化的策略,也有助于减轻即将发生或近期发生的水污染事件的负面影响。然而,面对水质动态的高度非稳态以及区域水质数据的可得性问题,即便是目前所流行的深度学习LSTM模型也很难准确预测水质动态。
研究将两种先进技术(即:小波分析WA 和迁移学习TL)与 LSTM 耦合,构建 WA-LSTM-TL模型,以同时解决河流水质预测中的非稳态和数据受限两大难题。我们展示了如何将预训练的 WA-LSTM 耦合模型通过TL 技术转移到其他地区,并利用当地较少的监测数据对其进行优化,从而实现高频精确预测。我们旨在解决两个主要研究问题:(1) WA 和 TL 技术能否帮助 LSTM 显著提高预测性能? (2) 如何以及何时使用 WA 和 TL 技术来克服水质动态的高度非稳态和监测数据受限问题?
图1 图形摘要
研究结果
在中国福建省 49 个水质监测点中,以 4 小时为时间步长对总磷、总氮、氨氮和高锰酸盐指数进行了预测。使用涵盖 20 个指标的区域化方法为每个目标域(待预测点)选择了合适的源域(数据提供点),以提高 WA-LSTM-TL 的预测效率。耦合的WA-LSTM有助于捕捉水质动态的非稳态模式,与传统LSTM相比,测试期性能显著提升(+53%)。在源域丰富数据的帮助下,WA-LSTM-TL的性能比本地训练的 WA-LSTM 高17%,且在本地数据有限的情况下,性能提升更显著(+66%)。基于迁移学习的建模优势随数据量的增加而减弱;但无论目标域数据是有限还是充足,其表现都优于本地直接建模。研究证明了将 WA 和 TL 技术与 LSTM 模型耦合的合理性,并从非稳态和数据受限的角度为改善河流水质的短期预测提供了前景广阔的耦合建模方法。基于该方法,有望在未来实现大洲甚至全球尺度的协同精确预测。
图2 WA-LSTM-TL耦合模型技术框架
图3 数据丰富时WA-LSTM模型的表现
图4 数据受限时基于不同区域化方法的WA-LSTM-TL模型表现
图5 源域和目标域的数据量对水质预测的影响
研究团队
论文第一作者为我院2021级博士生陈胜粤,通讯作者为黄金良教授,共同作者包括我院2020级博士生王鹏、2022级硕士生唐玺、以及已毕业博士张祯宇。研究得到了国家自然科学基金(No. 41971231; 42376225)的资助。
论文来源:https://doi.org/10.1016/j.watres.2023.120895
Chen S, Huang J, Wang P, Tang X, Zhang Z. A coupled model to improve river water quality prediction towards addressing non-stationarity and data limitation[J]. Water Research, 2024,248, 120895.
文、图|陈胜粤
责任编辑|黄金良