大气污染是引起城市和社会管理广泛关注的热点问题之一。大气污染预测是在发生严重污染或污染浓度超过特定限值时发出警报,有助于相关部门采取措施,指导城市社会经济活动,以促进城市可持续发展。
然而,现有的方法缺乏对PM2.5浓度的时空特征进行深度的挖掘,在长时间序列(≥24h)PM2.5浓度预测任务中的精度表现较差,并且缺乏大尺度的大气污染浓度时空分布预测,从而难以为整体区域的控制提供足够的信息。为此,研究通过考虑PM2.5浓度的时空特征,并基于深度学习模型分别构建大气污染物浓度的时间序列预报模型和空间估计模型,从而实现全国大范围PM2.5浓度长时间序列的高精度时空预测。
实验结果表明模型都能实现较高的精度。最后,基于提出的预报模型和空间化模型,搭建的大气污染物浓度预报智能化在线信息原型系统可实时发布预报结果并可进行空间化展示。研究实现了全国连续空间覆盖的PM2.5浓度高时空精度的实时预测,有力支持大气污染联防联控和公众环境空间质量信息服务。
时间序列预报模型文章《Modeling air quality prediction using a deep learning approach: Method optimization and evaluation》已发表在《Sustainable Cities and Society》2021年65期,时空预报框架文章《基于深度学习的中国连续空间覆盖PM2.5浓度预报》已被《测绘学报》录用。
随着世界经济快速发展,工业化和城市化进程加快,空气污染问题日益显著,严重威胁着人类的生产和生活。其中,PM2.5(大气中存在的细颗粒物直径在2.5微米以下的颗粒物)是造成空气污染的主要因素,PM2.5浓度的上升也会直接影响人体的身体健康。因此,实时预报PM2.5浓度的变化的预报具有重要的现实意义和社会价值。
研究使用了全国范围内1286个PM2.5监测站的历史时间序列数据和气象数据,PM2.5监测数据和气象数据分别来源于全国城市空气质量实时发布平台(http://106.37.208.233:20035/)以及中国气象数据服务中心(CMDC: http://data.cma.cn/en)。
图1 全国大范围1286个监测站的空间分布以及在2019年的PM2.5均值
通过时间序列预报模型和空间估计模型发展了全国大范围PM2.5浓度空间预报的整体架构,如下图所示。
在步骤一中,研究提出了一种基于深度人工神经网络的站点时间序列预报模型,用于PM2.5浓度长时间序列的预测。通过利用PM2.5监测数据和相关辅助数据(气象数据和时间数据),该模型通过时空相关分析集成了最佳时滞,利用多层双向LSTM和全连接层组成的时间滑动块,基于迭代预测方式可以捕捉较高的时间相关性,从而预测各个监测站未来24小时的PM2.5浓度时间序列预报值。
基于监测站的预报结果无法准确获取未来PM2.5浓度的空间分布,在步骤二中,研究通过拟合深度学习技术挖掘PM2.5浓度以及相关空间传输有效变量之间的非线性关系,提出了一种基于空间依赖性大气PM2.5浓度精细空间化模型。该模型通过嵌入未来时间序列预报各个时刻的空间滞后变量值,以及PM2.5扩散变量因子如土地利用、交通、重点企业排放源的位置等,从而实现PM2.5浓度未来时间序列预报结果的精细空间化。
下图对比了全国大范围2019年所有监测站PM2.5浓度日均监测值和模型输出的PM2.5浓度日均预测值的时序变化。通过对比观测值与预测值的变化曲线,我们可以看出模型预测的未来PM2.5浓度时序变化曲线能够很好地拟合监测值的时间变化趋势,其精度R2为0.96。模型在四个季节总体预测表现较好,秋冬季的R2在0.90以上,以上结果证明了模型的实用性以及有效性,表明该模型能够应用于大气污染的长时间序列预测任务中。
图3 全国2019年PM2.5日均观测值与预测值的变化曲线图
为了验证模型的性能,研究以京津冀地区为实验对象,以城市为单位分别建立了基于深度学习的模型(LSTM和LSTME),以站点为单位分别建立了多元回归模型(MLR)和支持向量机回归(SVR)模型。图4显示了提出的模型在各项精度指标上都优于其他模型,说明了此模型在长期预测中可以实现更高的精度和稳定性。
同时,研究也将提出的空间化模型与通用的空间化模型-BPNN进行了对比, 并使用十折交叉验证方式评估空间估计模型的准确性。其中BPNN模型在训练集和测试集的平均十折交叉验证结果R2值分别为0.76和0.73,研究提出的模型分别为0.88和0.87,该模型在训练集和测试集的RMSE值对比BPNN模型分别降低了35%和45%,MAE值分别降低了23%以及44%。通过以上对比分析,可以发现提出的空间化模型在两个数据集上都取得了较高的精度。
通过提出的全国大范围PM2.5浓度空间预报的整体架构,基于2020年7月29日12时至24时的历史数据,获得全国大范围未来24小时的PM2.5站点预报值以及空间分辨率10 km的空间预报图。由下图可知,全国大范围在该时间段的PM2.5浓度值大部分低于25 μg/m3,其中京津冀地区的PM2.5浓度值最高,PM2.5浓度值高达35 μg/m3以上。
基于以上提出的时空预报框架,研究采用MVC(模型-视图-控制)设计思想,结合数据库技术、爬虫技术、网站技术等实现大气PM2.5浓度时空预报原型系统的架构,通过将得到的实时时空预报结果连接到应用模块可以实现网站的空间展示。下图展示了大气PM2.5浓度时空预报发布的网站(http://218.85.23.37:20104/),可以在线实时访问,该网站能够为用户提供全国大范围全天各个站点PM2.5未来24小时时序变化结果以及覆盖全国大范围的空间预报结果。
研究通过结合构建的时间序列预报模型和空间化模型,发展了一套完整的大气PM2.5浓度时空预报框架,并搭建了全国大范围PM2.5浓度时空预报原型系统。不仅可以提供各个站点未来的PM2.5浓度预报结果,而且能发布空间大范围连续覆盖的未来实时PM2.5浓度预报结果。这项研究在概念和方法上的进步可以帮助共同预防和控制区域性的空气污染,从而促进城市的可持续发展。
[1] Mao W, Wang W, Jiao L, et al. Modeling air quality prediction using a deep learning approach: Method optimization and evaluation[J]. Sustainable Cities and Society, 2021, 65: 102567.
[2] 毛文婧, 王卫林, 焦利民, 刘安宝. 基于深度学习的中国连续空间覆盖PM2.5浓度预报[J]. 测绘学报(已录用).
最近有朋友问我们:为什么没有及时看到推文?因为微信改了推送规则,没有点“赞”或“在看”,没有把我们“星标”,都有可能出现这种状况。
加“星标”,不迷路!看完文章顺手点点“赞”或“在看”,就可以准时与我们见面了~
原文始发于微信公众号(城市数据派):基于深度学习构建PM2.5的时间序列预报和空间估计模型丨城市数据派