随着我国经济的快速发展,空气污染逐渐对人们的工作和生活造成严重影响[1],其中以雾霾为首的大气污染问题尤为突出,而PM2.5作为雾霾的主要成因之一,对人体造成各种程度的危害。PM2.5指的是在空气中当量直径小于等于2.5 μm的颗粒物,其来源十分广泛,包括化石燃料的燃烧、垃圾焚烧、工业粉尘、厨房烟气等[2-3]。近年来,有不少国内外学者运用了多种预测模型对PM2.5质量浓度进行了预测研究。张洪[4]结合风速、风向、气温、相对湿度等因素,Xu 等[5]还结合了道路信息,运用站点预测模型和网格预测模型对京津冀地区的PM2.5质量浓度进行了预测;Masood等[6]结合气象因素及大气污染物建立了支持向量机(Support Vector Machine)模型和人工神经网络模型,对印度德里的PM2.5质量浓度进行了预测;张怡文等[7]运用主成分分析法结合BP(Back Propagation)神经网络对合肥市的PM2.5质量浓度进行了预测分析,说明了PM2.5质量浓度受季节因素的影响较大,由于不同季节的气象有不同的特征,对PM2.5质量浓度的影响也不同;He等[8]和Asha[9]均运用了多元逐步回归,并分别结合其他方法,对上海市和印度马哈拉施特拉邦的PM2.5质量浓度进行了预测。
上述研究主要探究了PM2.5质量浓度与大气污染物、气象因子之间的相关性,并对PM2.5质量浓度进行了预测,结果显示大部分城市的PM2.5质量浓度均存在季节性变化规律。同时,文献[10-11]的结论也显示PM2.5质量浓度具有明显的季节变化趋势。针对这一现象,若能够对传统的预测模型进行改良,使其能够适应这种季节性变化规律,便可在一定程度上提高预测精度。广州作为广东省的省会、我国重要的中心城市,空气污染等环境问题备受关注,且广州地处亚热带季风气候区,气象因素具有明显季节性变化,具有广泛代表性。据广东省2021年第七次全国人口普查数据[12]显示,广州市常住人口位居全省第一,具有一定的研究意义。因此针对广州市的PM2.5质量浓度变化情况,本文将引入季节指数概念,改进传统的多元线性回归模型、多层感知器预测模型,建立一个改良的预测模型用于广州市PM2.5质量浓度的预测,为PM2.5质量浓度预测和防治工作提供一定的理论基础和改进思路。
1 数据来源及分析方法 1.1 数据来源本文所使用的污染物数据来自于广州市生态环境局的实测数据(
PM2.5质量浓度会因为温度、湿度等因素呈现出一种周期性的变化。例如在夏季,降水可以在一定程度上清除大气污染物,而冬季降水相对较少,很难达到稀释大气污染物的效果。此外,风也可以在一定程度上减少大气污染物,风速越大越有利于大气污染物的稀释扩散[13]。分析广州市生态环境局以月为单位统计的PM2.5质量浓度的发展趋势,2015~2019年广州市PM2.5质量浓度的季节性变化规律如图1所示。
其变化特征表现为以下几个方面:(1) 趋势下降性:据图1所示,在同一统计月,部分年份的PM2.5质量浓度有下降的趋势。主要原因是近年来广州市推进公交车电动化,也加大了城市扬尘的污染防控力度,城市大气颗粒污染物得到一定的控制。(2) 季节变化性:据图1所示,在同一年度,随着月份的变化,PM2.5质量浓度呈现出季节性变化。主要表现为4~8月,随着月降水量的增加,雨水可以更好地洗刷空气中的污染物,PM2.5质量浓度下降较快;6月PM2.5质量浓度最低。12月至次年1月气温达到最低,PM2.5质量浓度上升速率较快;大部分年份在1月出现高峰;PM2.5最高质量浓度约为最低的2~3倍。数据分析说明季节因素对于城市PM2.5质量浓度有一定的影响。
1.3 基于季节指数改进的多元线性回归和多层感知器模型月度PM2.5质量浓度统计的时间跨度较长,容易受气候、假期等稳定因素的影响,大气中的PM2.5质量浓度呈现出一种非线性的下降趋势。
能够处理这种季节性波动的方法有3种,分别是小波分解、滑动平均法和惠普滤波分解。而惠普滤波分解是相对简单的方法,它通过有限的数据分解信号,不仅可以捕捉一般趋势,而且可以表征时间序列数据集中的季节因素。
1.3.1 季节指数季节指数法既考虑了季节指数的趋势性变化, 又充分利用了已知数据信息,因此广泛应用于能源、疾病等方面的预测[14-15],是一种较好的预测季节性波动时间序列的一般方法[16]。假设PM2.5的月质量浓度是由2部分组成,分别是趋势部分和周期性部分。其公式为
$ {Y_t} = Y_t^{\rm{T}} + Y_t^{\text{C}},\;\;\;\; t{\text{ = 1,}}2, \cdots ,60 $ | (1) |
式中:
由于该时间序列的趋势部分相对平滑,所以在使用惠普滤波器从初始的时间序列中分离趋势分量时,约束条件相当于式(2)的最小值问题。
$ \mathrm{min}\Bigg({\displaystyle {\sum} _{t=1}^{n}{({Y}_{t}-{Y}_{t}^{{\rm{T}}})}^{2}}+\lambda {\displaystyle {\sum} _{t=2}^{n-1}{({Y}_{t+1}^{{\rm{T}}}-{Y}_{t}^{{\rm{T}}})-({Y}_{t}^{{\rm{T}}}-{Y}_{t-1}^{{\rm{T}}})}^{2}}\Bigg) $ | (2) |
式中:
季节指数能够描述时间序列的季节性周期变化特征[18]。一般来说,季节因素对同一季节的影响相对稳定,因此季节指数可以通过计算每个月PM2.5质量浓度的实际值与趋势部分的比值得到。
${s_{t}} = \frac{{{Y}_{t}}}{{Y_{t}^{\rm{T}}}},\;t = 1,2, \cdots ,60 $ | (3) |
式中:
多层感知器(Multilayer Perceptron ,MLP)包括输入层、输出层和多个隐藏层,是一种多层前馈人工神经网络。其结构简单,有良好的容错性、鲁棒性和极强的非线性映射能力[19]。人工神经元是MLP模型的信息处理节点,是MLP模型的最基本处理单元。神经元之间的连接强度称为连接权值,信息处理机制为
$ {a}_{m}^{(l)}=f\Bigg({\sum} _{{M}_{l-1}}^{k=1}{w}_{k,m}^{(l)}{a}_{k}^{(l-1)}+{b}_{m}^{(l)}\Bigg) $ | (4) |
式中:
线性回归是利用数理统计中的回归分析来确定2种或2种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。回归分析中包括2个或2个以上的自变量,且因变量和自变量之间是线性关系,该模型一般形式为
$ y = {\beta _0} + {\beta _1}{x_1} + \cdots + {\beta _k}{x_k} + \xi $ | (5) |
式中:
本文采用广州市2015~2019年的PM2.5月质量浓度数据,根据1.3.1部分,通过Eviews10进行惠普滤波分解,将原始的时间序列分成趋势部分与周期性部分。结果如图2所示。
如图2所示,广州市的PM2.5质量浓度具有缓慢下降的趋势,也存在明显的季节性波动,2017年表现的最为明显。通过式(3)对原始数据进行处理,即得到每个月份的季节指数。
2.2 预测模型构建 2.2.1 MLP模型构建将PM2.5月质量浓度作为因变量,PM10、NO2、SO2、O3、CO、平均气温、平均风速、平均气压、平均相对湿度、雨天数(均为月度数据)作为协变量[20-22],且协变量均作正态化处理。构建的神经网络模型结构为9-16-16-1,即模型包括1个输入层、2个隐藏层和1个输出层。输入层有9个神经元,隐藏1层有16个神经元,隐藏2层有16个神经元,输出层有1个神经元。隐藏层的激活函数均为S型函数。模型的样本数和误差见表1。
多层感知器神经网络会对自变量的重要性进行排序,结果显示“SO2”“平均相对湿度”“CO”重要性占比较高。其原因可能是PM2.5与SO2和CO具有同源性,均来源于城市机动车尾气。
2.2.2 多元线性回归分析研究表明,PM2.5与PM10、NO2、SO2、O3、CO、平均气温、平均风速、平均气压、平均相对湿度、雨天数具有较好的相关性[23]。将2.1所求得的各月季节指数结合随机变量(广州市的PM10、NO2、SO2、O3、CO、平均气温、平均风速、平均气压、平均相对湿度、雨天数)计算各自的回归系数,得出回归方程为
$ \begin{split} s = & 6.433 + 0.015{x_1} - 0.002{x_2} - 0.004{x_3} + \\ & 0.001{x_4} + 0.003{x_5} - 0.03{x_6} - 0.009{x_7} -\\ & 0.006{x_8} + 0.006{x_9} - 0.002{x_{10}} \end{split} $ | (7) |
式中:
利用上述模型,可以得到各月的PM2.5质量浓度趋势值以及对应季节指数的预测值,将上文计算结果按照式(8)进行整合。
$ {Y_{0,t}} = {s_{0,t}} \times Y_{0,t}^{\rm{T}},\;t = 1,2, \cdots ,60 $ | (8) |
式中:
整合后即可得出组合模型的预测值,组合模型预测值与实际值的变化曲线如图3所示。
为验证模型的准确性,用3个指标检验模型的精度:均方根误差(Root Mean Square Error, RMSE)、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)、平均绝对误差(Mean Absolute Error, MAE)[24-25],见式(9)~(11)。
$ {{{\rm{RMSE}}}}=\sqrt{\frac{1}{n}{\sum} _{n}^{i=1}{e}^{2}(i)} $ | (9) |
$ {{{\rm{MAPE}}}}=\frac{1}{n}{\sum} _{n}^{i=1}\left|\frac{e(i)}{{Y}_{t}(i)}\right|\times 100\text{%} $ | (10) |
${{{\rm{MAE}}}}=\frac{1}{n}{\sum} _{n}^{i=1}\left|e(i)\right| $ | (11) |
式中:
为了验证本模型的性能,采用多层感知器与多元线性回归分别对原始数据进行一次计算(各模型参数与组合模型相同),多层感知器与多元线性回归模型的计算值与实际值的变化曲线对比如图4所示,各模型的预测精度如表2所示。
由图3和图4可以看出,3个模型预测的结果和实际值总体来说符合情况较好,其中经过季节指数优化后的组合模型预测精度高于优化前的预测精度,根据表2中的3个指标可以看出,组合模型的RMSE、MAPE、MAE分别比多层感知器模型减少了23.1%、31%、24.2%;比多元线性回归模型减少了35.3%、41.3%、41%。
3 结语本文根据PM2.5质量浓度具有明显的季节性变化这一特点,借助惠普滤波分解器,引入了季节指数,组合优化传统的多元线性回归模型和多层感知器模型,构建了基于季节指数改进的多元线性回归和多层感知器模型,以用于PM2.5质量浓度预测。实验结果表明,该模型精度均优于传统的多元线性回归模型和多层感知器模型。
[1] |
FAN H, ZHAO C F, YANG Y K. A comprehensive analysis of the spatio-temporal variation of urban air pollution in China during 2014–2018[J].
Atmospheric Environment, 2020, 220(117066): 1-12.
|
[2] |
王玮, 汤大钢, 刘红杰, 等. 中国PM2.5污染状况和污染特征的研究
[J].
环境科学研究, 2000(1): 1-5.
WANG W, TANG D G, LIU H J, et al. Research on corrent pollution sataus and pollution characteristics of PM2.5 in China [J]. Research of Environmental Sciences, 2000(1): 1-5. DOI: 10.3321/j.issn:1001-6929.2000.01.001. |
[3] |
甘阳阳, 李志生. 空气幕对厨房内PM2.5控制效果的模拟与分析
[J].
广东工业大学学报, 2020, 37(3): 82-87.
GAN Y Y, LI Z S. A numerical effect on PM2.5 in the kitchen [J]. Journal of Guangdong University of Technology, 2020, 37(3): 82-87. DOI: 10.12052/gdutxb.190086. |
[4] |
张洪. 京津冀地区空气质量时空分布特征及PM2.5浓度预测[D]. 哈尔滨: 哈尔滨师范大学, 2020.
|
[5] |
XU X D, TONG T, ZHANG W, et al. Fine-grained prediction of PM2.5 concentration based on multisource data and deep learning
[J].
Atmospheric Pollution Research, 2020, 11(10): 1728-1737.
DOI: 10.1016/j.apr.2020.06.032. |
[6] |
MASOOD A, AHMAD K. A model for particulate matter PM2.5 prediction for Delhi based on machine learning approaches
[J].
Procedia Computer Science, 2020, 167(1): 2101-2110.
|
[7] |
张怡文, 郭傲东, 吴海龙, 等. 基于PCA-BP神经网络的PM2.5季节性预测方法研究
[J].
南京林业大学学报(自然科学版), 2020, 44(5): 231-238.
ZHANG Y W, GUO A D, WU H L, et al. Seasonal prediction of PM2.5 based on the PCA-BP neural network [J]. Journal of Nanjing Forestry University (Natural Sciences Edition), 2020, 44(5): 231-238. |
[8] |
HE H D, LI M, WANG W L, et al. Prediction of PM2.5 concentration based on the similarity in air quality monitoring network
[J].
Building and Environment, 2018, 137(1): 11-17.
|
[9] |
ASHA B C. Estimating PM2.5 concentration from satellite derived aerosol optical depth and meteorological variables using a combination model
[J].
Atmospheric Pollution Research, 2019, 10(3): 847-857.
DOI: 10.1016/j.apr.2018.12.013. |
[10] |
LIU Z R, HU B, WANG L L, et al. Seasonal and diurnal variation in particulate matter (PM 10 and PM 2.5 ) at an urban site of Beijing: analyses from a 9-year study
[J].
Environmental Science and Pollution Research, 2015, 22(1): 627-642.
DOI: 10.1007/s11356-014-3347-0. |
[11] |
李梓铭, 孙兆彬, 邵勰, 等. 北京城区PM2.5不同时间尺度周期性研究
[J].
中国环境科学, 2017, 37(2): 407-415.
LI Z M, SUN Z B, SHAO X, et al. Using Morlet wavelet analysis to analyze multiple time scale periodically in PM2.5 in Beijing [J]. China Environmental Science, 2017, 37(2): 407-415. DOI: 10.3969/j.issn.1000-6923.2017.02.002. |
[12] |
广东省统计局. 广东省第七次全国人口普查公报[EB/OL]. (2021-05-15)[2021-05-30]. http://stats.gd.gov.cn/attachment/0/421/421374/3284452.pdf.
|
[13] |
何丹, 徐宝平, 吴丽芳, 等. 江西省典型城市气象因素对PM2.5和PM10污染特征影响分析——以萍乡市为例
[J].
能源研究与管理, 2020(4): 42-46.
HE D, XU B P, WU L F, et al. Analysis of the impact of meteorological factors on the pollution characteristics of PM2.5 and PM10 in the typical cities of Jiangxi Province—taking Pingxiang city as an example [J]. Energy Research and Mangement, 2020(4): 42-46. |
[14] |
焦晨, 黄艳然, 赵钦风, 等. 时间序列分解模型在山东省糖尿病门诊量预测中的应用[J].
中国农村卫生事业管理, 2021, 41(2): 93-97.
JIAO C, HUANG Y R, ZHAO Q F, et al. Application of time series decomposition model to the predictionof the number of diabetics in Shandong Province[J]. Chinese Rural Health Service Administration, 2021, 41(2): 93-97. DOI: 10.3969/j.issn.1005-5916.2021.02.005. |
[15] |
郑薇, 王灿强, 李维德. 基于季节指数调整与HGWO-SVR算法的农产品价格预测模型[J]. 统计与决策, 2018, 34(19): 33-37.
ZHENG W, WANG C Q, LI W D. Forecasting model of agricultural products prices based on seasonal index adjustment and HGWO-SVR algorithm[J]. Statistics Decision, 2018, 34(19): 33-37. |
[16] |
郭秀英, 尹兴国, 张艳云. 季节性波动时间序列预测的分解季节指数法[J].
数理统计与管理, 2000(6): 60-64.
GUO X Y, YIN X G, ZHANG Y Y. The analysis method of seasonal index number of time sequence of seasonal fluctuation[J]. Journal of Applied Statistics and Management, 2000(6): 60-64. DOI: 10.3969/j.issn.1002-1566.2000.06.014. |
[17] |
XU W, REN G, LIU Y, et al. Forecasting energy consumption using a new GM–ARMA model based on HP filter: the case of Guangdong Province of China[J].
Economic Modelling, 2015, 45(1): 127-135.
|
[18] |
陈通箭. 基于改进小波神经网络的高速公路季节性车流量预测模型[J]. 智能城市, 2020, 6(3): 22-24.
CHEN T J. Seasonal traffic flow prediction model of expressway based on improved wavelet neural network[J]. Intelligent City, 2020, 6(3): 22-24. |
[19] |
SUN S, RAPPAPORT T S, RANGAN S, et al. Propagation path loss models for 5G urban micro-and macro-cellular scenarios[C]// 2016 IEEE 83rd Vehicular Technology Conference (VTC Spring). Nanjing: IEEE, 2016: 1-6.
|
[20] |
谢劭峰, 赵云, 李国弘, 等. 基于WPA-WOA-BP神经网络的PM2.5浓度预测
[J].
大地测量与地球动力学, 2021, 41(1): 12-16.
XIE S F, ZHAO Y, LI G H, et al. Prediction of PM2.5 concentration based on WPA-WOA-BP neural network [J]. Journal of Geodesy and Geodynamics, 2021, 41(1): 12-16. |
[21] |
王徐凯, 余华银, 杨桂元, 等. 基于多层组合模型的武汉市月平均PM2.5浓度预测
[J].
牡丹江师范学院学报(自然科学版), 2021(1): 7-11.
WANG X K, YU H Y, YANG G Y, et al. Prediction of nonthly average PM2.5 concentration based on multilayer combination model: a case study of Wuhan [J]. Journal of Mudanjiang Normal University(Natural Sciences Edition), 2021(1): 7-11. DOI: 10.3969/j.issn.1003-6180.2021.01.003. |
[22] |
郭骐嘉, 姚宜斌, 周永江. 融合GNSS气象参数的PM2.5随机森林预测模型[J]. 测绘科学, 2021, 46(4): 37-42.
GUO Q J, YAO Y B, ZHOU Y J. PM2.5 random forest prediction model incorporating GNSS meteorological parameters[J]. Science of Surveying and Mapping, 2021, 46(4): 37-42. |
[23] |
王赛兰. 基于多元方法和时间序列的PM2.5浓度分析与预测[D]. 长沙: 湖南师范大学, 2019.
|
[24] |
魏朋志, 谢劭峰, 周志浩, 等. 节假日效应下的PM2.5浓度预测[J/OL]. 桂林理工大学学报, 2021: 1-7(2021-03-03)[2021-03-22]. http://kns.cnki.net/kcms/detail/45.1375.N.20210303.1307.004.html.
WEI P Z, XIE S F, ZHOU Z H, et al. PM2.5 concentration prediction under holiday effect [J/OL]. Journal of Guilin University of Technology, 2021: 1-7 (2021-03-03)[2021-03-22]. http://kns.cnki.net/kcms/detail/45.1375.N.20210303.1307.004.html. |
[25] |
陈兵红, 靳全锋, 柴红玲, 等. 浙江省大气PM2.5时空分布及相关因子分析[J]. 环境科学学报, 2021: 41(3): 817-829.
CHEN B H, JIN Q F, CHAI H L, et al. Spatiotemporal distribution and correlation factors of PM2. 5 concentrations in Zhejiang Province[J]. Acta Scientiae Circumstantiae, 2021: 41(3): 817-829. |