计算机应用   2017, Vol. 37 Issue (11): 3057-3063  DOI: 10.11772/j.issn.1001-9081.2017.11.3057
0

引用本文 

戴李杰, 张长江, 马雷鸣. 基于机器学习的PM2.5短期浓度动态预报模型[J]. 计算机应用, 2017, 37(11): 3057-3063.DOI: 10.11772/j.issn.1001-9081.2017.11.3057.
DAI Lijie, ZHANG Changjiang, MA Leiming. Dynamic forecasting model of short-term PM2.5 concentration based on machine learning[J]. Journal of Computer Applications, 2017, 37(11): 3057-3063. DOI: 10.11772/j.issn.1001-9081.2017.11.3057.

基金项目

国家自然科学基金资助项目(41575046);浙江省科技厅公益性技术应用研究计划项目(2016C33010);浙江省金华市科技计划项目(2014-3-028)

通信作者

张长江, 电子邮箱 zcj74922@zjnu.edu.cn

作者简介

戴李杰(1990-), 男, 浙江桐庐人, 硕士研究生, 主要研究方向:信号与信息处理、机器学习、模式识别;
张长江(1974-), 男, 黑龙江齐齐哈尔人, 教授, 博士, 主要研究方向:信号与信息处理、机器学习、模式识别;
马雷鸣(1975-), 男, 新疆石河子人, 研究员, 博士, 主要研究方向:气象数值预报

文章历史

收稿日期:2017-05-16
修回日期:2017-06-09
基于机器学习的PM2.5短期浓度动态预报模型
戴李杰1, 张长江1, 马雷鸣2    
1. 浙江师范大学 数理与信息工程学院, 浙江 金华 321004;
2. 上海市气象局 中心气象台, 上海 200030
摘要: 针对目前现有的PM2.5模式预报系统的预报值偏离实际浓度较大的问题,从上海市浦东气象局获得2015年2月至7月的PM2.5实况观测浓度、PM2.5模式预报(WRF-Chem)浓度和5个主要气象因子的模式预报数据资料,联合应用支持向量机(SVM)和粒子群优化(PSO)算法建立滚动预报模型,对PM2.5未来24小时浓度进行预报,同时对未来一天的昼、夜均值及日均值浓度进行预报,并与径向基函数神经网络(RBFNN)、多元线性回归法(MLR)、模式预报(WRF-Chem)作对比。实验结果表明,相比其他预报方法,所提出的SVM模型较大提高了PM2.5未来1小时浓度预报精度,这与此前的研究结论相符;所提模型能对PM2.5未来24小时浓度进行较好的预报,能对未来一天的昼均值、夜均值及日均值进行有效预报,并且对未来12小时的逐时浓度及未来一天的夜均值浓度的预报准确度较高。
关键词: 机器学习    粒子群优化算法    动态模型    滚动预报    
Dynamic forecasting model of short-term PM2.5 concentration based on machine learning
DAI Lijie1, ZHANG Changjiang1, MA Leiming2     
1. College of Mathematics, Physics and Information Engineering, Zhejiang Normal University, Jinhua Zhejiang 321004, China;
2. Central Meteorological Observatory, Shanghai Meteorological Bureau, Shanghai 200030, China
Abstract: The forecasted concentration of PM2.5 forecasting model greatly deviate from the measured concentration. In order to solve this problem, the data (from February 2015 to July 2015), consisting of measured PM2.5 concentration, PM2.5 model (WRF-Chem) forecasted concentration and model forecasted data of 5 main meteorological factors, were provided by Shanghai Pudong Meteorological Bureau. Support Vector Machine (SVM) and Particle Swarm Optimization (PSO) algorithm were combined to build rolling forecasting model of hourly PM2.5 concentration in 24 hours in advance. Meanwhile, the nighttime average concentration, daytime average concentration and daily average concentration during the upcoming day were forecasted by rolling model. Compared with Radical Basis Function Neural Network (RBFNN), Multiple Linear Regression (MLR) and WRF-Chem, the experimental results show that the proposed SVM model improves the forecasting accuracy of PM2.5 concentration one hour in advance (according with the results concluded from finished research), and can comparatively well forecast PM2.5 concentration in 24 hours in advance, and effectively forecast the nighttime average concentration, daytime average concentration and daily average concentration during the upcoming day. In addition, the proposed model has comparatively high forecasting accuracies of hourly PM2.5 concentration in 12 hours in advance and nighttime average concentration during the upcoming day.
Key words: machine learning    Particle Swarm Optimization (PSO) algorithm    dynamic model    rolling forecasting    
0 引言

目前PM2.5浓度预报的研究在中国才刚刚起步,观测数据资料缺乏,PM2.5浓度的预报手段比较粗糙,实际预报效果不尽如人意。现阶段,对于PM2.5浓度的预报主要包括数值模式预报和统计预报两种方法。由于数值模式预报对污染与气象数据的要求较高,而大量详细的相关数据往往很难获得[1],所以数值模式预报方法在中国大多城市并不成熟。目前,主要通过统计模型对PM2.5浓度进行预报,主要包括回归模型(线性和非线性回归模型)、神经网络模型、支持向量机(Support Vector Machine, SVM)模型及马尔可夫模型等。

回归模型在气象预报领域是一种有效和广为使用的方法,近年来被较多应用于PM2.5浓度预报。如Cobourn[2]提出一种基于非线性回归和后推气流轨迹浓度的预报模型来预报PM2.5浓度日均最大值。Baker等[3]使用非线性回归模型对单一排放来源的PM2.5浓度进行预报。

人工神经网络(Artificial Neural Network, ANN)能较好地解决非线性问题,具有自学习功能,近年来也被应用于PM2.5浓度预报,其中尤以反向传播神经网络(Back Propagation Neural Network, BPNN)及径向基神经网络(Radical Basis Function Neural Network, RBFNN)较为常用。如:Zhang等[4]用变化隐含层神经元数量来改进BPNN,并用地理信息系统来评估不同算法的PM2.5浓度预报效果,结果显示当隐含层神经元数量为20时有较高的精度;Wu等[5]将气溶胶光学厚度、边界层高度、相对湿度、温度、风速、风向及月份作为神经网络的输入,利用基于贝叶斯规则的BPNN对PM微粒(PM1、PM10和PM2.5)进行研究分析。有学者使用RBFNN应用于PM2.5浓度预报,如:Zheng等[6]用RBFNN建立静态预报模型,选择8个影响因子作为训练输入,相应时间的PM2.5浓度值作为训练输出,结果表明RBFNN模型的预报能力优于BPNN模型。近年来,有学者将ANN与其他智能技术相结合应用于PM2.5浓度预报,如:Zhou等[7]建立基于总体平均经验模式分解和广义回归神经网络的混合预报模型,预报西安市未来一天的日均PM2.5浓度;Feng等[8]将基于轨道的地理参数作为神经网络的输入,用气团轨迹分析和小波变换的方法来提高ANN的性能,预报未来两天的PM2.5日平均浓度值,结果表明该混合模型有效地提高了预报准确度并具有预报高峰点浓度值的能力;Voukantsis等[9]建立线性回归与ANN混合的模型对PM10及PM2.5未来一天的日均值进行预报;Mishra等[10]将神经网络与模糊逻辑相结合,对德里市区的PM2.5浓度进行预报,所建立的模糊神经网络模型优于ANN模型和多元线性回归法(Multiple Linear Regression, MLR)模型。

近年来SVM逐渐被成功应用于对PM2.5的浓度进行预报,如:李龙等[11]选择综合气象指数、二氧化硫浓度、一氧化碳浓度、二氧化氮浓度和PM10浓度构成特征向量,并利用特征向量和PM2.5浓度数据来建立最小二乘支持向量机预报模型,结果表明该模型能够较为准确地预报PM2.5浓度,泛化能力较强。刘杰等[12]提出应用SVM和模糊粒化时间序列相结合的方法,以北京市城六区海淀万柳监测点为例,结果表明基于模糊粒化时间序列的预报模型能较好解决PM2.5机理性建模方式下由于影响因素考虑不全而造成的预报结果不稳定。

虽然上述国内外学者使用SVM对PM2.5浓度进行预报,但是所建立的模型基本上为静态模型,采用固定的数据进行训练,然后用测试数据进行预报。

除了上述基于回归方程、神经网络和SVM等技术外,近年来一些其他智能技术也被成功应用于PM2.5浓度预报的领域中,如:Sun等[13]提出改进的隐马尔可夫模型来预报日平均浓度,他们把重点放在PM2.5高浓度时间段,预报两个地区的PM2.5浓度过高的时期;Yang[14]使用椭圆轨道模型对日均PM2.5浓度的变化进行预报,并将此方法用在湘潭监测站的日均PM2.5浓度变化的预报,利用前6天的日均值数据来建立模型,预报下一天的PM2.5日均浓度值。

综上所述,由于PM2.5与空气质量、气象因子之间一般来说是非线性的关系,虽然神经网络能较好地解决非线性关系问题,非线性拟合能力较强,但仍然存在一些问题,其学习速度慢、容易过拟合和陷入局部极小值等问题都会导致预报结果的不准确。SVM在解决小样本、非线性及高维模式识别中表现出许多特有的优势,可用于模式分类、非线性回归和时间序列预报等。目前对PM2.5浓度进行预报进行的研究,所建立的模型基本上为静态模型。本文提出新的PM2.5浓度预报方法,在此之前,已完成研究应用SVM建立PM2.5未来一小时浓度动态预报模型,利用粒子群优化(Particle Swarm Optimization, PSO)算法辅助寻找适用于每次预报模型的最优SVM参数,实验结果表明SVM模型的预报精度最优,并且对PM2.5浓度变化剧烈的情况具有较好的预报能力[15]。之后,完成研究联合应用SVM和PSO建立滚动预报模型,预报PM2.5未来12 h浓度值及未来一天的夜均值浓度,实验结果表明SVM模型的预报精度最高[16]。在此研究基础上,由于人类生产生活具有昼夜的区分,则对未来白天和夜晚的PM2.5浓度均值的预报将比日均值更具指导意义,本文将PM2.5模式预报数据与5个主要气象影响因子模式预报数据结合使用,联合应用SVM和PSO建立滚动预报模型,对PM2.5未来24 h浓度进行逐时预报,同时对未来一天的昼、夜均值及未来一天的日均值浓度进行预报。本文所采用的方法是建立动态预报模型,每次建模训练的数据及SVM参数都是动态变化的,即每次预报时,都建立不同的动态模型,以提高PM2.5浓度预报的准确度。

1 数据及预报方法 1.1 数据选取与处理

数据是由上海浦东气象局所提供的历史小时数据(2015年2月3日至7月15日),包括PM2.5实况观测值、PM2.5模式预报(WRF-Chem)浓度及2 m高度处温度(Temperature, T2)、2 m高度处相对湿度(Relative Humidity, RH2)、风速(Wind Speed, WS)、风向(Wind Direction, WD)、海平面气压(Sea Level pressure, SLVL)等模式预报的气象要素数据。经过统计分析得出小时PM2.5浓度与该5个主要因子相关性较大,本文选择此5个气象因子(T2、RH2、WS、WD、SLVL)及PM2.5模式预报值作为预报PM2.5未来24 h建模的训练输入,训练输出为相应时刻的实况观测值,以此可建立未来24 h的滚动预报模型。本文使用模式预报中每日20:00(北京时间)起报数据,利用模式每次预报未来24 h的PM2.5模式预报值及5个气象因子模式预报数据,即每次预报时间段为21:00时至次日20:00时。

在训练之前,先对数据进行归一化处理,将数据都归一化到[0, 1],可消除各维数据之间的数量级差别,有利于提高模型的预报精度,所用到的归一化函数为:

$ {x_k} = \left( {{x_k} - {x_{{\rm{min}}}}} \right)/\left( {{x_{{\rm{max}}}} - {x_{{\rm{min}}}}} \right) $ (1)

式中:xmin为数据序列中的最小值;xmax为数据序列中的最大值。

1.2 训练建模所用样本量选择

本文联合应用SVM和PSO建立PM2.5未来24 h的滚动预报模型,训练数据分别选择前18 h至前48 h,得到不同训练建模数据的PM2.5预报的平均绝对误差(Mean Absolute Error, MAE)及平均相对误差(Mean Relative Error, MRE)。本文利用2015年2月3日至7月15日的数据进行分析,寻找最适合预报PM2.5未来24 h浓度值的训练建模所用数据量。首先选择2月4日20:00为第一次起报,每次预报未来24 h浓度值,每日20:00预报一次,以此类推,直到7月15日20:00最后一次起报,共162次预报数据。若选择2月4日为第一次预报,则训练建模数据量可从前18 h至前24 h,最终可得162次预报数据。若选择2月5日为第一次预报,则训练建模数据量可从前25 h至前48 h,最终可得161次预报数据。误差曲线如图 1所示。

图 1 采用不同样本量建模的误差曲线 Figure 1 Error curve of using different sample size for modeling

对于图 1(a)中采用不同样本量作为训练建模时的SVM模型的误差曲线,第一个点为使用前18 h的数据量进行训练建模,对162次预报(每次预报未来24 h)的MAE进行平均运算后所得数据,以此类推,得到训练数据量分别从前19 h至前48 h的误差曲线。图 1(b)中SVM模型的误差曲线为相同方法下所得的MRE曲线。由图 1可知,对于预报未来24 h浓度,当训练建模数据量为前19 h时,MAE较小,MRE最小,因此选取待预报时刻的前19 h的历史数据量作为训练建模的数据量。

1.3 ε-支持向量机非线性回归

利用SVM进行非线性回归和预报是将数据通过非线性映射到高维特征空间Ω中,即将低维线性不可分问题转化至高维中线性可分,在该特征空间中进行线性回归。

假设数据样本{(x1, y1), (x2, y2), …, (xn, yn)}, xiRd, yiR(i=1, 2, …, n), 则SVM回归模型的线性回归函数方程为: f(x)=ω·x+b,然后将回归估计转化为一个最优化问题,然后引入ε不敏感系数、松弛变量ξiξi*,且ξiξi*均大于等于0,则问题[17]描述为:

$ {\rm{min}}\frac{1}{2}{\left\| \mathit{\boldsymbol{\omega }} \right\|^2} + C\mathop \sum \limits_{i = 1}^n \xi + {\xi ^*} $ (2)
$ {\rm{s}}{\rm{.t}}{\rm{.}}\left\{ \begin{array}{l} {y_i} - \mathit{\boldsymbol{\omega }} \cdot {\mathit{\boldsymbol{x}}_i} - b \le \varepsilon + {\xi _i}\\ \mathit{\boldsymbol{\omega }} \cdot {\mathit{\boldsymbol{x}}_i} + b - {y_i} \le \varepsilon + \xi _i^*\\ {\xi _i},\xi _i^* \ge 0,i = 1,2, \ldots ,n \end{array} \right. $ (3)

式中,C为惩罚常数,用于控制对超出误差范围的样本的惩罚程度。然后用拉格朗日乘子法求解,将原空间中的非线性回归问题转化为高维特征空间中的线性回归进行求解,基本思想是将高维特征空间中的向量内积φ(xiφ(x)用输入空间中的核函数K(xi, x)来替代[18],即:

$ K\left( {{\mathit{\boldsymbol{x}}_i},\mathit{\boldsymbol{x}}} \right) = \mathit{\boldsymbol{\varphi }}\left( {{\mathit{\boldsymbol{x}}_i}} \right) \cdot \mathit{\boldsymbol{\varphi }}\left( \mathit{\boldsymbol{x}} \right) $ (4)

回归函数可以写为:

$ f\left( \mathit{\boldsymbol{x}} \right) = \mathop \sum \limits_{i = 1}^n \left( {{a_i} - a_i^*} \right)K\left( {{\mathit{\boldsymbol{x}}_i},\mathit{\boldsymbol{x}}} \right) + b $ (5)

式中:b为阈值;aiai*(i=1, 2, …, n)为拉格朗日乘子;K(xi, x)为核函数。核函数作为SVM的核心,巧妙地避开在高维空间中复杂的数学运算问题,使得复杂的问题简单化。

本文基于2015年2月至7月的气象数据资料,使用Matlab语言编程,用SVM、RBFNN和MLR分别建立预报模型。SVM类型选择epsilon-SVR,核函数选择RBF核函数,其中利用PSO优化SVM的惩罚参数c和核函数中的系数γ,通过交叉验证的方法选择最佳参数cγ,然后用选定的参数进行训练建模,用训练好的模型进行预报。

2 粒子群优化算法

粒子群优化(PSO)算法中每个粒子代表问题的一个潜在解,用位置、速度和适应度值三项指标来表示该粒子的特征,速度影响粒子的运动方向和距离,适应度值由适应度函数计算所得。在每次迭代过程中,粒子通过个体极值和种群全局极值来更新自身速度和位置,公式如下:

$ V_{id}^{k + 1} = \omega V_{id}^k + {c_1}{r_1}\left( {P_{id}^k - X_{id}^k} \right) + {c_2}{r_2}\left( {P_{gd}^k - X_{id}^k} \right) $ (6)
$ X_{id}^{k + 1} = V_{id}^k + V_{id}^{k + 1} $ (7)

式中:ω为惯性权重;d=1, 2, …, D; i=1, 2, …, n; k为迭代次数;Vid为粒子的速度; Xid为粒子的位置;c1c2为学习因子;r1r2为分布于[0, 1]的随机数。

惯性权重ω描述了粒子的惯性对于速度的影响,其取值大小可以调节PSO算法的全局与局部寻优的能力。You等[19]指出随着迭代次数的增加,惯性权重逐渐减小,算法的局部寻优能力越来越强,但也有可能会陷入局部最优,他们提出了自适应惯性权重的策略,随着迭代次数的增加,惯性权重将自动改变,表达式为:

$ \omega = \left\{ {\begin{array}{*{20}{l}} {{\omega _{{\rm{min}}}} - \frac{{\left( {{\omega _{{\rm{max}}}} - {\omega _{{\rm{min}}}}} \right) \times \left( {f - {f_{{\rm{min}}}}} \right)}}{{\left( {{f_{{\rm{avg}}}} - {f_{{\rm{min}}}}} \right)}},}&{f \le {f_{{\rm{avg}}}}}\\ {{\omega _{{\rm{max}}}},}&{f > {f_{{\rm{avg}}}}} \end{array}} \right. $ (8)

式中:ωmaxωmin表示惯性权重的最大值和最小值,f表示当前的目标函数值,favgfmin表示当前所有微粒的平均目标值和最小目标值,权重值ω会随着目标函数值而自动地改变,当各粒子的目标值趋于一致或局部最优时,将使惯性权重增加,从而避免陷入局部最优;当各粒子的目标值比较分散时,将使惯性权重减小,有利于粒子靠近最优粒子。该自适应改变惯性权重策略可有效地提高全局和局部寻优能力。在大多数的应用中,ωmax=0.9,ωmin=0.4时,算法性能最好。

粒子群算法存在容易早熟收敛的缺点,当遇到多峰问题时易陷入局部最优解。借鉴遗传算法中的变异思想,将变异算子引入粒子群算法,即对某些变量以一定的概率重新初始化。本文在粒子群算法的基础上引入变异算子,在每次速度和种群更新过后,以一定的概率重新初始化粒子,使新粒子可以重新在更大空间中进行寻优,增强粒子群算法的寻优能力。

3 预报模型的建立

基于上海浦东气象局获得2015年2月—7月的PM2.5实况观测浓度、PM2.5模式预报(WRF-Chem)浓度和5个主要气象影响因子的模式预报数据资料,在PM2.5模式预报数据的基础上,加入另外5个主要气象影响因子模式预报数据,联合应用SVM和PSO建立滚动预报模型,对PM2.5未来24 h浓度进行预报,同时对未来一天的昼、夜均值及未来一天的日均值浓度进行预报。

具体方案如下:

1) 采用三次样条插值方法对所获得的数据(2015年2月—7月)中少量的缺失数据进行插值,然后对数据进行归一化预处理。

2) 利用SVM与RBFNN、MLR分别进行建模,将模式下PM2.5浓度预报值和同时刻5个气象影响因子模式预报值作为训练输入,相应时刻的PM2.5实况观测值作为输出,训练数据量取前19 h的数据。

3) 对于已建好的模型,导入未来一个小时PM2.5及5个气象影响因子模式预报值,预报未来一小时PM2.5浓度值。

4) 将预报所得的PM2.5浓度值作为该时刻的实况值,作为预报下一个小时浓度的建模所用,可预报PM2.5下一个小时浓度值,以此建立滚动预报模型,然后转步骤3)直至预报到24 h为止。

5) 将预报所得的未来24 h浓度值的前12 h(21:00至次日8:00)和后12 h(次日9:00至20:00)分别作平均运算,得到未来夜均值和昼均值;将预报所得的未来24 h(21:00至次日20:00)浓度值作平均运算,得到未来一天的日均值浓度。

基于机器学习的PM2.5浓度滚动预报模型流程如图 2所示。

图 2 基于机器学习的PM2.5浓度滚动预报模型 Figure 2 Rolling forecasting model of PM2.5 concentration based on machine learning
4 实验结果及分析

本文使用Matlab语言编程,用SVM、MLR和RBFNN分别建立预报模型。最终经实验得出未来24 h、未来一天的夜均值、昼均值及未来一天的日均值浓度预报曲线、绝对误差柱状图。

4.1 预报未来一天的PM2.5夜均值及昼均值 4.1.1 预报曲线及误差柱状图

2015年2月—7月的夜均值及昼均值浓度预报曲线如图 3所示。2015年2月—7月的夜均值及昼均值绝对误差柱状图如图 4所示。

图 3 PM2.5夜均值及昼均值浓度预报曲线 Figure 3 Forecasting curve of nighttime and daytime average concentration
图 4 PM2.5夜均值及昼均值绝对误差柱状图 Figure 4 Absolute error histogram of nighttime and daytime average concentration

图 3可知,对于PM2.5未来一天的夜均值及昼均值浓度,各种方法的预报曲线与实际观测曲线的趋势都相似。SVM模型的预报曲线与实际观测曲线最为接近,尤其在浓度转变的波峰波谷附近,该模型仍能较好地进行预报。WRF-Chem预报曲线的前半部分相比实际观测曲线偏低。RBFNN模型的预报曲线有少数偏离实况观测值较大,整体趋势与实际观测曲线相似。MLR模型的预报曲线有较多的点偏离实际观测曲线,预报效果不理想。相比之下,SVM模型的预报曲线与实际观测曲线的趋势最为接近。

图 4可知,对于PM2.5未来一天的夜均值及昼均值浓度,绝对误差落在最小误差区间(-5, 5]的频数最多的是SVM预报模型。WRF-Chem预报的误差柱状图中,落在误差区间(-15, -5]的频数最多。RBFNN模型和MLR模型预报的误差柱状图中,落在最小误差区间(-5, 5]的频数最多,但RBFNN模型的预报中有少数落在误差较大的区间,偏离实况观测值较大。各种预报方法的MAE从小到大依次是SVM模型、WRF-Chem、RBFNN模型和MLR模型。相比之下,对于PM2.5未来一天的夜均值及昼均值浓度,SVM模型的预报精度最高,并且算法稳定性最好。

4.1.2 误差分析

夜均值及昼均值误差数据如表 1所示,夜均值误差数据如表 2所示。

表 1 夜均值及昼均值MAE        μg/m3 Table 1 MAE of nighttime and daytime average concentration        μg/m3
表 2 夜均值MAE        μg/m3 Table 2 MAE of nighttime average concentration        μg/m3

表 1可知,对于未来一天的夜均值及昼均值浓度,SVM模型的MAE比WRF-Chem小,RBFNN模型和MLR模型的MAE比SVM模型和WRF-Chem大,并且RBFNN模型的预报稳定性较差,MLR模型的预报误差最大。对于2月4日—7月15日的MAE,从小到大分别是SVM模型、WRF-Chem、RBFNN模型及MLR模型。综上所述,对于未来一天的夜均值及昼均值浓度,SVM模型的预报精度最高,算法性能稳定。同时发现,对于PM2.5的短期预报(未来一天的夜均值及昼均值浓度),RBFNN模型的预报精度比MLR模型高。

表 2可知,对于未来一天的夜均值浓度,SVM模型每个月的MAE都比WRF-Chem小,RBFNN模型及MLR模型的MAE比SVM模型和WRF-Chem大,并且RBFNN模型和MLR模型的预报稳定性较差。对于2月4日—7月15日的MAE,从小到大分别是SVM、WRF-Chem、RBFNN及MLR。对于未来一天夜均值浓度的预报,SVM模型的预报精度较高,误差比RBFNN模型、MLR模型及WRF-Chem小。本文所提出的SVM预报模型可以有效地预报未来一天的夜均值浓度,预报误差相比WRF-Chem预报有一定降低。

4.2 预报未来一天的日均值 4.2.1 预报曲线及误差柱状图

2015年2月—7月的日均值预报曲线如图 5所示。2015年2月—7月的日均值绝对误差柱状图如图 6所示。

图 5 PM2.5日均值预报曲线 Figure 5 Forecasting curve of daily average concentration
图 6 日均值绝对误差柱状图 Figure 6 bsolute error histogram of daily average concentration

图 5可知,对于PM2.5未来一天的日均值浓度,各种方法的预报曲线与实际观测曲线的趋势都相似。SVM模型的预报曲线与实际观测曲线最为接近,尤其在浓度转变的波峰波谷附近,该方法仍能较好地进行预报。WRF-Chem预报曲线的前半部分相比实际观测曲线偏低。RBFNN模型的预报曲线有少数偏离实况观测值较大,整体趋势与实际观测曲线相似。MLR模型的预报曲线有较多的点偏离实际观测曲线,预报效果不理想。相比之下,SVM模型的预报曲线与实际观测曲线的趋势最为接近,算法性能最稳定。

图 6可知,对于PM2.5未来一天的日均值浓度,绝对误差落在最小误差区间(-5, 5]的频数最多的是SVM模型。WRF-Chem预报的误差柱状图中,落在误差区间(-15, -5]的频数最多。RBFNN模型预报的误差柱状图中,落在最小误差区间(-5, 5]的频数最多,但有少数点落在误差较大的区间,偏离实况观测值较大。各种预报方法的MAE从小到大依次是SVM模型、WRF-Chem、RBFNN模型和MLR模型。相比之下,对于PM2.5未来一天的日均值浓度,SVM模型预报的精度最高,并且算法稳定性最好。

4.2.2 误差分析

日均值的误差数据如表 3所示。

表 3 日均值MAE Table 3 MAE of daily average concentration

表 3可知,对于未来一天的日均值浓度,SVM模型的MAE比WRF-Chem小,RBFNN模型预报的稳定性较差,MLR模型的预报误差最大。相比各个预报方法,本文所提出的SVM模型的预报误差最小,算法性能最稳定。对于2月4日至7月15日的MAE,从小到大分别是SVM模型、WRF-Chem、RBFNN模型及MLR模型。综上所述,对于未来一天的日均值浓度,SVM模型的预报准确度最高,算法性能稳定。同时发现,对于PM2.5的短期预报(未来一天的日均值浓度),RBFNN模型的预报精度比MLR模型高。

5 结语

本文提出基于机器学习的PM2.5短期浓度预报方法,利用气象影响因子及PM2.5浓度实际观测数据,联合应用SVM和PSO建立PM2.5动态预报模型,并对比RBFNN、MLR、WRF-Chem预报效果,经实验得出如下结论:

1) 对于预报未来24 h逐时浓度值,第一个小时的预报精度较高,前12 h的预报误差相比后12 h更小,本文所提出的SVM模型可以对未来12 h的均值进行有效预报,并且算法性能稳定。由于本文采用滚动预报的方法,预报误差会不断累积,不可避免地存在一些不足,而这些问题也是今后努力研究的方向。

2) 对于未来一天的夜均值及昼均值浓度,2015年2月—7月MAE从小到大依次为SVM模型、WRF-Chem、RBFNN模型及MLR模型,体现了SVM在处理高维非线性问题上的优势。此前已完成的研究表明:在预报未来一小时浓度中,MLR模型的误差比RBFNN模型小[15],说明在临近预报中,MLR模型优于RBFNN模型,而在本文的短期预报中,RBFNN模型优于MLR模型,说明RBFNN模型比MLR模型具有更强的非线性问题的处理能力。本文所提出的SVM预报模型可对未来一天的夜均值(12 h均值)进行较为准确的预报,并且算法性能稳定。若使用模式每日8:00起报的数据,则对未来12 h均值(昼均值)进行较为准确的预报,体现了滚动预报模型的优势,可为人们出行及生产生活起到指导作用。

3) 对于未来一天的日均值浓度,2015年2月—7月MAE从小到大依次为SVM模型、WRF-Chem、RBFNN模型及MLR模型,体现了SVM在处理高维非线性问题上的优势。同理说明在临近预报中,MLR模型优于RBFNN模型,而在短期预报中,RBFNN模型优于MLR模型。相比之下,SVM模型可对未来一天的日均值浓度进行有效预报。

参考文献(References)
[1] 刘慧君. 武汉市PM2. 5污染的演变预测及成因分析和仿真[D]. 长沙: 湖南大学, 2014. (LIU H J. Developing pattern prediction, casual analysis and simulation of PM2.5 pollution in Wuhan city[D]. Changsha:Hunan University, 2014.) http://cdmd.cnki.com.cn/Article/CDMD-10532-1014233372.htm
[2] COBOURN W G. An enhanced PM2.5 air quality forecast model based on nonlinear regression and back-trajectory concentrations[J]. Atmospheric Environment, 2010, 44(25): 3015-3023. DOI:10.1016/j.atmosenv.2010.05.009
[3] BAKER K R, FOLEY K M. A nonlinear regression model estimating single source concentrations of primary and secondarily formed PM2.5[J]. Atmospheric Environment, 2011, 45(22): 3758-3767. DOI:10.1016/j.atmosenv.2011.03.074
[4] ZHANG P, ZHANG T, HE L, et al. Study on prediction and spatial variation of PM2.5 pollution by using improved BP artificial neural network model of computer technology and GIS[J]. Computer Modelling and New Technologies, 2014, 18(12): 107-115.
[5] WU Y R, GUO J P, ZHANG X Y, et al. Synergy of satellite and ground based observations in estimation of particulate matter in eastern China[J]. Science of the Total Environment, 2012, 433(7): 20-30.
[6] ZHENG H M, SHANG X X. Study on prediction of atmospheric PM2.5 based on RBF neural network[C]//Proceedings of the 20134th International Conference on Digital Manufacturing and Automation. Piscataway, NJ:IEEE, 2013:1287-1289.
[7] ZHOU Q P, JIANG H Y, WANG J Z, et al. A hybrid model for PM2.5 forecasting based on ensemble empirical mode decomposition and a general regression neural network[J]. Science of the Total Environment, 2014, 496(2): 264-274.
[8] FENG X, LI Q, ZHU Y J, et al. Artificial neural networks forecasting of PM2.5 pollution using air mass trajectory based geographic model and wavelet transformation[J]. Atmospheric Environment, 2015, 107: 118-128. DOI:10.1016/j.atmosenv.2015.02.030
[9] VOUKANTSIS D, KARATZAS K, KUKKONEN J, et al. Intercomparison of air quality data using principal component analysis, and forecasting of PM10 and PM2.5 concentrations using artificial neural networks, in Thessaloniki and Helsinki[J]. Science of the Total Environment, 2011, 409(7): 1266-1276. DOI:10.1016/j.scitotenv.2010.12.039
[10] MISHRA D, GOYAL P, UPADHYAY A. Artificial intelligence based approach to forecast PM2.5 during haze episodes:a case study of Delhi, India[J]. Atmospheric Environment, 2015, 102: 239-248. DOI:10.1016/j.atmosenv.2014.11.050
[11] 李龙, 马磊, 贺建峰, 等. 基于特征向量的最小二乘支持向量机PM2.5浓度预测模型[J]. 计算机应用, 2014, 34(8): 2212-2216. (LI L, MA L, HE J F, et al. PM2.5 concentration prediction model of least squares support vector machine based on feature vector[J]. Journal of Computer Applications, 2014, 34(8): 2212-2216. DOI:10.11772/j.issn.1001-9081.2014.08.2212)
[12] 刘杰, 杨鹏, 吕文生, 等. 模糊时序与支持向量机建模相结合的PM2.5质量浓度预测[J]. 北京科技大学学报, 2014, 36(12): 1694-1702. (LIU J, YANG P, LYU W S, et al. Prediction model of PM2.5 mass concentrations based on fuzzy time series and support vector machine[J]. Journal of University of Science and Technology Beijing, 2014, 36(12): 1694-1702.)
[13] SUN W, ZHANG H, PALAZOGLU A, et al. Prediction of 24-hour-average PM2.5 concentrations using a hidden Markov model with different emission distributions in Northern California[J]. Science of the Total Environment, 2013, 443(3): 93-103.
[14] YANG Z C. Modeling and forecasting daily movement of ambient air mean PM2.5 concentration based on the elliptic orbit model with weekly quasi-periodic extension:a case study[J]. Environmental Science and Pollution Research, 2014, 21(16): 9959-9972. DOI:10.1007/s11356-014-2899-3
[15] 张长江, 戴李杰, 马雷鸣. 应用SVM的PM2.5未来一小时浓度动态预报模型[J]. 红外与激光工程, 2017, 46(2): 252-259. (ZHANG C J, DAI L J, MA L M. Dynamic model for forecasting concentration of PM2.5 one hour in advance using support vector machine[J]. Infrared and Laser Engineering, 2017, 46(2): 252-259.)
[16] ZHANG C J, DAI L J, MA L M. Rolling forecasting model of PM2.5 concentration based on support vector machine and particle swarm optimization[C]//Proceedings of the 2016 International Symposium on Optoelectronic Technology and Application. Bellingham, WA:SPIE, 2016:10156.
[17] 梁栋, 杨勤英, 黄文江, 等. 基于小波变换与支持向量机回归的冬小麦叶面积指数估算[J]. 红外与激光工程, 2015, 44(1): 335-340. (LIANG D, YANG Q Y, HUANG W J, et al. Estimation of leaf area index based on wavelet transform and support vector machine regression in winter wheat[J]. Infrared and Laser Engineering, 2015, 44(1): 335-340.)
[18] 金焱, 褚政, 张瑾. 改进加权支持向量机回归方法器件易损性评估[J]. 强激光与粒子束, 2014, 26(12): 177-182. (JIN Y, CHU Z, ZHANG J. Improved weighted support vector regression algorithm for vulnerability assessment of electronic devices illuminated or injected by high power microwave[J]. High Power Laser and Particle Beams, 2014, 26(12): 177-182.)
[19] YOU Z Y, CHEN W R, HE G J, et al. Adaptive weight particle swarm optimization algorithm with constriction factor[C]//Proceedings of the 2010 International Conference of Information Science and Management Engineering. Washington, DC:IEEE Computer Society, 2010:245-248.