计算机应用   2017, Vol. 37 Issue (10): 2854-2860  DOI: 10.11772/j.issn.1001-9081.2017.10.2854
0

引用本文 

石峰, 楼文高, 张博. 基于灰狼群智能最优化的神经网络PM2.5浓度预测[J]. 计算机应用, 2017, 37(10): 2854-2860.DOI: 10.11772/j.issn.1001-9081.2017.10.2854.
SHI Feng, LOU Wengao, ZHANG Bo. Neural network model for PM2.5 concentration prediction by grey wolf optimizer algorithm[J]. Journal of Computer Applications, 2017, 37(10): 2854-2860. DOI: 10.11772/j.issn.1001-9081.2017.10.2854.

基金项目

上海高校知识服务平台"上海市商贸服务业知识项目服务中心"建设项目(ZF1226)

通信作者

张博, E-mail:79379816@qq.com

作者简介

石峰(1992-), 男, 河南南阳人, 硕士研究生, 主要研究方向:人工神经网络、数据挖掘;
楼文高(1964-), 男, 浙江杭州人, 教授, 博士, 主要研究方向:金融工程、商务经济学、人工神经网络、数据挖掘;
张博(1979-), 男, 天津人, 副教授, 博士, CCF会员, 主要研究方向:网络新媒体、数字出版

文章历史

收稿日期:2017-04-20
修回日期:2017-06-22
基于灰狼群智能最优化的神经网络PM2.5浓度预测
石峰1, 楼文高1,2, 张博3    
1. 上海理工大学 光电信息与计算机工程学院, 上海 200093;
2. 上海商学院 信息与计算机学院, 上海 200235;
3. 上海理工大学 出版印刷与艺术设计学院, 上海 200093
摘要: 针对目前PM2.5浓度测量成本高和测量过程繁杂等问题,建立了基于灰狼群智能最优化算法的神经网络预测模型。从非机理模型的角度,结合气象因素和空气污染物对上海市的PM2.5浓度进行预测,并使用平均影响值分析了影响PM2.5浓度的重要因素。使用灰狼群智能算法优化神经网络的过程中,引入了检验样本实时监控训练过程以避免发生"过训练"现象,确保建立的神经网络模型具有较好的泛化能力。实验结果表明:PM10对PM2.5的影响最为显著,其次是CO和前一天PM2.5。选取2016年11月1日-12日的数据进行验证,其平均相对误差为13.46%,平均绝对误差为8μg/m3,与粒子群算法优化的神经网络、BP神经网络模型及支持向量回归(SVR)模型的误差相比,平均相对误差分别下降了约3个百分点、5个百分点和1个百分点。因此,使用灰狼算法优化的神经网络更适合上海市PM2.5浓度的预测和空气质量的预报。
关键词: 灰狼优化算法    BP神经网络    PM2.5浓度预测    预测模型    空气污染物    
Neural network model for PM2.5 concentration prediction by grey wolf optimizer algorithm
SHI Feng1, LOU Wengao1,2, ZHANG Bo3     
1. School of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China;
2. Information and Computer Faculty, Shanghai Business School, Shanghai 200235, China;
3. College of Communication and Art Design, University of Shanghai for Science and Technology, Shanghai 200093, China
Abstract: Focusing on high cost and complicated process of the fine particulate matter (PM2.5) measurement system, a neural network model based on grey wolf optimizer algorithm was established. From the perspective of non-mechanism model, the daily PM2.5 concentration in Shanghai was forecasted with meteorological factors and air pollutants, and the important factors were analyzed by mean impact value. To avoid the "over training" and ensure the generalization ability, the validation datasets were used to monitor the training process. The experimental results show that the most significant factors that affecting the PM2.5 concentration are PM10, and then are the CO and the previous day's PM2.5. Based on the datasets obtained from November 1, 2016 to November 12, the relative average error of the proposed model is 13.46%, the absolute average error is 8μg/m3; the relative average error of it is decreased by about 3 percentage points, 5 percentage points and 1 percentage points compared with the prediction models based on Particle Swarm Optimization (PSO), BP neural network and Support Vector Regression (SVR). The neural network model based on the grey wolf optimizer algorithm is more suitable for forecasting PM2.5concentration and air quality in Shanghai.
Key words: grey wolf optimizer algorithm    BP neural network    PM2.5 concentration prediction    prediction model    air pollutant    
0 引言

空气污染问题变得越来越严重, 不仅对汽车行业、建筑业、环保行业等社会支柱产业发展产生很大影响, 对商贸服务业等第三产业发展、产业结构转型和高层次人才引进等也会造成重大影响[1], 同时对城市居民的身体健康也构成很大威胁[2]。我国沿海大城市大气污染的主要来源是机动车尾气、中长途传输的沙尘、生活物质燃烧、城市扬尘等[3-4], 除此之外, 污染物与气象要素之间的交互作用[5-7]对大气污染的影响也很显著。在大气污染物中,PM2.5是关注的重点对象, 其测量成本高、测量过程繁杂等因素给空气质量发布带来不便, 为此从非机理角度, 建立可靠、合理的PM2.5浓度预报模型, 对PM2.5监测和发布空气质量指数具有重要的理论意义和实践价值, 是环保部门和环境科学与工程学界的热点和难点问题。

空气质量的影响因素较为复杂, 国内外对空气质量研究的模型主要有机理模型和非机理模型。机理模型的预报模式主要以数值预报为主, 数值预报的准确率主要受到模式分辨率、污染源排放资料和空气质量监测数据等诸多因素影响[8]。目前数值预报采用的主要模型多尺度空气质量(Community Multiscale Air Quality, CMAQ)模型[9]、天气预报模式(Weather Research and Forecasting Model, WRF)与CMAQ结合的WRF-CMAQ模型、[10]、WRF-Chem模型[11]、多模式集合预报[12]等, 王占山等[13]对CMAQ模型在大气污染物各方面的应用研究作了总结, 并指出了国内外使用该模型研究的主要方面有评价模型的模拟性能,模拟预测空气中污染物浓度以及研究各污染物的来源、产生机理及传输扩散过程。使用机理模型对空气质量进行预报, 预报的精度相对比较高, 但需要考虑复杂的物理化学过程、气象、污染物扩散、边界层条件等综合因素, 进而造成预报系统计算复杂、软硬件要求高。而非机理模型是通过历史数据获取数据特征、发现潜在的变化规律, 简化了空气质量预报的影响因素, 方便在实际中应用, 近年来在实际应用中已经逐渐成熟。当前国内外采用的非机理模型主要有基于自回归移动平均模型(Autoregressive Integrated Moving Average Model, ARIMA)[14-15]、多元线性回归模型(Multivariable Linear Regression Model, MLR)[16-17]、灰色理论预测模型[18-19]、支持向量机(Support Vector Machine, SVM)[20-21]、神经网络模型(Artificial Neural Network, ANN)[22-28]的大气污染物浓度预测。经分析可发现:ARIMA模型、灰色模型和多元线性(实际上是幂函数)等确定型模型虽然在预测PM2.5浓度中具有一定的适用性, 但是没有考虑到污染物之间的相互作用等, 而神经网络恰能够模拟这种机理不明确的非线性系统。文献[22]采用概率神经网络(Probabilistic Neural Network, PNN)模型只能进行分类(定性)研究, 而文献[23-28]虽然采用T-S、小波及粒子群算法等优化算法改进BP神经网络模型性能和收敛速度, 取得了一定效果, 但本质上仍然是采用反向传播(Back Propagation, BP)神经网络建模, 而BP神经网络建模的最大问题是训练时很容易出现“过训练”现象, 从而导致建立的模型没有泛化能力和实用价值。这些文献中大多没有遵循BP神经网络建模的基本原则和步骤[32, 38], 泛化能力和预测能力值得进一步的探讨和研究。

从非机理模型的角度出发, 针对当前使用神经网络在空气质量预报应用中存在的问题, 本文在进行建模时遵循神经网络建模基本原则和步骤, 建立了基于灰狼优化的神经网络模型对上海市PM2.5日均浓度进行预测, 分析了灰狼优化的神经网络模型的泛化能力、有效性和鲁棒性。研究结果表明:群智能灰狼最优化算法克服了BP算法收敛速度慢和易陷入局部最优等缺陷, 收敛性能好, 通过采用检验样本实时监控训练过程以避免发生“过训练”现象, 确保建立的模型具有较好的泛化能力, 根据建立模型的测试样本、预测样本与训练样本和检验样本具有相似的精度, 说明建立的PM2.5浓度预测模型具有较好的预测能力和实用价值, 可以为PM2.5浓度监测和发布空气质量指数提供可靠的依据和预测模型(方法)。

1 模型原理 1.1 BP神经网络

BP神经网络是一种多层前馈神经网络, 网络结构包含输入层、隐含层和输出层, 通过样本的训练寻求合适的网络权值和阈值。关于BP神经网络的详细原理请参考文献[29-30]。BP神经网络有诸多的优点, 但由于网络结构过大以及过度训练都会造成训练过程出现“过训练”现象而陷于局部最优, 收敛性能差。因此, 应用BP神经网络建模必须遵循一定的建模原则和基本步骤[31-33, 38]

1.2 灰狼优化神经网络的算法

Mirjalili等[34]在2014年提出了灰狼优化(Grey Wolf Optimizer, GWO)算法, 是一种新型群智能优化算法, 通过模拟自然界中灰狼寻找、包围和攻击猎物等狩猎机制的过程来完成最优化工作。该算法将狼群划分为4个等级, 将狼按照适应度值最优排序, 选择适应度值的前3个分别作为最优灰狼α, 次优灰狼β和第三优灰狼δ, 剩余灰狼作为ω。在捕食过程中, 由αβδ灰狼进行猎物的追捕, 而剩余灰狼ω追随前三者进行追踪和围捕, 猎物的位置便是问题的解。研究证明GWO算法在全局寻优方面明显优于粒子群优化(Particle Swarm Optimization, PSO)算法、遗传算法(Genetic Algorithm, GA)和进化策略(Evolutionary Strategy, ES)等智能优化算法[34-35]。因此, 本文利用GWO来优化BP神经网络的权重和阈值。下面给出灰狼算法的主要数学模型:

定义1 定义猎物所在位置的全局最优解及个体与猎物间的距离向量D

$\mathit{\boldsymbol{D}} = {\rm{|}}\mathit{\boldsymbol{C}}{\rm{ }} \cdot {\mathit{\boldsymbol{X}}_p}{\rm{(}}\mathit{t}{\rm{) - }}\mathit{\boldsymbol{X}}{\rm{(}}\mathit{t}{\rm{)|}}$ (1)
$\mathit{C}=2{{r}_{1}}$ (2)

其中:Xp(t)表示第t代猎物的位置; X(t)表示第t代灰狼个体当前的位置; C表示向量系数; r1为[0, 1]内的随机数。

定义2  灰狼向猎物移动过程中, 个体的更新方式。

$\left\{ \begin{align} & {{\mathit{\boldsymbol{D}}}_{\alpha }}=\rm{ }\!\!|\!\!\rm{ }{{\mathit{C}}_{\rm{1}}}\cdot {{\mathit{\boldsymbol{X}}}_{\alpha }}(\mathit{t})-{{\mathit{\boldsymbol{X}}}_{\omega }}\rm{(}\mathit{t}\rm{) }\!\!|\!\!\rm{ } \\ & {{\mathit{\boldsymbol{D}}}_{\beta }}=\rm{ }\!\!|\!\!\rm{ }{{\mathit{C}}_{\rm{2}}}\cdot {{\mathit{\boldsymbol{X}}}_{\beta }}(\mathit{t})-{{\mathit{\boldsymbol{X}}}_{\omega }}\rm{(}\mathit{t}\rm{) }\!\!|\!\!\rm{ } \\ & {{\mathit{\boldsymbol{D}}}_{\delta }}=\rm{ }\!\!|\!\!\rm{ }{{\mathit{C}}_{\rm{3}}}\cdot {{\mathit{\boldsymbol{X}}}_{\delta }}(\mathit{t})-{{\mathit{\boldsymbol{X}}}_{\omega }}\rm{(}\mathit{t}\rm{) }\!\!|\!\!\rm{ } \\ & {{\mathit{\boldsymbol{X}}}_{\rm{1}}}={{\mathit{\boldsymbol{X}}}_{\alpha }}-{{A}_{1}}\cdot {{\mathit{\boldsymbol{D}}}_{\alpha }} \\ & {{\mathit{\boldsymbol{X}}}_{\rm{2}}}={{\mathit{\boldsymbol{X}}}_{\beta }}-{{A}_{2}}\cdot {{\mathit{\boldsymbol{D}}}_{\beta }} \\ & {{\mathit{\boldsymbol{X}}}_{\rm{3}}}={{\mathit{\boldsymbol{X}}}_{\delta }}-{{A}_{3}}\cdot {{\mathit{\boldsymbol{D}}}_{\delta }} \\ & {{\mathit{\boldsymbol{X}}}_{\omega }}(\mathit{t}+1)=({{\mathit{\boldsymbol{X}}}_{1}}+{{\mathit{\boldsymbol{X}}}_{2}}+{{\mathit{\boldsymbol{X}}}_{3}})/3 \\ \end{align} \right.$ (3)
$A=2a{{r}_{2}}-a$ (4)

其中:A为收敛因子; r2表示为[0, 1]内的随机数; a表示在迭代过程中随着迭代次数增加从2递减至0;Xω(t+1) 表示灰狼个体更新后的位置。

灰狼优化算法是一种能够寻找全局最优解的群智能算法, 具有加速模型收敛速度快和提升精度等特点, 将BP神经网络的权重和阈值作为灰狼的位置信息, 根据灰狼对猎物的位置判断, 不断更新位置, 就等同于在不断更新权重和阈值, 最终寻得全局最优。具体优化神经网络过程如下:

Step1  确定神经网络结构, 主要是隐层节点的选取。

Step2  初始化参数。根据网络结构计算灰狼个体位置信息的维度(dim)、灰狼种群大小(SN)、最大迭代次数(maxIter)、灰狼维度的上界(ub)和下界(lb), 随机初始化灰狼位置。

Step3  确定神经网络适应度函数及隐层节点、输出节点的激励函数, 其中适应度函数选用均方误差(Mean Squared Error, MSE), 隐含层和输出层的激励函数均采用Sigmoid型函数。

Step4  计算适应度值, 选取最优灰狼α、次优灰狼β和第三优灰狼δ, 根据式(3) 更新剩余灰狼ω的位置信息,并更新参数ACa

Step5  记录训练样本和检验样本的误差及所对应的最优灰狼α的位置。

Step6  判断个体每一维度是否存在越界, 将越界的值设置为灰狼维度的上界(ub)或下界(lb)。

Step7  判断是否满足设定的误差或者达到最大迭代次数; 否则重复Step4~Step7, 直到满足条件。

Step8  最后返回结果为最优灰狼位置α及对应的最小误差;训练样本和检验样本的误差及训练过程每一次迭代最优灰狼α的位置。

2 建立PM2.5浓度预测模型

本文空气质量数据来源于上海市空气质量实时查询系统(http://www.semc.gov.cn/aqi/home/Index.aspx), 气象数据来源于天气网(http://lishi.tianqi.com/shanghai/index.html)。选取上海市2013年1月1日(之前没有公布这方面的数据)至2016年10月31日空气污染物数据及气象数据(1 400组)为原始数据, 对上海市PM2.5浓度建立预测模型。从获取的原始数据可以看出, 初步选取的指标包括气象因素(天气状况、温度、风向和风速)和空气污染物(PM10、NO2、SO2、CO、O3)。

2.1 选取影响PM2.5浓度的因素

根据上海的气温季节性变化明显, 习惯将上海的四季划分为12月—次年的2月为冬季、3月—5月为春季、6月—8月为夏季、9月—11月为秋季。分别统计上海春夏秋冬四季的PM2.5浓度值为75 μg/m3、55 μg/m3、59 μg/m3、102 μg/m3, 可以看出上海市的PM2.5季节变化特征是冬季>春季>秋季>夏季, 表明上海市的PM2.5浓度具有季节性变化特征, 这与汤羹等[6]研究的结果一致。

原始数据中, 天气状况有15种类型, 将其划分为晴天、多云、阴天、雨天和雪天, 分别统计这些天气所对应的PM2.5浓度, 其中晴天的平均浓度最高为91 μg/m3, 多云和阴雾天气的平均浓度为77 μg/m3和71 μg/m3, 晴天平均浓度最高;进一步的统计分析, 发现污染天气的占比是33%(晴天数为300天), 空气优良的占66%;进一步的分析发现在99天的污染空气中, 春夏秋冬四季的占比分别是31.33%、0%、15.15%、53.52%。由此可见:晴天的浓度最高是因为高浓度天气发生在春冬季节, 使最终的平均浓度值偏大;雨天和雪天的PM2.5的平均浓度是56 μg/m3和48 μg/m3偏低, 在雨和雪的作用下能够稀释PM2.5污染物的浓度。

图 1绘制了2013年01月01日—2016年10月31日内月份PM2.5均浓度和均温度曲线。从图 1中可以看出, 温度与PM2.5浓度的影响比较明显, 随着温度的升高PM2.5浓度在逐渐的降低, 在8月份和9月份达到最低为45μg/m3, 而温度的降低会导致PM2.5的浓度升高, 在12月份和1月份均值较高都超过了75 μg/m3。温度明显的特征变化, 使得上海的四季分明。PM2.5浓度随温度变化的原因是:随着温度逐渐升高, 混合层高度越大, 污染物越容易在垂直方向上稀释; 反之, 污染物容易聚集在近地层, 导致污染物浓度上升[36]; 温度比较低, 容易产生逆温现象, 空气污染物容易沉集致使空气污染物浓度升高[7, 36]

图 1 PM2.5月均浓度与月份和温度的关系 Figure 1 Relationship between PM2.5 monthly concentration and month and tempera ture

风向与风速为2个因素, 上海的地面风为偏西风时, 会伴随着高污染物浓度出现, 且冬季盛行偏西风, 夏季多东南风, 来自海上的清洁空气对空气污染物浓度具有一定稀释作用, 大量的降雨对去除污染物浓度也具有显著作用[6]。综合文献[22-28]所选取的气象因素和污染物因素, 本文最后选取天气状况、温度和风速作为气象因素,选取PM10、NO2、SO2、CO、O3这5种作为空气污染物。

2.2 数据预处理和样本分组

由于指标间的数据的量纲不同, 为减小对模型造成的不利影响, 要对数据进行归一化处理。进行量化处理时, 要考虑到指标对实际PM2.5浓度的影响, 而且不同的量化方式对结果产生的影响不同, 依据2.1节分析, 作出如下量化处理:1) 天气状况(X1), 对雨天、晴云、多云、阴雾和雪天分别量化为1、2、3、4和5来表示;2) 温度(X2),温度按照四季的PM2.5浓度均值比值来量化; 3) 上海来自偏东方向的风有助于污染物浓度的扩散, 而偏西方向会加重污染物浓度, 因此将风速分解为东西方向(X3)和南北方向(X4)来表示。对量化后的数据采用最大最小归一化处理, 其计算公式为:

$\mathit{x}(*)=\frac{\mathit{x}-\mathit{min}}{\mathit{max}-\mathit{min}}*0.6+0.2$ (5)

其中:x(*)表示归一化后的数据; x表示原始数据; min表示每一个指标的最小值; max表示每一个指标的最大值。将数据归一化到0.2~0.8。通过以上的量化处理后最终的指标体系包括:天气状况(X1)、温度(X2)、东西向风速(X3)、南北向风速(X4)、PM10(X5)、NO2(X6)、SO2(X7)、CO(X8)、O3(X9)、前一天PM2.5(X10)浓度共10个指标。针对这1 400组数据归一化后, 使用自组织映射(Self Organizing Mapping, SOM)算法将样本按照3:1:1的比例[32]划分为训练样本、检验样本和测试样本, 三类样本的数量分别为:712、344和344。其中:训练样本用来训练整个网络模型; 检验样本用来监控在训练过程中是否出现“过训练”现象; 测试样本用来判断所建立模型是否具有泛化能力。

2.3 确定合理的神经网络结构

BP神经网络在解决实际的问题时, 主要考虑的是隐层数和隐层节点的个数与研究问题的复杂程度等。Hecht-Nielsen[37]证明了一个三层的BP神经网络能够完成m维向n维的任意映射, 因此隐层数选择一层。针对隐层节点个数的选取, 楼文高等[32]指出目前确定隐层节点个数的各类公式都不具有一般性, 可以作为初步参考值, 通常采用试凑法[38]来确定。根据BP神经网络建模基本原则, 训练样本数量要多于网络连接权重个数的3~5倍以上, 达到5~10倍则更好[33]。因此, 对于本例, 隐层合理节点个数应在3~17范围内。表 1为采用不同隐层节点个数(N)时建模实验所得到的训练样本、检验样本和测试样本(简称三类样本)的均方根误差, 该数值是反归一化后的结果。

表 1 不同隐层节点个数时的三类样本均方根误差对比 Table 1 Error of three kinds of samples under different hidden layer nodes

表 1中可以看出随着隐层节点个数的增加, 训练样本误差逐渐减小且最终误差变化不大, 而检验样本和测试样本的误差随隐层节点个数的增加, 到9个节点时达到最小而后又有所增大, 说明隐层节点个数不是越多越好, 而是存在一个合理的隐层节点个数, 隐层节点过多, 容易发生“过拟合”现象。遵循选取合理隐层节点个数的原则, 应当选取检验样本最小时隐层节点个数, 综合考虑, 最终确定隐层节点的合理个数为9。

2.4 建立预测PM2.5浓度的模型

本文使用R软件来进行建模, 经多次实验, GWO优化的神经网络参数如下:狼群的数量为200;初始位置的上界和下界为3和-3;最大迭代次数为150;网络结构为10-9-1, 即输入层有10个节点(变量个数), 9个隐层节点和1个输出节点(PM2.5浓度)。为确保模型具有泛化能力, 要确保测试样本误差与训练样本误差、检验样本误差相当或者小于它们的1.20倍[38]。遵循这一原则, 随机初始化神经网络的权重和阈值进行100次以上反复的训练, 其训练过程如图 2所示。

图 2 模型训练过程误差(归一化数据)曲线 Figure 2 Model training error curve in normalized data

训练样本、检验样本和测试样本的均方根误差分别为16.24 μg/m3、13.48 μg/m3和13.21 μg/m3; 平均绝对误差分别为11.29 μg/m3、10.12 μg/m3和9.79 μg/m3; 平均相对误差分别为17.14%、16.77%和15.41%;预测值与实际值的Pearson系数分别为0.939 8、0.959 2和0.954 8。

3 结果与讨论 3.1 模型性能分析

将上海市2016年11月1日—12日(共12个样本)气象数据和空气污染物数据用同样方式归一化后, 使用GWO优化的神经网络模型和PSO优化的神经网络模型、支持向量回归(Support Vector Regression, SVR)模型进行对比。为了使所建模型具有说服力, 训练过程使用相同的训练样本及归一化方式。其中PSO优化的神经网络模型参数设置为:网络结构采用10-9-1, 惯性权重w=0.729, 加速因子c1=c2=1.496 28, 粒子速度范围[-0.6, 0.6], 粒子的边界范围[-3, 3], 最大迭代次数150, 粒子的个数200。SVR模型借助LIBSVM工具箱建模, 使用网格搜索算法和交叉验证训练参数, 得出模型的参数为:惩罚因子c=5.278, 核函数采用径向基函数, 核函数参数g=0.062 5, 交叉验证参数v=5, ε-不损失函数值p=0.01。为了能够说明模型的适用性, 前一天PM2.5浓度都采用预测值, 其预测值和真实值的结果如图 3所示。

图 3 PM2.5浓度预测值与实际值的比较 Figure 3 Comparison of predicted and monitored PM2.5 concentrations

对不同方法优化的神经网络模型的性能参数如表 2所示。

表 2 不同模型的预测误差比较 Table 2 Predicted results and errors of different models

表 2可看出:GWO优化的神经网络模型在PM2.5浓度预测方面要优于PSO优化的神经网络模型、BP神经网络模型及SVR模型, 且GWO优化的神经网络的预测误差与训练样本、检验样本和测试样本误差对比分析, 检验样本在实时监控训练过程没有发生“过训练”现象, 测试样本误差与训练样本误差相当或小于它们的1.2倍, 而预测样本的误差较小, 说明模型具有很好的泛化能力、预测能力和适用性。所建立的GWO优化的神经网络模型适合对PM2.5浓度预测。

3.2 不同污染等级误差分析

根据《环境空气质量指数(AQI)技术规定(试行)》(HJ633—2012) 规定, 空气质量指数(ρ)等级划分的对应关系为:ρ≤50为优、50<ρ≤100为良、100<ρ≤150为轻度污染、150<ρ≤200为中度污染、200<ρ≤300为重度污染和为ρ>300严重污染共6个等级, 指数越大污染越严重, 而且PM2.5分指数可以通过PM2.5浓度计算获取。对上海市2013年1月1日—2016年10月31日PM2.5分指数进行统计结果为:0~50(518天)、50~100(607天)、100~150(184天)、150~200(56天)、200~300(33天)和300~500(2天), 因此, 可以看出上海PM2.5的污染这3年来多处于优良(80.36%)及轻度污染(13.14%), 高度污染(6.5%)所占比例较小。利用所建立的GWO优化神经模型对不同天气污染等级计算误差结果如表 3所示。

表 3 不同天气污染等级误差结果 Table 3 Errors of different air pollution level

表 3可以看出, 不同天气污染等级的平均绝对误差最大不超过32 μg/m3 (重度污染时), 原因是重度污染天气的浓度高且数据平稳性差, 经常出现突增情形, 所以预测的绝对误差相对比较大; 平均相对误差最大(等级为优时)为20.85%, 天气为优时浓度较低且占据的天数比较多, 也可能使得平均相对误差偏大; 而其他等级的平均相对误差在11%左右, 对天气污染等级预报的正确率80.43%。因此, 所建立的GWO优化的神经网络模型在不同天气污染等级预测方面具有较好的正确性和可靠性, 适合对污染天气作预报。

3.3 影响PM2.5的重要因素

Dombi等[39]提出了一种利用平均影响值(Mean Impact Value, MIV)来反映神经网络各个输入指标对目标指标的影响程度, 是目前分析变量(指标)重要性的最好方法之一。使用MIV不仅可以有效分析输入变量对输出变量的重要性, 还可以分析指标的性质(正向指标还是逆向指标), 绝对值大小表示影响程度。据此可以分析影响PM2.5浓度各个因素的重要性及其排序, 如表 4所示。

表 4 各个变量(指标)的MIV值 Table 4 Mean impact value of each indicator

表 4中可以看出, 在10个输入变量中, 天气状况(X1)、SO2(X7)和NO2(X6)呈现负相关, 是逆向指标, 而温度(X2)、东西向风速(X3)、南北向风速(X4)、PM10(X5)、CO(X8)、O3(X9)、前一天PM2.5(X10)浓度呈现正相关, 是正向指标; 对PM2.5的影响程度从大到小依次排序为:X5X8X10X9X2X7X1X3X4X6。在气象因素中, 温度(X2)的影响最大, 次之是天气状况(X1), 风速的影响很小; 在空气污染物中, PM10(X5)的影响最大, 其次是CO(X8), 再次是前一天PM2.5(X10)和O3(X9)。在整个指标体系中, PM10的影响最显著, 其次是CO, 它们的影响程度显著大于其他所有指标。

4 结语

本文在遵循神经网络建模基本原则和步骤的前提下,综合考虑了气象因素和大气污染物对PM2.5浓度的影响,建立了GWO算法优化神经网络的PM2.5浓度预测模型,使用检验样本监控训练过程以避免发生“过训练”现象。从误差分析结果来看,该模型在PM2.5浓度的预测方面要优于PSO优化的神经网络模型、BP神经网络模型及SVR模型。测试样本和预测样本具有与训练样本和检验样本相似的误差精度,说明本文建立的基于GWO的PM2.5浓度预测模型具有较好的泛化能力、预测能力和鲁棒性, 具有较好的实用价值。将该模型应用于不同天气污染等级的预报上,结果表明该模型对不同天气污染等级的预报, 也具有良好的效果。文中使用MIV值研究影响PM2.5因素的重要性,结果表明:气象因素中温度影响最大,空气污染物中PM10影响最为显著。本文在建模过程中发现GWO算法虽能达到全局最优,但后期收敛速度较慢,同时考虑到其他气象因素(湿度、压强等)也会对PM2.5浓度产生影响,鉴于此在以后的研究中将进一步改进网络模型。

参考文献(References)
[1] 张兵, 杨俊, 宋昆仑, 等. 大气污染的危害及其对经济社会的影响研究——以石家庄市为例[J]. 环境科学与管理, 2015, 40(7): 61-64. (ZAHNG B, YANG J, SONG K L, et al. Harm of air pollution and its impact on economy and society-taking Shijiazhuang city as an example[J]. Environmental Science and Management, 2015, 40(7): 61-64.)
[2] 马晓燕, 张志红. PM2.5与哮喘关系的研究进展[J]. 环境与职业医学, 2015, 32(3): 279-283. (MA X Y, ZHANG Z H. Research progress on association between PM2.5 and asthma[J]. Journal of Environmental and Occupational Medicine, 2015, 32(3): 279-283.)
[3] WANG Y, ZHUANG G, ZHANG X, et al. The ion chemistry, seasonal cycle, and sources of PM2.5, and TSP aerosol in Shanghai[J]. Atmospheric Environment, 2006, 40(16): 2935-2952. DOI:10.1016/j.atmosenv.2005.12.051
[4] 叶文波. 宁波市大气可吸入颗粒物PM10和PM2.5的源解析研究[J]. 环境污染与防治, 2011, 33(9): 66-69. (YE W B. Study on source apportionment of PM10 and PM2.5 in ambient air of Ningbo[J]. Environmental Pollution and Control, 2011, 33(9): 66-69.)
[5] 贺祥, 林振山. 基于GAM模型分析影响因素交互作用对PM2.5浓度变化的影响[J]. 环境科学, 2017, 38(1): 22-32. (HE X, LIN Z S. Interactive effects of the influencing factors on the changes of PM2.5 concentration based on gam model[J]. Environmental Science, 2017, 38(1): 22-32.)
[6] 汤羹, 马宪国. 上海气象因素对PM2.5等大气污染物浓度的影响[J]. 能源研究与信息, 2016, 32(2): 71-74. (TANG G, MA X G. Influence of meteorological conditions in Shanghai on the concentration of PM2.5and other air pollutants[J]. Energy Research and Information, 2016, 32(2): 71-74.)
[7] 张浩月, 王雪松, 陆克定, 等. 珠江三角洲秋季典型气象条件对O3和PM10污染的影响[J]. 北京大学学报(自然科学版), 2014, 50(3): 565-576. (ZHANG H Y, WANG X S, LU K D, et al. Impact of typical meteorological conditions on the O3and PM10 pollution episodes in the Pearl River Delta in autumn[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2014, 50(3): 565-576.)
[8] 王晓彦, 赵熠琳, 霍晓芹, 等. 基于数值模式的环境空气质量预报影响因素和改进方法[J]. 中国环境监测, 2016, 32(5): 1-7. (WANG X Y, ZHAO Y L, HUO X Q, et al. Discussion on the influence factors and improvement methods of ambient air quality forecasting based on numerical models[J]. Environmental Monitoring in China, 2016, 32(5): 1-7.)
[9] 王茜, 吴剑斌, 林燕芬. CMAQ模式及其修正技术在上海市PM2.5预报中的应用检验[J]. 环境科学学报, 2015, 35(6): 1651-1656. (WANG Q, WU J B, LIN Y F. Implementation of a dynamic linear regression method on the CMAQ forecast of PM2.5 in Shanghai[J]. Acta Scientiae Circumstantiae, 2015, 35(6): 1651-1656.)
[10] SYRAKOV D, PRODANOVA M, GEORGIEVA E, et al. Simulation of European air quality by WRF-CMAQ models using AQMEⅡ-2 infrastructure[J]. Journal of Computational & Applied Mathematics, 2016, 293(C): 232-245.
[11] ZHANG Y, ZHANG X, WANG L, et al. Application of WRF/Chem over East Asia: part I, model evaluation and intercomparison with MM5/CMAQ[J]. Atmospheric Environment, 2016, 124: 285-300. DOI:10.1016/j.atmosenv.2015.07.022
[12] 黄思, 唐晓, 徐文帅, 等. 利用多模式集合和多元线性回归改进北京PM10预报[J]. 环境科学学报, 2015, 35(1): 56-64. (HUANG S, TANG X, XU W S, et al. Application of ensemble forecast and linear regression method in improving PM10 forecast over Beijing areas[J]. Acta Scientiae Circumstantiae, 2015, 35(1): 56-64.)
[13] 王占山, 李晓倩, 王宗爽, 等. 空气质量模型CMAQ的国内外研究现状[J]. 环境科学与技术, 2013, 36(6): 386-391. (WANG Z S, LI X Q, WANG Z S, et al. Application status of Models-3/CMAQ in environmental management[J]. Environmental Science & Technology, 2013, 36(6): 386-391.)
[14] 余辉, 袁晶, 于旭耀, 等. 基于ARMAX的PM2.5小时浓度跟踪预测模型[J]. 天津大学学报(自然科学与工程技术版), 2017, 50(1): 105-111. (YU H, YUAN J, YU X Y, et al. Tracking prediction model for PM2.5 hourly concentration based on ARMAX[J]. Journal of Tianjin University (Science and Technology), 2017, 50(1): 105-111.)
[15] 彭斯俊, 沈加超, 朱雪. 基于ARIMA模型的PM2.5预测[J]. 安全与环境工程, 2014, 21(6): 125-128. (PENG S J, SHEN J C, ZHU X. Forecast of PM2.5 based on the arima model[J]. Safety and Environmental Engineering, 2014, 21(6): 125-128.)
[16] 张玉丽, 何玉, 朱家明. 基于多元线性回归模型PM2.5预测问题的研究[J]. 安徽科技学院学报, 2016, 30(3): 92-97. (ZAHNG Y L, HE Y, ZHU J M. Study of the prediction of PM2.5 based on the multivariate linear regression model[J]. Journal of Anhui Science and Technology University, 2016, 30(3): 92-97.)
[17] TAI A P K, MICKLEY L J, JACOB D J. Correlations between fine particulate matter (PM2.5) and meteorological variables in the United States: implications for the sensitivity of PM2.5 to climate change[J]. Atmospheric Environment, 2010, 44(32): 3976-3984. DOI:10.1016/j.atmosenv.2010.06.060
[18] 艾洪福, 潘贺, 李迎斌. 关于空气雾霾PM2.5含量预测优化研究[J]. 计算机仿真, 2017, 34(1): 392-395. (AI H F, PAN H, LI Y B. Research on optimization of PM2.5 content prediction in air haze[J]. Computer Simulation, 2017, 34(1): 392-395.)
[19] 戴华炜, 陈小旋, 孙晓通. 基于GM (1, 1) 模型群的深圳市大气污染物灰色预测[J]. 数学的实践与认识, 2014, 44(1): 131-136. (DAI H W, CHEN X X, SUN X T. The gray prediction model of the atmospheric pollutants in Shenzhen based on GM (1, 1)[J]. Mathematics in Practice and Theory, 2014, 44(1): 131-136.)
[20] 杨忠, 童楚东, 俞杰, 等. 加权因子的PSO-SVR区域空气PM2.5浓度预报方法[J]. 计算机应用研究, 2017(2): 405-408. (YANG Z, TONG C D, YU J, et al. Regional PM2.5 concentration prediction method of PSO-SVR model with weighting factors[J]. Application Research of Computers, 2017(2): 405-408.)
[21] 李龙, 马磊, 贺建峰, 等. 基于特征向量的最小二乘支持向量机PM2.5浓度预测模型[J]. 计算机应用, 2014, 34(8): 2212-2216. (LI L, MA L, HE J F, et al. PM2.5concentration prediction model of least squares support vector machine based on feature vector[J]. Journal of Computer Applications, 2014, 34(8): 2212-2216. DOI:10.11772/j.issn.1001-9081.2014.08.2212)
[22] 葛考, 时贝贝, 徐康耀, 等. 基于BAPSO-PNN神经网络算法的空气质量评价研究[J]. 环境工程, 2015, 33: 676-681. (GE K, SHI B B, XU K Y, et al. Air quality assement based on BAPSO-PNN neural network algorithm[J]. Environmental Engineering, 2015, 33: 676-681.)
[23] 杨云, 付彦丽. 基于T-S模型模糊神经网络的PM2.5质量浓度预测[J]. 陕西科技大学学报, 2015, 33(6): 162-166. (YANG Y, FU Y L. The prediction of mass concentration of PM2.5 based on T-S fuzzy neural network[J]. Journal of Shaanxi University of Science and Technology, 2015, 33(6): 162-166.)
[24] 马天成, 刘大铭, 李雪洁, 等. 基于改进型PSO的模糊神经网络PM2.5浓度预测[J]. 计算机工程与设计, 2014, 35(9): 3258-3262. (MA T C, LIU D M, LI X J, et al. Improved particle swarm optimization based fuzzy neural network for PM2.5 concentration prediction[J]. Computer Engineering and Design, 2014, 35(9): 3258-3262.)
[25] 荆涛, 李霖, 于文柱, 等. t分布受控遗传算法优化BP神经网络的PM2.5质量浓度预测[J]. 中国环境监测, 2015, 31(4): 100-105. (JIN T, LI L, YU W Z, et al. Prediction of PM2.5 mass concentration based on BP neural network optimized by t-distribution controlled genetic algorithm[J]. Environmental Monitoring in China, 2015, 31(4): 100-105.)
[26] 谢超, 马民涛, 于肖肖. 多种神经网络在华北西部区域城市空气质量预测中的应用[J]. 环境工程学报, 2015, 9(12): 6005-6009. (XIE C, MA M T, YU X X. Forecasting model of air pollution index based on multi-artificial neural network in western region of Northern China[J]. Chinese Journal of Environmental Engineering, 2015, 9(12): 6005-6009. DOI:10.12030/j.cjee.20151257)
[27] 李嵩, 王冀, 张丹闯, 等. 大气PM2.5污染指数预测优化模型仿真分析[J]. 计算机仿真, 2015, 32(12): 400-403. (LI S, WANG J, ZHANG D C, et al. Simulation analysis of prediction optimization model for atmospheric PM2.5 pollution index[J]. Computer Simulation, 2015, 32(12): 400-403. DOI:10.3969/j.issn.1006-9348.2015.12.086)
[28] MISHRA D, GOYAL P, UPADHYAY A. Artificial intelligence based approach to forecast PM2.5, during haze episodes: a case study of Delhi, India[J]. Atmospheric Environment, 2015, 102: 239-248. DOI:10.1016/j.atmosenv.2014.11.050
[29] HAYKIN S. Neural Networks: a Comprehensive Foundation[M]. 2rd ed. Upper Saddle River, NJ: Prentice Hall Press, 1998.
[30] BISHOP C M. Neural Networks for Pattern Recognition[M]. Oxford: Oxford University Press, 1995.
[31] ZHANG G, PATUWO B E, HU M Y. Forecasting with artificial neural networks: the state of the art[J]. International Journal of Forecasting, 1998, 14(1): 35-62. DOI:10.1016/S0169-2070(97)00044-7
[32] 楼文高, 王延政. 基于BP网络的水质综合评价模型及其应用[J]. 环境工程学报, 2003, 4(8): 23-26. (LOU W G, WANG Y Z. Water quality comprehensive assessment model using BP networks and its applications[J]. Chinese Journal of Environmental Engineering, 2003, 4(8): 23-26.)
[33] 楼文高. 实现BP神经网络从理论到实践的跨越[J]. 哈尔滨工程大学学报, 2006, 27: 59-63. (LOU W G. Realization of BP neural network from theory to practice[J]. Journal of Harbin Engineering University, 2006, 27: 59-63. DOI:10.3969/j.issn.1006-7043.2006.z1.013)
[34] MIRJALILI S, MIRJALILI S M, LEWIS A. Grey wolf optimizer[J]. Advances in Engineering Software, 2014, 69(3): 46-61.
[35] MIRJALILI S. How effective is the grey wolf optimizer in training multi-layer perceptrons[J]. Applied Intelligence, 2015, 43(1): 150-161. DOI:10.1007/s10489-014-0645-7
[36] 葛跃, 王明新, 孙向武, 等. 基于增强回归树的城市PM2.5日均值变化分析:以常州为例[J]. 环境科学, 2017, 38(2): 485-494. (GE Y, WANG M X, SUN X W, et al. Variation analysis of daily PM2.5 concentrations based on boosted regression tree: a case study in Changzhou[J]. Environmental Science, 2017, 38(2): 485-494.)
[37] HECHT-NIELSEN R. Theory of the backpropagation neural network [M]// WECHSLER H. Neural Networks for Perception. New York: Academic Press, 1991: 65-93. http://link.springer.com/content/pdf/bbm%3A978-3-319-00248-4%2F1.pdf
[38] 楼文高, 乔龙. 基于神经网络的金融风险预警模型及其实证研究[J]. 金融论坛, 2011(11): 52-61. (LOU W G, QIAO L. Early warning model of financial risks and empirical study based on neural network[J]. Finance Forum, 2011(11): 52-61.)
[39] DOMBI G W, NANDI P, SAXE J M, et al. Prediction of rib fracture injury outcome by an artificial neural network[J]. Journal of Trauma, 1995, 39(5): 915-921. DOI:10.1097/00005373-199511000-00016