多算法多模型与在线第二次学习结合的短期电力负荷预测方法

引用本文

周末, 金敏. 多算法多模型与在线第二次学习结合的短期电力负荷预测方法[J]. 计算机应用, 2017, 37(11): 3317-3322.DOI: 10.11772/j.issn.1001-9081.2017.11.3317. 复制到剪切板

ZHOU Mo, JIN Min. Short-term power load forecasting method combining with multi-algorithm & multi-model and online second learning[J]. Journal of Computer Applications, 2017, 37(11): 3317-3322. DOI: 10.11772/j.issn.1001-9081.2017.11.3317. 复制到剪切板

基金项目

国家自然科学基金资助项目（61374172）；国家科技成果转化项目（201255）

通信作者

金敏, E-mail: jinmin@hnu.edu.cn

作者简介

周末(1990-), 男, 湖北汉川人, 硕士研究生, 主要研究方向:人工智能、电力负荷预测;
金敏(1973-), 女, 湖南岳阳人, 教授, 博士, 主要研究方向:嵌入式系统、人工智能、大数据、工业4.0、电力负荷预测

文章历史

收稿日期：2017-05-08
修回日期：2017-06-16

Contents Abstract Full text Figures/Tables PDF

多算法多模型与在线第二次学习结合的短期电力负荷预测方法

周末, 金敏

湖南大学信息科学与工程学院, 长沙 410084

收稿日期：2017-05-08；修回日期：2017-06-16

基金项目：国家自然科学基金资助项目（61374172）；国家科技成果转化项目（201255）

作者简介：周末(1990-), 男, 湖北汉川人, 硕士研究生, 主要研究方向:人工智能、电力负荷预测;
金敏(1973-), 女, 湖南岳阳人, 教授, 博士, 主要研究方向:嵌入式系统、人工智能、大数据、工业4.0、电力负荷预测

通信作者：金敏, E-mail: jinmin@hnu.edu.cn

摘要: 为了提高短期电力负荷预测精度，首次提出多算法多模型与在线第二次学习结合的预测方法。首先，利用互信息方法和统计方法对输入变量进行选择；然后，通过Bootstrap方法对数据集进行多样性采样，利用多个不同的人工智能算法和机器学习算法训练得到多个差异化较大的异构预测模型；最后，用每个待预测时刻最近一段时间的实际负荷值、第一次学习生成的多异构预测模型的负荷预测值构成新训练数据集，对新训练数据集进行在线第二次学习，得到最终预测结果。对中国广州市负荷进行预测研究，与最优单模型、单算法多模型和多算法单模型相比，在每日总负荷预测中，全年平均绝对百分误差（MAPE）分别下降了21.07%、7.64%和5.00%，在每日峰值负荷预测中，全年MAPE分别下降了16.02%、7.60%和13.14%。实验结果表明，推荐方法有效地提高了负荷预测精度，有利于智能电网实现节能降耗、调度精细化管理和电网安全预警。

关键词: 短期电力负荷预测多样性采样异构模型多算法多模型在线第二次学习

Short-term power load forecasting method combining with multi-algorithm & multi-model and online second learning

ZHOU Mo, JIN Min

College of Computer Science and Electronic Engineering, Hunan University, Changsha Hunan 410084, China

Foundation Item: This work is partially supported by the National Natural Science Foundation of China (61374172), the National Scientific and Technological Achievement Transformation Project of China (201255)

Author introduction: ZHOU Mo, born in 1990, M. S. candidate. His research interests include artificial intelligence, power load forecasting;
JIN Min, born in 1973, Ph. D., professor. Her research interests include embedded system, artificial intelligence, big data, industry 4.0, power load forecasting

Abstract: In order to improve the forecasting accuracy of the short-term power load, a forecasting method combining multi-algorithm & multi-model and online second learning was newly proposed. First, the input variables were selected by using mutual information and statistical information and a dataset was constructed. Then, multiple training sets were generated by performing diverse sampling with bootstrap on the original training set. Multiple models were obtained using different artificial intelligence and machine-learning algorithms. Finally, the offline second-learning method was improved. A new training set was generated using the actual load, and the multi-model forecasts for recent period within the forecasted time, which is trained by online second learning to obtain the final forecasting results. The load in Guangzhou, China was studied. Compared to the optimal single-model, single-algorithm & multi-model and multi-algorithm & single-model, Mean Absolute Percentage Error (MAPE) of the proposed model was reduced by 21.07%, 7.64% and 5.00%, respectively, in the daily total load forecasting, and by 16.02%, 7.60%, and 13.14%, respectively, in the daily peak load forecasting. The experimental results show that the proposed method can improve the prediction accuracy of the power load, reduce costs, implement optimal scheduling management, and ensure security with early warnings in smart grids.

Key words: short-term power load forecasting diversity sampling heterogeneous model multi-algorithm and multi-model online second learning

0 引言

电力负荷预测是智能电网建设的基本环节之一，精准、时效的负荷预测是智能电网实现节能降耗、调度精细化管理和电网安全预警的基础。由于影响电力负荷变化的因素呈现出较高的随机性，使得电力负荷的变化也具有较高的随机性，加大了预测的难度。已有电力负荷预测模型总体分为经典预测模型、人工智能预测模型和机器学习预测模型。经典预测模型主要有回归分析法^[1]、时间序列法^[2]等，经典预测模型是一种简单的线性方法，模型结构简单，预测速度快，但对于电力负荷非线性变化问题预测精度不高。人工智能预测模型主要是神经网络^[3-6]，例如反向传播神经网络(Back Propagation Neural Network, BPNN)、极限学习机等。神经网络算法具有很强的非线性拟合能力和自学习能力，但大部分网络结构需要经验进行确定；虽然极限学习机能够解决网络结构的问题，但极限学习机不稳定。机器学习预测模型主要有支持向量机(Support Vector Machine, SVM)^[7]、最小二乘支持向量机(Least Square Support Vector Machine, LSSVM)^[8-10]、随机森林(Random Forest, RF)^[11-12]和GBRT(Gradient Boosting Regression Tree) ^{[11, 13]}等。LSSVM是标准SVM的一种扩展，克服了标准SVM的缺点，降低了计算复杂度，提高了求解速度，在负荷增长较大时预测效果依然较好，但LSSVM对异常值的鲁棒性不够好，且模型训练参数需要通过寻优的方法获得，增加了训练时间和难度；随机森林和GBRT这两种算法本质是树型算法，克服了LSSVM的缺点，对异常值的鲁棒性好，模型训练所需参数少，预测精度较高，GBRT算法在迭代过程中可能出现过拟合问题，用RF算法去学习一个回归模型，将模型的预测输出初始化GBRT(initialized GBRT, iGBRT)^[14]，可以有效避免过拟合问题，且训练效率更高，预测性能相比RF和GBRT有所提升，但树型算法在负荷增长较大时预测精度不高。

任何一种预测模型都有其特定的适用范围。在模型训练时，单模型方法可能出现过拟合、泛化能力受限，在模型预测时，每个单模型在相同的时间点上预测效果不一样，预测精度仍有提升空间，为了进一步减小预测误差，多个领域对多模型集成方法进行了研究，如图像识别、医疗诊断等^[15-17]。目前训练多模型的方法主要分为两种:一种是针对单个算法，通过数据集采样多样性、设置不同模型参数、选取不同输入变量等方式，生成多个模型^[18-20]，这种方法较好地解决了单模型可能出现过拟合、泛化能力受限等问题，但该方法局限于单一算法，无法解决单个算法适用范围受限的问题; 另一种是针对多个算法，每个算法生成一个模型^[21-23]，多个算法优势互补克服了单个算法适用范围受限的缺点，但每个算法采用的依然是单一模型，容易造成过拟合、泛化能力不强等问题。在多模型融合方法中，应用广泛的是简单平均方法和加权平均方法，但这些都是一种线性的融合方法，电力负荷变化具有非线性特性，利用线性加权融合仍有一定的缺陷。

针对上述问题，本文提出多算法多模型与在线第二次学习结合的预测方法，通过Bootstrap方法进行多样性采样，利用LSSVM、iGBRT和BP算法训练得到多个差异化较大的预测模型，将待预测时刻最近一段时间的负荷预测值与实际值构成融合矩阵，使用LSSVM算法对融合矩阵进行在线第二次学习，得到最终预测结果。本文将该方法应用在电力系统城市每日总负荷和每日峰值负荷预测中，通过实验研究探索数据集的选取、多模型构建、在线第二次学习，分析比较不同模型的预测性能。

1 多算法多模型与在线第二次学习 1.1 LSSVM

LSSVM是标准支持向量机的一种扩展，克服了标准支持向量机的缺点，优化指标采用平方项，并用等式约束代替标准支持向量机的不等式约束，即将二次规划问题转化为线性方程组求解，降低了计算复杂性，提高了求解速度，在预测性能方面表现较强^[24]。

对于给定数据集{y_i, x_i}_i=1^N, 其中y是目标向量，x是输入向量，对非线性负荷预测模型，回归函数为:

$ F\left( \mathit{\boldsymbol{x}} \right) = {\mathit{\boldsymbol{\omega }}^{\rm{T}}} \cdot \varphi \left( \mathit{\boldsymbol{x}} \right) + b $

(1)

其中: ω为权值向量，b是阈值，φ(x)是从输入空间到高维特征空间的非线性映射。LSSVM优化目标为:

$ \begin{gathered} \min J\left( {\mathit{\boldsymbol{\omega }}, \mathit{\boldsymbol{e}}} \right) = \frac{1}{2}{\left\| \mathit{\boldsymbol{\omega }} \right\|^2} + \frac{1}{2}C\sum\limits_{i = 1}^N {e_i^2} \hfill \\ {\rm{s}}{\rm{.t}}{\rm{.}}\;\;{y_i} = {\mathit{\boldsymbol{\omega }}^{\rm{T}}} \cdot \varphi \left( {{\mathit{\boldsymbol{x}}_i}} \right) + b + {e_i}, i = 1, 2, ..., N \hfill \\ \end{gathered} $

(2)

根据Karush-Kuhn-Tucker (KKT)最优条件和Lagrange方法来解此优化问题可得LSSVM的回归模型：

$ y = \sum\limits_{i = 1}^n {{\alpha _i}K\left( {\mathit{\boldsymbol{x}}, {\mathit{\boldsymbol{x}}_i}} \right) + b} $

(3)

对于非线性回归，使用一个非线性映射φ(x)将数据映射到一个高维特征空间，再在高维特征空间中进行线性回归，其关键问题是核函数的选取，目前常用的核函数有多项式核函数、Sigmoid核函数和径向基核函数(Radial Basis Function, RBF)，其中RBF中只有1个参数调节，且有很好的性能，在本文中选用RBF作为核函数：

$ K\left( {\mathit{\boldsymbol{x}}, {\mathit{\boldsymbol{x}}_i}} \right) = \exp \left( {-{{\left\| {\mathit{\boldsymbol{x}}-{\mathit{\boldsymbol{x}}_i}} \right\|}^2}/2{\sigma ^2}} \right) $

(4)

因此，在训练LSSVM时有两个参数需要调节：一个是核函数参数σ，一个是正规化参数C。

1.2 初始化GBRT

GBRT算法在迭代过程中需要对缩减参数和迭代轮数进行权衡：当缩减参数很大时，迭代轮数很小，模型容易出现过拟合，预测精度不高；当缩减参数很小时，为了降低过拟合，提高预测精度，迭代轮数就必须增大。本文对缩减参数和迭代轮数进行权衡，将RF作为一个低成本、对参数选择不敏感和不容易过拟合的算法去学习一个回归模型，将模型的预测输出初始化GBRT(iGBRT)，使GBRT的迭代起始点接近迭代终点，即使缩减参数比较小，也能使用较小的迭代轮数达到全局最优，使GBRT有效避免过拟合问题，且训练效率更高，预测性能相比RF和GBRT更好。

随机森林和GBRT两种算法本质是树型算法，在对异常值鲁棒性和预测能力方面表现较好。随机森林是由Breiman^[25]提出的一种集成学习算法，该方法用随机的方式建立一片森林，该森林由很多决策树组成，每一棵决策树之间没有关联。Friedman^[26]将梯度下降方法应用于回归算法中，提出了Gradient Boosting算法，该算法利用模型的损失函数的负梯度求解损失函数的最小值，迭代得到最佳模型。假定训练数据集{y_i, x_i}_i=1^N，其中y是目标向量，x是输入向量。Gradient Boosting回归算法本质上是一种利用M个基函数的加法展开式对目标函数进行逼近的方法：

$ F\left( {\mathit{\boldsymbol{x}};\alpha, \beta } \right) = \sum\limits_{m = 0}^M {H\left( {\mathit{\boldsymbol{x}};{\alpha _m}, {\beta _m}} \right)} $

(5)

其中: H(x; α_m, β_m)为一个简单的参数函数，称为基函数，本文中是CART树。α、β是决策树的参数，M为基函数的个数。

在训练过程中，根据式(6)不断得到新的回归树：

$ \left( {{\alpha _m}, {\beta _m}} \right) = \mathop {\arg \min }\limits_{\alpha, \beta } \sum\limits_{i = 1}^N {\psi \left( {{y_i}, {F_{m-1}}\left( {{\mathit{\boldsymbol{x}}_i}} \right) + H\left( {{\mathit{\boldsymbol{x}}_i};\alpha, \beta } \right)} \right)} $

(6)

得到一个新的回归树之后，就更新整个模型：

$ {F_m}\left( \mathit{\boldsymbol{x}} \right) = {F_{m-1}}\left( \mathit{\boldsymbol{x}} \right) + \nu H\left( {\mathit{\boldsymbol{x}};{\alpha _m}, {\beta _m}} \right) $

(7)

其中: ν是缩减参数，避免损失函数下降过快，防止过拟合。当m=0时，F₀(x)是所有训练样本输出值的均值。本文选择的损失函数是ψ(y, F)=(y-F)²/2。

1.3 BP神经网络

BP神经网络是一种多层前馈神经网络，该网络的主要特点是信号前向传递，误差反向传播^[27]。在前向传递中，输入信号从输入层经隐含层逐层处理，直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出，则转入反向传播，根据预测误差调整网络权值和阈值，从而使BP神经网络预测输出不断逼近期望输出。

1.4 算法流程

本文提出多算法多模型与在线第二次学习结合的预测方法，通过Bootstrap方法进行多样性采样，利用LSSVM、iGBRT和BP算法训练得到多个差异化较大的预测模型，将待预测时刻最近一段时间的负荷预测值与实际值构成融合矩阵，使用LSSVM算法对融合矩阵进行在线第二次学习，得到最终预测结果。

该方法的具体步骤如下所示，主要分为四步：

第一步数据集选取。影响电力负荷变化的因素众多，总体分为社会因素和自然因素。社会因素，包括经济增长规模、工业用户类型与数量、星期类型和节假日等，其中经济增长规模、工业用户类型与数量，其短期数据一般暂未公开, 无法获取，而星期类型和节假日，可以通过日历和政府网站获得其公开数据。自然因素，典型的包括温度、湿度、气压、风速、降雨量等气象因素，可以从气象科学数据网站获得其公开数。为追溯电力负荷变化源头、揭示电力负荷变化的内在规律和趋势，本文在数据集选取方面，不仅选用电力系统领域的电力负荷历史数据，而且选用来源于非电力系统领域的多种负荷变化影响因素的可得数据，包括星期类型数据、节假日数据和气象数据(包括温度、气压、湿度、风速等)，并且采用互信息和统计信息衡量这些数据与负荷变化间关联关系的强弱以筛选出特征值。

互信息是一种信息度量，表示一个随机变量包含另一个随机变量的信息量，度量两变量之间的相关性^[28-29]。本文采用互信息对气象特征值进行选取，剔除噪声变量，降低模型训练的规模及计算复杂度, 提高模型预测性能。在互信息标准中，两个随机变量X和Y的统计依存关系用互信息来度量：

$ I\left( {\mathit{\boldsymbol{X}}, \mathit{\boldsymbol{Y}}} \right) = \iint {{\mu _{\mathit{\boldsymbol{X}}, \mathit{\boldsymbol{Y}}}}}\left( {x, y} \right)\operatorname{l} {\rm{b}}\frac{{{\mu _{\mathit{\boldsymbol{X}}, \mathit{\boldsymbol{Y}}}}\left( {x, y} \right)}}{{{\mu _\mathit{\boldsymbol{X}}}\left( x \right){\mu _\mathit{\boldsymbol{Y}}}\left( y \right)}}{\rm{d}}x{\rm{d}}y $

(8)

其中：I(X, Y)代表变量X和Y的互信息，互信息越大，表示两变量之间的相关性越大。

得到互信息之后，选择前N个互信息最大的气象特征值W_j(j=1, 2, …, N)作为部分特征值；通过对不同星期类型WT_i和节假日H_i电力负荷使用情况进行统计，分析出相关规律，构造特征值。对于第i时刻，其前M时刻的历史负荷Y_i－k(k=1, 2, …, M)对负荷预测也有影响，将WT_i、H_i、W_j与Y_i－k作为全部特征值与实际负荷Y_i(i=1, 2, …, n，n代表总样本数)构成数据集：

$ \mathit{\boldsymbol{D}}{\rm{ = }}\left[{W{T_i}, {H_i}, {W_{i1}}, {W_{i2}}, ..., {W_{iN}}, {Y_{i, i-M}}, {Y_{i, i-M + 1}}, ..., {Y_{i, i-1}}, {Y_i}} \right];i = 1, 2, ..., n $

第二步构建多模型。为了有效降低单模型可能出现的过拟合，增强模型泛化能力，增加模型多样性，提高预测精度，使多个算法优势互补，通过Bootstrap方法，使用采样率μ对数据集D进行m₁、m₂和m₃次可重复采样，利用LSSVM算法训练m₁个模型L₁, L₂, …, L_m₁，iGBRT算法训练m₂个模型G₁, G₂, …, G_m₂和BP算法训练m₃个模型B₁, B₂, …, B_m₃，得到Multi-model。

Bootstrap方法称为自助法，它是一种有放回的抽样方法，是一种用小样本估计总体值的非参数统计方法。已经证明，在初始样本足够大的情况下，Bootstrap抽样能够无偏地接近总体的分布。其核心思想和基本步骤是：1)设定抽样比例，即从原始样本中按照指定的比例抽取样本；2)设定样本集个数N，即重复上述N次，得到N个样本集。

第三步在线第二次学习。利用Multi-model对待预测时刻前K时刻负荷进行预测，将负荷预测值作为融合矩阵的特征值，与负荷实际值Y构成融合矩阵：

$ \left[{\begin{array}{*{20}{c}} {{L_{11}}}&{{L_{12}}}&{...}&{{L_{1{m_1}}}}&{{G_{11}}}&{{G_{12}}}&{...}&{{G_{1{m_2}}}}&{{B_{11}}}&{{B_{12}}}&{...}&{{B_{1{m_3}}}}&{{Y_1}} \\ {{L_{21}}}&{{L_{22}}}&{...}&{{L_{2{m_1}}}}&{{G_{21}}}&{{G_{22}}}&{...}&{{G_{2{m_2}}}}&{{B_{21}}}&{{B_{22}}}&{...}&{{B_{2{m_3}}}}&{{Y_2}} \\ \vdots&\vdots &{}& \vdots&\vdots&\vdots &{}& \vdots&\vdots&\vdots &{}& \vdots&\vdots \\ {{L_{K1}}}&{{L_{K2}}}&{...}&{{L_{K{m_1}}}}&{{G_{K1}}}&{{G_{K2}}}&{...}&{{G_{K{m_2}}}}&{{B_{K1}}}&{{B_{K2}}}&{...}&{{B_{K{m_3}}}}&{{Y_K}} \end{array}} \right] $

因为电力负荷变化具有非线性特性，融合矩阵较小。LSSVM是基于结构风险最小化原则，在小样本和非线性情况下，使用LSSVM算法对融合矩阵进行学习，仍然能保证较好的泛化能力。学习完成后得到决策模型。

第四步最终预测。通过第一步得到的训练数据集和测试数据集，第二步训练得到的Multi-model，以及第三步二次学习得到的决策模型，最后一步将待预测时刻的Multi-model的电力负荷预测值和实际值构成预测样本，输入到融合模型进行预测，得到最终预测结果。

2 实验研究

本文实验研究的环境包括处理器：Inter Core 2 Duo E7500，内存：4 GB，主频：2.94 GHz，操作系统：Windows 7。

2.1 特征值选取

实验所用的数据集包括历史负荷数据、气象数据、星期类型数据和节假日数据，其中历史负荷数据是广东省广州市近3年的数据，每15 min采集一次；气象数据来自于中国气象科学数据共享服务网；星期数据和节假日数据通过日历和政府网站获得。气象包括温度、湿度、气压、风速、降雨量等因素，但不同的因素对电力负荷变化影响程度或强或弱，因此需要对气象因素进行选取。根据式(8)计算，图 1(a)是气象候选特征值与每日总负荷之间的互信息，图 1(b)是气象候选特征值与每日峰值负荷之间的互信息，图中已对互信息值进行了降序排列。

图 1 气象候选特征值与每日负荷之间的互信息 Figure 1 Mutual information between weather candidate feature and daily load

图 1表明，每个气象特征值对负荷的影响程度不一样，本文选择0.3作为阈值，选择图 1(a)中前7个作为每日总负荷预测气象特征值，包括日平均气温、日最高气温、日最低气温、平均水汽压、日最高本站气压、平均本站气压、日最低本站气压；选择图 1(b)中前5个作为每日峰值负荷预测气象特征值，包括日平均气温、日最高气温、日最低气温、平均水汽压。

图 2(a)是两年工作日、双休日和节假日平均每日总负荷，图 2(b)是两年工作日、双休日和节假日平均每日峰值负荷。图 2表明，工作日负荷是最高的，且工作日负荷大小接近，双休日负荷较低，节假日负荷是最低的。在本文中，将星期类型用1、0标志表示，1代表工作日，0代表双休日；节假日用1、0标志表示，1代表节假日，0代表非节假日。用选择的气象特征值、星期特征值、节假日特征值和待预测日前7天的历史负荷值构成数据集全部特征值，预测值分别是每日总负荷和每日峰值负荷。

图 2 两年工作日、双休日和节假日平均每日负荷 Figure 2 Average daily load for each working day, weekend and holiday of two years

2.2 模型评估指标

针对电力负荷预测系统性能评估的方法有很多，其中平均绝对百分误差(Mean Absolute Percentage Error, MAPE)是使用最多的方法，因此本文选择MAPE作为评估指标：

$ MAPE = \frac{1}{N}\sum\limits_{t = 1}^N {\left| {\frac{{{y_t}-{{\hat y}_t}}}{{{y_t}}}} \right|} \times 100\% $

(9)

式中: N为预测时刻数，y_t为t时刻的实际负荷值，$ {{{\hat y}_t}} $为t时刻的预测负荷值。

2.3 预测性能研究

在单模型方法研究中，为了获得更高预测精度，单模型训练集选择每个预测时刻之前所有数据，测试集是第3年数据；在多模型方法研究中，多模型训练集是前两年数据，测试集是第3年数据，在进行第2次学习时，新训练数据集由待预测日前k=60 d的原星期类型和节假日特征值、气象特征值、历史负荷特征值、负荷预测值和实际值构成。LSSVM中核函数参数σ和正规化参数C采用十字交叉验证和网格搜索进行参数寻优；iGBRT中的RF算法树数目为500，GBRT算法树总数为30，学习速率为ν=0.1，基学习器为CART；BP神经网络隐含层节点数为20。构建单算法多模型和多算法多模型时，采样率μ=0.7，训练数据集个数m₁=10，m₂=10，m₃=10；构建多算法单模型时，采样率μ=1，训练数据集个数m₁=1，m₂=1，m₃=1。

案例1 本实验对LSSVM、iGBRT和BP单模型以及本文预测模型预测性能进行研究。表 1是不同模型全年负荷预测误差。

表 1 本文方法与单模型全年负荷预测误差对比 % Table 1 Forecasting errors of the proposed model and single-models for a one-year period %

表 1预测结果表明，本文方法与最优单模型LSSVM相比，在每日总负荷预测中，MAPE减少了21.07%；在每日峰值负荷预测中，MAPE减少了16.02%，这说明本文方法比单模型泛化能力更强，预测精度更高。

表 2给出了4种方法的运行时间，其中总体运行时间为离线运行时间和在线运行时间之和。对本文方法而言，离线运行时间用于多模型离线训练，在线运行时间用于在线第二次学习和在线预测。从表 2中可以看出，本文方法总体运行时间较长，主要是因为多模型离线训练阶段消耗时间长，为225.767 s，在线第二次学习和在线预测阶段消耗11.136 s。在实验中，多模型的离线训练只进行一次，因此系统的实际运行时间就是在线运行时间(用于在线第二次学习和在线预测)，考虑本文的实验环境，11.136 s的时间开销完全可以满足实际预测系统的应用需求。

表 2 本文方法与单模型方法运行时间对比 s Table 2 Runtime comparsion of the proposed method and single-modles s

图 3是7月每日总负荷和每日峰值负荷实际曲线、预测曲线和预测误差曲线。图 3误差曲线表明，BP误差曲线存在较大的误差点，这说明单算法单模型存在过拟合问题，采用多样性采样可以避免单模型过拟合问题；LSSVM、iGBRT和BP单模型在相同时间点上预测效果有差别，且都有各自预测最好的时间点，而在大部分预测时间点上，本文方法预测值比单模型预测值更接近实际负荷值，这说明本文方法综合利用了多个算法的优点、解决了单个算法适用范围受限的问题，泛化能力更强。从图 3负荷曲线可知单模型大部分预测值都低于负荷实际值，这说明对于负荷存在的增长率问题，单模型没有很好地学习到，泛化能力受限。

图 3 七月负荷实际曲线、预测曲线及预测误差曲线 Figure 3 Actual load, forecasting load, and forecasting errors for July

案例2 本实验对不同融合方法预测性能进行研究。将本文在线第二次学习方法与文献[14]中推荐的偏最小二乘法(Partial Least Squares, PLS)方法进行对比。在线第二次学习和PLS集成所用到的训练数据集是每个待预测时刻最近一段时间的Multi-model负荷预测值及实际值构成训练数据集D1，D1_PLS是PLS方法对D1数据集进行多模型集成，D1_LSSVM是LSSVM对D1数据集进行第二次学习。表 3是不同融合方法全年负荷预测误差。

表 3 不同融合方法全年负荷预测误差 % Table 3 Forecasting errors of different combination methods for a one-year period %

表 3预测结果表明，D1_LSSVM进行多模型二次学习的预测精度明显高于D1_PLS加权平均方法，这说明对于电力负荷变化具有非线性特性，采用非线性融合方法比线性加权融合方法学习得更好。

案例3 本实验对单算法多模型、多算法单模型方法预测性能进行研究。单算法多模型由LSSVM、iGBRT和BP算法分别采用Bootstrap方法进行重复采样，每个算法训练5个模型构建；多算法单模型由LSSVM、iGBRT和BP算法进行两两组合和全部组合的方式构建，每个算法训练1个模型。表 4是不同多模型全年负荷预测误差，所有多模型都使用案例2中D1_LSSVM进行在线第二次学习。

表 4 本文方法与多算法单模型、单算法多模型全年负荷预测误差 % Table 4 Forecasting errors of the proposed model, multi-algorithm & single-models and single-algorithm & multi-models for a one-year period %

由表 4可知，在每日总负荷预测中，3种多模型方法中各自最优的模型是LSSVM_iGBRT、Multi_LSSVM和本文方法；在每日峰值负荷预测中，3种多模型方法中各自最优的模型是BP_LSSVM、Multi_LSSVM和本文方法。在每日总负荷预测中，本文方法相比LSSVM_iGBRT和Multi_LSSVM方法，全年平均MAPE减少了5.00%和7.64%，在每日峰值负荷预测中，本文方法相比BP _LSSVM和Multi_LSSVM方法，全年平均MAPE减少了13.14%和7.60%。在每日总负荷预测中，LSSVM_iBGRT在多算法单模型中全年平均预测精度最高，在每日峰值负荷预测中，Multi_LSSVM和Multi_ BP在单算法多模型中全年平均预测模式下，表现的预测性能不同。而多算法多模型方法在全年平均预测精度上都是最高的，这说明本文方法比单算法多模型和多算法单模型方法预测精度更高，说明多算法多模型方法将多个算法优势互补克服了单算法多模型中单个算法适用范围受限的缺点，也提高了多算法单模型泛化能力，应用更加自由。

表 5显示了多模型方法的运行时间，从表 5中可以看出，多模型方法总体运行时间都比较长，主要是因为多模型离线训练阶段消耗时间长。综合考虑负荷预测精度和实验环境，与其他多模型方法相比，本文方法依然是较优的方法。

表 5 本文方法与单算法多模型、多算法单模型运行时间对比 s Table 5 Runtime comparision of the proposed method, multi-algorithm & multi-models and multi-algorithm & single-models s

3 结语

本文首次提出多算法多模型与在线第2次学习结合的预测方法。对广东省广州市近3年每日总负荷和每日峰值负荷进行预测研究，实验结果为，本文预测方法与最优单模型、最优多算法单模型和最优单算法多模型相比，在每日总负荷预测中，全年MAPE减少了21.07%、5.00%和7.64%，在每日峰值负荷预测中，全年MAPE减少了16.02%、13.14%和7.60%。实验结果表明：通过利用气象数据、星期类型数据、节假日数据和负荷数据更好地揭示了负荷变化的内在规律和趋势; 对训练集进行多样性采样，克服了单模型过拟合问题，泛化能力增强，使多个算法优势互补，解决单个算法适用范围受限的问题；采用在线第二次学习方法，解决了电力负荷存在的增长率和近因效应问题。

本文提出的预测方法不局限于电力负荷预测领域，对于交通流量预测、电价预测等领域，本文方法同样适用，只是在构建多算法多模型时，需要针对各个领域数据集的不同特点选择不同的算法。

参考文献(References)

[1]	DUDEK G. Pattern-based local linear regression models for short-term load forecasting[J]. Electric Power Systems Research, 2016, 130: 139-147. DOI:10.1016/j.epsr.2015.09.001
[2]	CHO M Y, HWANG J C, CHEN C S. Customer short term load forecasting by using ARIMA transfer function model[C]//Proceedings of the 1995 International Conference on Energy Management and Power Delivery. Piscataway, NJ:IEEE, 1995:317-322.
[3]	LI S, WANG P, GOEL L. Short-term load forecasting by wavelet transform and evolutionary extreme learning machine[J]. Electric Power Systems Research, 2015, 122: 96-103. DOI:10.1016/j.epsr.2015.01.002
[4]	XIAO Z, YE S J, ZHONG B, et al. BP neural network with rough set for short term load forecasting[J]. Expert Systems with Applications, 2009, 36(1): 273-279. DOI:10.1016/j.eswa.2007.09.031
[5]	师彪, 李郁侠, 于新花, 等. 改进粒子群——BP神经网络模型的短期电力负荷预测[J]. 计算机应用, 2009, 29(4): 1036-1039. (SHI B, LI Y X, YU X H, et al. Short-term load forecast based on modified particle swarm optimizer and back propagation neural network model[J]. Journal of Computer Applications, 2009, 29(4): 1036-1039.)
[6]	郎坤, 张明媛, 袁永博. 基于迭代误差补偿的核极端学习机模型在短期电力负荷预测中的应用[J]. 计算机应用, 2015, 35(7): 2083-2087. (LANG K, ZHANG M Y, YUAN Y B. Application of extreme learning machine with kernels model based on iterative error correction in short term electricity load forecasting[J]. Journal of Computer Applications, 2015, 35(7): 2083-2087. DOI:10.11772/j.issn.1001-9081.2015.07.2083)
[7]	吴倩红, 高军, 侯广松, 等. 实现影响因素多源异构融合的短期负荷预测支持向量机算法[J]. 电力系统自动化, 2016, 40(15): 67-72. (WU Q H, GAO J, HOU G S, et al. Short-term load forecasting support vector machine algorithm based on multi-source heterogeneous fusion of load factors[J]. Automation of Electric Power Systems, 2016, 40(15): 67-72. DOI:10.7500/AEPS20160229012)
[8]	CHEN Y H, HONG W C, SHEN W, et al. Electric load forecasting based on a least squares support vector machine with fuzzy time series and global harmony search algorithm[J]. Energies, 2016, 9(2): 7-82.
[9]	LIN W M, TU C S, YANG R F, et al. Particle swarm optimisation aided least-square support vector machine for load forecast with spikes[J]. IET Generation, Transmission & Distribution, 2016, 10(5): 1145-1153.
[10]	胡时雨, 罗滇生, 阳霜, 等. 基于多变量LS-SVM和模糊循环推理系统的负荷预测[J]. 计算机应用, 2015, 35(2): 595-600. (HU S Y, LUO D S, YANG S, et al. Load forecasting based on multi-variable LS-SVM and fuzzy recursive inference system[J]. Journal of Computer Applications, 2015, 35(2): 595-600. DOI:10.11772/j.issn.1001-9081.2015.02.0595)
[11]	PAPADOPOULOS S, KARAKATSANIS I. Short-term electricity load forecasting using time series and ensemble learning methods[C]//Proceedings of the 2015 IEEE Power and Energy Conference at Illinois. Piscataway:IEEE, 2015:1-6.
[12]	WU X Y, HE J H, YIP T, et al. A two-stage random forest method for short-term load forecasting[C]//Proceedings of the 2016 IEEE Power and Energy Society General Meeting. Piscataway, NJ:IEEE, 2016:1-5.
[13]	TAIEB S B, HYNDMAN R J. A gradient boosting approach to the Kaggle load forecasting competition[J]. International Journal of Forecasting, 2014, 30(2): 382-394. DOI:10.1016/j.ijforecast.2013.07.005
[14]	MOHAN A, CHEN Z, WEINBERGER K. Web-search ranking with initialized gradient boosted regression trees[C]//Proceedings of the 2010 International Conference on Yahoo! Learning to Rank Challenge. Haifa, Israel:JMLR, 2010, 14:77-89.
[15]	LI N, JIANG Y, ZHOU Z H. Multi-label selective ensemble[C]//Proceedings of the 12th International Workshop on Multiple Classifier Systems. Berlin:Springer, 2015:76-88.
[16]	ZHOU Z H, WU J X, TANG W. Ensembling neural networks:many could be better than all[J]. Artificial Intelligence, 2002, 137(1): 239-263.
[17]	WANG B, CHIANG H D. ELITE:ensemble of optimal input-pruned neural networks using TRUST-TECH[J]. IEEE Transactions on Neural Networks, 2011, 22(1): 96-109. DOI:10.1109/TNN.2010.2087354
[18]	LI S, GOEL L, WANG P. An ensemble approach for short-term load forecasting by extreme learning machine[J]. Applied Energy, 2016, 170: 22-29. DOI:10.1016/j.apenergy.2016.02.114
[19]	CHEN L G, CHIANG H D, DONG N, et al. Group-based chaos genetic algorithm and non-linear ensemble of neural networks for short-term load forecasting[J]. IET Generation Transmission & Distribution, 2016, 10(6): 1440-1447.
[20]	RIBEIRO G T, GRITTI M C, AYALA H V H, et al. Short-term load forecasting using wavenet ensemble approaches[C]//Proceedings of the 2016 International Joint Conference on Neural Networks. Piscataway, NJ:IEEE, 2016:727-734.
[21]	SIWEK K, OSOWSKI S, SZUPILUK R. Ensemble neural network approach for accurate load forecasting in a power system[J]. International Journal of Applied Mathematics & Computer Science, 2009, 19(2): 303-315.
[22]	GRMANOVÁ G, LAURINEC P, ROZINAJOVÁ V, et al. Incremental ensemble learning for electricity load forecasting[J]. Acta Polytechnica Hungarica, 2016, 13(2): 97-117.
[23]	DUDEK G. Heterogeneous ensembles for short-term electricity demand forecasting[C]//Proceedings of the 201617th International Scientific Conference on Electric Power Engineering. Piscataway, NJ:IEEE, 2016:1-6.
[24]	SUYKENS J A K, VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9(3): 293-300. DOI:10.1023/A:1018628609742
[25]	BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. DOI:10.1023/A:1010933404324
[26]	FRIEDMAN J H. Greedy function approximation:a gradient boosting machine[J]. The Annals of Statistics, 2001, 29(5): 1189-1232.
[27]	HECHTNIELSEN R. Theory of the back propagation neural network[C]//Proceedings of the 1989 International Joint Conference on Neural Networks. Piscataway, NJ:IEEE, 1989:593-605.
[28]	GUILLEN A, HERRERA L J, RUBIO G, et al. New method for instance or prototype selection using mutual information in time series prediction[J]. Neurocomputing, 2010, 73(10): 2030-2038.
[29]	BONNLANDER B V, WEIGEND A S. Selecting input variables using mutual information and nonparametric density estimation[EB/OL].[2016-11-20].http://pdfs.semanticscholar.org/0cbb/68b53c3a079545790e1e97e9f14bb4d613a9.pdf.