文章快速检索     高级检索
  北京化工大学学报(自然科学版)  2019, Vol. 46 Issue (2): 97-102   DOI: 10.13543/j.bhxbzr.2019.02.015
0

引用本文  

刘云, 易松. 基于双参数最小二乘支持向量机(TPA-LSSVM)的风电时间序列预测模型的优化研究[J]. 北京化工大学学报(自然科学版), 2019, 46(2): 97-102. DOI: 10.13543/j.bhxbzr.2019.02.015.
LIU Yun, YI Song. Optimization of a wind power time series prediction model based on a two-parameter least squares support vector machine[J]. Journal of Beijing University of Chemical Technology (Natural Science), 2019, 46(2): 97-102. DOI: 10.13543/j.bhxbzr.2019.02.015.

基金项目

国家自然基金(61262040)

第一作者

刘云, 男, 1973年生, 副教授.

通信联系人

易松, E-mail:1090037776@qq.com

文章历史

收稿日期:2018-09-13
基于双参数最小二乘支持向量机(TPA-LSSVM)的风电时间序列预测模型的优化研究
刘云 , 易松     
昆明理工大学 信息工程与自动化学院, 昆明 650500
摘要:风电时间序列预测模型的优劣直接影响风功率的应用价值,最小二乘支持向量机(least squares support vector machine,LSSVM)在处理风电预测问题上具有明显优势。提出了一种双参数算法(two-parameter algorithm,TPA),从理论上证明了任意初始值均可线性收敛到全局最优值。调用TPA算法对LSSVM模型的惩罚因子和径向基宽度进行寻优赋值,并将训练好的TPA-LSSVM模型应用于风电预测中。仿真结果表明,与LSSVM模型、粒子群最小二乘支持向量机(PSO-LSSVM)模型、径向基函数神经网络(RBFNN)模型相比,TPA算法可以更好地实现LSSVM的参数寻优,TPA-LSSVM模型能有效提高预测精度。
关键词最小二乘支持向量机    时间序列预测    双参数算法    参数寻优    
Optimization of a wind power time series prediction model based on a two-parameter least squares support vector machine
LIU Yun , YI Song     
Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650500, China
Abstract: The advantages and disadvantages of the wind power time series prediction model directly affect the application value of wind power. The least squares support vector machine (LSSVM) has obvious advantages in dealing with wind power prediction. This paper proposes a two-parameter algorithm (TPA), which shows that any initial value can converge linearly to the global optimal value. The two-parameter (TPA) algorithm is employed to optimize the penalty factor and radial base width of the LSSVM model, and the trained TPA-LSSVM model is then applied to wind power prediction. The simulation results show that compared with the LSSVM model, the particle swarm least squares support vector machine (PSO-LSSVM) model and the radial basis function neural network (RBFNN) model, the TPA algorithm can better realize the parameter optimization of LSSVM, and thus the TPA-LSSVM model can effectively improve the prediction accuracy.
Key words: least squares support vector machine    time series prediction    two-parameter algorithm    parameter optimization    
引言

由于高间歇性和不可调度性,大规模风电一体化对电力系统的稳定运行带来了巨大的挑战,而短期风电预测概念的提出明显缓解了这一问题[1]。现有的预测主要基于物理模型[2]、统计模型[3]和混合模型[4]3种模型。物理模型基于地形和风电场的详细物理描述,从数值天气预报中获得模拟结果,而统计模型基于历史气象时间序列。由于数值天气预报的高计算成本,基于数值天气预报的物理模型不适用于短期风电预测(提前预测小于等于6 h)。混合模型包含物理模型和统计模型,由于同样需要数值天气预报的结果,因此其应用也有较大限制。统计模型与物理模型和混合模型相比,成本更低,复杂度更小,更适合于短期风电预测[5]

在统计模型中,通过训练历史风电数据来预测未来风电数据。自回归整合移动平均(ARIMA)模型是风电预测中使用最为广泛的传统统计模型之一,但该模型通常只能表示线性关系。风电数据具有非平稳性、非线性的特点,ARIMA模型的预测性能受限。Mahnaz等[6]提出使用径向基函数神经网络(RBFNN)预测短期风电,RBFNN能够以任意精度逼近任意的非线性函数,且拓扑结构紧凑,收敛速度快。但RBFNN对训练样本依赖程度很高,很难反映系统真正的输入输出关系,且在优选过程中容易出现数据病态现象。Wu等[7]提出了支持向量机(support vector machine, SVM),该模型广泛应用于时间序列数据的预测。最小二乘支持向量机(least squares support vector machine,LSSVM)模型[8]是SVM模型的拓展,采用最小二乘线性系统作为损失函数,将SVM的二次规划问题转变为求解线性方程,有效提高了运算速度并降低了复杂度。在LSSVM模型中,惩罚因子μ和径向基宽度δ直接影响预测结果。针对LSSVM参数的优化问题,Corus等[9]使用基于遗传算法(genetic algorithm,GA)优化的LSSVM模型预测风电,但GA算法存在早熟、欺骗等现象,以及搜索效率低、时间复杂度高等问题。Anamika等[10]使用基于粒子群优化(particle swarm optimization, PSO)的LSSVM模型预测风电,PSO算法使用编码和适应度函数优化控制参数,但容易出现早熟或停滞搜索现象,易陷入局部极值。由于GA算法与PSO算法在对LSSVM的参数进行寻优时均有不同程度的限制,故针对LSSVM的参数寻优算法还有待突破。

为了使LSSVM预测模型具有更好的预测效果,本文提出一种最优化算法—双参数算法(two-parameter algorithm,TPA),从理论上证明了任意初始值均可线性收敛到全局最优值。TPA算法可防止早熟和欺骗现象的发生,并且收敛速度快,寻优精度高,不易陷入局部极值。通过调用TPA算法对LSSVM模型的惩罚因子μ和径向基宽度δ进行寻优赋值,并将训练好的TPA-LSSVM模型应用于风电预测中。仿真结果表明,与LSSVM模型、粒子群最小二乘支持向量机(PSO-LSSVM)模型和径向基函数神经网络(RBFNN)模型相比,TPA-LSSVM模型有效提高了预测精度。

1 模型构建

支持向量机是根据结构风险最小化原则和统计学习理论提出的,最小二乘支持向量机是SVM的最小二乘法,即将SVM中的非等式约束转化为等式约束,使SVM中的二次规划问题变为求解线性方程问题。

首先假设训练样本集为(x1, y1), (x2y2),…(xm, ym), 其中xiRm表示样本输入向量,yiR表示样本输出向量,m表示样本总数。输入空间Rm被非线性映射函数φ(x)映射到特征空间Z。根据结构风险最小化原则构建LSSVM模型的最优决策函数,可表示为

$ f\left( \mathit{\boldsymbol{x}} \right) = {\left\| \mathit{\boldsymbol{w}} \right\|^2}\varphi \left( \mathit{\boldsymbol{x}} \right) + \mathit{\boldsymbol{b}} $ (1)

式中wZbRwb的值可以通过风险函数确定。LSSVM的优化问题可表示为

$ \mathop {\min }\limits_{\mathit{\boldsymbol{w}},\mathit{\boldsymbol{b}},\mathit{\boldsymbol{e}}} J\left( {\mathit{\boldsymbol{w}},\mathit{\boldsymbol{e}}} \right) = \frac{1}{2}{\mathit{\boldsymbol{w}}^{\rm{T}}}\mathit{\boldsymbol{w}} + \frac{\mathit{\boldsymbol{\mu }}}{2}\sum\limits_{i = 1}^n {\mathit{\boldsymbol{e}}_i^2} $ (2)
$ {\rm{s}}.\;{\rm{t}}.\;\;\;{y_i} = {\mathit{\boldsymbol{w}}^{\rm{T}}}\varphi \left( {{\mathit{\boldsymbol{x}}_i}} \right) + \mathit{\boldsymbol{b}} + {\mathit{\boldsymbol{e}}_i} $ (3)

式中w表示权重向量,b表示偏差向量,ei表示松弛因子向量,μ表示惩罚因子向量,φ(·)表示从输入空间到高维特征空间的非直接映射。

为了快速找到式(2)中函数的最小值,运用拉格朗日法对该问题进行求解

$ L\left( {\mathit{\boldsymbol{w}},\mathit{\boldsymbol{b}},\mathit{\boldsymbol{e}},\mathit{\boldsymbol{\alpha }}} \right) = J\left( {\mathit{\boldsymbol{w}},\mathit{\boldsymbol{e}}} \right) - \sum\limits_{i = 1}^n {{\mathit{\boldsymbol{\alpha }}_i}\left[ {{\mathit{\boldsymbol{w}}^{\rm{T}}}\varphi \left( {{\mathit{\boldsymbol{x}}_i}} \right) + \mathit{\boldsymbol{b}} + {\mathit{\boldsymbol{e}}_i} - {y_i}} \right]} $ (4)

式中,α为对应xi拉格朗日乘子,可以表示为α=(α1, α2,…,αm)。根据Kuhn-Tucker最优化(KKT)条件,对式(4)进行微分可得出

$ \frac{{\partial \mathit{\boldsymbol{L}}}}{{\partial \mathit{\boldsymbol{w}}}} = 0 \Rightarrow \mathit{\boldsymbol{w}} = \sum\limits_{i = 1}^n {{\mathit{\boldsymbol{\alpha }}_i}\varphi \left( {{\mathit{\boldsymbol{x}}_i}} \right)} $ (5)
$ \frac{{\partial \mathit{\boldsymbol{L}}}}{{\partial \mathit{\boldsymbol{b}}}} = 0 \Rightarrow \sum\limits_{i = 1}^n {{\mathit{\boldsymbol{\alpha }}_i}} = 0 $ (6)
$ \frac{{\partial \mathit{\boldsymbol{L}}}}{{\partial {\mathit{\boldsymbol{e}}_i}}} = 0 \Rightarrow {\mathit{\boldsymbol{\alpha }}_i} = \mathit{\boldsymbol{\mu }}{\mathit{\boldsymbol{e}}_i} $ (7)
$ \frac{{\partial \mathit{\boldsymbol{L}}}}{{\partial {\mathit{\boldsymbol{\alpha }}_i}}} = 0 \Rightarrow {\mathit{\boldsymbol{w}}^{\rm{T}}}\varphi \left( {{\mathit{\boldsymbol{x}}_i}} \right) + \mathit{\boldsymbol{b}} + {\mathit{\boldsymbol{e}}_i} - {y_i} = 0 $ (8)

根据表达式(5)~(8)可以解出αb的值。

对于一个新样本x,LSSVM模型的输出为

$ f\left( \mathit{\boldsymbol{x}} \right) = \sum\limits_{i = 1}^n {{\mathit{\boldsymbol{\alpha }}_i}K\left( {\mathit{\boldsymbol{x}},{\mathit{\boldsymbol{x}}_i}} \right) + \mathit{\boldsymbol{b}}} $ (9)

式中K(x, xi)=φ(xT)φ(xi),为核函数。本文选取径向基(RBF)核函数,可以表示为

$ K\left( {\mathit{\boldsymbol{x}},{\mathit{\boldsymbol{x}}_i}} \right) = \exp \left[ { - \frac{{{{\left( {\mathit{\boldsymbol{x}} - {\mathit{\boldsymbol{x}}_i}} \right)}^2}}}{{{\delta ^2}}}} \right] $ (10)

式中δ表示基核宽度。

为解决优化问题(2),应选择合适的惩罚因子μ和径向基宽度δ来训练LSSVM,合理选择μδ可有效提高模型的预测精度。为避免由于经验选择或随机选择参数而造成的误差,使用TPA算法对参数进行优化。

2 基于TPA算法优化的最小二乘支持向量机 2.1 TPA算法描述

首先考虑一个优化问题

$ \mathop {{\rm{minimize}}}\limits_{x \in {\mathit{\boldsymbol{R}}^n}} f\left( x \right) $ (11)

式中f:RnRf为连续可微的强m-凸函数,Lipschitz常数为Lf具有唯一的全局极小值点x*,且x*Rn。其中强m-凸函数定义如下。

设(X, ‖·‖)是实赋范线性空间,IX的一个凸子集,JR内的一个区间,且(0, 1)⊂J, 函数m:J→[0, +∞)。若函数f:I→[0, +∞)满足:存在常数c>0,∀x, yIt∈(0, 1),则称fI上的强m-凸函数

$ \begin{array}{l} f\left( {tx + \left( {1 - t} \right)y} \right) \ge m\left( t \right)f\left( x \right) + m\left( {1 - t} \right)f\left( y \right) - \\ ct\left( {1 - t} \right){\left\| {x - y} \right\|^2} \end{array} $ (12)

Lipschitz定义如下。

L对于在实数集的子集的函数f:DR, 若存在常数,使得|f(a)-f(b)|≤L|a-b|, 其中∀a, bD,则称f符合Lipschitz条件,对于f最小的常数L称为f的Lipschitz常数。

定义1(函数类)   令函数f的集合为Sm, l,其中f为连续可微的强m-凸函数,Lipschitz常数为L,当fSm, l时,g=L/mg为条件数。

定义2(TPA算法)   为解决式(11)的无约束最优化问题,近年来部分学者提出采用递归法来编写算法[11-12],如式(13)所示。

$ \begin{array}{l} {\mathit{\boldsymbol{\xi }}_{k + 1}} = \left( {1 + \beta } \right){\mathit{\boldsymbol{\xi }}_k} - \beta {\mathit{\boldsymbol{\xi }}_{k - 1}} - \alpha \nabla f\left( {{\mathit{\boldsymbol{y}}_k}} \right)\\ {\mathit{\boldsymbol{y}}_k} = \left( {1 + \gamma } \right){\mathit{\boldsymbol{\xi }}_k} - \gamma {\mathit{\boldsymbol{\xi }}_{k - 1}}\\ {\mathit{\boldsymbol{x}}_k} = \left( {1 + \delta } \right){\mathit{\boldsymbol{\xi }}_k} - \delta {\mathit{\boldsymbol{\xi }}_{k - 1}} \end{array} $ (13)

式中α, β, γ, δ为变量,$ \mathit{\boldsymbol{\xi }} \in \ell _{2e}^n$表示系统的内部状态,$ \ell _{2e}^n$为所有单边序列x的集合,$ \mathit{\boldsymbol{y }} \in \ell _{2e}^n$用于求解梯度,输出为$ \mathit{\boldsymbol{x }} \in \ell _{2e}^n$,且ξ0, ξ-1Rn表示初始条件。

已知Lipschitz常数为Lg=L/m

$ \rho = 1 - 1/\sqrt g $,则

$ \begin{array}{l} \left( {\alpha ,\beta ,\gamma ,\delta } \right) = \left( {\frac{{1 + \rho }}{L},\frac{{{\rho ^2}}}{{2 - \rho }},\frac{{{\rho ^2}}}{{\left( {2 - \rho } \right)\left( {1 + \rho } \right)}},} \right.\\ \left. {\frac{{{\rho ^2}}}{{1 - {\rho ^2}}}} \right) \end{array} $ (14)

式(14)即为TPA算法。

2.2 TPA算法收敛性证明

定理1  令$ \mathit{\boldsymbol{x }} \in \ell _{2e}^n$, x*Rnk0≥0,如果存在一个序列$ \mathit{\boldsymbol{q }} \in \ell _{2e}$,则

$ {\left\| {{\mathit{\boldsymbol{x}}_{k + 1}} - {\mathit{\boldsymbol{x}}_ * }} \right\|^2} \le {\rho ^2}{\left\| {{\mathit{\boldsymbol{x}}_k} - {\mathit{\boldsymbol{x}}_ * }} \right\|^2} - {\mathit{\boldsymbol{q}}_k},\forall k \ge {k_0} $ (15)
$ 0 \le \sum\limits_{j = 0}^k {{\rho ^{ - 2j}}{\mathit{\boldsymbol{q}}_j}} ,\forall k \ge 0 $ (16)

xk以速率ρ经过k0次迭代后,线性收敛到x*,当kk0时,‖xk-x*‖≤k,其中

$ c = {\left( {{\rho ^{ - 2{k_0}}}{{\left\| {{\mathit{\boldsymbol{x}}_{{k_0}}} - {\mathit{\boldsymbol{x}}_ * }} \right\|}^2} + \sum\limits_{j = 0}^{{k_0} - 1} {{\rho ^{ - 2\left( {j + 1} \right)}}{\mathit{\boldsymbol{q}}_j}} } \right)^{\frac{1}{2}}} $ (17)

证明:假设存在一个满足式(15)和式(16)的序列$ \mathit{\boldsymbol{q }} \in \ell _{2e}$。首先定义一个等式ηk

$ {\mathit{\boldsymbol{\eta }}_k} = {\left\| {{\mathit{\boldsymbol{x}}_{k + 1}} - {\mathit{\boldsymbol{x}}_ * }} \right\|^2} - {\rho ^2}{\left\| {{\mathit{\boldsymbol{x}}_{k + 1}} - {\mathit{\boldsymbol{x}}_ * }} \right\|^2} + {\mathit{\boldsymbol{q}}_k} $ (18)

将式(18)代入式(15)可得,在kk0时,ηk≤0恒成立。对其进行求和

$ \begin{array}{l} 0 \ge \sum\limits_{j = {k_0}}^{k - 1} {{\rho ^{2\left( {k - j - 1} \right)}}{\mathit{\boldsymbol{\eta }}_j}} = {\left\| {{\mathit{\boldsymbol{x}}_k} - {\mathit{\boldsymbol{x}}_ * }} \right\|^2} - {\rho ^{2\left( {k - {k_0}} \right)}}\\ \left\| {{\mathit{\boldsymbol{x}}_{{k_0}}} - {\mathit{\boldsymbol{x}}_ * }} \right\| + {\rho ^{2\left( {k - 1} \right)}}\sum\limits_{j = {k_0}}^{k - 1} {{\rho ^{ - 2j}}{\mathit{\boldsymbol{q}}_j}} \end{array} $ (19)

根据式(16),可得

$ - \sum\limits_{j = 0}^{{k_0} - 1} {{\rho ^{ - 2j}}{\mathit{\boldsymbol{q}}_j}} \le - \sum\limits_{j = {k_0}}^{k - 1} {{\rho ^{ - 2j}}{\mathit{\boldsymbol{q}}_j}} $ (20)

结合式(19)和式(20)得到误差的约束条件为

$ \begin{array}{l} {\left\| {{\mathit{\boldsymbol{x}}_k} - {\mathit{\boldsymbol{x}}_ * }} \right\|^2} \le {\rho ^{2\left( {k - {k_0}} \right)}}{\left\| {{\mathit{\boldsymbol{x}}_{{k_0}}} - {\mathit{\boldsymbol{x}}_ * }} \right\|^2} + \\ {\rho ^{2\left( {k - 1} \right)}}\sum\limits_{j = {k_0}}^{k - 1} {{\rho ^{ - 2j}}{\mathit{\boldsymbol{q}}_j}} \end{array} $ (21)

kk0时,式(21)成立。从式(21)右边提取ρ2k,得

$ \begin{array}{l} {\left\| {{\mathit{\boldsymbol{x}}_k} - {\mathit{\boldsymbol{x}}_ * }} \right\|^2} \le {\rho ^{2k}}\left( {{\rho ^{ - 2{k_0}}}{{\left\| {{\mathit{\boldsymbol{x}}_{{k_0}}} - {\mathit{\boldsymbol{x}}_ * }} \right\|}^2} + } \right.\\ \left. {\sum\limits_{j = 0}^{{k_0} - 1} {{\rho ^{ - 2\left( {j + 1} \right)}}{\mathit{\boldsymbol{q}}_j}} } \right) \end{array} $ (22)

两边同时开方

$ \begin{array}{l} \left\| {{\mathit{\boldsymbol{x}}_k} - {\mathit{\boldsymbol{x}}_ * }} \right\| \le \rho \left( {{\rho ^{ - 2{k_0}}}{{\left\| {{\mathit{\boldsymbol{x}}_{{k_0}}} - {\mathit{\boldsymbol{x}}_ * }} \right\|}^2} + } \right.\\ {\left. {\sum\limits_{j = 0}^{{k_0} - 1} {{\rho ^{ - 2\left( {j + 1} \right)}}{\mathit{\boldsymbol{q}}_j}} } \right)^{\frac{1}{2}}} \end{array} $ (23)

$ c = {\left( {{\rho ^{ - 2{k_0}}}{{\left\| {{\mathit{\boldsymbol{x}}_{{k_0}}} - {\mathit{\boldsymbol{x}}_ * }} \right\|}^2} + \sum\limits_{j = 0}^{{k_0} - 1} {{\rho ^{ - 2\left( {j + 1} \right)}}{\mathit{\boldsymbol{q}}_j}} } \right)^{\frac{1}{2}}} $

可得

$ \left\| {{\mathit{\boldsymbol{x}}_k} - {\mathit{\boldsymbol{x}}_ * }} \right\| \le c{\rho ^k} $ (24)

因此,xk以速率ρ经过k0次迭代后,线性收敛到x*

定理2  当fSm, L且0 < mL时,x*Rn是函数f的唯一最小值。对于任何初始值ξ0ξ-1Rn,双变量算法的迭代都满足

$ \left\| {{\mathit{\boldsymbol{x}}_k} - {\mathit{\boldsymbol{x}}_ * }} \right\| \le c{\rho ^k} $ (25)
$ f\left( {{\mathit{\boldsymbol{x}}_k}} \right) - f\left( {{\mathit{\boldsymbol{x}}_ * }} \right) \le {c^2}\frac{L}{2}{\rho ^{2k}} $ (26)

式(25)和式(26)在k≥1时成立,其中$\rho = 1 - 1/\sqrt k $

$ c = {\rho ^{ - 1}}{\left( {{{\left\| {{\mathit{\boldsymbol{x}}_1} - {\mathit{\boldsymbol{x}}_ * }} \right\|}^2} - \frac{1}{{mL}}{\mathit{\boldsymbol{p}}_m}{{\left( {{\mathit{\boldsymbol{y}}_0}} \right)}^{\rm{T}}}{\mathit{\boldsymbol{p}}_L}\left( {{\mathit{\boldsymbol{y}}_0}} \right)} \right)^{1/2}} $ (27)
$ {\mathit{\boldsymbol{p}}_r}\left( \mathit{\boldsymbol{y}} \right) = \nabla f\left( \mathit{\boldsymbol{y}} \right) - r\left( {\mathit{\boldsymbol{y}} - {\mathit{\boldsymbol{x}}_ * }} \right) $ (28)

为了证明定理2中xk以速率ρ线性收敛到x*,需要一个满足式(16)的序列qk且使式(15)成立。本文采用文献[13]中的引理生成序列qk

引理1  令fSm, L且∇f(x*)=0,定义pr(y)=∇f(y)-r(y-x*),可得到

$ {\mathit{\boldsymbol{q}}_k} = \left\{ \begin{array}{l} - {\mathit{\boldsymbol{p}}_m}{\left( {{\mathit{\boldsymbol{y}}_k}} \right)^{\rm{T}}}\left[ {{\mathit{\boldsymbol{p}}_L}\left( {{\mathit{\boldsymbol{y}}_k}} \right) - {\rho ^2}{\mathit{\boldsymbol{p}}_L}\left( {{\mathit{\boldsymbol{y}}_{k - 1}}} \right)} \right],\;\;\;\;\;\;k \ge 1\\ - {\mathit{\boldsymbol{p}}_m}{\left( {{\mathit{\boldsymbol{y}}_0}} \right)^{\rm{T}}}{\mathit{\boldsymbol{p}}_L}\left( {{\mathit{\boldsymbol{y}}_0}} \right),\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;k \ge 0 \end{array} \right. $ (29)

$ 0 \le \sum\limits_{j = 0}^k {{\rho ^{ - 2j}}{\mathit{\boldsymbol{q}}_j}} ,\forall k \ge 0 $ (30)

证明:双变量算法产生序列xkyk且初始条件为ξ0ξ1。取k0=1,可得

$ {\mathit{\boldsymbol{q}}_k} = \frac{1}{{mL}}\left\{ \begin{array}{l} {\mathit{\boldsymbol{p}}_m}{\left( {{\mathit{\boldsymbol{y}}_k}} \right)^{\rm{T}}}\left[ {{\mathit{\boldsymbol{p}}_L}\left( {{\mathit{\boldsymbol{y}}_k}} \right) - {\rho ^2}{\mathit{\boldsymbol{p}}_L}\left( {{\mathit{\boldsymbol{y}}_{k - 1}}} \right)} \right],\;\;\;\;\;\;\;\;k \ge 1\\ - {\mathit{\boldsymbol{p}}_m}{\left( {{\mathit{\boldsymbol{y}}_0}} \right)^{\rm{T}}}{\mathit{\boldsymbol{p}}_L}\left( {{\mathit{\boldsymbol{y}}_0}} \right),\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;k \ge 0 \end{array} \right. $ (31)

式中pL(yk)=∇f(yk)-r(yk-x*),当k≥1时,式(16)成立。将式(15)和式(16)代入式(18)中,可得序列ηk的表达式

$ \begin{array}{l} {\mathit{\boldsymbol{\eta }}_k} = {\left\| {{\mathit{\boldsymbol{x}}_{k + 1}} - {\mathit{\boldsymbol{x}}_ * }} \right\|^2} - {\rho ^2}{\left\| {{\mathit{\boldsymbol{x}}_k} - {\mathit{\boldsymbol{x}}_ * }} \right\|^2} - \frac{1}{{mL}}{\rho _m}\\ {\left( {{\mathit{\boldsymbol{y}}_k}} \right)^{\rm{T}}}\left[ {{\rho _L}\left( {{\mathit{\boldsymbol{y}}_k}} \right) - {\rho ^2}{\rho _L}\left( {{\mathit{\boldsymbol{y}}_{k - 1}}} \right)} \right] \end{array} $ (32)

k≥1时,式(32)成立。根据三重动量法的定义,可以将式(14)进行等效

$ \left\{ \begin{array}{l} {\mathit{\boldsymbol{x}}_{k + 1}} = \left( {1 + \delta } \right){\mathit{\boldsymbol{\xi }}_{k + 1}} - \delta {\mathit{\boldsymbol{\xi }}_k}\\ {\mathit{\boldsymbol{x}}_k} = \left( {1 + \delta } \right){\mathit{\boldsymbol{\xi }}_k} - \delta {\mathit{\boldsymbol{\xi }}_{k - 1}}\\ {\mathit{\boldsymbol{y}}_k} = \left( {1 + \gamma } \right){\mathit{\boldsymbol{\xi }}_k} - \gamma {\mathit{\boldsymbol{\xi }}_{k - 1}}\\ {\mathit{\boldsymbol{y}}_{k - 1}} = \left( {1 + \gamma } \right){\mathit{\boldsymbol{\xi }}_{k - 1}} - \gamma {\mathit{\boldsymbol{\xi }}_{k - 2}}\\ \nabla f\left( {{\mathit{\boldsymbol{y}}_k}} \right) = \left[ { - {\mathit{\boldsymbol{\xi }}_{k + 1}} + \left( {1 + \beta } \right){\mathit{\boldsymbol{\xi }}_k} - \beta {\mathit{\boldsymbol{\xi }}_{k - 1}}} \right]/\alpha \\ \nabla f\left( {{\mathit{\boldsymbol{y}}_{k - 1}}} \right) = \left[ { - {\mathit{\boldsymbol{\xi }}_{k - 1}} + \left( {1 + \beta } \right){\mathit{\boldsymbol{\xi }}_{k - 1}} - \beta {\mathit{\boldsymbol{\xi }}_{k - 2}}} \right]/\alpha \end{array} \right. $ (33)

式中,

$ \left\{ \begin{array}{l} \left( {\alpha ,\beta ,\gamma ,\delta } \right) = \left( {\frac{{1 + \rho }}{L},\frac{{{\rho ^2}}}{{2 - \rho }},\frac{{{\rho ^2}}}{{\left( {2 - \rho } \right)\left( {1 + \rho } \right)}},} \right.\\ \;\;\;\;\;\;\;\left. {\frac{{{\rho ^2}}}{{1 - {\rho ^2}}}} \right)\\ \rho = 1 - 1/\sqrt {L/m} \end{array} \right. $ (34)

ηk可由ξk-2, ξk-1, ξk, ξk+1, x*表示,将式(33)和式(34)代入式(32)中,可得出等式ηk≡0的唯一解ξk-2, ξk-1, ξk, ξk+1, x*

2.3 预测模型参数优化

通过对TPA算法及LSSVM算法的分析,提出将TPA算法应用于LSSVM参数的寻优,通过对LSSVM中的惩罚因子μ和径向基宽度δ进行寻优赋值,使TPA-LSSVM预测模型具有更好的预测效果。

TPA-LSSVM预测模型具体应用步骤如下。

(1) 初始化TPA-LSSVM预测模型中相关参数。

(2) 使用TPA算法搜索惩罚因子μ和径向基宽度δ的值。

(3) 取惩罚因子μ和径向基宽度δ的全局最优值,并对LSSVM模型进行训练。

(4) 对训练得到的模型进行测试,得出测试结果。

3 实验结果与分析 3.1 数据集

采用美国国家海洋和大气管理局(NOAA)的“weather data”数据集作为模型的训练数据。NOAA标准数据集是美国国家海洋和大气管理局通过气象卫星以及其他途径采集形成的实时数据集[14],该数据集每15 min采样一次,测试数据和训练数据有不同的概率分布,使风电预测更具有真实性。本文实验采用2011~2016年数据作为训练数据,2017年第一季度的风力发电数据作为测试数据。

3.2 TPA算法参数选取

由式(14)可得,TPA算法的4个参数与函数fmL两个参数取值有关。mL的选取采用多次试验法,其中L使用文献[5]中的取值,即L=104。为了使训练的数据完整有效,令m的取值范围为1~10,对于不同大小组合的m值与L值,采用TPA算法对训练样本进行预测。表 1为不同的m值对应的预测误差。

下载CSV 表 1 不同m值的预测误差 Table 1 Prediction errors for different m values

表 1中选取预测误差最小的一组值作为函数f的维数m和Lipschitz梯度大小L的最终取值。由表 1可知,m取5。由mL的取值可以计算出g值和ρ值,将ρL代入式(13)中,可计算出TPA算法的具体表达式。

3.3 性能评估

为了评估TPA-LSSVM模型的性能,将其与常见的LSSVM模型、PSO-LSSVM模型和RBFNN模型进行对比。

实验采用归一化平均绝对误差(RNMAE)和归一化均方误差(RNRMSE)作为评估指标。其中RNMAE评估预测值的准确度,RNRMSE评估偏差的程度与变化。评价指标的定义为[15]

$ {R_{{\rm{NMAE}}}} = \frac{1}{N}\sum\limits_{i = 1}^N {\frac{{{{\left| {{x_i} - {{\hat x}_i}} \right|}^2}}}{P} \times 100\% } $ (35)
$ {R_{{\rm{NRMSE}}}} = \frac{1}{P}\sqrt {\frac{1}{N}\sum\limits_{i = 1}^N {{{\left( {{x_i} - {{\hat x}_i}} \right)}^2}} } \times 100\% $ (36)

式中,N为测试样本大小;P表示数据集的风力发电容量,在本文实验中取967 MW;xi为真实值,$ {\hat x_i}$为预测值。

3.4 预测分析

图 1可以看出,TPA-LSSVM模型的性能明显优于其他预测模型。随着提前预测时间的增加,模型的RNRMSE出现不同程度上升,但TPA-LSSVM模型的增幅最小。仿真结果表明,TPA-LSSVM模型的偏差最小,数据更加集中。

图 1 不同提前预测时间的归一化均方误差 Fig.1 Normalized mean square errors for different early prediction times

图 2可知,TPA-LSSVM模型与其他模型相比,预测效果更优,预测精度更高。随着提前预测时间的增加,模型的误差逐渐变大。仿真结果表明,在不同的时刻,TPA-LSSVM模型的RNMAE均为最小,预测精度最高。

图 2 不同提前预测时间的归一化平均绝对误差 Fig.2 Normalized mean absolute errors for different early prediction times
4 结论

惩罚因子和径向基宽度直接影响LSSVM模型的预测精度,本文提出了一种双参数(TPA)算法,从理论上证明任意初始值均可线性收敛到全局最优值。TPA算法可防止早熟和欺骗现象的发生,并且收敛速度快,寻优精度高,不易陷入局部极值。通过调用TPA算法对LSSVM模型的惩罚因子和径向基宽度进行寻优赋值,并将训练好的TPA-LSSVM模型应用于风电预测中。仿真结果表明,与LSSVM模型、PSO-LSSVM模型和RBFNN模型相比,TPA算法可以更好地实现LSSVM的参数寻优,TPA-LSSVM模型能有效提高预测精度。在今后的研究工作中可将TPA算法与其他寻优算法进行组合,以提升算法的性能,从而为商业应用提供更多的选择。

参考文献
[1]
KUMPF A, TOST B, BAUMGART M, et al. Visualizing confidence in cluster-based ensemble weather forecast analyses[J]. IEEE Transactions on Visualization and Computer Graphics, 2018, 24(1): 109-119. DOI:10.1109/TVCG.2017.2745178
[2]
WARRINGTON J, DREW D, LYGEROS J. Low-dimensional space-and time-coupled power system control policies driven by high-dimensional ensemble weather forecasts[J]. IEEE Control Systems Letters, 2018, 2(1): 1-6.
[3]
YAN J, ZHANG H, LIU Y Q, et al. Forecasting the high penetration of wind power on multiple scales using multi-to-multi mapping[J]. IEEE Transcations on Power Systems, 2018, 33(3): 3276-3284. DOI:10.1109/TPWRS.2017.2787667
[4]
YAN J, LI F R, LIU Y Q, et al. Novel cost model for balancing wind power forecasting uncertainty[J]. IEEE Transactions on Energy Conversion, 2017, 32(1): 318-329.
[5]
JIAO R H, HUANG X J, MA X H, et al. A model combining stacked auto encoder and back propagation algorithm for short-term wind power forecasting[J]. IEEE Acess, 2018, 6: 17851-17858. DOI:10.1109/ACCESS.2018.2818108
[6]
MAHNAZ M, AKHIL K, NALESH S, et al. A hardware architecture for radial basis function neural network classifier[J]. IEEE Transactions on Parallel and Distributed Systems, 2018, 29(3): 481-495. DOI:10.1109/TPDS.2017.2768366
[7]
WU X H, ZUO W M, LIN L, et al. F-SVM:combination of feature transformation and SVM learning via convex relaxation[J]. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(11): 5185-5199. DOI:10.1109/TNNLS.2018.2791507
[8]
CHENG R J, SONG Y D, CHEN D W, et al. Intelligent localization of a high-speed train using LSSVM and the online sparse optimization approach[J]. IEEE Transactions on Intelligent Transportation Systems, 2017, 18(8): 2071-2084. DOI:10.1109/TITS.2016.2633344
[9]
CORUS D, OLIVETO P S. Standard steady state genetic algorithms can hillclimb faster than mutation-only evolutionary algorithms[J]. IEEE Transactions on Evolutionary Computation, 2018, 22(5): 720-732. DOI:10.1109/TEVC.2017.2745715
[10]
ANAMIKA, PEESAPATI R, KUMAR N. Electricity price forecasting and classification through wavelet-dynamic weighted PSO-FFNN approach[J]. IEEE Systems Journal, 2018, 12(4): 3075-3084. DOI:10.1109/JSYST.2017.2717446
[11]
候旭珂, 杨宏伟, 马方, 等. 一种新的广义鲁棒主成分分析(GRPCA)算法研究及应用[J]. 北京化工大学学报(自然科学版), 2018, 45(4): 82-85.
HOU X K, YANG H W, MA F, et al. A new generalized robust principal component analysis (GRPCA) algorithm[J]. Journal of Beijing University of Chemical Technology(Natural Science), 2018, 45(4): 82-85. (in Chinese)
[12]
易军凯, 王超, 李辉. 面向文本分类的的深度置信网络特征提取方法研究[J]. 北京化工大学学报(自然科学版), 2018, 45(3): 90-94.
YI J K, WANG C, LI H. A feature extraction method for text categorization based on a deep belief network (DBN)[J]. Journal of Beijing University of Chemical Technology(Natural Science), 2018, 45(3): 90-94. (in Chinese)
[13]
LESSARD L, RECHT B, PACKARD A. Analysis and design of optimization algorithms via integral quadratic constraints[J]. SIAM Journal on Optimization, 2016, 26(1): 57-95.
[14]
KATHRYN D S. National oceanic and atmospheric administration repository of meteorological databases[EB/OL].[2018-07-28]. http://www.cdc.noaa.gov/cdc/data.ncep.reanalysis.derived.html.
[15]
ZHANG Y G, CHEN B, ZHAO Y, et al. Wind speed prediction of IPSO-BP neural network based on Lorenz disturbance[J]. IEEE Access, 2018, 6: 53168-53179. DOI:10.1109/ACCESS.2018.2869981