2. 对外经济贸易大学 金融学院, 北京 100029
2. School of Finance and Banking, University of International Business and Economics, Beijing 100029, China
利率期限结构是相同的风险水平下利率与到期期限之间的数量关系或理论上的零息票债券收益率曲线。利率期限结构在资产定价、金融风险管理和货币政策制定等方面具有重要作用,所以其获取方法是金融学研究的热点问题之一。
曲线拟合法是获取利率期限结构的传统方法之一,该方法通过假定收益率曲线的数学模型,并利用样本数据估计模型中的参数值,从而预测利率期限结构。常用的曲线拟合方法有:多项式样条函数利率期限结构模型[1]、Nelson-Siegel(NS)模型[2]、Svensson(SV)模型[3-4]和双斜率因子动态利率期限结构模型[5]等。但此类拟合模型均存在一个共性问题,即如果收益率曲线的真实情况不符合模型所设定的形式,那么必然存在模式设定误差,甚至模型设定错误,显然不利于利率期限结构预测。
神经网络作为一种新型的人工智能算法,具有自学习的特性和良好的非线性逼近能力,避免了传统计量模型主观性假定过多而造成的模型应用范围较小、对样本信息利用不充分的缺点。随着信息科技的发展,以神经网络为代表的人工智能技术在经济预测问题中得到了广泛的应用,并取得了较好的效果[6-9]。近年来,有学者尝试应用神经网络方法预测利率期限结构[10-12],但是他们仅使用某一种神经网络,且只给出最终结果,并未针对网络参数的选取做进一步研究。本文将现有4类神经网络技术用于研究利率期限结构预测,利用部分国债到期收益率对网络进行训练,在此基础上通过对我国国债的到期收益率进行实证预测,比较了4个模型的优劣,并详细探讨网络参数选取对预测精度的影响,以期为准确预测利率期限结构提供技术支持。
1 4类神经网络模型 1.1 反向传播神经网络反向传播神经网络(BPNN)的拓扑结构如图 1所示。
输入序列Xp=(x1p, x2p, …, xmp)T (p=1, 2, …, W),其中W为样本总数。
第p个样本隐层第j个结点的输出值为:
$h_j^p = {f_j}\left( {{a_{0j}} + \sum\limits_{i = 1}^m {{\omega _{ij}}x_i^p} } \right)\;\left( {j = 1,2, \cdots ,L} \right)$ | (1) |
式中,fj(·)为激活函数,ωij为输入层和隐层之间的连接权值,a0j为常数项,j为隐层结点数。本文中激活函数使用如下形式
${f_j}\left( z \right) = \frac{{{\rm{exp}}\left( z \right)}}{{1 + {\rm{exp}}\left( z \right)}}$ | (2) |
BPNN第p个样本输出层第k个结点值为:
$y_k^p = \sum\limits_{j = 1}^L {{\omega _{jk}}h_j^p} \left( {k = 1,2, \cdots ,n} \right)$ | (3) |
其中,ωjk为隐层到输出层的权值,hjp为第j个隐层结点的输出值,k为输出层结点数。
1.2 小波神经网络小波神经网络(WNN)是在反向传播神经网络的基础上,用小波元代替神经元,将小波函数作为激活函数。小波函数通过尺度伸缩和平移变换,能够有效地提取信息,抗噪声能力强。
输入序列Xp=(x1p, x2p, …, xmp)T (p=1, 2, …, W),W为样本总数。
第p个样本隐层第j个结点的输出值为:
$h_j^p = {f_j}\left( {\left( {\sum\limits_{i = 1}^m {{\omega _{ij}}x_i^p - {b_j}} } \right)/{a_j}} \right)\left( {j = 1,2, \cdots ,L} \right)$ | (4) |
式中,fj(·)为小波基函数,ωij为输入层和隐层之间的连接权值,bj为fj(·)的平移因子,aj为fj(·)的伸缩因子,j为隐层结点数。fj(·)一般选取Morlet小波函数,即fj(z)=cos (1.75z)e-z2/2。
WNN的第p个样本输出层第k个结点值为
$y_k^p = \sum\limits_{j = 1}^L {{\omega _{jk}}h_j^p} \left( {k = 1,2, \cdots ,n} \right)$ |
径向基神经网络(RBFNN)是典型的局部逼近神经网络,与其他神经网络相比,RBFNN仅需要训练隐层与输出层之间的激活函数,故学习速度更快;但RBFNN需要设置更多的隐层结点,以此保证对数据的响应,缺点是易出现过拟合现象。
输入序列Xp=(x1p, x2p, …, xmp)T (p=1, 2, …, W),其中W为样本总数。
隐层采用径向基函数作为激活函数,用于实现非线性变换,隐层第j个结点的输出值为:
$h_j^p = {f_j}({\mathit{\boldsymbol{X}}_p} - {c_j})\left( {j = 1,2, \cdots ,L} \right)$ | (5) |
式中,fj(·)为径向基函数,cj为第j个结点函数的中心参数,‖·‖为欧式范数,j为隐层结点数。fj(·)选取高斯函数作为径向基函数:
${f_j}\left( z \right) = {\rm{exp}}\left( { - \frac{{z - {c_j}{^2}}}{{2{\sigma ^2}}}} \right)\left( {j = 1,2, \cdots ,L} \right)$ | (6) |
其中σ为高斯函数的宽度,也称为平滑参数。σ越小,RBFNN的拟合效果越精确,但拟合结果不平滑;σ越大则相反。
第p个样本输出层第k个结点的预测值为
$y_k^p = \sum\limits_{j = 1}^L {{\omega _{jk}}h_j^p} \left( {k = 1,2, \cdots ,n} \right)$ |
广义回归神经网络(GRNN)是RBFNN的一个分支,它的模式层仍使用径向基函数,求和层通过线性函数对模式层的结点进行求和。与其他神经网络相比,GRNN的隐层结点数是确定的,只需给定一个平滑参数,受主观影响小。GRNN需要进行训练的参数只有平滑参数,网络收敛速度更快,训练时间更短。GRNN在小样本预测方面优势更大,其拓扑结构如图 2所示。
输入序列Xp=(x1p, x2p, …, xmp)T,期望目标值序列Op=(o1p, o2p, …, oNp)T(p=1, 2, …, W),其中W为样本总数。
模式层的结点数目等于样本总数,结点与样本一一对应。模式层第j个结点函数为:
$h_j^p = {\rm{exp}}\left( { - \frac{{{{({\mathit{\boldsymbol{X}}_p} - {\mathit{\boldsymbol{X}}_j})}^{\rm{T}}}({\mathit{\boldsymbol{X}}_p} - {\mathit{\boldsymbol{X}}_j})}}{{2{\sigma ^2}}}} \right)$ | (7) |
式中,j=1, 2, …, W,Xj为第j个结点对应的学习样本。
求和层中有两类神经元,一类神经元对模式层中所有结点进行算数求和,传递函数为
${S^p} = \sum\limits_{j = 1}^W {h_j^p} \left( {p = 1,2, \cdots ,W} \right)$ | (8) |
另一类神经元对模式层中所有结点进行加权求和,第p个样本的模式层中第j个结点的权值为第j个样本中的期望目标值序列中第k个元素。传递函数为
$S_k^p = \sum\limits_{j = 1}^W {o_k^jh_j^p} \left( {k = 1,2, \cdots ,N} \right)$ | (9) |
第p个样本输出层第k个结点的预测值为
$y_k^p = \frac{{S_k^p}}{{{S^p}}}\left( {k = 1,2, \cdots ,N} \right)$ | (10) |
对于任意的神经网络,其一般算法步骤如下。
1) 网络初始化。确定训练样本向量、目标向量和训练参数。
2) 计算预测值序列。输入(xip, rkp) (i=1, 2, …, m; k=1, 2, …, N),xip为第p支国债的剩余年限,rkp为第p支国债的到期收益率;设ykp为第p支国债的到期收益率的预测值,由式(11) 计算总误差
$E = \sum\limits_{p = 1}^W {\sum\limits_{k = 1}^N {{{(r_k^p - y_k^p)}^2}} } $ | (11) |
3) 参数修正。修正网络权值和训练参数,使网络预测值逐步逼近期望值,如若达到最大迭代次数,则停止训练;否则,返回步骤2)。
2.2 拟合及预测效果检验为检验模型拟合及预测利率期限结构的效果,本文用训练神经网络后得到的利率函数作为贴现函数,对债券进行贴现并求得其理论价格。由于收益率计算出的偏差均值过小,难以比较出不同模型的区别,且债券定价是收益率预测的一个重要方面,本文采用理论价格和实际价格之间的绝对偏差均值来检验每日的拟合和预测效果,其计算公式为:
${E_{{\rm{MAD}}}} = \frac{1}{W}\sum\limits_{j = 1}^W {\left| {{{\hat P}_j} - {P_j}} \right|} ,j = 1,2 \cdots W$ | (12) |
其中,
由样本期内误差的均值和标准差评价多日的拟合和预测效果,均值和标准差计算公式分别如式(13)、(14) 所示:
$E = \sum\limits_{i = 1}^M {\frac{1}{M}} {E_{{\rm{MAD}}(i)}}$ | (13) |
$\sigma = \sqrt {\frac{1}{{M - 1}}\sum\limits_{i = 1}^M {{{({E_{{\rm{MAD}}(i)}} - E)}^2}} } $ | (14) |
其中,M表示样本的天数。
3 实证比较与分析为了避开2008年到2010年期间4万亿计划造成的债券市场短期的非正常数据,同时从利率期限结构和时效性的角度考虑,本文选取了2011年1月到2016年7月国债数据(数据来自wind数据库,http://www.wind.com.cn)。每月月末交易日为观察日,若为非工作日即向前顺延至工作日,共计67组数据,每组数据中80%用于拟合,20%用于预测。
3.1 最优参数选取在神经网络中,一些重要参数直接影响神经网络的预测效果,如BPNN和WNN的隐层结点数和迭代次数、RBFNN的隐层结点数和平滑参数及GRNN的平滑参数。神经网络参数选择的标准和范围目前尚无通行的法则,本文依据预测结果的表现来确定相关参数的取值。以2016年7月29日的数据为样本,设定BPNN和WNN的隐层节点数的变化区间为[1, 15],递增量为1,网络的迭代次数的变化区间为[1000, 10000],递增量为1000。先针对GRNN中的平滑参数进行测试,变化区间为[0.0001,0.1],递增量为0.0001;再根据GRNN最优值出现的区间,设定RBFNN中平滑参数的变化区间为[0.01,0.1],递增量为0.01,隐层节点数的变化区间为[1, 15],递增量为1。由公式(12) 计算出的4类网络的拟合与预测误差如图 3~6所示。
由图 3~5看出,隐层结点数超过一定值时,网络的精度会下降,说明隐层结点数的增加并不会一直提高网络的精度。如图 3中隐层结点数为1、图 4中为9、图 5中为8时神经网络的精度达到最优。
由图 3、4可以看出,隐层结点数过多时,随着迭代次数的增加,网络的预测效果时好时坏,具有一定的随机性,说明过多的隐层结点数导致过拟合出现时,迭代次数的增加将使误差进一步增大。所以选择迭代次数最小值1000为最优值。
由图 5、6看出,随着平滑参数的增大,网络拟合和预测误差呈先降后升的趋势。当RBFNN的平滑参数为0.08,GRNN的平滑参数为0.0212时误差最小;平滑参数小于最优值时,网络的局部拟合能力较强,但对距离中心较远的数据无法响应,造成误差过大,此时平滑参数的增大有助于改善网络的精度;平滑参数超过最优值时,其局部拟合能力降低,整体误差变大。
由以上对图 3~6分析结果,得出4类神经网络的最优相关参数如表 1所示。
根据所确定的最优参数对67个样本进行拟合,得出4类神经网络下的拟合及预测误差的时间序列变化趋势如图 7所示,拟合及预测误差的均值和标准差如表 2所示。
由图 7和表 2可以看出:4类神经网络中,RBFNN虽然拟合效果较好,但是预测效果较差,且预测误差的波动性过高;GRNN的预测效果最优,同时预测稳定性较好。说明RBFNN和GRNN更易出现过拟合现象。这两种神经网络均为局部响应型神经网络,只能通过选取适当的参数来降低过拟合出现的可能性,但不能完全避免。在4类神经网络中,BPNN的拟合误差和预测误差之间的波动最小,且预测结果也较为稳定;WNN的拟合及预测效果最差,且误差的波动性较大。原因是一方面与BPNN相比,WNN需要训练的参数更多,而在国债利率期限结构中,可获得的样本数量较少,使得网络训练不充分;另一方面,WNN的优势在于对复杂信号的分解[13],而国债利率期限结构中,数据结构相对简单,故WNN的优势难以体现。
4 结束语本文在结合以往文献的基础上,筛选出适用于经济预测问题的4类神经网络,分别建立预测模型,分析了不同神经网络中参数选取对于网络拟合及预测精度的影响,确定了4类神经网络中相关参数的最优取值;并以67个月的月末数据为样本,对比了4类神经网络的拟合及预测误差。实证结果表明:广义回归神经网络预测效果较好,反向传播神经网络预测结果波动性较小。当网络参数选取恰当时,神经网络可以作为一种我国国债利率期限结构的预测技术。
[1] |
周荣喜, 邱菀华. 基于多项式样条函数的利率期限结构模型实证比较[J]. 系统工程, 2004, 22(6): 39-43. Zhou R X, Qiu W H. Empirical comparison of term structure of interest rate based on polynomial spline functions[J]. Systems Engineering, 2004, 22(6): 39-43. (in Chinese) |
[2] |
Diebold F X, Canlin L. Forecasting the term structure of government bond yields[J]. Journal of Econometrics, 2006, 130(2): 337-364. DOI:10.1016/j.jeconom.2005.03.005 |
[3] |
赵晶, 张洋, 尹浩明. 中国国债利率期限结构的动态特征:基于NS和SV模型的实证判别[J]. 管理世界, 2014(11): 164-165. Zhao J, Zhang Y, Yin H M. Dynamic characteristics of interest rate term structure of China's national debt:evidence based on NS and SV[J]. Management World, 2014(11): 164-165. (in Chinese) |
[4] |
周荣喜, 刘雯宇, 牛伟宁. 基于SV利率期限结构模型的国债价差研究[J]. 北京化工大学学报(自然科学版), 2011, 38(3): 129-133. Zhou R X, Liu W Y, Niu W N. A study of bond spreads based on the stochastic volatility model of the term structure of interest rates[J]. Journal of Beijing University of Chemical Technology:Natural Science, 2011, 38(3): 129-133. (in Chinese) |
[5] |
沈根祥, 陈映洲. 双斜率因子动态Nelson-Siegel利率期限结构模型及其应用[J]. 中国管理科学, 2015, 23(10): 1-10. Shen G X, Chen Y Z. Nelson-Siegel dynamic term structure model with double slope factors and its applications[J]. Chinese Journal of Management Science, 2015, 23(10): 1-10. (in Chinese) |
[6] |
马力. 基于神经网络的旅游收入预测模型建立研究——以山西为例[J]. 科学决策, 2010(9): 66-72. Ma L. The study of tourism demand forecasting model based on ANN-it takes Shanxi as example[J]. Scientific Decision Making, 2010(9): 66-72. (in Chinese) |
[7] |
Hejazi S A, Jackson K R. A neural network approach to efficient valuation of large portfolios of variable annuities[J]. Insurance Mathematics & Economics, 2016, 70: 169-181. |
[8] |
Jammazi R, Aloui C. Crude oil price forecasting:experimental evidence from wavelet decomposition and neural network modeling[J]. Energy Economics, 2012, 34(3): 828-841. DOI:10.1016/j.eneco.2011.07.018 |
[9] |
熊志斌. ARIMA融合神经网络的人民币汇率预测模型研究[J]. 数量经济技术经济研究, 2011(6): 64-76. Xiong Z B. Research on RMB exchange rate forecasting model based on combining ARIMA with neural networks[J]. The Journal of Quantitative & Technical Economics, 2011(6): 64-76. (in Chinese) |
[10] |
姜德峰. 基于神经网络的利率期限结构研究[J]. 青海金融, 2007(5): 21-23. Jiang D F. Study on interest rate term structure based on neural network[J]. Qinghai Finance, 2007(5): 21-23. (in Chinese) |
[11] |
周万隆, 胡雅丽. 神经网络在国债利率期限结构中的建模与实证[J]. 商业研究, 2003(4): 110-112. Zhou W L, Hu Y L. Modeling and demonstration of neural network in term structure of national debt interest rate[J]. Commercial Research, 2003(4): 110-112. (in Chinese) |
[12] |
董皓舒. 基于智能神经网络组合预测的国债利率期限结构建模与实证[J]. 中国市场, 2010(44): 47-49. Dong H S. Modeling and demonstration of interest rate term structure of national debt based on combination forecasting of intelligent Neural Network[J]. China Market, 2010(44): 47-49. (in Chinese) DOI:10.3969/j.issn.1005-6432.2010.44.027 |
[13] |
郑承利, 黄冬冬. 小波神经网络对沪深A300的分析和预测[J]. 上海管理科学, 2011, 33(3): 34-37. Zheng C L, Huang D D. The analysis and prediction of a 300 index based on wavelet neural network[J]. Shanghai Management Science, 2011, 33(3): 34-37. (in Chinese) |