土壤墒情可用多种方法监测。文献[1-2]使用遥感技术逆建模获得农田墒情信息, 文献[3]使用架设固定端传感器组网进行墒情监测, 利用这些技术均可获得墒情信息, 但遥感技术存在成本过高等问题, 固定端传感器组网在实际使用中也存在架设成本高、传感器易损坏等问题。许多学者也对土壤墒情预测进行了研究。文献[4-5]采用反向传播 (Back Propagation, BP) 神经网络进行墒情预测, 文献[6]使用支持向量机 (Support Vector Machine, SVM) 进行墒情预测, 文献[7]利用土壤水动力学、土壤水量平衡法估计墒情变化情况, 文献[8]使用经验公式法,等等。这些方法都有明显的缺点:SVM参数和核函数计算复杂, 需要人为选取, 影响预测精度, 且在理论上SVM只能提供次优解[9];水量平衡法和土壤水动力学需要测量大量数据, 参数更多, 计算过程更为复杂;经验公式法有较强的地域特色, 通用性、稳定性较差;神经网络模型仅需较少的准备工作便可映射出输入输出间蕴含的内部规律, 但具有容易陷入局部极小、没有良好的泛化能力等缺点。
本文参考了各种土壤墒情监测、预测方法的优缺点, 提出使用非固定式传感器进行蓝牙组网收集墒情数据, 提出使用高精度多源定位接入融合方法获得墒情对应的位置信息, 利用4G网络进行数据传输, 使用改进的灰狼算法优化贝叶斯神经网络模型, 分析预测土壤墒情, 即插即用, 具有低成本、不易损坏、适用性强等优势。
1 土壤墒情监测预测系统如图 1所示, 本文土壤墒情监测预测系统主要由四个子系统组成:数据采集子系统、定位子系统、信息传输子系统和数据综合处理子系统。
数据采集子系统使用非固定无线传感器, 利用先进的蓝牙4.1技术实现自组网, 该技术不但将传统蓝牙一对一的连接优化, 同时也利用星状拓扑来完成一对多点的连接, 从而满足终端与多个传感器进行数据传输, 即使在连接和断线切换迅速的应用场景下, 数据也能够在网状拓扑之间移动, 不会为维持此网络而显得过于复杂, 有效降低了连接复杂性, 减少了连接建立时间, 同时降低了采集成本。终端通过蓝牙接收到传感器网络数据后, 利用4G网络将数据传输至数据综合处理子系统。
1.2 定位子系统针对现有室外大田环境下定位信号不准确等问题, 提出高精度多源定位接入融合方法, 融合卫星系统、移动通信网与气压测高技术进行广域室外高精度定位, 利用卫星导航系统和广域移动高速数据传送网协同实现广域室外大田的定位, 依托于北京邮电大学研制的TC-OFDM (Time & Code Division-Orthogonal Frequency Division Multiplexing) 系统实现广域室外高精度无缝定位;同时提出一种基于4G参数的移动设备位置解算及基于启发式策略和证据推理框架的行为分析方法, 并将该技术嵌入到移动采集终端。
数据综合处理子系统根据当地的气象数据与传感器采集的土壤墒情、土壤温度等数据, 进行建模运算, 预测墒情并给出灌溉用水量建议, 显示在用户终端。
数据综合处理子系统中使用改进灰狼算法优化贝叶斯神经网络进行墒情预测。其中, 灰狼优化 (Grey Wolf Optimizer, GWO) 算法是Mirjalili等[10]于2014年提出的一种新的群体智能优化算法, 具有结构简单、参数少、搜索能力较强等特点。
2 土壤墒情预测模型 2.1 问题描述有研究[11]表明, 气象因素的变化对土壤墒情的变化波动起着决定性作用, 土壤墒情的具体数值也与之前时间的土壤墒情值密切相关, 因此, 选择气象要素与先前墒情时间序列变量作为输入变量。
设W=(w1, w2, …, wm) 为气象要素变量, X={x1, x2, …, xt}为墒情时间序列变量, 预测模型为G, 预测模型输出值为Y′, 真实墒情值为Y, 则:
$ {{Y}^{'}}=G(\mathit{\boldsymbol{W}}, X) $ | (1) |
定义模型学习样本误差和R, 则:
$ R=\sum\limits_{i=1}^{N}{{{(Y-{{Y}^{'}})}^{2}}} $ | (2) |
其中N为学习样本总数。本研究的目标是找到模型G, 使得误差和R最小, 即:
$ \min (R)=\min (\sum\limits_{i=1}^{N}{{{({{Y}^{'}}-Y)}^{2}}}) $ | (3) |
灰狼算法具有优秀的解空间搜索策略, 其根据三个适应度最高的个体估计猎物 (全局最优解) 位置, 并使用多个随机变量控制狼群对猎物信息的敏感度, 使得狼群具有优秀的全局探索解空间能力与局部开采最优解能力。下面给出具体定义:
定义1 设种群个体数量总数为N的狼群X={x1, x2, …, xn}, 目标函数Y=F(xi), 搜索空间为d维, 其中第i只灰狼在d维空间中的位置可表示为xi={xi1, xi2, …, xid}, 其含义为神经网络连接点权值、阈值映射的d维变量。将狼群划分为4个社会等级, 其中适应度值最高的个体为α, 排名第二及第三的对应个体记为β、δ, 其余个体记为ω。
定义2 定义猎物所在位置为搜索空间的全局最优解, 个体与猎物间的距离向量D定义为:
$ \mathit{\boldsymbol{D}}=|\mathit{\boldsymbol{C}}\cdot {{x}_{p}}-{{x}_{i}}| $ | (4) |
其中:xp为猎物所在位置;xi为狼群中的个体;C为系数向量。C的计算公式如下:
$ \mathit{\boldsymbol{C}}=2{{r}_{1}} $ | (5) |
其中:r1为[0,1]内的随机变量。
如图 3, 将α、β、δ看作是距离猎物较近的个体, 等级为ω的狼群位置更新方法如下:
$ \left\{ \begin{array}{*{35}{l}} {{\mathit{\boldsymbol{D}}}_{\alpha }}=|{{\mathit{\boldsymbol{C}}}_{1}}\cdot {{x}_{\alpha }}(t)-{{x}_{\omega }}(t)| \\ {{\mathit{\boldsymbol{D}}}_{\beta }}=|{{\mathit{\boldsymbol{C}}}_{1}}\cdot {{x}_{\alpha }}(t)-{{x}_{\omega }}(t)| \\ {{\mathit{\boldsymbol{D}}}_{\delta }}=|{{\mathit{\boldsymbol{C}}}_{1}}\cdot {{x}_{\alpha }}(t)-{{x}_{\omega }}(t)| \\ {{X}_{1}}={{X}_{\alpha }}-\left| {{A}_{1}} \right|\cdot {{\mathit{\boldsymbol{D}}}_{\alpha }} \\ {{X}_{2}}={{X}_{\beta }}-\left| {{A}_{2}} \right|\cdot {{\mathit{\boldsymbol{D}}}_{\beta }} \\ {{X}_{3}}={{X}_{\delta }}-\left| {{A}_{3}} \right|\cdot {{\mathit{\boldsymbol{D}}}_{\delta }} \\ {{x}_{\omega }}(t+1)={{X}_{1}}+{{X}_{2}}+{{X}_{3}}/3 \\ \end{array} \right. $ | (6) |
其中A为收敛因子, 其值为:
$ \mathit{\boldsymbol{A}}=2a{{r}_{2}}-a $ | (7) |
其中:r2为[0,1]内的随机变量;a在迭代过程中随着迭代次数的增加从2至0线性递减。
位置更新结束后, 将狼群根据适应度值重新划分xα、xβ、xδ等级。
2.2.2 改进灰狼算法在传统的灰狼算法中, 由式 (4)~(7) 可知, 个体在搜索空间的位置更新方向是随机的, 由随机变量r2与线性递减变量a控制。当|A|>1时, 其移动方向为远离最优解的方向; 当|A| < 1时, 其移动方向为靠近最优解的方向, 采用这样的策略可以使个体在搜索空间具有优秀的探索能力, 也可以帮助狼群跳出局部最优解; 当|A|=1时,个体保持原来的位置,不移动。
然而在传统的狼群算法中, 由于变量a线性递减, 在搜索进入中后期时, |A|值必然小于1, 个体移动方向不再随机, 种群趋同, 狼群的位置多样性降低, 如果此时狼群陷入局部最优, 会导致整个种群的位置更新停滞且无法跳出。神经网络是复杂的非线性模型, 其解空间存在数量较多的局部最优解, 因此, 在优化神经网络参数问题上, 局部最优回避能力十分重要。
为增加算法的局部最优回避能力, 并保证算法收敛,本文提出一种末尾探索者策略。将种群搜索分为三个时期:活跃探索期、周期探索期和种群回归期。在活跃探索期, 每次位置更新前均找出适应度值最低的个体标记为探索者, 使用随机变量进行位置更新。在周期探索期, 每k次位置迭代后进行一次末尾探索者更新。在种群回归期, 采用标准的灰狼算法更新策略。当种群回归期中xα适应度值连续10次变化幅度小于设定值或位置更新超过最大迭代次数时, 算法结束。输出最优解xα。
定义3 将种群数量为N的狼群中适应度最小的个体记为探索者ε, 个体ε的位置更新策略如下:
$ {{x}_{\varepsilon }}=random(\mathit{\boldsymbol{K}}) $ | (8) |
其中:K为由神经网络的权值阈值组成的多维变量。
改进后的灰狼算法加强了传统灰狼算法的局部最优回避能力, 使算法在搜索中后期依然保持一定的解空间搜索能力。
收敛性分析:
文献[12]的研究表明,为保证算法收敛性,在算法的初始步骤中,种群探索移动应该有较大的变化,这有助于广泛地探索搜索空间。然后,应该减少这些变化以保证在算法结束时能够在最优解附近收敛。
改进后的灰狼算法使用末尾探索者策略,使狼群初期探索更具随机性,同时设立了周期探索期和种群回归期,根据文献[12], 这种更新策略可以保证改进后的灰狼算法最终收敛到搜索空间中的某一点。
改进后的具体算法如下:
首先设定种群规模N、搜索空间维数d, 随机初始化狼群个体xi, 初始化a、r1、r2等变量, 并计算搜索空间中每个个体的适应度值, 将适应度值排名前三位分别记为xα、xβ、xδ。
判断当前所处时期, 如处于活跃探索期或周期探索期中的第nk次迭代 (n为整数), 则找出适应度值最低的个体ε, 标记为探索者, 根据式 (8) 进行位置更新, 并更新适应度值排名前三位个体xα、xβ、xδ; 否则, 跳过该步。
根据式 (4)~(7) 进行搜索空间狼群个体的位置更新, 并更新a、r1、r2等变量的值, 重新计算狼群中每个个体的适应度值。
重复以上步骤, 当种群回归期中xα适应度值连续10次变化幅度小于设定值或位置更新超过最大迭代次数时, 算法结束, 进行网络预测最优解xα输出。
2.2.3 贝叶斯正则化算法贝叶斯正则化算法是在神经网络训练过程中, 在常规均方差性能函数基础上引入修正函数。一般情况下, 神经网络的训练性能函数采用均方误差 (Mean Square Error, MSE), 即:
$ MSE=\frac{1}{n}\sum\limits_{i=1}^{n}{{{({{t}_{i}}-{{p}_{i}})}^{2}}} $ | (9) |
其中:MSE为常规均方误差; n为样本总数; ti为真实值; pi为模型输出值。
在贝叶斯正则化算法中, 将神经网络的训练性能函数改进变为如下形式:
$ MS{{E}^{'}}=\alpha \cdot msw+\beta \cdot MSE;msw=\frac{1}{m}\sum\limits_{i=1}^{m}{{{w}_{j}}^{2}} $ | (10) |
其中:α+β=1;msw为均方; m为网络权值总数; wj为网络权值; α和β为正则化系数, 其大小对网络训练效果影响显著。在常规正则化算法中, α和β的值很难确定, 贝叶斯正则化算法可以在神经网络训练过程中自适应地调节α和β的大小, 在保证网络均方误差尽可能小的前提下, 有效地控制网络的复杂程度, 避免个别样本大幅度影响网络权值, 从而提高网络的泛化能力。
3 实验数据与结果分析 3.1 使用标准函数进行改进灰狼算法性能分析采用表 1所示的3个标准测试函数分别对粒子群算法 (PSO)、灰狼算法 (GWO)、改进灰狼算法进行性能测试 (改进GWO)。实验设定种群个数为30, 最大迭代次数为80, 三种算法均使用相同的初始种群。
实验结果如图 4所示。
分别记录三种算法以上实验的运行时间, 进行算法实时性分析, 得到表 2。
由表 2可以看出, 灰狼算法运行耗时超出粒子群算法, 而改进灰狼算法耗时最大。而由图 4可以看出, 在收敛速度与精度方面, 灰狼算法优于粒子群算法。改进的灰狼算法相对于传统灰狼算法, 拥有更好的局部最优回避能力与较小的最优解。
3.2 使用改进灰狼算法优化墒情预测模型 3.2.1 实验数据墒情预测模型的实验数据来源于河南省某市试验田基地, 该试验田按照国内一流标准建设, 安装有地埋式自动伸缩一体化喷灌设备、地埋式自动化喷灌取水设备和地埋式喷滴灌取水设备。通过站点测量获取该试验田2015年部分月份10 cm与20 cm的土壤墒情数据, 并通过气象站获取对应时间的空气温度、空气湿度、辐射、风速、有效降雨量/灌溉用水量等气象数据。
本文采用2015年4月17日—6月17日的数据进行系统预测模型的精度验证试验。
3.2.2 不同算法策略模型的墒情预测对比试验将数据分为训练集与测试集, 分别采用传统贝叶斯神经网络、粒子群算法优化的贝叶斯神经网络、灰狼算法优化的贝叶斯神经网络与改进灰狼算法优化的贝叶斯神经网络进行时间方向的预测, 并对结果对比分析。
首先确定神经网络的输入变量维度。通过主成分分析法计算相关性, 选取空气温度、空气湿度、辐射、风速、有效降雨量、灌溉用水量与墒情时间序列作为输入变量。通过经验公式与实验结合设定网络隐含层神经元个数, 设置种群规模为10, 最大迭代次数为20, 在对比实验中, 设置算法使用相同的初始族群。最后, 使用平均相对误差 (Mean Relative Error, MRE) 作为模型评价指标。
$ MSE=\frac{1}{n\cdot {{y}_{i}}}\sum\limits_{i=1}^{n}{\left| {{y}_{i}}-y_{i}^{'} \right|} $ | (11) |
其中: yi为实际墒情值, yi′为模型预测墒情值, n为样本大小。
3.2.3 结果对比分析实验结果如图 5所示。从图 5可以看出, 在训练初期, 算法均陷入局部最优, 经过5次左右迭代均跳出。而在训练中后期, 传统灰狼算法、粒子群算法在局部最优解附近波动, 停止更新, 改进灰狼算法在多次迭代后回避了局部最优, 继续位置更新。
迭代完成后的最终模型误差如表 3所示。
由于神经网络训练时间较长, 使得算法总运行时间主要取决于调用神经网络计算适应度值的次数, 算法运行时间如表 4所示。
从以上分析可得出, 在优化神经网络参数问题上, 改进灰狼算法相对于传统灰狼算法、粒子群算法和传统贝叶斯神经网络, 耗时增加, 但拥有更好的局部最优回避能力、更小的误差。
3.2.4 改进灰狼算法优化墒情预测模型的实际应用将该模型实际应用至土壤墒情预测系统。该模型相对传统算法, 虽然模型训练耗时增加, 但在预测质量上有较为明显的优势:在 (7, 9, 1) 的神经网络结构下, 与直接神经网络预测相比, 相对误差下降4个百分点左右;与其他优化算法相比, 相对误差下降1至2个百分点, 在10天以上无雨的情况下, 墒情预测相对误差降低到5%以内。
4 结语本文提出并实现了基于改进灰狼算法优化贝叶斯神经网络的土壤墒情监测预测系统。使用改进灰狼算法优化的贝叶斯正则化神经网络, 通过选取河南省某市试验田基地2015年4月17日—6月17日的数据进行对比实验, 结果表明该算法拥有更小的误差、更好的局部最优回避能力。将该模型实际应用至土壤墒情预测系统, 相对传统算法, 虽然模型训练耗时增加, 但在预测质量上有优势。
[1] | SHIN Y, JUNG Y. Development of irrigation water management model for reducing drought severity using remotely sensed soil moisture footprints[J]. Journal of Irrigation & Drainage Engineering, 2014, 140 (7) : 43-48. |
[2] | CHAROENHIRUNYINGYOS S, HONDA K, KAMTHONKIAT D, et al. Soil moisture estimation from inverse modeling using multiple criteria functions[J]. Computers & Electronics in Agriculture, 2011, 75 (2) : 278-287. |
[3] | LENKA S K, MOHAPATRA A G. Gradient descent with momentum based neural network pattern classification for the prediction of soil moisture content in precision agriculture[C]//Proceedings of the 2005 IEEE International Symposium on Nanoelectronic and Information Systems. Piscataway, NJ: IEEE, 2015:63-66. |
[4] | 金龙, 罗莹. 农田土壤湿度的人工神经网络预报模型研究[J]. 土壤学报, 1998, 35 (1) : 25-32. ( JIN L, LUO Y. Forecast model of farmland soil moisture by artificial neural network[J]. Acta Pedologica Sinica, 1998, 35 (1) : 25-32. ) |
[5] | 尚松浩, 毛晓敏, 雷志栋. 冬小麦田间墒情预报的BP神经网络模型[J]. 水利学报, 2002 (4) : 60-63. ( SHANG S H, MAO X M, LEI Z D. Prediction model of field soil moisture in winter wheat based on BP neural network[J]. Journal of Hydraulic Engineering, 2002 (4) : 60-63. ) |
[6] | LAMORSKI K, PASTUSZKA T, KRZYSZCZAK J, et al. Soil water dynamic modeling using the physical and support vector machine methods[J]. Vadose Zone Journal, 2013, 12 (4) : 1742-1751. |
[7] | HASSAN-ESFAHANI L, TORRES-RUA A, MCKEE M. Assessment of optimal irrigation water allocation for pressurized irrigation system using water balance approach, learning machines, and remotely sensed data[J]. Agricultural Water Management, 2015, 153 : 42-50. doi: 10.1016/j.agwat.2015.02.005 |
[8] | 尚松浩, 雷志栋, 杨诗秀. 冬小麦田间墒情预报的经验模型[J]. 农业工程学报, 2000, 16 (5) : 31-33. ( SHANG S H, LEI Z D, YANG S X. Empirical model for soil moisture forecast in winter wheat field[J]. Transactions of the Chinese Society of Agricultural Engineering, 2000, 16 (5) : 31-33. ) |
[9] | HUANG G, ZHOU H, DING X, et al. Extreme learning machine for regression and multiclass classification[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B, 2012, 42 (2) : 513-529. doi: 10.1109/TSMCB.2011.2168604 |
[10] | MIRJALILI S, MIRJALILI S M, LEWIS A. Grey wolf optimizer[J]. Advances in Engineering Software, 2014, 69 (3) : 46-61. |
[11] | SENEVIRATNE S I, CORTI T, DAVIN E L, et al. Investigating soil moisture-climate interactions in a changing climate: a review[J]. Earth-Science Reviews, 2010, 99 (3/4) : 125-161. |
[12] | BERGH F V D, ENGELBRECHT A P. A study of particle swarm optimization particle trajectories[J]. Information Sciences, 2006, 176 (8) : 937-971. doi: 10.1016/j.ins.2005.02.003 |