文章快速检索     高级检索
  北京化工大学学报(自然科学版)  2019, Vol. 46 Issue (5): 53-59   DOI: 10.13543/j.bhxbzr.2019.05.008
0

引用本文  

马波, 郑凡帆. 降噪自编码器在机械设备故障预警中的应用[J]. 北京化工大学学报(自然科学版), 2019, 46(5): 53-59. DOI: 10.13543/j.bhxbzr.2019.05.008.
MA Bo, ZHENG FanFan. Application of a denoising autoencoder for the early warning of mechanical faults[J]. Journal of Beijing University of Chemical Technology (Natural Science), 2019, 46(5): 53-59. DOI: 10.13543/j.bhxbzr.2019.05.008.

基金项目

国家质量基础的共性技术研究(2016YFF0203303)

第一作者

马波, 男, 1977年生, 副教授, E-mail:18811742751@163.com.

文章历史

收稿日期:2018-10-06
降噪自编码器在机械设备故障预警中的应用
马波 1, 郑凡帆 2     
1. 北京化工大学 发动机健康监控及网络化教育部重点实验室, 北京 100029;
2. 北京化工大学 机电工程学院, 北京 100029
摘要:针对目前复杂机械设备大多采用单特征值门限报警法,无法实现提前预警的现状,提出一种基于降噪自编码器(denoising autoencoder,DAE)的特征自学习方法,将高维监测数据编码成低维特征,作为设备运行状态的特征表示,通过度量待测样本编码特征与基准的距离实现故障预警。实验结果表明,本文方法能够区分正常样本特征与任意故障样本特征,并能降低变工况及环境噪声干扰的影响;工程应用案例表明,本文方法能够发现设备故障发生前的微弱征兆,实现提前预警。
关键词降噪自编码器(DAE)    正常样本    故障征兆    故障预警    
Application of a denoising autoencoder for the early warning of mechanical faults
MA Bo1 , ZHENG FanFan2     
1. Key Laboratory of Engine Health Monitoring and Networking, Ministry of Education, Beijing University of Chemical Technology, Beijing 100029, China;
2. College of Mechanical and Electrical Engineering, Beijing University of Chemical Technology, Beijing 100029, China
Abstract: The vibration signals of complex mechanical equipment are nonlinear and non-stationary. It is therefore difficult to characterize the operation state of the equipment based on features extracted by traditional signal processing methods, which leads to the low accuracy of the corresponding early warning methods. To solve this problem and make full use of the in-depth learning ability when learning high-order abstract features of data, a method of data feature self-learning for mechanical equipment based on a denoising autoencoder (DAE) is proposed for fault forewarning. The DAE is first trained with normal data, and the coding part is reserved as a self-learning model. Then, the test samples are input into the self-learning model to give the time-domain and frequency-domain feature combination, and the feature clustering center is used as the benchmark in the initial stage of equipment operation. Finally, the JS divergence, which measures the difference between real-time characteristics and benchmark characteristics, is used as an early warning index. Experiments show that the proposed method can capture the small changes in the running state of mechanical equipment and greatly advance the early warning time of faults.
Key words: denoising autoencoder(DAE)    normal sample    fault symptom    fault forewarning    
引言

往复机械、航空发动机、大型风电装备等复杂机械设备在石油开采、炼油化工、航空、电力等领域中占据重要地位。为保证其安全运行,避免重大损失,必须建立精准的预警方法。目前,企业中多数该类机械设备已安装了在线监测系统,但大多采用单特征值固定门限报警法,其缺点是:①报警阈值由企业提供并预先设定到监测系统中,当机组报警时故障已经恶化到一定程度,无法实现早期预警;②复杂机械设备激励源多、传递路径复杂,振动信号呈非平稳性和非线性的特点,难以用单一特征表征复杂机械设备的运行状态[1-2]

为解决现有单特征值门限预警法的不足,一部分学者从信号处理角度入手,利用小波包分解[3-4]、经验模态分解[5]、阶比跟踪[6]、希尔伯特变换[7]等方法提取具备更强表征能力的特征。然而,这些方法提取的故障特征不能保证对所有故障类型都敏感,还需根据实际故障类型,结合丰富的工程实践经验并综合考虑多种特征参数,才能取得较好的效果。近年来,深度神经网络、卷积神经网络、深度置信网络等深度学习方法得到极大的发展[8],由于这些方法能够自适应地学习特征,有效避免传统信号处理方法在故障特征提取中存在的问题,被逐步应用于设备故障预警与诊断工作中。Jia等[9]使用深度神经网络实现了对齿轮传动系统的准确诊断;Zhang等[10]针对振动信号设计了一种“第一层宽卷积神经网络”,并在轴承故障诊断中取得了较好的效果。但这些方法均为有监督学习模型,模型的训练需建立在故障样本较为完备的基础上,实际工程应用难度较大。因此,降噪自动编码器(denoising autoencoder,DAE)这种基于无监督学习模型提取故障特征的方法得以发展。DAE的训练无需类别标注,只需寻找出数据自身隐含的特征信息[11],采用正常样本进行训练;同时DAE也属于深度学习模型,通过构建深度神经网络,经由多层的非线性变换将高维的输入信息组合成高阶抽象的低维特征[12],再通过对训练数据加噪来训练模型还原原始输入的能力,从而一定程度上降低环境扰动的影响,增强特征的鲁棒性[13]

本文基于DAE自适应提取故障特征和无监督训练的特性,仅使用历史正常样本来训练DAE模型,学习出历史正常样本的特征集合并计算特征基准与报警阈值,同时保留DAE编码网络作为特征自学习模型;然后将监测数据输入特征自学习模型得编码特征,再度量其与基准的距离并与报警阈值对比,发现设备故障早期的微弱征兆,实现提前预警。

1 理论背景 1.1 降噪自动编码器

自动编码器(autoencoder, AE)是一种无监督神经网络,分为编码网络与解码网络两个部分,其结构如图 1所示。AE的输入层和输出层相同,通过编码网络可将原始数据转化为低维编码矢量,并经过解码网络的解码重构将其变换为原始数据。由于在输出层实现了信号重构,可将编码矢量视为原始数据的一种特征表示[14]

图 1 AE的模型结构 Fig.1 The structure of the AE

机械设备运行环境干扰因素较多且工况变化复杂,导致相同健康状态下的样本有所波动。因此,本文采用DAE向原始训练样本添加含有一定统计特性的噪声,使之成为“受损”样本,然后对“受损”样本进行编码并重构。若重构样本与原始样本高度相似,则表明模型能够降低微小随机扰动的影响,学习出鲁棒性特征[13]

给定一个无标签的机械设备样本集{xm}m=1M,向其中加入高斯噪声得到受损样本集{$\mathit{\boldsymbol{\tilde x}}$m}m=1M。编码网络fθ将每一个训练样本$\mathit{\boldsymbol{\tilde x}}$m变换为编码矢量hm,然后解码网络gθ再将hm反变换为原始样本xm的重构表示$\mathit{\boldsymbol{\hat x}}$m

$ {\mathit{\boldsymbol{h}}^m} = {f_\theta }({{\mathit{\boldsymbol{\tilde x}}}^m}) = {a_{\rm{f}}}(\mathit{\boldsymbol{W}}{{\mathit{\boldsymbol{\tilde x}}}^m} + \mathit{\boldsymbol{b}}) $ (1)
$ {{\mathit{\boldsymbol{\hat x}}}^m} = {g_{{\theta ^\prime }}}({\mathit{\boldsymbol{h}}^m}) = {a_{\rm{g}}}({\mathit{\boldsymbol{W}}^\prime }{\mathit{\boldsymbol{h}}^m} + {\mathit{\boldsymbol{b}}^\prime }) $ (2)

式中,afag为编码网络和解码网络的激活函数,θ={W, b}、θ′={W′, b′}分别为编码网络和解码网络的参数集合,Wb分别为编码网络的权重和偏置,W′、b′分别为解码网络的权重和偏置。DAE通过最小化重构数据$\mathit{\boldsymbol{\hat x}}$m与原始数据xm的均方误差L($\mathit{\boldsymbol{\hat x}}$m, xm),使网络参数到达最优。均方误差公式为

$ L({{\mathit{\boldsymbol{\hat x}}}^m}, {\mathit{\boldsymbol{x}}^m}) = \frac{1}{M}\sum\limits_{m = 1}^M {{{\left\| {{{\mathit{\boldsymbol{\hat x}}}^m} - {\mathit{\boldsymbol{x}}^m}} \right\|}^2}} $ (3)

式中,M为训练样本集的样本数量。

1.2 JS散度

Jensen-Shannon(JS)散度[15]用于衡量两个不同分布之间的差异,它是对Kullback-Leibler(KL)散度的改进,KL散度公式如下

$ {D_{{\rm{KL}}}}(\mathit{\boldsymbol{p}}\left\| \mathit{\boldsymbol{q}} \right.) = \sum\limits_{i = 1}^n {{\mathit{\boldsymbol{p}}_i}} \lg \frac{{{\mathit{\boldsymbol{p}}_i}}}{{{\mathit{\boldsymbol{q}}_i}}} $ (4)

式中,p可视为特征基准分布,q可视为实时监测数据的编码特征分布,n为特征的维度。对KL散度改进后得到JS散度

$ \begin{array}{l} \;\;\;\;{D_{{\rm{JS}}}}(\mathit{\boldsymbol{p}}\left\| \mathit{\boldsymbol{q}} \right.) = \frac{1}{2}[{D_{{\rm{JS}}}}(\mathit{\boldsymbol{p}}, \frac{{\mathit{\boldsymbol{p}} + \mathit{\boldsymbol{q}}}}{2}) + {D_{{\rm{JS}}}}(\mathit{\boldsymbol{q}},\\ \frac{{\mathit{\boldsymbol{p}}{\rm{ + }}\mathit{\boldsymbol{q}}}}{2})] \end{array} $ (5)

本文采用JS散度作为距离度量指标。

2 模拟实验 2.1 数据分析

为了适应工程现场的复杂环境,需确保所提方法能够区分正常样本特征与任意故障状态下的特征,并降低工况变化及环境噪声的干扰,实际工程应用中能采集到的故障样本类别往往较为单一,因此采用凯斯西储大学(CWRU)滚动轴承数据中心的轴承数据集进行验证。CWRU轴承数据中心的采集系统如图 2所示。

图 2 CWRU滚动轴承实验台示意图 Fig.2 CWRU rolling bearing test bench

实验对象为图中的A-A′截面所示的滚动球轴承SKF6205,该轴承包含滚动体损伤、外圈损伤和内圈损伤,损伤直径分别为0.177 8 mm、0.355 6 mm和0.533 4 mm,共计9种故障。将通道16的加速度传感器垂直固定在电机输出轴支撑轴承上方的壳上采集数据,采样频率12 kHz。实验准备了3类数据集,每一类数据集的工况详情见表 1

下载CSV 表 1 工况详情 Table 1 Details of working conditions

3种工况下的正常样本频谱如图 3所示。可以看出,不同工况下的正常样本频谱也存在着一定差异,本文方法旨在学习出鲁棒性特征,尽可能消除变工况及环境干扰的影响。

图 3 不同工况下的正常频谱图 Fig.3 Examples of normal spectra under different conditions
2.2 模拟及结果分析

模拟采用的DAE网络参数如表 2所示。表中,输入层和输出层的节点数为一组频谱的数据点数1 024,输入层、隐含层1和2构成了编码网络,隐含层2、3和输出层构成了解码网络,隐含层2的2个神经元节点为所求特征。

下载CSV 表 2 用于轴承实验的DAE网络参数 Table 2 DAE network parameters in the bearing experiments

取3类工况的各4 460组正常样本频谱作为训练集,所有健康状态频谱数据各1 160组作为测试集,迭代训练收敛后,利用DAE的编码网络部分学习出测试集的特征如图 4(a)所示;为进一步验证本文方法具备抗变工况干扰的能力,采用文献[16]提出的稀疏自编码(sparse autoencoders,SAE)方法,使用同样的网络结构进行对比实验,学习出的测试集特征如图 4(b)所示。由图 4(a)可以看出,测试集中正常样本的特征(标签0)可以区别于任意故障状态下的特征(标签1~9),为实现准确预警故障提供了保障。

图 4 DAE方法与SAE方法学习的特征对比 Fig.4 Comparison of the characteristics learned by DAE and SAE

图 4(b)可以看出,对比方法学习出的正常样本特征明显分为3部分,且未完全与故障特征区分开,无法实现准确预警。这是由于本文方法在训练样本中添加了具备一定统计特性的噪声,训练DAE将“受损”的训练样本近似还原到初始状态,使模型学习更具鲁棒性。而SAE不具备DAE的机制,导致其学习到的特征始终都含有与工况、环境噪声相关的信息,正常状态下的特征产生明显波动,无法完整区分出正常状态和故障状态。

3 工程应用验证 3.1 工程现场数据简介

由于CWRU轴承实验台的轴承损伤为人为制造,而实际工程中的设备从正常运行到发生严重故障期间存在劣化过程,故障征兆较为微弱。因此,还需通过实际工程应用的案例来验证本文方法对微弱故障征兆的识别能力。

选取某4缸往复压缩机为实验对象,其振动信号监测传感器的测点布局如图 5所示。振动信号由加速度传感器和速度传感器进行采集,加速度传感器安装在十字头上方的中体测点处,速度传感器安装在曲轴箱壳体上,实验采用的数据为加速度传感器信号。

图 5 测点布局 Fig.5 Layout of the sensor
3.2 故障预警方法

针对往复式压缩机的故障预警工作,提出一套标准化流程,具体如下。

(1) 数据预处理

获取多个测点的历史正常频谱样本集X,并根据各个测点频谱数据的极值分别进行归一化处理。相应公式如下

$ {\mathit{\boldsymbol{x}}^\prime } = \frac{{\mathit{\boldsymbol{x}} - {\mathit{\boldsymbol{x}}_{ \min }}}}{{{\mathit{\boldsymbol{x}}_{ \max }} - {\mathit{\boldsymbol{x}}_{ \min }}}} $ (6)

式中,xminxmax分别为对应测点振动信号的极小值和极大值,x′为归一化后的数据。所有样本归一化后向其中添加具备一定统计特性的噪声(本文采用高斯噪声),使之成为“受损”的训练样本集$\mathit{\boldsymbol{\tilde X}}$

(2)特征自学习模型构建

用“受损”的训练样本集$\mathit{\boldsymbol{\tilde X}}$训练DAE,迭代训练至收敛后,保留其编码部分作为特征自学习模型M。

(3) 报警阈值计算

利用编码网络,计算归一化处理后的正常样本集X′的特征集Z,并计算其均值z0作为基准;计算特征集Z中每一元素zz0的距离,统计距离的方差σ,并以3σ作为报警阈值Th

(4) 故障预警

将待测样本xt根据流程(1)中的归一化标准进行归一化处理,然后输入到特征自学习模型M中学习出特征zt并计算其与基准特征z0的距离d,若d超过阈值Th,则触发报警;若低于阈值,则获取下一待测样本,进入下一报警流程。

故障预警流程如图 6所示。

图 6 故障预警流程图 Fig.6 Fault early warning process
3.3 验证结果与分析

实验中采用的DAE网络参数如表 3所示。输入层和输出层的节点数为一组往复压缩机频谱信号的采样点数,输入层及隐含层1、2、3构成编码网络,隐含层3、4、5和输出层构成解码网络,隐含层3的5个神经元节点为所求特征。

下载CSV 表 3 用于往复压缩机实验的DAE网络参数 Table 3 DAE network parameters in the reciprocating compressor experiments

采用历史正常频谱来训练DAE模型,迭代训练收敛后,保留编码网络部分作为特征自学习模型,并计算历史正常频谱的特征集合、基准特征及报警阈值,最后取待测频谱样本进行状态预警。

选取发生了活塞组件磨损、气阀泄露以及液击故障的3台往复压缩机组作为研究对象,其预警结果如图 7所示。可以看出,无论发生何种故障,利用本文方法的报警系统都在故障发生前及时发现了异常状态,实现了提前预警。而现场报警系统采用的单特征值门限报警法无法准确判断故障发生前劣化过程的微弱征兆,最终导致故障发生。

图 7 本文方法对不同故障的预警结果 Fig.7 The early warning results of different faults obtained using our method

作为对比,采用文献[17]中的峰值、偏度、歪度、峭度等时域和频域特征组合作为预警指标,按3.2节中的故障预警流程进行实验,预警结果如图 8所示。可以看出,对比方法的报警时间点滞后于本文方法,且无法准确反映设备的劣化趋势。这是由于对比方法采用相同的特征组合对不同故障进行预警,难以及时发现所有故障发生早期的微弱征兆;而本文方法的预警原理与故障类型无关,故具备更强的通用性。

图 8 对比方法对不同故障的预警结果 Fig.8 Comparison of early warning results for different faults obtained using different method
4 结论

(1) 分析了复杂机械的振动信号特性,针对现有预警方法的不足提出了一种基于DAE的故障早期预警方法,该方法无需故障样本参与训练,具备较高的工程应用价值。

(2) 本文方法能够区分正常样本特征与任意故障样本特征,并降低变工况和环境噪声的影响,可为实现故障预警提供前提保障。

(3) 本文方法能通过度量设备待测样本编码特征与正常样本特征基准的距离,发现设备劣化阶段的微弱征兆,实现在故障发生前预警,从而提高了应变能力,降低了故障损失。

参考文献
[1]
WANG X B, YANG Z X, YAN X A. Novel particle swarm optimization-based variational mode decompos-etion method for the fault diagnosis of complex rotating machinery[J]. IEEE/ASME Transactions on Mechatronics, 2018, 23(1): 68-79. DOI:10.1109/TMECH.2017.2787686
[2]
王国彪, 何正嘉, 陈雪峰, 等. 机械故障诊断基础研究"何去何从"[J]. 机械工程学报, 2013, 49(1): 63-72.
WANG G B, HE Z J, CHEN X F, et al. Basic research on machinery fault diagnosis-what is the pre-scription[J]. Chinese Journal of Mechanical Engineering, 2013, 49(1): 63-72. (in Chinese)
[3]
BIN G F, GAO J J, LI X J, et al. Early fault diagnosis of rotating machinery based on wavelet packets-empirical mode decomposition feature extraction and neural network[J]. Mechanical Systems and Signal Processing, 2012, 27: 696-711. DOI:10.1016/j.ymssp.2011.08.002
[4]
PAN Y, CHEN J, LI X L. Bearing performance degra-dation assessment based on lifting wavelet packet decomposition and fuzzy c-means[J]. Mechanical Systems and Signal Processing, 2010, 24(2): 559-566. DOI:10.1016/j.ymssp.2009.07.012
[5]
WANG H C, CHEN J, DONG G M. Feature extraction of rolling bearing's early weak fault based on EEMD and tunable Q-factor wavelet transform[J]. Mechanical Systems and Signal Processing, 2014, 48(1/2): 103-119.
[6]
BORGHESANI P, PENNACCHI P, RANDALL R B, et al. Order tracking for discrete-random separation in variable speed conditions[J]. Mechanical Systems and Signal Processing, 2012, 30: 1-22. DOI:10.1016/j.ymssp.2012.01.015
[7]
LIU H M, WANG X, LU C, et al. Rolling bearing fault diagnosis under variable conditions using Hilbert Huang transform and singular value decomposition[J/OL]. Mathematical Problems in Engineering, 2014.[2018-09-25].http://dx.doi.org/10.1155/2014/765621.
[8]
LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015, 521(7553): 436-444. DOI:10.1038/nature14539
[9]
JIA F, LEI Y G, LIN J, et al. Deep neural network:a promising tool for fault characteristic mining and intelligent diagnosis of rotating machinery with massive data[J]. Mechanical Systems and Signal Processing, 2016, 72: 303-315.
[10]
ZHANG W, PENG G L, LI C H, et al. A new deep learning model for fault diagnosis with good antinoise and domain adaptation ability on raw vibration signals[J]. Sensors, 2017, 17(2): 425.
[11]
KEMKER R, KANAN C. Self-taught feature learning for hyperspectral image classification[J]. IEEE Transa-ctions on Geoscience and Remote Sensing, 2017, 55(5): 2693-2705. DOI:10.1109/TGRS.2017.2651639
[12]
HINTON G E, SALAKHUTDINOV R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507. DOI:10.1126/science.1127647
[13]
VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders[C]//Proceedings of the 25th International Conference on Machine Learning. Helsinki, 2008: 1096-1103. https://www.researchgate.net/publication/221346269_Extracting_and_composing_robust_features_with_denoising_autoencoders
[14]
BENGIO Y. Learning deep architectures for AI[M]//Foundations and Trends in Machine Learning. Hanove: Now Poblishers Inc., 2009: 1-127.
[15]
LIN J. Divergence measures based on the Shannon entropy[J]. IEEE Transactions on Information Theory, 1991, 37(1): 145-151.
[16]
张绍辉. 基于多路稀疏自编码的轴承状态动态监测[J]. 振动与冲击, 2016, 35(19): 125-131.
ZHANG S H. Bearing condition dynamic monitoring based on multiway sparse autocoder[J]. Journal of V-ibration and Shock, 2016, 35(19): 125-131. (in Chinese)
[17]
孟玲霞, 徐小力, 蒋章雷, 等. 风电机组齿轮箱早期故障预警方法研究[J]. 仪器仪表学报, 2016(12): 2758-2765.
MENG L X, XU X L, JIANG Z L, et al. Study on the early fault warning method for wind turbine gearbox[J]. Chinese Journal of Scientific Instrument, 2016(12): 2758-2765. (in Chinese)