计算机应用   2017, Vol. 37 Issue (4): 1207-1211  DOI: 10.11772/j.issn.1001-9081.2017.04.1207
0

引用本文 

杨洪柏, 张宏利, 刘树林. 基于可视化异类特征优选融合的滚动轴承故障诊断[J]. 计算机应用, 2017, 37(4): 1207-1211.DOI: 10.11772/j.issn.1001-9081.2017.04.1207.
YANG Hongbai, ZHANG Hongli, LIU Shulin. Rolling bearing fault diagnosis based on visual heterogeneous feature fusion[J]. Journal of Computer Applications, 2017, 37(4): 1207-1211. DOI: 10.11772/j.issn.1001-9081.2017.04.1207.

基金项目

国家自然科学基金资助项目(51575331)

通讯作者

杨洪柏 (1972-), 女, 江苏沭阳人, 副教授, 博士, 主要研究方向:计算机集成制造、故障诊断、信号处理, E-mail:948645047@qq.com

作者简介

张宏利 (1985-), 男, 山东临沂人, 讲师, 博士, 主要研究方向:智能故障诊断、模式识别;
刘树林 (1963-), 男, 河北保定人, 教授, 博士, 主要研究方向:复杂设备故障诊断

文章历史

收稿日期:2016-09-19
修回日期:2016-12-22
基于可视化异类特征优选融合的滚动轴承故障诊断
杨洪柏1,2, 张宏利2, 刘树林2    
1. 上海开放大学 理工学院, 上海 200433;
2. 上海大学 机电工程与自动化学院, 上海 200072
摘要: 针对故障诊断过程中基于简单的多类故障特征联合决策存在特征集维数多、数据冗余、故障识别率不高的缺点,提出了一种基于异类特征优选融合的故障诊断方法。该方法根据多类特征数据的轮廓图,分析各维特征数据的聚类特性,去除聚类性弱、对故障区分无益的冗余特征维度,仅保留聚类性强的特征维度用于故障识别。在轴承故障诊断实验中,选用故障信号时域统计量和小波包能量两类多维特征进行优选融合,并采用反向传播(BP)神经网络进行故障模式识别。故障识别率达到100%,显著高于无特征优选的故障诊断方法。实验结果表明所提出的方法简便易行,可以显著提高故障识别率。
关键词: 异类特征    特征融合    模式识别    故障诊断    滚动轴承    
Rolling bearing fault diagnosis based on visual heterogeneous feature fusion
YANG Hongbai1,2, ZHANG Hongli2, LIU Shulin2     
1. School of Science and Technology, Shanghai Open University, Shanghai 200433, China;
2. School of Mechatronic Engineering and Automation, Shanghai University, Shanghai 200072, China
Abstract: Aiming at the shortcomings of large feature set dimensionality, data redundancy and low fault recognition rate in existing fault diagnosis method based on simple combination of multi-classes features, a fault diagnosis method based on heterogeneous feature selection and fusion was proposed. The clustering characteristics of the feature data was analyzed according to the contours of the data of various class of features, and the redundant feature dimensions which are weakly clustered and not useful for fault classification were removed, only the feature dimensions with strong clustering characteristics were retained for the fault recognition. In the bearing fault diagnosis experiment, time-domain statistics and wavelet packet energy of fault signals were optimally selected and merged, and Back Propagation (BP) neural network was used for fault pattern recognition. The fault recognition rate reached 100%, which is significantly higher than that of the fault diagnosis method without feature selection and fusion. Experimental results show that the proposed method is easy to be implemented and can significantly improve the fault recognition rate.
Key words: heterogeneous feature    feature fusion    pattern recognition    fault diagnosis    rolling bearing    
0 引言

针对同一类故障, 用不同传感器采集的振动信号称为不同源振动信号,同一传感器采集的数据称为同源振动信号,而采用不同提取方法得到的不同特征, 则称为异类特征。不论是异源同类特征还是同源异类特征, 由于信号源不同或特征提取方法不同, 使得特征具有不同的属性, 表征了故障的某一方面特性。单用一类特征进行故障诊断类似瞎子摸象, 可能以偏概全, 影响故障识别率。目前, 为了对设备作出准确、全面的状态评估, 一些学者采用不同源数据特征或同源数据异类特征共同来进行故障诊断[1-8], 其结果会造成特征集的维数增加、数据处理量加大、数据存在冗余、一些不敏感特征存在等, 影响故障识别率。

为了降维, 去除冗余特征及不敏感特征, 实现特征的有效融合, 许多学者进行了研究。Chen等[1]采用遗传算法对时域特征进行优选。也有许多学者采用非线性流形学习法对高维特征集的维数约简[2]。杨宇等[3]用基于Wrapper模式的距离评价技术进行特征选择;Peng等[4]用互信息理论用于特征选择; Zhao[5]应用粗糙集理论进行特征选择。目前比较主流的特征融合方法为主成分分析方法及其改进方法[6-8], 其中古莹奎等[6]应用主成分分析法对小波包能量单类特征提取累积贡献率达到95%的特征主成分并输入支持向量机 (Support Vector Machine, SVM) 分类器中进行识别,将滚动轴承故障特征从8维降低到5维, 最终的故障诊断的准确率为97%。

针对前述问题, 本文提出一种基于可视化技术的异类特征优选融合方法。该方法利用特征的轮廓图对特征直观地去除冗余和不敏感特征, 选择出优质特征。本文方法简单易用, 是异类特征有效融合的一种探索。具体实现时, 可以先对各单一特征运用轮廓图进行优选, 然后进行多类特征融合进一步优选, 使得识别率稳定在一个比较高的水平。

1 基于图形的故障特征优选方法

可视化技术具有直观、简单有效的特点。可视化方法主要有散点图、轮廓图 (平行坐标法)、多维径向坐标法等方法[9]。轮廓图将n维数据空间用n条等距离的平行轴映射到二维平面上。每条轴线对应于一个属性维, 也即横坐标表示各个特征参数, 纵坐标表示各个特征值。每一个数据样本都可以转换成图形形式, 用一条折线表示在n条平行轴上[9]。用轮廓图法把所有的故障样本都用这样的可视化方式显现在一幅图形中, 具有相同属性的特征向量会靠拢在一起, 与其他类别具有可分性, 否则说明特征参数对故障类别没有可分性。

模式识别实质就是分类, 聚类特性越明显, 其识别率越高。利用这一特点, 通过可视化图形观察进行特征优选。通过直观的方式去除聚类特性不明显的特征, 筛选出聚类明显的优质特征。

图 1(a)是鸢尾 (Iris) 花数据集特征数据的轮廓图。Iris有3种植物, 分别是Setosa、Versicolor和Virginica, 4个特征分别是萼片长度 (Sepal Length, SL)、萼片宽度 (Sepal Width, SW)、花瓣长度 (Petal Length, PL) 和花瓣宽度 (Petal Width, PW)。每种植物有样本40个, 一共有120个植物样本。从图 1(a)可以看出有3种聚类, 图中萼片长度SL和萼片宽度SW各个类别之间区分度不高, 聚类特性不明显, 交织在一起, 去掉这两个“劣质”指标, 保留2个“优质”指标的轮廓图如图 1(b)所示, 图中的类别区分度较图 1(a)明显提高。

图 1 Iris数据特征轮廓图 Figure 1 Feature contour of Iris data

基于轮廓图的可视化特征优选方法的步骤可描述如下:

Step1   绘制各种故障特征样本的轮廓图。

Step2   分析某一特征数据聚类特性。

Step3   某一特征能较清楚地区分各故障类型, 则保留该特征; 否则, 去除该特征。

Step4   若还有未分析特征, 转Step 2;否则, 特征优选过程结束。

2 滚动轴承异类特征可视化优选及故障诊断 2.1 BP神经网络诊断流程

智能诊断方法目前多以频谱频带能量为特征, 采用神经网络进行故障识别[9-13]。时域统计特征是最为简单最早使用的特征, 故而提取滚动轴承故障信号的时域统计特征和小波包能量两种异类特征, 应用可视化融合方法进行优选, 然后用应用最广泛的模式识别方法——反向传播 (Back Propagation, BP) 神经网络进行智能诊断。

滚动轴承的数据选用美国Case Western Reserve University轴承数据中心的实验数据, 实验轴承为6205-2RS JEM SKF深沟球轴承, 故障刻痕深度为0.177 8 mm, 采样频率为12 kHz, 转速为1 730 r/min。分别取滚动轴承正常工作、滚动体、内圈、外圈故障样本数据各59个样本, 每个样本长度为2 048个数据,进行时域特征和小波包能量的提取。为了简化融合后高维数据的融合困难, 可首先对各类特征进行可视化初选, 然后再合并起来进一步优化融合。为了研究可视化优选方法对诊断识别率提高效果, 分别对单类特征优选前后的诊断识别率进行对比研究。特征联合后再用可视化方法进一步进行优选, 并进行优选前后故障诊断识别率进行对比研究, 来分析其效果。

BP网络采用三层神经网络结构, 第一层为输入层, 神经元个数等同于输入特征个数; 第二层为隐含层, 选Sigmoid激活函数f(x)=1/(1-e-αx), 根据选择原则和测试结果选择隐层神经元个数为10个; 第三层为线性输出层, 针对模式识别的神经网络, 输出层采用线性输出。对应的期望输出分别为:无故障 (0, 0, 0, 1)、滚动体故障 (0, 0, 1, 0)、内圈故障 (0, 1, 0, 0) 和外圈故障 (1, 0, 0, 0)。

建立如图 2所示的滚动轴承故障诊断流程图, 具体步骤如下:1) 选取训练和测试用的滚动轴承振动信号; 2) 提取各类特征; 3) 应用可视化图形优选方法优选特征; 4) 将各个优选的特征作为神经网络的输入, 以内圈故障、滚动体故障、外圈故障和正常状态四种模式作为网络输出, 确定网络结构, 对网络进行训练; 5) 用训练好的网络对测试样本进行分类识别。

图 2 滚动轴承故障诊断流程 Figure 2 Flow chart of rolling bearing fault diagnosis

另外, 为了研究特征优选对噪声的鲁棒性, 采用原始信号训练, 用不同信噪比 (Signal-to-Noise Ratio, SNR) 的信号进行测试。任意选取原始数据每种状态下的20个样本构成故障训练样本 (共80个), 其余的样本构成模型的测试样本 (共156个)。若是加噪信号, 为了与不加噪测试样本相同, 每种样本随机取39个样本也组成156个测试样本。

2.2 时域统计特征的初步优选

常用的时域特征参数包括4个有量纲指标和5个无量纲指标[13]x(n) 为时域信号序列 (n=1, 2, …, N), 选用4个有量纲特征指标为绝对均值Xm、方差Xc、均方根Xrms和平均峰值Xp。其计算公式为:

$ {{X}_{\text{m}}}=\frac{1}{N}\sum\limits_{n=1}^{N}{\left| x\text{(}n\text{)} \right|} $ (1)
$ {{X}_{\text{c}}}=\frac{1}{N}\sum\limits_{n=1}^{N}{{{\left[x\left( n \right)-\bar{X} \right]}^{2}}} $ (2)
$ {{X}_{\text{rms}}}={{\left( \frac{1}{N}\sum\limits_{n=1}^{N}{{{x}^{2}}\left( n \right)} \right)}^{1/2}} $ (3)
$ {{X}_{\text{p}}}=\frac{1}{{{J}_{0}}}\sum\limits_{j=1}^{{{J}_{0}}}{{{x}_{\text{p}}}\left( j \right)} $ (4)

其中:xp(j)(j=1, 2, …, J0) 是峰值, 本文J0取10。

选用5个无量纲参数指标为峰值指标Cp、脉冲指标Cf、裕度指标Ce、峭度指标Cq和歪度指标Cw。其计算公式为:

$ {{C}_{\text{p}}}={{X}_{\text{p}}}/{{X}_{\text{rms}}} $ (5)
$ {{C}_{\text{f}}}={{X}_{\text{p}}}/{{X}_{\text{m}}} $ (6)
$ {{C}_{\text{e}}}={{X}_{\text{rms}}}/{{X}_{\text{m}}} $ (7)
$ {{C}_{\text{q}}}=E{{\left( x-\mu \right)}^{4}}/{{\sigma }^{4}} $ (8)
$ {{C}_{\text{w}}}=E{{\left( x-\mu \right)}^{3}}/{{\sigma }^{3}} $ (9)

其中:μ为均值; σ为标准差。

每个特征参数反映振动状态的不同情况, 不同故障信号所对应的敏感特征不同。针对要识别的故障, 挑选出具有故障敏感性和聚类性的特征是提高故障识别率的关键。本文把对故障敏感并明显表现出聚类特性的特征称为优质特征。

图 3是滚动轴承时域统计特征的轮廓图。滚动轴承故障具有4种类型:正常 (无故障)、滚动体故障, 内圈故障和外圈故障。基于各特征幅值大小差别较大, 不利于聚类特性的分辨, 对特征数据进行归一化处理, 归一化后的滚动轴承特征轮廓图如图 4(a)所示, 后文都用归一化图。图 4(a)中峰值指标Cp和歪度指标Cw均匀地分布整个特征域, 聚类特性不明显, 甚至不同类别有部分交织, 去掉这两个“劣质”指标, 保留7个“优质”指标的轮廓图如图 4(b)所示, 图中的类别区分度较图 3图 4(a)明显提高。用BP网络进行识别, 不同SNR下的实验结果如表 1所示, 特征经过优选过的故障识别率都高于同样条件下的未经优选的故障识别率。

图 3 滚动轴承故障时域特征未归一化轮廓图 Figure 3 Un-normalized contour of rolling bearing fault time domain features
图 4 滚动轴承故障时域特征归一化轮廓图 Figure 4 Normalized contour of rolling bearing fault time domain features
表 1 时域特征下滚动轴承故障诊断识别率 Table 1 Fault recognition rate of rolling bearing under domain features

无噪信号未经优选时的识别率为69.231%, 优选过的识别率上升到98.077%(见表 1)。从表 1还可知, 特征没有进行优选情况下, 故障识别率随着噪声的加入逐步下降; 而特征经过优选后的故障识别率保持比较高的故障识别率, 体现出优质特征对噪声具有一定的鲁棒性。

2.3 小波包能量特征初步优选

小波包能量特征也是常用的故障诊断特征。小波包分析法选取Daubechies-db16小波包, 对滚动轴承信号进行小波包3层分解得到8个分解频带。同样用无噪信号训练BP模型, 用不同SNR的信号进行测试。实验结果显现在无噪情况下和SNR=50 dB时诊断正确率都很高, 可达到100%的识别率; 当SNR=20 dB时识别率大幅下降, 低至25%。对不同SNR下的测试数据绘制轮廓图进行分析, 无噪情况下4类特征的小波包能量归一化后的训练数据和测试数据轮廓图如图 5所示。该图中, 四类故障聚类明显, 也可说明高识别率的原因。

图 5 无噪情况下轴承故障数据小波包能量特征轮廓图 Figure 5 Wavelet packet energy contour for bearing fault data without noise

SNR=20 dB时, 测试数据的轮廓图如图 6所示。图 6(a)为未经优选的特征轮廓图, 第5和第6能量特征三个故障类别交织在一起难以区别, 初步先去掉这两个特征, 剩下的6个特征轮廓图如图 6(b)所示, 四个故障模式分类较前分明了些。把相应的特征输入到BP模型, SNR=20 dB的故障识别率可提升到75.641%, 从而也验证了轮廓图中的聚类特性与识别率有强相关性。

图 6 轴承故障测试数据小波包能量特征轮廓图 (20 dB) Figure 6 Wavelet packet energy contour for bearing fault data (20 dB)
2.4 异类特征融合滚动轴承故障诊断

把初选过的时域统计特征和小波包能量特征融合一起, SNR=20 dB的故障识别率为96.154%, 比单一小波包能量识别率高, 但低于时域统计特征的识别率。对测试数据绘制出轮廓图 (见图 7) 进行分析, 发现CeCq、小波第1频带三个特征, 不同类别之间交叉较多, 进一步优化去除这三个特征, 再进行模式识别, 识别率可稳定在100%。

图 7 时域统计特征和小波包能量特征融合轮廓图 (20 dB) Figure 7 Fusion contour of time-domain statistical and wavelet packet energy features (20 dB)

由上述滚动轴承故障诊断过程可知, 基于可视化技术的异类特征融合方法操作简单, 识别效果好。目前特征优选过程是在人工参与的情况下进行的,在今后进一步的研究中将会把成熟的聚类算法 (如K-means算法) 应用于特征优选过程, 从而实现异类特征融合方法的完全自动化, 以达到故障自动化诊断的目标。

3 结语

用轮廓图来进行可视化特征优选是一种简单且直观的方法, 直观地去除冗余和不敏感特征, 选择出优质特征,对于异类特征的有效融合具有一定效果。为了简化融合过程, 先分别对单类特征进行初步优选, 然后合成优选。以滚动轴承故障信号时域统计和小波包能量两类特征融合为例, 用不同信噪比的加噪故障信号进行故障识别率对比研究。实验结果表明该方法能够对提高故障识别率有效。下一步的工作将是把聚类算法引入特征优选过程, 以实现故障诊断过程的自动化。

参考文献
[1] CHEN P, TOYOTA T, HE Z. Automated function generation of symptom parameters and application to fault diagnosis of machinery under variable operating conditions[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part A: Systems and Humans, 2001, 31 (6) : 775-781. doi: 10.1109/3468.983436
[2] 苏祖强, 汤宝平, 姚金宝. 基于敏感特征选择与流行学习维数约简的故障诊断[J]. 振动与冲击, 2014, 33 (3) : 70-75. ( SU Z Q, TANG B P, YAO J B. Fault diagnosis method based on sensitive feature selection and manifold learning dimension reduction[J]. Journal of Vibration and Shock, 2014, 33 (3) : 70-75. )
[3] 杨宇, 潘海洋, 程军圣. 基于特征选择和RRVPMCD的滚动轴承故障诊断[J]. 振动工程学报, 2014, 27 (4) : 629-636. ( YANG Y, PAN H Y, CHENG J S. The rolling bearing fault diagnosis method based on the feature selection and RRVPMCD[J]. Journal of Vibration Engineering, 2014, 27 (4) : 629-636. )
[4] PENG H, LONG F, DING C. Feature selection based on mutual information: Criteria of max-dependency, max-relevance, and min-redundancy[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27 (8) : 1226-1238. doi: 10.1109/TPAMI.2005.159
[5] ZHAO X M. Data-driven fault detection, isolation and identification of rotating machinery: with applications to pumps and gearboxes[D]. Edmonton: University of Alberta, 2012.
[6] 古莹奎, 承姿辛, 朱繁泷. 基于主成分分析和支持向量机的滚动轴承故障特征融合分析[J]. 中国机械工程, 2015, 26 (20) : 2778-2783. ( GU Y K, CHENG Z X, ZHU F L. Rolling bearing fault feature fusion based on PCA and SVM[J]. China Mechanical Engineering, 2015, 26 (20) : 2778-2783. )
[7] 巫茜, 蔡海尼, 黄丽丰. 基于主成分分析的多源特征融合故障诊断方法[J]. 计算机科学, 2011, 38 (1) : 268-270. ( WU Q, CAI H N, HUANG L F. Feature-level fusion fault diagnosis based on PCA[J]. Computer Science, 2011, 38 (1) : 268-270. )
[8] 李学军, 李平, 蒋玲莉, 等. 基于异类信息特征融合的异步电机故障诊断[J]. 仪器仪表学报, 2013, 34 (1) : 227-233. ( LI X J, LI P, JIANG L L, et al. Fault diagnosis method of asynchronous motor based on heterogeneous information feature fusion[J]. Chinese Journal of Scientific Instrument, 2013, 34 (1) : 227-233. )
[9] 刘颖慧, 刘树林, 唐友福, 等. 基于斜率关联度的模式识别方法及滚动轴承故障诊断应用[J]. 机械科学与技术, 2012, 31 (9) : 1500-1503. ( LIU Y H, LIU S L, TANG Y F, et al. A method of pattern recognition with slope relational degree and its application to rolling bearing fault diagnosis[J]. Mechanical Science and Technology, 2012, 31 (9) : 1500-1503. )
[10] 程军圣, 史美丽, 杨宇. 基于LMD与神经网络的滚动轴承故障诊断方法[J]. 振动与冲击, 2010, 29 (8) : 141-144. ( CHENG J S, SHI M L, YANG Y. Roller bearing fault diagnosis method based on LMD and neural network[J]. Journal of Vibration and Shock, 2010, 29 (8) : 141-144. )
[11] 杨宇, 于德介, 程军圣. 基于经验模态分解包络谱的滚动轴承故障诊断方法[J]. 中国机械工程, 2004, 15 (16) : 1469-1471. ( YANG Y, YU D J, CHENG J S. A fault diagnosis approach for roller bearings based on EMD and envelop spectrum[J]. China Mechanical Engineering, 2004, 15 (16) : 1469-1471. )
[12] 胡耀斌, 厉善元, 胡良斌. 基于神经网络的滚动轴承故障诊断方法的研究[J]. 机械设计与制造, 2012 (2) : 187-189. ( HU Y B, LI S Y, HU L B. Fault diagnosis of rolling bearing based on neural network[J]. Machinery Design & Manufacture, 2012 (2) : 187-189. )
[13] 张键. 机械故障诊断技术[M]. 北京: 机械工业出版社, 2015 : 60 -63. ( ZHANG J. Mechanical Fault Diagnosis Technology[M]. Beijing: China Machine Press, 2015 : 60 -63. )