2. 北京化工大学 经济管理学院, 北京 100029
2. School of Economics and Management, Beijing University of Chemical Technology, Beijing 100029, China
故障诊断是可靠性分析的重要领域。单独从某一项故障特征进行故障诊断较为困难,而且缺乏可信性。针对这一问题,基于多传感器信息融合的故障诊断方法成为研究热点。
由传感器获取的故障特征信息经常由于环境等因素的干扰以及传感器自身的问题不够精准完备,甚至不可信,多传感器提供的故障特征信息也可能变得互相矛盾[1]。证据理论也被称作D-S理论,它是一种典型的不确定性推理方法,能够有效处理包含不确定性的信息[2-3]。传统的故障信息融合诊断方法如过程神经元网络等方法,需要对故障机理有着较为清晰的认知,而利用证据理论进行故障诊断则很少需要考虑这些问题,因而更加简洁方便。Basir等[4]将证据理论引入故障诊断领域,给出了利用基本信度分配的信度和似然度进行故障诊断的准则。Oukhellou等[5]完成了由神经网络方法获取的数据向基本概率分配的转化。林云等[6]将灰色关联理论和熵权理论相结合,提出故障信度分配的生成方法。Moosavian等[7]将证据理论与支持向量机方法相结合用于故障识别。Jiang等[8]利用证据理论融合包含不确定性的传感器数据,综合进行故障判断。
前人主要从故障证据的生成和修正两个方面进行研究,但缺乏两者间的有机统一,故障信度的收敛速度不够快。因此,本文基于证据理论提出一种具有普遍适用性的故障诊断方法,对故障信度分配的生成和修正方法进行研究,并结合电机转子故障诊断的实例给予验证。
1 D-S证据理论基本概率分配函数(BPA)是证据理论表示和处理不确定性的基础,也被称为基本信度分配函数(BBA)。对于由N个相互独立的命题组成的识别框架Θ,2Θ表示Θ的幂集合,基本概率分配函数就是从幂集合2Θ到区间[0, 1]的一个映射,记为mass函数,用m表示,并且满足式(1)。
$ \sum\limits_{A \subseteq \mathit{\Theta }} {m\left( A \right) = 1} $ | (1) |
其中A是幂集合中的元素,也被称为命题。若m(A)>0,则称A为函数的焦元,特别地,当A是空集时有m(ϕ)=0。
信度表示证据信息对命题的信任程度,命题A的信度Bel(A)的计算公式如式(2)所示
$ Bel\left( A \right) = \sum\limits_{B \subset \mathit{A}} {m\left( B \right)} $ | (2) |
其中B是幂集合中的元素。
似然度表示证据信息对命题不否认的程度,命题A的似然度pl(A)计算公式为
$ pl\left( A \right) = \sum\limits_{B \cap \mathit{A} \ne \phi } {m\left( B \right)} $ | (3) |
将信度作为区间下界,似然度作为区间上界,由它们组成的区间就是命题的信任区间,表示对命题的确认程度,区间越大,则命题的不确定性越高。
证据组合公式是证据理论的核心,经典的证据组合公式是D-S公式。对于同一识别框架Θ上的k个mass函数m1, m2, …, mk,其D-S组合公式为
$ m\left( A \right) = \frac{{\sum\limits_{{A_1} \cap {A_2} \cdots \cap {A_k}} {{m_1}\left( {{A_1}} \right){m_2}\left( {{A_2}} \right) \cdots {m_k}\left( {{A_k}} \right)} }}{{1 - \sum\limits_{{A_1} \cap {A_2} \cdots \cap {A_k} = \emptyset } {{m_1}\left( {{A_1}} \right){m_2}\left( {{A_2}} \right) \cdots {m_k}\left( {{A_k}} \right)} }} $ | (4) |
其中,m是融合后的mass函数,A1, A2, …, Ak分别是m1, m2, …, mk中包含的集合元素(命题),
利用单一的故障特征进行故障检测容易遗失部分重要信息,因而综合多故障特征进行检测是十分必要的[9]。对于某一产品,其可能发生的故障类型有n种,分别记为F1,F2,…,Fn,特别地,当产品故障类型未知时,记为FΘ。选取m个故障特征C1, C2, …, Cm用于故障诊断。利用故障仿真技术分别对故障F1,F2,…,Fn进行多次模拟,得到各类故障的特征参考值记为rji,表示故障Fi在故障特征Cj取值变化的期望值。由于历史测量数据往往缺少对应的故障类型的记录,因而将各个特征的历史数据取期望后,记为故障未知状态FΘ的参考值,用rjΘ表示。将故障Fi的各个故障特征参考值构成的向量(r1i, r2i, …, rji, …, rmi)称为它的特征参考向量。
观测向量与参考向量的接近程度能够反映观测故障隶属于某一故障的程度。这里,采用欧式距离度量两者之间的差异。为避免不同故障特征的数量级差异带来的问题,首先要对参考向量进行归一化。
$ nr_{j}^{i}=\frac{r_{j}^{i}}{\underset{i}{\mathop{\max \left( r_{j}^{i} \right)}}\,},\ \ i=1,2,\cdots ,n,\mathit{\Theta };j=1,2,\cdots ,m $ | (5) |
对各故障特征进行多次观测,可以得到多组观测值,其中第p组观测值用(h1p, h2p…, hjp, …, hmp)表示。同样,为消除数量级不同带来的问题,要将观测值进行归一化处理,处理方法如式(6)
$ \begin{array}{*{35}{l}} nh_{j}^{p}=\frac{h_{j}^{p}}{\underset{i}{\mathop{\max \left( r_{j}^{i} \right)}}\,},\ \ i=1,2,\cdots ,n,\mathit{\Theta };j=1,2,\cdots ,m; \\ p=1,2,\cdots ,S \\ \end{array} $ | (6) |
得到归一化向量(nh1p, nh2p…, nhjp, …, nhmp),计算其与故障Fi参考向量(nr1i, nr2i, …, nrji, …, nrmi)的欧式距离,记为edip。
$ ed_i^p = \sqrt {\sum\limits_j {{{\left( {nr_j^i - nh_j^p} \right)}^2}} } ,j = 1,2, \cdots ,m $ | (7) |
向量(ed1p, ed2p, …, edip, …, ednp, edΘp)表示第p组观测值与各个故障模式参考值之间的欧式距离,通过求解距离倒数在所有距离倒数之和中的比例,可以得到观测数据对每个故障类型的支持度,即基本信度分配,运算公式为
$ m_i^p = \frac{{1/ed_i^p}}{{\sum\limits_i {1/ed_i^p} }},i = 1,2, \cdots ,n,\mathit{\Theta } $ | (8) |
可以看出观测向量与某一故障的参考向量的距离越大,则观测故障为该故障的可能性越小。对于第p组观测数据对各故障支持度的分配可表示为(m1p, m2p…, mip, …, mΘp)且满足
当两组证据同时赋予某一故障较高的信度时,这两组证据融合结果对该故障的支持度应该进一步提高,这称为融合结果的收敛。对于同一识别框架Θ上的两组证据,m1(F1)=0.5, m1(F2)=0.3, m1(F3)=0.2,m2与m1相同,m1与m2都赋予F1较高的信度,融合后应该使得F1获得更高的信度支持。两组证据融合的结果为:m(F1)=0.66, m(F2)=0.24, m(F3)=0.1。可以发现融合后故障F1的信度进一步提高,这是证据融合的信度偏移现象,表现为信度在某个命题的聚集,这种现象便于决策者做出判断。
因人为或者其他因素的影响可能造成故障特征的测量误差,由该类误差数据生成的mass函数与其他组观测数据生成的mass函数存在明显的冲突,若直接采用D-S公式融合这些冲突证据,将会影响信度在正确命题上的收敛。这类mass函数在融合时应赋予较低的可信度,以提高融合结果的准确性。对于同一类型的故障,大多数观测数据生成的mass函数应该是一致的,而误差数据会与其存在较大的差异。基于这种思想,通过证据之间差异的度量比较,将其分为可信证据和冲突证据。
在证据理论中,信度和似然度构成的信度区间表示证据对命题的确认程度。对于故障诊断的一组证据(m1p, m2p…, mip, …, mΘp),通过式(1)、(2)计算Fi的信度区间[mi-p, mi+p],进而得到一组区间向量([m1-p, m1+p], …, [mi-p, mi+p]…, [mΘ-p, mΘ+p])。在区间数距离定义的基础上,两组证据对应的区间向量的距离dpq可定义为[10]
$ {d_{pq}} = \sum\limits_{i = 1}^\mathit{\Theta } {\frac{{\sqrt 2 }}{2}\sqrt {{{\left( {m_{i - }^p - m_{i - }^q} \right)}^2} + {{\left( {m_{i + }^p - m_{i + }^q} \right)}^2}} } $ | (9) |
dpq满足非负性、对称性、三角不等性等距离性质。之所以采用证据的信任区间的距离来度量两组证据的差异,是因为这种区间距离能更有效地反映证据在人们认知理解上的差别。
对于第p组证据,计算它与其他证据的平均距离,记为dp。
$ {d_p} = \frac{1}{{S - 1}}\sum\limits_{q = 1;q \ne p}^s {{d_{pq}}} $ | (10) |
S组证据构成的证据集用ES表示,定义证据集的平均距离为dS。
$ {d_S} = \frac{1}{{S\left( {S - 1} \right)}}\sum\limits_{p,q}^S {{d_{pq}}} = \frac{1}{S}\sum\limits_p^S {{d_p}} $ | (11) |
大多数观测数据的诊断结果都是一致的,一般可信证据的平均距离要小于证据集的平均距离,而冲突证据与绝大多数证据的距离都比较大,因而冲突证据的平均距离一般要大于证据集的平均距离。所以将可信证据集ER定义为证据mp的集合,mp的平均距离满足式(12)
$ {d_p} \le {d_S} $ | (12) |
不满足式(12)的证据称为冲突证据,它们构成冲突证据集EC。
2.3 故障证据的修正与融合令可信证据集ER中证据的可信度rp=1,冲突证据集EC中证据的可信度rp按照式(13)计算。
$ {r_p} = {d_S}/{d_p} $ | (13) |
为降低可信度低的故障证据的干扰,给出第p组mass函数的修正方法。
$ \left\{ \begin{array}{l} {m_p}\left( \mathit{\Theta } \right) = 1 - {r_p} + {m^p}\left( \mathit{\Theta } \right)\\ {m_p}\left( {{F_i}} \right) = {r_p}{m^p}\left( {{F_i}} \right),{F_i} \subseteq \mathit{\Theta } \end{array} \right. $ | (14) |
其中,p=1, 2, …, S。然后利用式(8)对修正后的mass函数进行融合,得到综合的mass函数m。
2.4 故障诊断准则经过多组观测数据的融合后,可得到每个故障模式对应的可信度,即m=(m(F1), …, m(Fi), …, m(FΘ)),将m(Fi)按照大小重新排序。若m(Fi)最大值对应的故障是FΘ,则说明现有信息无法判定故障类型,需要继续融合信息。若最大值对应的故障为A1,次大值对应的故障是A2,且A1和A2的mass值满足m(A1)-m(A2)>ε,那么则判定当前故障为A1,其中ε是预先设定的阀值。如果A1与A2的mass值之差小于阀值,则需要继续融合信息,或由专家判断是否发生了并行故障。
3 实例验证电机转子作为电动机和发电机的核心部件,主要功能是完成电能与机械能的相互转化,它的故障类型主要有转子不对称、转子不平衡、基座松动3种。针对某一型号的电机转子试验台,电机转子转动的初始频率设定为25 Hz,选取其1倍频、2倍频、3倍频下振动幅度的平均值作为故障特征,分别用1A,2A,3A表示,位移变量的幅度平均值也作为一个故障特征,用X表示,那么故障特征集合为{1A, 2A, 3A, X}。
将转子正常工作状态记为F1,转子不平衡记为F2,转子不对中记为F3,基座松动记为F4,则电机转子故障的整个识别框架为Θ={F1, F2, F3, F4},如果产品发生故障,观测数据融合得到的F1信度应该会很低。经过多次故障仿真,结合历史数据得到各故障的特征参考值如表 1所示。其中Θ表示未知状态。
从表 1可以看出F1与其他故障状态的特征参考值相差较大,很容易通过故障特征值判断电机转子是否发生故障。此外,特征X与其他特征的参考值存在明显的差异,因而有必要采取归一化操作,消除数量级差异带来的影响。
对处于不对中状态的电机转子进行模拟观测,得到3组观测数据,这3组数据的融合结果应该是将最大的信度赋予故障F3。3组观测数据的原始数据S1、S2、S3和归一化处理后的数据C1、C2、C3如表 2所示。
从表 2可以看出,前两组原始数据S1、S2与F3的特征参考值最接近,表明S1、S2对F3的支持度在所有的故障状态中是最高的。而S3与F4的特征参考值最接近,表明S3对F4的支持度最高。因而可将S3视为干扰信息。
利用式(7)和(8),得到3组观测数据对应的故障基本信度分配如表 3所示。
mi(i=1, 2, 3)分别表示3组观测数据对应的mass函数。m1和m2将最大的信度都赋予了F3,m3将最大的信度赋予了F4,这与我们的直观认知是相符的,说明本文提出的故障信度分配的生成方法是切实有效的。此外,从表 3可以发现,3组证据都给正常状态F1赋予了很低的信度,这是因为观测数据本身就是电机转子在故障状态下的测量数据,与正常数据偏差甚远,因而这种分配也是合理的。
计算3个证据相互之间的距离d12=0.4570,d13= 1.1433,d23=1.4316,进而得到每个证据的平均距离d1=0.8001,d2=0.9443,d3=1.2874,以及整个证据集的平均距离d=1.0106。d1和d2都小于d,而d3则大于d,按照2.3节提出的可信度确定方法,证据m1与证据m2都是可信证据,可信度定为1,证据m3属于冲突证据,可信度为0.785。由于m1与m2的可信度均为1,修正后的结果与原信度分配一样,而m3则变为(0.0292, 0.0749, 0.0821, 0.4980, 0.3158),故障F4的信度减少,未知状态Θ的信度增加。
为验证提出的修正方法是否能够降低干扰信息的影响,分别计算出未修正的3组证据的融合结果m和修正后的证据融合结果mc,如表 4所示。
从表 4可以发现,m与mc都赋予F1极小的信度,可以判断此时电机转子处于故障状态。如果将诊断阀值定为0.2,修正前后的融合结果对当前故障的判断都是F3,即电机转子处于不对中状态。从诊断结果来说,无论是直接进行证据融合还是修正后再融合,得到的结论是一致的。不过mc对故障F3的支持度达到0.9110,大于m对故障F3的支持度0.8982,说明本文利用可信度来修正证据信息的方法确实降低了冲突证据m3的影响。
图 1直观展示了证据融合提升故障诊断准确性的良好效果。可以看出原3组证据中,m1与m2支持故障都为F3,而只有m3更多支持F4,所以直观上判断故障更可能是F3。本文证据融合结果mc最支持F3,与直观判断一致,而且赋予了F3更高的支持度,使得判断结果更加可信。
证据理论对于不确定信息的处理优势使其非常适合复杂环境下的故障信息融合工作。本文提出的基于证据理论的故障诊断方法具有较强的适用性,能够有效判断产品的故障模式,并且降低干扰信息对诊断结果的影响,提高了融合结果的准确性。证据融合规则能够实现信度向较多证据支持的命题的快速聚集,本文提出的修正方法更进一步加速了这种聚集,从而达到快速准确诊断故障的目的。
[1] |
宋亚飞, 王晓丹, 雷蕾, 等. 基于证据理论和混淆矩阵的传感器可靠性评估[J]. 控制与决策, 2015, 30(6): 1111-1115. Song Y F, Wang X D, Lei L, et al. Evaluating dynamic reliability of sensors based on evidence theory and confusion matrix[J]. Control and Decision, 2015, 30(6): 1111-1115. (in Chinese) |
[2] |
Agarwal H, Renaud J E, Preston E L, et al. Uncertainty quantification using evidence theory in multidisciplinary design optimization[J]. Reliability Engineering & System Safety, 2004, 85(1): 281-294. |
[3] |
Pilch M, Trucano T G, Helton J C. Ideas underlying the quantification of margins and uncertainties[J]. Reliability Engineering & System Safety, 2011, 96(9): 965-975. |
[4] |
Basir O, Yuan X Y. Engine fault diagnosis based on multi-sensor information fusion using Dempster-Shafer evidence theory[J]. Information Fusion, 2007, 8(4): 379-386. DOI:10.1016/j.inffus.2005.07.003 |
[5] |
Oukhellou L, Debiolles A, Denoeux T, et al. Fault diagnosis in railway track circuits using Dempster-Shafer classifier fusion[J]. Engineering Applications of Artificial Intelligence, 2010, 23(1): 117-128. DOI:10.1016/j.engappai.2009.06.005 |
[6] |
林云, 李一兵, Zhou R L. 灰色关联和证据理论在故障识别中的应用和改进[J]. 应用基础与工程科学学报, 2011, 19(2): 314-322. Lin Y, Li Y B, Zhou R L. Application and improvement of gray correlation and evidence theory in fault recognition[J]. Journal of Basic Science and Engineering, 2011, 19(2): 314-322. (in Chinese) |
[7] |
Moosavian A, Khazaee M, Najafi G, et al. Spark plug fault recognition based on sensor fusion and classifier combination using Dempster-Shafer evidence theory[J]. Applied Acoustics, 2015, 93(2): 120-129. |
[8] |
Jiang W, Xie C H, Zhuang M Y, et al. Sensor data fusion with Z-numbers and its application in fault diagnosis[J]. Sensors, 2016, 16(9): 1509-1531. DOI:10.3390/s16091509 |
[9] |
欧阳高强, 曹柳林. 一种基于相对主元分析的故障检测方法[J]. 北京化工大学学报:自然科学版, 2014, 41(4): 112-116. Ouyang G Q, Cao L L. A fault detection approach using relative principal component analysis[J]. Journal of Beijing University of Chemical Technology:Natural Science, 2014, 41(4): 112-116. (in Chinese) |
[10] |
谭吉玉, 朱传喜, 张小芝, 等. 一种新的基于TOPSIS的区间数排序法[J]. 统计与决策, 2015(1): 94-96. Tan J Y, Zhu C X, Zhang X Z, et al. A new interval number ranking method based on TOPSIS[J]. Statistics & Decision, 2015(1): 94-96. (in Chinese) |