计算机应用   2016, Vol. 36 Issue (12): 3505-3510  DOI: 10.11772/j.issn.1001-9081.2016.12.3505
0

引用本文 

陈维兴, 曲睿, 孙毅刚. 基于改进Apriori算法的地面空调间歇故障预测[J]. 计算机应用, 2016, 36(12): 3505-3510.DOI: 10.11772/j.issn.1001-9081.2016.12.3505.
CHEN Weixing, QU Rui, SUN Yigang. Prediction for intermittent faults of ground air conditioning based on improved Apriori algorithm[J]. JOURNAL OF COMPUTER APPLICATIONS, 2016, 36(12): 3505-3510. DOI: 10.11772/j.issn.1001-9081.2016.12.3505.

基金项目

国家自然科学委员会—中国民航局民航联合研究基金资助项目(U1433107);中央高校基本科研业务费专项资金资助项目(3122014D021)

通信作者

曲睿(1990-),女,辽宁沈阳人,硕士研究生,主要研究方向:数据融合、数据挖掘,rae.qu@hotmail.com

作者简介

陈维兴(1981-),男,天津人,副教授,硕士,主要研究方向:嵌入式系统、工业系统网络;
孙毅刚(1963-),男,山东汶上人,教授,博士,主要研究方向:航空设备智能监控

文章历史

收稿日期:2016-04-13
修回日期:2016-06-30
基于改进Apriori算法的地面空调间歇故障预测
陈维兴, 曲睿, 孙毅刚    
中国民航大学 电子信息与自动化学院, 天津 300300
摘要: 针对机坪地面空调间歇故障引起的使用效能低、维修滞后等问题,提出了二次关联累加数组(AS)-Apriori与聚类K-means相结合的间歇故障预测方法,并基于此实现了延误维修预测。其中:AS-Apriori算法解决了Apriori频繁扫描事务库的低效问题,通过实时构造间歇故障数组并对其对应项累加求和;延误维修预测是为了估计出永久故障临界区以安排合理维修,可采用正态分布求出不同间歇故障变量的维修波及延误概率并进行依次累加而实现。验证表明,AS-Apriori提高了运行效率,且二次关联规则支持度提升了20.656个百分点,能更准确预测间歇故障,同时参照数据分析,预测的维修波及延误累加概率呈线性分布,即可预测性高的间歇故障更便于预先维护管理,减少永久故障的形成。
关键词: 地面空调    数据挖掘    间歇故障    预测    永久故障    
Prediction for intermittent faults of ground air conditioning based on improved Apriori algorithm
CHEN Weixing, QU Rui, SUN Yigang     
College of Electronic Information and Automation, Civil Aviation University of China, Tianjin 300300, China
Abstract: Aiming at the problems caused by intermittent faults of ground air conditioning, including low use efficiency, maintenance lag etc., a prediction method of intermittent faults which combined re-association Array Summation (AS)-Apriori with clustering K-means was raised, based on this method, delayed maintenance forecast was realized. The low efficiency problem of frequently scanning transaction database in Apriori was solved in AS-Apriori algorithm, by constructing intermittent fault arrays and giving a summation of corresponding items on them in real-time. The goal of delayed maintenance forecast is to estimate the critical region of permanent fault to arrange reasonable maintenance, which can be realized by using Gaussian distribution for the solution of maintenance wave of different intermittent fault variables and delay probability and then giving an accumulation in order. The results show that, the operational efficiency is improved, the support degree of re-association rules is upgraded by 20.656 percentage points, and more accurate prediction of intermittent failure is realized. Moreover, according to the analysis of data, the probability of forecasting maintenance-wave and delay-probability is shown as a linear distribution, which means that the high predictability of intermittent faults is more convenient to maintain and manage in advance and the formation of permanent fault is reduced.
Key words: ground air conditioning    data mining    intermittent fault    prediction    permanent fault    
0 引言

根据节能减排的需要,民航局自2012年开始推动国内机场以地面空调替代机载引气空调的工作: 一方面可以为飞机机舱提供过滤、加热、冷却、除湿和通风等条件;另一方面可以减少大量航空燃油的消耗,降低运营成本,目前如北京、上海、广州、沈阳、青岛等国内大中型机场已经开始将地面桥载空调投入运营[1]

目前,地面空调存在以下几个问题:1) 各大机场相继引入了地面空调系统环节,其稳定性直接关系到机场运行;2) 部分机场由于地面空调的保障问题影响使用,甚至造成了航班晚点;3) 地面空调具有结构复杂、故障变量种类多等特点,并且针对其间歇故障相关的专家经验比较贫乏,传统专家系统方法具有随机性、片面性和主观性等特点,使得地面空调的间歇故障在线诊断等问题表现出模糊性和不精确性。因此,提高地面空调的可靠性和稳定性至关重要,而间歇故障预测[2]就是其中重要手段之一。同时现场维修人员针对不同的间歇故障采用不同的维护手段,因此,拥有一个完备的间歇故障采集故障数据库也是其在线诊断维修的必要手段之一。本文中涉及了间歇故障采集和间歇故障储备数据库,及间歇故障预测和维护。

1 间歇故障概述

随着各类电子设备故障的复杂性和难预测性的提升,一种介于永久故障和瞬态故障的更复杂的故障——间歇故障出现在人们的视野里。它是持续时间短、可反复出现、未经处理可自动消失的一种非永久故障[3-4]

1.1 间歇故障的产生原因

由于间歇故障的复杂性,现在的故障诊断方法难以适用,而且其产生的原因也是多种多样: 可能是系统缺乏制冷剂;冷凝器出风不良,有障碍物堵住;室外温度过高;设备中阀门和压缩机的密闭性不严[5];各种开关接触不良、电源电压相间不平衡和电磁干扰[6];另外人为操作干扰、动物干扰和湿度、系统机械应力等环境干扰也会导致间歇故障产生。

1.2 间歇故障的采集和在线储备数据库

目前,在进行地面空调间歇故障数据采集的过程中,通过数据的预处理分析可知,地面空调的故障80%~90%来自于间歇故障[7],很多维修人员对间歇故障并不重视,认为是故障虚报或者系统能自维修,这正是间歇故障的特点,它是一种不经修复可在有限时间内自行修复的故障,这也就导致了间歇故障发展成为了永久故障。还有一种是维修人员一旦检测出故障,不经过分析就认为其是一种永久故障,并对故障进行修理或更换零件,这样会导致好的零件被维修或是更换,从而增加了维修费用。所以,得到一个完备种类的间歇故障数据库成为近似准确地维修地面空调的重中之重,然而,有些间歇故障的出现就在几秒间,因此,间歇故障的采集成为一个难点。本文通过采集全部非正常故障(甚至一个脉冲),按时间段进行归类,正常归为“0”,故障归为“1”(本文针对的对象为间歇故障,因此“故障”自动认为是间歇故障),然后提取所有的“1”进行进一步诊断,把诊断后的间歇故障进行在线监控,若有必要进行在线维修,维修后若故障变成非间歇故障,则自动将“1”改为“0”,继续诊断下一个故障,以此类推。具体操作如图 1所示。

图 1 间歇故障的采集和在线储备数据库
2 地面空调间歇故障在线诊断预测总体流程

实际中,针对现场地面空调的数据量大、复杂,难以明显地发现潜在的数据强关联等特点,因此不能及时解决其间歇故障的问题,本文通过聚类和改进二次关联累加数组(Array Summation,AS)-Apriori进行结合,并验证了交互结合法在数据量大而复杂的间歇故障诊断中的稳定性和高效性[8],达到在线预测的效果。图 2为间歇故障在线预测维修反馈的总过程。

图 2 间歇故障在线预测维修反馈的总过程
2.1 AS-Apriori算法

通过对Apriori算法的分析可知,Apriori算法通过连接和剪枝两个步骤生成候选项集,不但会生成大量候选项集,而且Apriori算法要通过扫描数据库以获得其支持度计数从而得到频繁项集,在这一过程中Apriori算法的缺点也暴露出来,其性能瓶颈问题如下:

1) 多次扫描事务数据库,需要很大的I/O负载。

对每次k循环,候选集Ck中每个元素都必须通过扫描一次数据库来验证其是否加入Lk。假如一个频繁项目集包含10个项,那么就至少需要扫描事务数据库10遍。

2) 可能生成庞大的候选集。

Lk-1产生k-候选集Ck是指数增长的,例如104个1-频繁项目集就有可能产生接近107个元素的2-候选集。如此大的候选集对时间和主存空间都是一种挑战。

为了改善Apriori算法需要多次扫描数据库而带来低效的缺陷,本文采用了基于累加数组的方法来获得频繁项集。

基于改进的累加数组(AS-Apriori)方法的主要思想:针对所有的离散数据集,根据其在事务数据库中出现的记录生成一维数组(它的列项数即事务数据库的事务项(Transaction ID,TID)个数),在生成数组的同时就能统计出支持度并生成频繁1-项集。然后对任意两两频繁1-项集的数组对应项做“累加求和”运算,统计出支持度并生成2-项集,如此循环,最终得到符合要求的所有频繁项集。图 3为AS-Apriori算法改进的总过程分析。

图 3 AS-Apriori算法的总过程框图

说明:由于图 3为改进算法的总过程理念分析,并没有真实数据介入,因此没有进行剪枝过程,而是分别把所有的1次和2次求和数组所有项分别设成1-频繁项集和2-频繁项集,求3+项集也如上所求。

改进算法(AS-Apriori)建模的设计公式为:

1-频繁项集:

$\sum\limits_{i=1}^{n}{{{a}_{i}}\ge 2}$ (1)

2-频繁项集:

$\sum\limits_{k\ge 2}{\left[ \sum\limits_{i\ne j=1}^{n}{\left( \left[ {{B}_{i}} \right]+\left[ {{B}_{j}} \right] \right)} \right]}\ge 2$ (2)

3-频繁项集:

$\sum\limits_{k\ge 2}{\left[ \sum\limits_{\begin{smallmatrix} i\ne j=1 \\ i\ne j\ne z \end{smallmatrix}}^{n}{\left( \left[ {{C}_{ij}} \right]+\left[ {{B}_{z}} \right] \right)} \right]}\ge 2$ (3)

其中:n为TID事务数据库的个数;k为数组累加求和后的计数;本文的最小支持度阈值为2;式(1)~(3)分别对应求出的1、2和3频繁项集,3+频繁项集求得的公式同理。

2.2 AS-Apriori算法的性能分析

通过上述过程,最终得到所有的频繁项集。改进算法AS-Apriori只需要扫描事务数据库一次,避免了重复的数据库扫描而产生的效率低下。而且通过建模公式减少了剪枝这个步骤,仅仅通过公式计算减少了候选项集,大大提高了Apriori算法的效率。

为了证实对Apriori算法的优化效果,分别取Apriori算法和AS-Apriori算法在不同数据记录条下的运行时间进行对比。本文中的数据采集自广州白云机场的地面桥载空调,共采集25天。本数据为随机采集的数据,从早六点到晚九点之间,其参数变量取其中的送风压力、送风温度、压缩机的运行电流以及压缩机系统的高压压力、低压压力、机内温度和可能的故障原因等共8个变量。

数据预处理:滤掉不满足要求的数据,同时根据要解决的问题,对变量进行数目降维,简化后的数据不但具有故障在性能处理方面的针对性,还能提高软件运行效率。本文共3692组数据,由人眼观看的数据特征可知,当冷凝风机1和2启动和停止期间,风机压力会出现一组极小或缺失值,因此需要滤掉。最终取3000个数据进行改进AS-Apriori算法的性能验证。

图 4可知:随着事务数目从低到高的增长,显示出原始Apriori算法和改进后的AS-Apriori算法执行时间的相关变化情况。从给出实例的理论分析和实验结果表明,改进后的算法的效率要明显优于原算法。

图 4 AS-Apriori算法的性能验证
2.3 地面空调间歇故障在线预测方法体系和框架

由于关联只能处理离散型变量,因此针对其特点,本文对文献中处理故障数据的方法进行了优化,具体方法是通过K-means算法对故障变量进行聚类并且利用AS-Apriori算法对其离散模式(故障类型)进行关联,而相较对故障类型进行聚类及对故障变量进行关联的方法[9]而言,其优点在于:基于离散事件系统的间歇故障预测方法可靠性好,可以有效消除扰动和噪声对间歇故障运行处理效果的影响,同时处理简单、计算量小,因此对间歇故障具有良好的实用性。由于故障类型数据直接就是离散化的,所以在数据预处理上还可以节省大量时间,而对于处理实际中的大量数据集时,效率能明显提高。

地面空调本身结构变量复杂,变量种类繁多,表现为模糊性和异构性,在实际中处理这些变量时,往往会带来很多困难,因此,将聚类算法和关联算法分别应用于不同性质的数据,发挥每种算法的优势。然而,通过改变数据的结构和类型可以增加算法的容错性,扩展算法的应用范围,提高其在实际应用中的价值[10]。来自地面空调设备的技术变量主要有间歇故障变量和间歇故障类型两类,通过将聚类算法和关联算法经过互耦结合,最后得到预测结果。首先得到4个一次关系矩阵(公式后面的字表示不同特点的原始故障数据所采用的方法),关联-故障变量如下:

$A = \left[ {\matrix{ {{k_{11}}} & {{k_{12}}} & \cdots & {{k_{1n}}} \cr {{k_{21}}} & {{k_{22}}} & \cdots & {{k_{2n}}} \cr \cdots & \cdots & \cdots & \cdots \cr {{k_{m1}}} & {{k_{m2}}} & \cdots & {{k_{mn}}} \cr } } \right]$ (4)

聚类-故障类型如下:

$B = \left[ {\matrix{ {{k_{11}}} & {{k_{12}}} & \cdots & {{k_{1n}}} \cr {{k_{21}}} & {{k_{22}}} & \cdots & {{k_{2n}}} \cr \cdots & \cdots & \cdots & \cdots \cr {{k_{{\rm{n}}1}}} & {{k_{n2}}} & \cdots & {{k_{nn}}} \cr } } \right]$ (5)

聚类-故障变量如下:

$C = \left[ {\matrix{ {{l_{11}}} & {{l_{12}}} & \cdots & {{l_{1{\rm{m}}}}} \cr {{l_{21}}} & {{l_{22}}} & \cdots & {{l_{2m}}} \cr \cdots & \cdots & \cdots & \cdots \cr {{l_{{\rm{m}}1}}} & {{l_{m2}}} & \cdots & {{l_{mm}}} \cr } } \right]$ (6)

关联-故障类型如下:

$D = \left[ {\matrix{ {{i_{11}}} & {{i_{12}}} & \cdots & {{i_{1n}}} \cr {{i_{21}}} & {{i_{22}}} & \cdots & {{i_{2n}}} \cr \cdots & \cdots & \cdots & \cdots \cr {{i_{{\rm{m}}1}}} & {{i_{m2}}} & \cdots & {{i_{mn}}} \cr } } \right]$ (7)

然后将得到的一次关系矩阵A、B和C、D,其中A和D分别经过二次关联后,分别得到的二次关系矩阵E和F。

$P=E×B$ (8)
$Q=C×F$ (9)

明确指出:关系矩阵P是文献的方法得到的;关系矩阵Q则是对P的优化方法而得到。

通过上述方法的结合,可以得到不同的间歇故障变量在不同的间歇故障类型中所占的比重,即一个多维关系因素表,如表 1所示。

表 1中可以得到,利用聚类方法可以把地面空调的间歇故障变量分成n个间歇故障变量组集,同理,通过关联分析方法也可以把地面空调的间歇故障类型分成m个间歇故障类型组集。通过两个组集的结合,能够得到一个m×n的关系矩阵,最后对故障类型进行二次关联,最终得到不同间歇故障类型的关联间歇故障变量组集,为解决实际中地面空调发生的间歇故障提供有效的参考。

表 1 地面空调间歇故障分析关系表

表 1中反映的关系可以用切尔诺夫脸进行形象的表示,切尔诺夫脸一方面有助于揭示地面空调中间歇故障数据的趋势,另一方面有助于地面空调的规律和不规律数据的可视化实现。不同的切尔诺夫脸代表了n维间歇故障变量组集和m维间歇故障类型组集[11],脸部五官的动态变化反映了聚类和关联在地面空调中应用的特点,揭示了在实际作业中工作变量在关系性上的伴随现象,具体过程如图 5所示(脸的周长表示算法中近似用的时间长短)。

图 5 地面空调间歇故障关系切尔诺夫脸图
2.4 地面空调间歇故障在线预测方法验证

根据已采集到的数据通过统计产品与服务解决方案(Statistical Product and Service Solution,SPSS)软件仿真,由K-means聚类算法可以得到不同间歇故障变量的划分,令聚类数目为2,确定初始聚类中心采用软件的默认方式,距离采用欧氏距离。地面空调的间歇故障变量的聚类仿真结果如表 2所示。

表 2 地面空调间歇故障分析关系表

表 2中可以看到,送风量、机外静压和机风压外余压属于第一类间歇故障变量,机组进风温度、噪音量、额定电压和额定频率属于第二类间歇故障变量,两种变量的间歇故障类型的欧氏距离分别相近,满足聚类的要求。

结合已得到的地面空调间歇故障类型模型图,再利用关联规则的改进算法AS-Apriori可得到不同间歇故障类型之间的关联强度,令支持度Support=40%,置信度Confidence=90%,地面空调的间歇故障类型关联规则表如表 3所示(支持度为41.844%,置信度为100%)。

表 3中可以看出,关联规则表总共归纳出16条带有故障状态的规则,且每条规则的基本变量满足支持度和置信度最初设定的要求,因此确定为有效的规则。

表 3 地面空调间歇故障类型关联规则表

表 1中可以看到,间歇故障类型与间歇故障变量之间满足一定的函数关系,即间歇故障类型m= f(间歇故障变量n),间歇故障类型m与间歇故障变量n具有相关性,经过聚类分析和关联分析,得到一次关系矩阵C和D。

最后利用上述筛选规则后的一次关联规则对间歇故障类型组集进行二次关联AS-Apriori,得到最优化关系矩阵F,反映了不同间歇故障类型的复合发生关系,为实际解决故障提供合理建设性方案,经过二次关联后,得到了关联规则表,如表 4所示(支持度为62.5%,置信度为100%)。

表 4 地面空调二次关联规则表

表 4中可以得到,不同间歇故障类型组集之间的相关性可以通过支持度和置信度来体现,而且通过前后对比得到间歇故障类型的组集集合,该组集集合的实际价值最大。结合表 34,本文处理的数据集比文献中扩大了10倍且初始条件更严格,但二次关联规则支持度提升了20.656个百分点,而文献中的支持度提升了16.29个百分点,因此预测可靠性提升。

最后将聚类分析和二次关联分析的结果经过筛选和成熟的经验相结合,得到地面空调间歇故障复合矩阵Q,其模型如表 5所示。

表 5 地面空调间歇故障复合模型表

表 5中可以得到,间歇故障类型组集中,内过高、内油过和内油高的相关性最强,反映为间歇故障发生时产生的伴随现象,送风量、机外静压和机风压外余压属于一类间歇故障变量,机组进风温度、噪音量、额定电压和额定频率属于另一类间歇故障变量,其中油过高和内油过高与第一类间歇故障变量关系最强,表明了当发生油过高和内油过高的时候,应该对第一类间歇故障变量进行检查和测试,因此能够对未来可能发生的间歇故障起到预测作用;同理,内过高、内油过和内油高与第二类间歇故障变量关系最强,表明了当发生内过高、内油过和内油高的时候,应该对第二类间歇故障变量进行检查和测试,因此也同样能够对未来可能发生的间歇故障起到预测作用[12-13]

虽然上述方法能够预测出间歇故障,提高预测的效率,并能及时诊断维修间歇故障,但是,在现场会随机掺杂各种影响因素导致永久故障的产生,因此,对于间歇故障达到永久故障的临界区,也是本文的一个重要方向。

3 地面空调永久故障的临界区 3.1 间歇故障的维修延误堆积

现场实际作业中,地面空调间歇故障是通过有丰富经验的维修人员在线诊断和维修,但是,诊断维修延误无法避免:1)某一时刻故障连续、多且复杂;2)由于现场维修人员调度不当等问题,导致故障设备无法在规定时间内维修。然而,一个间歇故障诊断维修延误是产生永久故障的诱因,所以只要确定出独立的诊断间歇故障延误就能推算出永久故障发生的概率。独立诊断故障延误采用时间为度量单位,如延时50 s、3 min等。考虑到研究与计算的方便性,可以认为间歇故障独立延误时间具有一定的概率分布:

${{p}_{i}}\left( t \right)=\int_{0}^{t}{{{s}_{i}}\left( t \right)dt}$ (10)

其中: pi(t)si(t)分别表示故障i独立延误t时间概率和概率密度函数。

永久故障是基于间歇故障诊断维修延误而产生的最严重后果,如图 6所示,由间歇故障波及延误而产生的永久故障的延误链。

图 6 永久故障产生的延误链

独立的间歇故障诊断维修延误是由多种原因共同导致的,这种延误可以近似认为是服从正态分布[14]。假设间歇故障诊断维修1的独立延误y服从正态分布N1,σ12),间歇故障诊断维修2的波及延误时间为随机变量x,间歇故障诊断维修1与间歇故障诊断维修2之间的突发事件包含的预留时间为w,则间歇故障诊断维修2的波及延误时间小于t时间的概率为:

$\begin{align} & p\left\{ x <t \right\}=p\left\{ x=y-w<t \right\} \\ & =p\left\{ y<w+t \right\}=\int\limits_{-\infty }^{w+t}{\frac{1}{\sqrt{2\pi }\sigma }{{e}^{-\frac{{{\left( y-\mu \right)}^{2}}}{2{{\sigma }^{2}}}}}dy} \\ \end{align}$ (11)

由于每个间歇故障i对应一个故障诊断维修延误y1,y2,…,yi-1,当这些故障诊断维修延误yi服从正态分布Nii2)且故障相互独立时,间歇故障诊断维修波及延误概率为:

$\begin{align} & p\left\{ x <t \right\}=p\left\{ x=\sum\limits_{j=1}^{i-1}{\left( {{y}_{j}}-{{w}_{j}} \right)<t} \right\} \\ & =p\left\{ \sum\limits_{j=1}^{i-1}{{{y}_{j}}<\sum\limits_{j=1}^{i-1}{{{w}_{j}}+t}} \right\} \\ & =\int\limits_{-\infty }^{\sum\limits_{j=1}^{i-1}{{{w}_{j}}}+t}{\frac{1}{\sqrt{2\pi }\underset{j=1}{\overset{i-1}{\mathop{\prod }}}\,{{\sigma }_{j}}}{{\exp }^{\left[ -\frac{{{\left( y-\sum\limits_{j=1}^{i-1}{{{\mu }_{j}}} \right)}^{2}}}{2{{\left( \prod\limits_{j=1}^{i-1}{{{\sigma }_{j}}} \right)}^{2}}} \right]}}dy} \\ \end{align}$ (12)
3.2 永久故障的临界区

通过观察数据和现场采集到的间歇故障来看,疲劳损伤老化、部分零件接触不良和环境因素是地面空调机组间歇故障的主要原因之一,也是造成永久故障的潜在隐患。因此,本文针对三组空调机组变量数据(送风量、送风压力和风机电流)为例,通过观测时间的推移,依次预测出其效能强度,并预估出永久故障的时间区域。图 7为预处理后的三个变量频数的正态分布图(预处理后的数据为2507组,目标设备是广州机场内一台地面空调一共采集了三个月,每天5~8架飞机,平均每架飞机采集1~2 h,5 min采集一组数据)。

图 7 相同条件下不同地面空调变量的频数正态分布

在现场作业中,若假设场内有一台压缩机作业,在保证间歇故障不突变(例如:送风量减少,不是人为堵住管道口)或者间歇故障变量不加重(例如:送风量变小的过程中不会再叠加故障)的条件下,进行永久故障临界区域分析。通过式(9)间歇故障诊断维修波及延误概率得到间歇故障维修延误累加概率,随时间累加过程中,得到间歇故障累加图,由此能预测出永久故障的累加临界区。具体仿真结果如图 8所示。

图 8 地面空调三个变量的维修延误累加概率

图 7分析可知,按正态分布的均匀程度从强到弱分布如下:送风量>风机电流>送风压力,因此可得出其正态分布边界的不均匀值从多到少:送风压力>风机电流>送风量,而这些正态分布特征与维修延误累加概率有关联。例如:送风量的正态分布均匀程度最强,边界的不均匀值最少,因此在图 8中其发生永久故障(概率为1的点)概率的时间就比其他两个变量慢,并且相对其他两条曲线的斜率呈线性上升,因此可预测性高。其他两个变量分析类似。

而对于维修人员来说,在最坏的情况下,当快接近永久故障的临界区时,就需要对地面空调的间歇故障进行在线维修,才不至于到永久故障临界点时,对地面空调进行停机维修。

4 结语

针对Apriori算法存在着产生候选集效率低和频繁扫描数据等问题,为了能利用该算法对故障快速预测提供方向和目标,最终达到减少扫描次数、提高算法效率的目的,必须首先解决频繁扫描带来的低效问题。本文继承了原Apriori算法的基本思想,提出了一种基于数组对应项累加求和的关联规则改进算法AS-Apriori。最后利用改进的二次关联与聚类的结合进行间歇故障预测。该算法以地面桥载空调间歇故障作为事务数据库,为预测算法提供数据依据并验证了预测变量的能力,效果显著。

通过间歇故障的采集和对储备数据库等一系列间歇故障的提取,本文深入探讨了永久故障出现的临界区,根据间歇故障延误维修概率的累积求和,得到了永久故障的临界区,举例分析了送风量、送风压力和风机电流三个变量的正态分布,最终得到地面空调三个变量的维修延误累加概率,从中可以发现正态分布和边界值均匀的变量,其特点是:变化轨迹的斜率几乎呈线性、规律性明显、可预测性高。而正态分布和边界值不均匀的变量,其特点是:震荡厉害、无明显的规律、可预测性低。本文解决了实际现场中地面空调间歇故障恶化到永久故障的问题,但是达到永久故障的临界点具体数值仍难以确定,仅能预测一个具体范围。

参考文献
[1] CHANDOLA V, BANERJEE A, KUMAR V. Anomaly detection:a survey[J]. ACM Computing Surveys, 2009, 41 (3) : Article No. 15.
[2] 彭宇, 刘大同. 数据驱动故障预测和健康管理综述[J]. 仪器仪表学报, 2014, 35 (3) : 481-495. ( PENG Y, LIU D T. Data-driven prognostics and health management:a review of recent advances[J]. Chinese Journal of Scientific Instrument, 2014, 35 (3) : 481-495. )
[3] 周东华, 史建涛, 何潇. 动态系统间歇故障诊断技术综述[J]. 自动化学报, 2014, 40 (2) : 161-171. ( ZHOU D H, SHI J T, HE X. Review of intermittent fault diagnosis techniques for dynamic systems[J]. Acta Automatica Sinica, 2014, 40 (2) : 161-171. )
[4] 徐贵斌.动态系统故障诊断及预测研究[D].北京:清华大学,2011:8-19. ( XU G B. Diagnosis and prediction of dynamic system fault[D]. Beijing:Tsinghua University, 2011:8-19.) )
[5] ZANARDELLI W G, STRANGAS E G, AVIYENTE S. Identification of intermittent electrical and mechanical faults in permanent-magnet AC drives based on time-frequency analysis[J]. IEEE Transaction on Industry Applications, 2007, 43 (4) : 971-980. doi: 10.1109/TIA.2007.900446
[6] KRASNOBAEV V A, KRASNOBAEV L A. Application of Petri nets for the modeling of detection and location of intermittent faults in computers[J]. Automation and Remote Control, 1989, 49 (9) : 1198-1204.
[7] 邓冠前, 邱静, 李智, 等. 间歇故障诊断技术研究综述[J]. 兵工自动化, 2015, 34 (1) : 15-20. ( DENG G Q, QIU J, LI Z, et al. A survey on intermittent fault diagnosis technology[J]. Ordnance Industry Automation, 2015, 34 (1) : 15-20. )
[8] ELMASRI R, NAVATHE S B. Fundamentals of Database Systems[M]. Upper Saddle River: Addison Wesley Professional, 2010 : 808 -867.
[9] 孙毅刚, 曲睿, 陈维兴, 等. 面向数据挖掘的静态电源综合故障诊断研究[J]. 计算机测量与控制, 2015, 23 (10) : 3274-3276. ( SUN Y G, QU R, CHEN W X, et al. Research of data mining oriented integrated error diagnosis of solid state power[J]. Computer Measurement & Control, 2015, 23 (10) : 3274-3276. )
[10] ISALM M, BRANKOVIC L. Privacy preserving data mining a noise addition framework using a novel clustering technique[J]. Knowledge-Based System, 2011, 24 (8) : 1214-1223. doi: 10.1016/j.knosys.2011.05.011
[11] 解亚萍. 基于统计相关系数的数据离散化方法[J]. 计算机应用, 2011, 31 (5) : 1409-1412. ( XIE Y P. Data discretization method based om statistic correlation coefficient[J]. Journal of Computer Applications, 2011, 31 (5) : 1409-1412. doi: 10.3724/SP.J.1087.2011.01409 )
[12] BONCHI F, FERRARI E. Privacy-aware Knowledge Discovery Novel Application and New Techniques[M]. Boca Raton: CRC Press, 2011 : 111 -143.
[13] 吕大江, 石志寒, 雷英杰, 等. 基于自适应直觉模糊推理的数据挖掘方法[J]. 计算机应用, 2010, 30 (4) : 1089-1092. ( LYU D J, SHI Z H, LEI Y J, et al. Data mining method based on adaptive intuitionistic fuzzy inference[J]. Journal of Computer Applications, 2010, 30 (4) : 1089-1092. doi: 10.3724/SP.J.1087.2010.001089 )
[14] 张海峰, 胡明华. 航空公司短期航班计划编排模型及算法[J]. 南京航空航天大学学报, 2015, 47 (4) : 553-558. ( ZHANG H F, HU M H. Planning model and algorithm for short-term flight scheduling of airlines[J]. Journal of Nanjing University of Aeronautics & Astronautics, 2015, 47 (4) : 553-558. )