计算机应用   2016, Vol. 36 Issue (10): 2647-2652  DOI: 10.11772/j.issn.1001-9081.2016.10.2647
0

引用本文 

王军, 杨羊, 程勇. 基于数据预处理的无线气象传感网数据重构模型[J]. 计算机应用, 2016, 36(10): 2647-2652.DOI: 10.11772/j.issn.1001-9081.2016.10.2647.
WANG Jun, YANG Yang, CHENG Yong. Data preprocessing based recovery model in wireless meteorological sensor network[J]. JOURNAL OF COMPUTER APPLICATIONS, 2016, 36(10): 2647-2652. DOI: 10.11772/j.issn.1001-9081.2016.10.2647.

基金项目

国家自然科学基金资助项目(61373064,61402236);江苏省"六大人才高峰"项目(2015-DZXX-015,2013-DZXX-019);江苏省产学研前瞻性联合研究项目(BY2014007-2);公益性行业(气象)科研专项(GYHY201106037);江苏省农业气象重点实验室开放基金资助项目(KYQ1309)

通信作者

杨羊(1992-),男,江苏仪征人,硕士研究生,主要研究方向:无线传感器网络数据收集,E-mail:yyangnuist@foxmail.com

作者简介

王军(1970-),男,安徽铜陵人,教授,CCF会员,主要研究方向:无线传感器网络、大数据;
程勇(1980-),男,重庆人,讲师,博士,CCF会员,主要研究方向:无线传感器网络数据收集、大数据

文章历史

收稿日期:2016-03-14
修回日期:2016-06-15
基于数据预处理的无线气象传感网数据重构模型
王军1,2, 杨羊1, 程勇2    
1. 南京信息工程大学 计算机与软件学院, 南京 210044 ;
2. 南京信息工程大学 信息化建设与管理处, 南京 210044
摘要: 针对无线气象传感网内由于节点数量大、感知数据冗余度高而导致节点通信耗能过高的问题,提出了数据联合稀疏预处理模型,利用监测区域气象要素预报值和各簇头要素值计算出一个全网公共分量并对网内数据进行预处理。将分布式压缩感知应用于簇型传感网中,对各节点感知数据进行压缩观测,在汇聚节点进行数据重构,从根本上降低节点通信量,均衡负载;同时设计了一个基于公共分量异常数据稀疏方法。仿真实验中,相对于单独使用压缩感知,数据联合稀疏预处理模型能够有效利用数据时空相关性提高数据稀疏度,压缩性能提高了25%,重构性能提高46%;同时,异常数据处理方案能够以96%的高概率恢复异常数据。因此,该数据预处理模型能够提高数据重构效率,有效降低网内数据通信量,延长网络寿命。
关键词: 分布式压缩感知    无线气象传感器网络    公共分量分析    联合稀疏    数据预处理    
Data preprocessing based recovery model in wireless meteorological sensor network
WANG Jun1,2, YANG Yang1, CHENG Yong2     
1. College of Computer and Software, Nanjing University of Information Science and Technology, Nanjing Jiangsu 210044, China ;
2. Department of Information Construction and Management, Nanjing University of Information Science and Technology, Nanjing Jiangsu 210044, China
Abstract: To solve the problem of excessive communication energy consumption caused by large number of sensor nodes and high redundant sensor data in wireless meteorological sensor network, a Data Preprocessing Model based on Joint Sparsity (DPMJS) was proposed. By combining the meteorological forecast value with every cluster head's value in Wireless Sensor Network (WSN), DPMJS was used to compute a common portions to process sensor data. A data collection framework based on distributed compressed sensing was also applied to reduce data transmission and balance energy consumption in cluster network; data measured in common nodes was recovered in sink node, so as to reduce data communication radically. A suitable method to sparse the abnormal data was also designed. In simulation, using DPMJS can enhance the data sparsity by exploiting spatio-temporal correlation efficiently, and improve data recovery rate by 25%; compared with compressed sensing, data recovery rate is improved by 46%; meanwhile, the abnormal data processing can recovery data successfully by high probability of 96%. Experimental results indicate that the proposed data preprocessing model can increase efficiency of data recovery, reduce the amount of transmission significantly, and prolong the network lifetime.
Key words: distributed compressed sensing    wireless meteorological sensor network    common component analysis    joint sparsity    data preprocessing    
0 引言

无线传感器网络(Wireless Sensor Network,WSN)由部署在检测区域的大量体积小、成本低,具有无线通信、传感和数据处理能力的微型传感器节点组成[1]。节点通过相互通信形成多跳自组织式网络系统。WSN集成了检测、控制以及无线通信等功能,可以在任何时间、地点、环境下获取信息[2]。目前,研究较多的是应用于环境检测、精准农业等领域的无线气象传感网[3]。气象传感器节点体积微小,通常携带能量十分有限,而且不能二次充能。在气象传感网检测中,由于传感器节点分布区域广、部署密集,并且温湿度、气压等气象要素值存在时空连续性,在相当长的时空范围内变化较小,造成感知数据量大、冗余度高。传感器节点绝大部分能量消耗在无线通信模块,若将感知数据直接传输,会导致网络阻塞、节点通信能耗巨大,容易出现故障导致整个网络拓扑结构变化,甚至导致局部网络瘫痪,缩短网络寿命。因此,减少节点数据传输量、降低全网的通信成本、均衡能量消耗对于延长网络寿命十分重要。

近年来,Donoho等[4]提出了基于信号稀疏性的压缩感知(Compressed Sensing,CS)理论为信号数据处理提供了新的途径。不同于传统的Nyquist采样定理,该理论指出:当信号(N维)在某个变换域是稀疏的或可压缩的,可以利用与变换矩阵非相干的测量矩阵将变换系数线性投影为低维观测向量(M维,MN),同时这种投影保持了重建信号所需的信息,通过进一步求解系数最优化问题就能够从低维观测信号中精确地或者高概率精确地重构处原始高维信号[5-6]。任何信号在相应的稀疏域中都具有可压缩性。因此,在原始信号可压缩的前提下,在计算能力较弱的普通节点上运行复杂度较低的观测算法,获取感知数据的低维投影后传送到Sink节点,由于Sink节点能量充足,计算能力较强,可以在Sink节点上运行复杂度较高的重构算法重构出原始数据值[7]。由于气象传感网中数据存在较高时空相关性,稀疏度较高。通过压缩感知技术可以显著减少无线传感器网络通信量,降低节点通信能耗。

Baron等[8]进一步提出了分布式压缩感知(Distribute CS,DCS)理论,提出联合稀疏模型(Joint Sparsity Model,JSM),此模型可以同时开发气象要素信号的时间和空间相关性,把每个信号分成公共的成分和特有成分两个部分进行分析处理,最后对网内多个信号进行分布式联合重构,恢复原始数据,通过这种方式可以大幅减少观测节点数目,进一步降低网内通信量。如何选取合适的全网气象要素信号的公共成分是需要解决的问题。基于此,本文将分布式压缩感知应用于簇型无线传感器网络中,利用气象数据的时空相关性,提出了基于分布式压缩感知的数据联合稀疏预处理模型(Data Preprocessing Model based on Joint Sparsity,DPMJS),利用一个时间间隔中传感网内节点感知数据的时空相关性,结合感知区域气象要素预报值与簇头(Cluster Head,CH)节点感知数据值,对感知数据预处理后进行分布式压缩重构。同时,本文也提出了一种结合公共成分的异常数据稀疏处理方法,能够对异常数据进行及时有效的处理,快速将异常数据发送给Sink节点,在触发警告的同时避免了异常数据对数据观测造成的影响。

1 相关工作

随着压缩感知(CS)技术理论的逐步发展,有很多学者针对无线传感网中感知数据的压缩采集进行了研究。基于CS的WSN中数据收集方案能够使得网内数据融合和通信能耗达到最小,有效降低传感网中的数据时延[9-10]。文献[11]提出了树形路由传感网中数据的压缩采集(Compressive Data Gathering,CDG)方案,该方案将压缩感知应用到大型无线传感网中,有效地实现了树形传感网中节点的负载均衡;但CDG利用了传感网数据的空间相关性,没有考虑时间相关性。文献[12]将压缩感知应用于簇型传感器网络中,提出了传感网分簇最优分析模型,在簇结构个数和簇结构规模之间取得平衡,结合CS数据采集更加有效地减少了网络通信量。文献[13]基于分布式压缩感知,介绍了DCS的三种联合稀疏模型(Joint Sparsity Model,JSM),提出了WSN中分布式压缩编码框架,减少了节点间协作通信,降低了资源消耗,证明DCS非常适合无线传感网。文献[14-15]针对WSN中传感器节点能量带宽等资源受限的特点,从能量收集角度提出了基于DCS的WSN数据压缩重构方案。文献[16]提出了一种基于空间相关性的分布式压缩感知模型,并提出将事件区域节点组成一个簇,结合CS对簇内节点数据进行分布式压缩后发送到Sink节点进行联合重构;但该模型只考虑了空间相关性。

本文将分布式压缩感知应用于无线传感网簇型结构中,根据JSM,将每个数据分成公共成分和独有成分进行分析处理。提出的数据预处理模型结合了感知数据的时空相关性,确定出一个合适的全局公共成分,从而减少对公共成分的单独分析,缩小了数据处理的分布范围,提高了数据的可压缩性;并针对感知数据中的异常数据进行处理,快速将异常数据发送给Sink节点,并且避免异常对数据稀疏采集造成影响。

2 基于DCS的数据预处理模型 2.1 分布式压缩感知

压缩感知理论主要包括信号的稀疏表示、信号观测和信号重构三个部分。其实现结构如图 1所示。

图 1 压缩感知实现结构

信号能够被稀疏表示是进行压缩感知的前提。如果一个信号中只有少数元素是非零的,则该信号是稀疏的。然而,常见的自然信号在时域内都是不稀疏的,根据信号稀疏表示理论,自然信号可以通过某种变换ψ进行稀疏表示。对于任意一个长度为N的一维离散信号f∈RN,都可以由NN×1的正交基{ψi}Ni=1线性组合表示,则f可以表示为:

$f=\sum\limits_{i=1}^{N}{{{x}_{i}}{{\mathbf{\psi }}_{i}}或}f=\psi x$ (1)

其中:ψ=[ψ12,…,ψN];x是由投影系数xi组成的N×1的列向量,x是f在ψ域的等价表示。如果xL0范数‖x0=K,若K<<N,即x中非零值的个数远远小于f的长度,则x是K稀疏的,即fψ域是稀疏的或者说是可压缩的。一般自然信号在傅里叶变换(Discrete Fourier Transform,DFT)域、离散余弦变换(Discrete Cosine Transform,DCT)域、离散小波变换(Discrete Wavelet Transform,DWT)域中是可压缩的,这样就满足了对自然信号进行压缩采样的前提。

式(1)中,若x是K稀疏的,则信号f可以选取一个测量矩阵φ∈RM×N(M<<N)进行非适应性线性投影得到测量值y∈RM×1,表示如下:

$y=\varphi f=\varphi \psi x={{A}^{cs}}x;{{A}^{cs}}=\varphi \psi $ (2)

其中:Acs称为传感矩阵。因为MN,从y中恢复出信号f是低维空间求解高维空间问题。当信号f是稀疏或可压缩的,式(2)中的Acs满足约束等距性(Restricted Isometry Property,RIP)时,信号能够被高概率恢复[17]

对式(2)的逆问题可以通过L1-范数最优化求解,即:

$\tilde{x}=\operatorname{argmin}{{\left\| x \right\|}_{1}}\ \ x\in {{R}^{N}}s.t.y=\phi \psi x$ (3)

由于L1-范数是凸优化问题,所以式(3)是一个线性优化的问题,当测量值的数目满足M >cK lb (N/K)时,能够高概率高精度恢复稀疏或可压缩信号。其中:c为一个大于1的常数;N为原始数据序列的长度;K为稀疏度。

分布式压缩感知基于信号群数据联合稀疏。在JSM-1模型中,信号群所有的信号可以写成公共成分和特有成分相加形式:

$\mathbf{x}j=\mathbf{z}+\mathbf{z}j;j\in \{1,2,......,J\}$ (4)

其中:z=ψθz;‖θz0=K;zj=ψθj,‖θj0=Kj;J为信号群中信号的个数。因此,z是信号群中所有信号的公共成分,zj是信号xj的特有成分。信号群中所有信号可以在同一个稀疏域ψ中稀疏表示,公共成分和特有成分的稀疏度分别为KKj,根据DCS理论,c(K+Kj)个测量值足够重构出xj

2.2 模型建立 2.2.1 网络模型

气象传感网主要是用来对检测区域的环境参数进行采样和收集,本文提出的基于预处理的DCS数据收集模型适用于大型无线传感网。为了方便数据融合和节点管理,本文将数据收集方案应用于簇型传感网内,为了简化问题描述,网络拓扑如图 2所示。

图 2 簇型气象传感网

Sink节点和N个可感知温湿度等环境要素值的传感器节点,该网络固定且均分为J(2≤J≤N)个簇,簇头位于簇结构的中心位置。簇内采用DCS进行联合稀疏采样,簇头之间按照最短路径的路由策略将感知数据发送给Sink节点。

2.2.2 公共分量分析模型

CS理论指出,信号长度一定的情况下,稀疏度越高,信号重构所需的测量值个数越少。对于一个信号群,选择不同的共同分量会有不同的联合稀疏效果。气象传感网中,由于温度等环境要素的时空连续性以及节点的密集部署,相邻节点采集的数据之间存在较高的时空相关性。以温度要素为例,影响区域温度值的有阳光、风速等全局要素以及水分、动植物等自身要素。区域气象预报值能够很好地反映一段时间内监测区域全局要素值水平。文献[16]中以簇头(CH)监测值作为簇结构节点感知数据的公共分量进行分布式压缩采样,公共分量较多且没有代表性,联合稀疏效果差异较大,所以可以对区域气象预报值和簇头值进行联合样本分析得出全局气象要素公共分量,全局感知数据进行联合预处理。

假定传感网中节点时钟同步,在每轮数据采集开始前Sink节点接收到所有簇头节点的观测值序列{s1,s2,…,sj}和气象观测站的实时预报值s0。利用变差函数计算序列{s1,s2,…,sj}中每个值与s0的相关性,变差函数定义为:

$\mathbf{\gamma }(j)=\sqrt{\frac{1}{2}E(\frac{(Sj-S0)\mathbf{2}}{S0\mathbf{2}})}$ (5)

其中:变差函数γ(j)越小,说明簇头j(CHj)的观测值与预报值s0相关度越高。根据特定气象要素相关度要求设定一个相关性阈值β,当γ(j)≤β时,保留CHj的检测值;否则丢弃。经过相关度检验,对保留的n个簇头值[λ12,…,λn]以及s0进行调和均值计算,如式(6)所示:

$\bar{s}=\frac{n+1}{\sum\limits_{i=1}^{n}{\frac{\text{1}}{\lambda \text{i}}+\frac{\text{1}}{s0}}}$ (6)

调和均值能够较好地反映气象传感网内感知数据的总体水平,因此将作为全局分量进行数据的分布式压缩采集。

2.2.3 数据预处理压缩采样模型

为了简化模型,使得数据联合稀疏达到较优的水平,模型建立限定于以下假设:

1) 每个数据采样回合,所有簇结构中参与数据采样的节点个数为n;

2) 每个采样时间间隔tT-t0根据历史数据事先确定,保证传感网中感知数据有较好的时空相关度;

3) 为了方便数据传输过程中进行数据融合,每个节点中都有一个编号id。

首先,在传感网中运行分簇算法建立簇结构。每回合开始数据采集前Sink节点将公共分量s发送给所有节点。t时刻簇内节点得到的数据为dti,对数据dti作式(7)所示的预处理:

$xit=dit-\bar{s}$ (7)

簇内各节点数据完成预处理后可以组成一个1×n的向量ft(ft=(1-t,2-t,…,n-t)),经过一个时间tT-t0,每个簇结构感知数据可以表示为fj( fj∈Rn×T,fj=( ft0,ft1,…,ftT)),所以传感网中所有感知数据可以组成向量F(F=( f1,f2,…,fj))。在数据感知的同时进行数据的分布式随机压缩采样,每个簇结构中的分布式压缩采样过程如图 3所示:在时刻t,每个节点上以节点id为种子利用伪随机数生成器生成伪随机数φintφintxnt运算,其中:i(1≤i≤m)是压缩测量次数,n是节点标号,所以t时刻第i次随机测量簇头节点接收到的是数据加权和可以用式(8)表示:

${{y}^{t}}_{i}=\sum\limits_{n=1}^{\mathbf{N}}{{{\phi }_{in}}{{{\bar{x}}}^{\mathbf{t}}}_{n}}$ (8)
图 3 基于DCS簇内联合稀疏随机采样

在时刻t,经过m次随机加权和计算,簇头节点接收到一个1×m的向量yt(yt∈Rm,yt=(yt1,yt2,…,ytm))并通过最短路径发送给Sink节点。经过一个时间间隔tT-t0,一轮数据采集结束,簇内节点采集T次数据,T为采样回合数,簇头CHj一共接收到了Mj(Mj=mT)个数据并发送给了Sink节点,各簇结构发送给Sink节点数据可表示为Yj(Yj∈RMj,Yj=( yt0,yt1,…,ytT))。因此经过一轮观测采样,Sink节点接收到的数据可以表示为Y(Y=[Y1,Y2,…,Yj])

根据压缩感知理论,fj在特定变换域内可以被稀疏表示,即fj=ψx(‖x‖0=K)。因此,[t0,tT]时间段内所有伪随机数φint可以构成一个如下所示高斯随机观测矩阵φj:

$\varphi j=\left[ \begin{matrix} {{\varphi }_{11}}^{t0} & {{\varphi }_{12}}^{t0} & \cdots & {{\varphi }_{1n}}^{t0} \\ {{\varphi }_{21}}^{t0} & {{\varphi }_{22}}^{t0} & \cdots & {{\varphi }_{2n}}^{t0} \\ \vdots & \vdots & {} & \vdots \\ {{\varphi }_{m1}}^{t0} & {{\varphi }_{m2}}^{t0} & \cdots & {{\varphi }_{mn}}^{t0} \\ \vdots & \vdots & {} & \vdots \\ {{\varphi }^{tT}}_{m1} & {{\varphi }^{tT}}_{m2} & \cdots & {{\varphi }^{tT}}_{mn} \\ \end{matrix} \right]$

则通过分布式压缩采样得到的观测值Yj可以表示为:

${{\mathbf{Y}}_{j}}={{\varphi }_{j}}{{\mathbf{f}}_{j}}=\left[ \begin{matrix} {{\varphi }_{11}}^{t0} & {{\varphi }_{12}}^{t0} & \cdots & {{\varphi }_{1n}}^{t0} \\ {{\varphi }_{21}}^{t0} & {{\varphi }_{22}}^{t0} & \cdots & {{\varphi }_{2n}}^{t0} \\ \vdots & \vdots & {} & \vdots \\ {{\varphi }_{m1}}^{t0} & {{\varphi }_{m2}}^{t0} & \cdots & {{\varphi }_{mn}}^{t0} \\ \vdots & \vdots & {} & \vdots \\ {{\varphi }^{tT}}_{m1} & {{\varphi }^{tT}}_{m2} & \cdots & {{\varphi }^{tT}}_{mn} \\ \end{matrix} \right]\left[ \begin{matrix} {{f}^{t{0}'}} \\ {{f}^{t{1}'}} \\ \vdots \\ {{f}^{tT-{1}'}} \\ {{f}^{t{T}'}} \\ \end{matrix} \right]$

Sink节点获得观测值的同时也会接收到簇头节点打包发送过来的簇内节点id和以及时间戳t(t∈[t0,tT])。利用节点id和时间戳t,Sink节点可以在本地重新构造出观测矩阵φj并运行分布式压缩感知重构算法恢复原始信号。

2.3 分布式压缩重构

当接收到的数据量达到压缩感知数据恢复要求时,即M >cK lb (N/K),Sink节点立刻在本地重构出观测矩阵φ并运行分布式压缩感知解码算法重构出原始信号。φj中每列伪随机值是相邻节点生成的,为了增加随机因子的相关性,使得在Sink节点上能够更加简单准确地重构出随机观测矩阵,本文参考文献[11]提出观测矩阵重构策略:在数据开始压缩采样之前,Sink节点向传感网中所有簇头节点广播一个随机数种子Seed0,各簇头节点接收到Seed0后利用Seed0生成自己的随机数种子并广播到簇内各节点,则各节点就可以利用伪随机数生成器生成相关的随机权值系数;同样,Sink节点利用Seed0结合簇头节点id重构出各个簇的所有随机采样权值系数组成观测矩阵。

文献[17]的无线传感网中感知数据的压缩采样用块对角化随机测量矩阵表示,并且证明了该随机观测矩阵性能较好,因此本文也采取块对角化随机测量矩阵。结合本文提出的观测矩阵重构策略,在Sink节点利用Seed0和相关参数重构出各个簇结构的观测矩阵φ12,…,φj,这j个矩阵可以组成块对角随机观测矩阵φ,则簇结构无线传感器网络中,基于分布式压缩采样可以用式(9)表示:

$y=\varphi f=\left[ \begin{matrix} {{y}_{1}} \\ {{y}_{2}} \\ \vdots \\ {{y}_{j}} \\ \end{matrix} \right]\left[ \begin{matrix} {{\varphi }_{1}} & 0 & \cdots & 0 \\ 0 & {{\varphi }_{2}} & \cdots & 0 \\ \vdots & \vdots & {} & \vdots \\ 0 & 0 & \cdots & {{\varphi }_{j}} \\ \end{matrix} \right]\left[ \begin{matrix} {{f}_{1}}^{\prime } \\ {{f}_{2}}^{\prime } \\ \vdots \\ {{f}_{j}}^{\prime } \\ \end{matrix} \right]$ (9)

在区间[t0,tT]内,簇内节点采集数据并进行预处理后可以组成数据序列fj,各节点生成随机观测权值对感知数据进行压缩采样并发送给簇头节点组成数据序列yj,簇头节点将yj以及生成随机观测权值的相关要素发送给Sink节点,随后运行解码算法求解:

x=arg min‖x‖1; x∈RN s.t. y=φ ψ x

采用同步正交匹配追踪(Simultaneous Orthogonal Matching Pursuit,SOMP)算法重构出信号群各个信号[18],得到原始信号在ψ域的近似稀疏表示,最后再进行一次逆变换=ψ得到原始信号的近似值。由于数据重构算法较为复杂、数据处理量大,基于DCS的数据恢复存在一定的时延。

2.4 异常数据处理模型

无线传感网主要针对环境检测,异常数据往往代表有潜在危害时间发生,快速将异常情况通知到基站,及时触发消息预警是一个重要的任务。

图 4所示,正常信号可以在DCT稀疏域中稀疏表示;如图 5所示,当感知数据序列f中出现异常数据后,f在稀疏域中无法被很好地稀疏表示,即无法利用分布式压缩感知对感知数据进行有效的压缩采样并重构。

图 4 正常信号及其在DCT域稀疏表示
图 5 异常信号及其在DCT域稀疏表示

在[t0,tT]时间段内,全局公共分量是不变的,而且能够反映传感网气象要素的整体情况,与各个簇感知数据都有较强的相关性。t时刻,当传感网中参与压缩采样的节点出现感知数据xu时,立刻用节点中存储的全局公共分量替换,并将异常数据xu、节点id,以及时间戳t发送给簇头,由簇头及时发送给Sink节点,触发消息预警。传感网中的数据压缩采样和恢复照常进行,Sink节点恢复数据时,根据异常数据包中的异常值、时间戳和节点id替换其中对应值得到原始信号的近似值y

3 实验仿真

为了验证本文提出的公共分量分析模型以及基于公共分量的分布式压缩采样模型的性能,进行了Matlab实验仿真。

实验数据采用Intel Berkeley Research实验室采集的实际环境温度数据[19],提取其中40个节点模拟簇内节点采集情况,每回合采样间隔为1min。簇内信号数目为Nj,每个节点信号长度为N,压缩采样测量值个数为M,为了验证数据的时空相关性对压缩采样的影响,对数据进行了时钟同步以及时间戳标识处理。稀疏变换域采用离散余弦变换,观测矩阵为高斯伪随机分布观测序列,重构算法为正交匹配追踪(SOMP)算法。数据恢复误差采用归一化重构误差err,计算如式(10)所示。仿真中数据恢复算法运行500次,取归一化重构误差的平均值。

$err=\frac{norm(x-\hat{x})}{norm(x)}$ (10)

其中:x为重构算法恢复的数据序列;x为原始数据序列。

3.1 数据重构成功率

对信号进行压缩采样,测量值个数对于信号的成功恢复至关重要。仿真中分别利用压缩感知解码重构、分布式压缩感知解码重构和基于公共分量分析模型的分布式压缩采样对数据进行压缩重构。假设每个数据公共成分在DCT域稀疏,特有成分在独立域IN稀疏。重构误差小于0.04时视为重构成功,重构成功率为重构成功次数与总实验次数之比。仿真结果如图 6所示,信号长度N=100,簇内信号数目Nj=20。随着观测值个数M的增加,重构成功率出现指数式的增长。针对具体的三种压缩重构方案,对于各节点单独进行压缩重构,由于重构时没有利用数据的相关性,效果最差;以簇头节点值作为簇结构感知数据公共分量,再进行分布式压缩感知压缩重构,此时,原始数据稀疏度K=25和M=43时可以确保重构精度,数据通信量下降了57%;而本文提出的DPMJS先对数据进行预处理,得到K=18,Kj=6,显著提高了数据稀疏度,并且在M=32时就可以确保重构精度,数据通信量较预处理前下降了25%。由此可见,DPMJS能够有效减少压缩重构所需观测值个数,有效节省了节点的通信能耗;同时,在能量较为充足的汇聚节点运行复杂的数据重构算法,有利于均衡网络负载。因此,本文提出的基于预处理的DCS数据收集方案能够有效降低资源受限的无线传感器网络中节点通信数据量,延长全网寿命。

图 6 重构成功率比较
3.2 不同信号数目下重构所需观测值比较

在保证数据成功重构的同时,压缩重构所需的观测值多少能够直观展现对应的数据处理方案的性能,下面是针对不同方案在处理多个信号方面的性能进行对比与仿真。假设有10个簇,每个簇内含有信号数目Nj∈{10,15,…,50},每个信号长度均为100,分别应用CS、DCS和DPMJS对其进行仿真,得到在不同的信号数目下,成功重构出信号群内每个信号所需的观测值数目,仿真结果如图 7所示。

图 7 不同信号数目下重构所需观测值数目

图 7可知:

1) 在每个节点单独运行CS算法对信号群进行压缩重构时,随着信号数目的增加,所需观测值数目不断增加;应用DCS算法对信号群进行压缩重构时,每个信号所需的观测值随着信号数目的增加不断减少,当信号数目增大到一定程度时,所需观测值数目达到稳定值。

2) 当信号数目10≤Nj≤40时,本文提出的DPMJS数据压缩重构方案相对于没有采用本文数据预处理模型的DCS压缩重构方案,所需观测值数目更少,性能优势明显。

3.3 异常数据处理

由3.2节可知,异常数据对感知数据的稀疏表示影响较大,下面通过实验仿真验证本文提出的基于公共分量s的异常数据处理方法。以信号长度N=100,簇内信号数目Nj=20为例;人为修改两个数据值,模拟局部温度过高。

图 8表明,在不使用本文的异常数据处理方法情况下压缩重构感知数据。数据重构效果非常差,重构成功率只有44%,并且两个异常值没有恢复出来,系统无法及时触发预警,隐患较大。

图 8 未经异常处理压缩重构

图 9(a)为使用本文提出的异常数据处理方案后数据压缩重构对比图,从中可看出此时重构数据与原始数据几乎重合,此时重构成功率达到96%,满足了数据恢复精度的同时也成功恢复出两个异常值。两个异常值在发现时就已经发送给了Sink节点,及时触发了预警。图 9(b)表明用公共分量替换异常值后,在DCT域内感知数据能够被很好地稀疏表示。因此,本文提出的基于公共分量的异常数据处理方法能够有效解决异常数据对数据稀疏重构的影响。

图 9 经过异常处理压缩重构
4 结语

本文利用无线传感网感知信息的时空相关性和区域气象要素预报值,设计出一个基于联合稀疏的公共分量分析模型,对感知数据进行数据预处理和压缩重构。针对簇内数据压缩采样设计了一个时空相关观测矩阵,最大限度开发感知数据的时空相关性。通过仿真分析了基于公共分量预处理模型对分布式压缩感知数据压缩重构的影响,结果表明在满足数据精度的同时,该模型有效减少了观测数据量,降低了网内通信量;但本文提出的基于DCS的数据采集方案存在一定的数据时延,需要不断优化重构算法,降低算法复杂度。同时讨论了一种异常数据处理方案,并且通过实验结果验证了该方案能够有效解决异常数据对压缩重构的影响,快速发出预警。

参考文献
[1] 钱志鸿, 王义君. 面向物联网的无线传感器网络综述[J]. 电子与信息学报, 2013, 35 (1) : 215-227. ( QIAN Z H, WANG Y J. Internet of things-oriented wireless sensor networks review[J]. Journal of Electronics and Information Technology, 2013, 35 (1) : 215-227. ) (0)
[2] 洪锋, 褚红伟, 金宗科, 等. 无线传感器网络应用系统最新进展综述[J]. 计算机研究与发展, 2010, 47 (S2) : 81-87. ( HONG F, CHU H W, JIN Z K, et al. Review of recent progress on wireless sensor network application[J]. Journal of Computer Research and Development, 2010, 47 (S2) : 81-87. ) (0)
[3] 赵忠华, 皇甫伟, 孙利民, 等. 无线传感器网络管理技术[J]. 计算机科学, 2011, 38 (1) : 8-14. ( ZHAO Z H, HUANGFU W, SUN L M, et al. Wireless sensor network management technology[J]. Computer Science, 2011, 38 (1) : 8-14. ) (0)
[4] DONOHO D L. Compressed sensing[J]. IEEE Transactions on Information Theory, 2006, 52 (4) : 1289-1306. doi: 10.1109/TIT.2006.871582 (0)
[5] CANDES E J, TAO T. Near-optimal signal recovery from random projections: universal encoding strategies?[J]. IEEE Transactions on Information Theory, 2007, 52 (12) : 5406-5425. (0)
[6] 陈善雄, 何中市, 熊海灵, 等. 一种基于压缩感知的无线传感信号重构算法[J]. 计算机学报, 2015, 38 (3) : 614-624. ( CHEN S X, HE Z S, XIONG H L, et al. A reconstruction algorithm of wireless sensor signal based on compressed sensing[J]. Chinese Journal of Computers, 2015, 38 (3) : 614-624. ) (0)
[7] 周剑, 张明新. 无线传感器网络数据的相关性自适应压缩感知[J]. 计算机应用, 2013, 33 (2) : 374-377. ( ZHOU J, ZHANG M X. Correlation adaptive compressed sensing of wireless sensor network data[J]. Journal of Computer Applications, 2013, 33 (2) : 374-377. doi: 10.3724/SP.J.1087.2013.00374 ) (0)
[8] BARON D, DUARTE M F, WAKIN M B, et al. Distributed compressive sensing [C]//Proceedings of the 2010 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway, NJ: IEEE, 2009:2886-2889. (0)
[9] LEINONEN M, CODREANU M, JUNTTI M. Sequential compressed sensing with progressive signal reconstruction in wireless sensor networks[J]. IEEE Transactions on Wireless Communications, 2014, 14 (3) : 1622-1635. (0)
[10] 刘洲洲, 徐继良, 韩莹, 等. 基于压缩感知理论的WSN时序信号分段压缩算法[J]. 传感技术学报, 2016, 29 (1) : 122-128. ( LIU Z Z, XUN J L, HAN Y, et al. Timing signal subsection compression algorithm in WSN based on compressed sensing theory[J]. Journal of Sensors and Actuators, 2016, 29 (1) : 122-128. ) (0)
[11] LUO C, WU F, SUN J, et al. Compressive data gathering for large-scale wireless sensor networks[C]//Proceedings of the 15th Annual International Conference on Mobile Computing and Networking. New York: ACM, 2009:145-56. (0)
[12] XIE R, JIA X. Transmission-efficient clustering method for wireless sensor networks using compressive sensing[J]. IEEE Transactions on Parallel & Distributed Systems, 2014, 25 (3) : 806-815. (0)
[13] DUARTE M F, WAKIN M B, BARON D, et al. Universal distributed sensing via random projections[C]//Proceedings of the Fifth International Conference on Information Processing in Sensor Networks. Piscataway, NJ: IEEE, 2006:177-185. (0)
[14] LI L, LI J. Research of compressed sensing theory in WSN data fusion[C]//Proceedings of the 2011 Fourth International Symposium on Computational Intelligence and Design. Piscataway, NJ: IEEE, 2011:125-128. (0)
[15] 汪鲁才, 赵延昇, 林海军, 等. 基于分布式压缩感知的能量收集WSN[J]. 传感器与微系统, 2014, 33 (7) : 45-48. ( WANG L C, ZHAO Y S, LIN H J, et al. Energy harvesting WSN based on DCS[J]. Transducer and Microsystem Technologies, 2014, 33 (7) : 45-48. ) (0)
[16] HU H, YANG Z. Spatial correlation-based distributed compressed sensing in wireless sensor networks[C]//Proceedings of the 2010 6th International Conference on Wireless Communications Networking and Mobile Computing. Piscataway, NJ: IEEE, 2010:1-4. (0)
[17] CANDES E, ROMBERG J. Sparsity and incoherence in compressive sampling[J]. Inverse Problems, 2007, 23 (3) : 969-985. doi: 10.1088/0266-5611/23/3/008 (0)
[18] LI Z, XU W, TIAN Y, et al. Compressed sensing reconstruction algorithms with prior information: logit weight simultaneous orthogonal matching pursuit[C]//Proceedings of the 2014 IEEE 79th Vehicular Technology Conference. Piscataway, NJ: IEEE, 2015: 1-5. (0)
[19] BODIK P, HONG W, GUESTRIN C, et al. Intel lab data [EB/OL]. [2004-02-28]. http://db.lcs.mit.edu/labdata/labdata.html. (0)