基于脉冲神经网络的冷链制冷机结霜检测方法

引用本文

陈靖宇, 吕毅. 基于脉冲神经网络的冷链制冷机结霜检测方法[J]. 广东工业大学学报, 2023, 40(1): 29-38. DOI: 10.12052/gdutxb.220120.

Chen Jing-yu, Lyu Yi. Frost Detection Method of Cold Chain Refrigerating Machine Based on Spiking Neural Network[J]. JOURNAL OF GUANGDONG UNIVERSITY OF TECHNOLOGY, 2023, 40(1): 29-38. DOI: 10.12052/gdutxb.220120.

基金项目:

国家自然科学基金资助面上项目(62072120)；广东省重点领域研发计划项目(2021B0101200003)

作者简介:

陈靖宇(1973–)，男，高级实验师，硕士生导师，主要研究方向为新一代人工智能芯片与系统、低功耗多芯互连系统、类脑计算，E-mail：genechen@gdut.edu.cn。

文章历史

收稿日期：2022-07-16

Contents Abstract Full text Figures/Tables PDF

基于脉冲神经网络的冷链制冷机结霜检测方法

陈靖宇, 吕毅

广东工业大学计算机学院，广东广州 510006

收稿日期：2022-07-16

基金项目：国家自然科学基金资助面上项目(62072120)；广东省重点领域研发计划项目(2021B0101200003)

作者简介：陈靖宇(1973–)，男，高级实验师，硕士生导师，主要研究方向为新一代人工智能芯片与系统、低功耗多芯互连系统、类脑计算，E-mail：genechen@gdut.edu.cn。

摘要: 针对传统基于图像处理技术的结霜检测方法难以对处于复杂生产环境的冷链制冷机组进行灵活且准确的检测，还易受光照、起雾等环境因素的影响而误判的问题，设计了一种基于脉冲神经网络的冷链制冷机结霜检测方法。该方法以制冷机图像为输入，自动检测制冷机蒸发器结霜区域的动态变化情况，修正因光照、起雾等干扰因素引起的异常，并以脉冲发放率累积值划分双阈值作为结霜程度的判断依据。在多个投入至生产环境的冷链制冷机上进行实验，结果表明所设计的脉冲神经网络能够在实际生产环境下自适应地对制冷机蒸发器的结霜区进行动态区域检测、划分的双阈值可准确判断蒸发器的结霜程度，检测效果良好，稳定性强，可为制定冷链制冷机组除霜策略提供可靠的除霜时刻依据。

关键词: 脉冲神经网络结霜检测动态区域检测制冷机图像

Frost Detection Method of Cold Chain Refrigerating Machine Based on Spiking Neural Network

Chen Jing-yu, Lyu Yi

School of Computer Science and Technology, Guangdong University of Technology, Guangzhou 510006, China

Abstract: The traditional frost detection method based on image processing technology is difficult to flexibly and accurately detect the cold chain refrigeration unit in complex production environment. It is also easy to misjudge due to the influence of environmental factors such as illumination and fog. Therefore, a cold chain refrigerating machine frosting detection method based on spiking neural network is designed. Taking the refrigerator image as the input, the dynamic change of the frosting area of the refrigerator evaporator is automatically detected, the abnormalities caused by interference factors such as illumination and fog are corrected, and the double threshold divided by the cumulative value of pulse emission rate is used as the judgment basis of frosting degree. Experiments are carried out on several cold chain refrigerators put into the production environment. The results show that the designed spiking neural network can adaptively detect the dynamic region of the frosting area of the refrigerator evaporator under the actual production environment and the double threshold which is divided accurately can judge the frosting degree of the evaporator. The detection effect is good and the stability is strong, which can provide a reliable basis for the defrosting time of the defrosting strategy of the cold chain refrigeration unit.

Key words: spiking neural network frost detection dynamic region detection refrigerating machine image

节能减耗属于冷库的设计重点之一且倍受行业关注^[1-2]。制冷机组是冷库中的主要能耗设备，其工作过程中无法避免出现结霜现象。当制冷机表面结霜程度较大时会使其热能转移水平降低^[3]，加大制冷机组能耗，甚至损坏产品。因此，准确地检测出冷库制冷机工作时的结霜程度，对避免制冷机故障的发生尤为重要。

结霜是一个复杂的传热传质的过程，多种因素综合影响着结霜的过程。因此，一些研究人员对冷库温度、湿度、过热度^[4]等多维环境数据进行数学建模，分析结霜状况。这些间接的检测方法因简单、低成本被广泛应用，但也因为方法简单，检测精度普遍不高。如最普遍的温度−时间控制法^[5]被发现大约76.7%^[6]和63%^[7]的除霜操作是不必要的。为提高检测精度，研究人员开始采用精确测量的方式检测结霜程度，如使用扫描探针显微镜^[8]、侧视照片分析^[9]等多种方法测量霜层厚度和霜积累过程。尽管这些方法提高了结霜程度的检测精度，但由于测量点的数量和位置的限制、初始成本高、寿命短以及运行条件复杂，在实际应用中并没有得到广泛的认可。

随着图像处理技术在工程应用中承担着越来越重要的角色^[10]，一些研究人员开始将图像处理技术应用于结霜检测当中。例如，灰度转换和阈值分割技术^[11]直接定量分析霜冻形成过程^[12]。郑雪晶等^[13]提出一种温度−湿度−图像(Temperature-Humidity -Image, T-H-I)的除霜控制方法，其通过图像预处理、灰度转换和多阈值分割技术对霜层视觉特征进行量化，在避免不良除霜现象方面具有一定的效果。然而，基于灰度转换和阈值分割的检测方法局限于输入为蒸发器局部图像的情况，但是采用摄像头获取的处于实际生产环境下的制冷机图像中还包含了除制冷机外的多种事物，其难以自适应地将所需要检测蒸发器的区域划分出来，其余无关事物的变化会影响其检测效果，并且基于灰度的检测方法会因为光照及雾气等影响亮度的因素而降低精度^[14]。

近几年，神经网络在图像处理方面展现出了得天独厚的优势，但目前并没有研究人员使用图像加神经网络的方法对结霜进行检测。其中，以脉冲的形式实现神经元之间信息传输的脉冲神经网络(Spiking Neural Network, SNN)^[15]在神经元模型、突触模型、学习机制上具有很强的生物合理性^[16]，与真实生物神经网络高度接近。目前，已有一些研究人员利用SNN对模式识别进行研究，如Masquelier等^[17]利用HMAX结合SNN对人脸、摩托车和背景进行有效区分。Orchard等^[18]提出了基于事件触发机制的Hfirst模型，增强了动态物体的场景特征，可以从复杂背景中定位结构化目标。并且，SNN能模拟人体视觉功能识别图像中变化的信息，如蔡荣太等^[19]使用脉冲序列对像素灰度值或目标特征参数进行编码，通过模拟视觉皮层来检测视频流中的运动目标。由此，SNN处理具有时序特点的数据有一定优势^[20]，且其可应用于捕捉图像的动态变化。但是，结霜是一个连续变化和变化累积的过程，因此不仅需要捕捉到其动态变化，并且还需检测出其在变化时间上的累积强度，即结霜程度。

综上所述，本文提出了一种基于SNN的冷链制冷机结霜程度检测方法，SNN以LIF(Leaky Intergrate and Fired)脉冲神经元^[21]为神经元模型，以脉冲时间依赖可塑性(Spike Timing Dependant Plasticity, STDP)^[22]为权重更新规则设计动态区域检测模块，以双阈值划分设计结霜检测模块，并且提出异常帧差图像检测和修正算法。在多个位于实际生产环境中的冷库制冷机开展实验测试，实验结果表明本文提出的SNN能够自适应环境，对处于不同冷库的多个制冷机能较好地识别出其动态区域，在出现异常的亮度变化时能进行修正，避免干扰检测结果，结霜检测模块能提供合理的结霜程度检测。

1 脉冲神经网络的设计

针对当前传统图像处理技术难以解决的一些问题，如不灵活、易受环境影响等，本文在设计用于制冷机结霜程度检测的脉冲神经网络时，以动态区域检测、异常修正、结霜程度检测作为重心展开设计。

1.1 动态区域检测模块

基于传统图像处理技术的结霜检测方法要求摄像头的位置固定并且聚焦于制冷机的局部区域^[13]，这不仅不够灵活并且会因为摄像头的位置发生偏移或者结霜位置发生偏移而影响精度。而在处于生产环境下的冷链制冷机组情况相对复杂，摄像头位置和结霜位置多变，所以无法固定位置。此外，冷库摄像头所获取的图像不仅仅包含制冷机，还有冷库中活动的工作人员或车辆等其余背景事物，这便需要网络能自适应地将检测区域聚焦在制冷机蒸发器结霜变化的区域。

摄像头获取的图像中，每个事物都有变化的可能，但不同事物变化的频率不同，制冷机非结霜区域和背景区域变化频率较低，制冷机结霜的区域变化频率中等，其余为异常高频变化。变化在图像中最直观的体现为时序上相邻的帧之间存在灰度差，非动态区域体现为零灰度差或较低的灰度差，结霜区域体现为中等的灰度差。

因此，动态区域检测模块以时序的冷链制冷机组图像为数据集，以时序上相邻的两个图像的帧差图像作为模块的输入。每一张帧差图像的灰度值体现的是该时刻图像对于上一间隔时刻图像的灰度变化大小，多个帧差图像的累积反映为图像灰度的变化程度，变化程度中等的区域在一定程度上体现出制冷机结霜的变化区域。然而，非结霜区域同样存在一定的灰度差，因此仅靠帧差图像灰度值的累积并不能有效把结霜区域识别出来。而脉冲神经元需要足够强且持续的兴奋信号刺激才会发放脉冲，由此可以初步减轻变化程度低的区域带来的影响。所以，结霜检测模块设置了一个兴奋层，目的是通过兴奋层神经元脉冲发放率的累计值反映图像变化程度。

另外，为了将结霜变化区域和变化频率低的区域进一步区分，本文引入STDP权重更新机制和侧抑制机制。STDP的作用是将脉冲发放率高的兴奋神经元的前连接增强，将脉冲发放率低的兴奋神经元的前连接减弱，由此将变化程度相对较高的区域连接增强，使其对应的脉冲神经元更易发放脉冲，相反，变化程度低的区域对应的脉冲神经元更难发放脉冲。其次，在兴奋层后面设置一个抑制层，目的是通过抑制神经元对兴奋层中未发放脉冲的兴奋神经元发送抑制信号，进一步降低其发放脉冲的可能。最后，为了筛选出累积脉冲发放率中等的区域，本文对累积脉冲发放率进行频率直方图分析，将分布在中部区间的神经元对应的像素点作为动态区域。

综上所述，本文设计了脉冲神经网络的动态区域检测模块，模块网络结构如图1所示，其中包括编码层、兴奋层、抑制层。

图 1 动态区域检测模块网络结构 Figure 1 Network structure of dynamic area detection module

首先，经过灰度化和缩放处理后的图像在进入编码层前进行帧差处理，其帧差公式如式(1) 所示。

$ {S}_{t}\left(x,y\right) ={f}_{t}\left(x,y\right) -{f}_{t-1}\left(x,y\right) $

(1)

式中： $ {S}_{t}\left(x,y\right) $ 为当前时刻图像与前一间隔时刻图像的帧差结果。 $ {f}_{t}\left(x,y\right) $ 为当前时刻的图像， $ {f}_{t-1}\left(x,y\right) $ 为前一间隔时刻的图像，为了保证帧差后图像的像素值依然保持在0至255之间，其帧差操作公式如式(2) 所示。

$ {D}_{t}\left(x,y\right) =\frac{\left({S}_{t}\left(x,y\right) -\mathrm{m}\mathrm{i}\mathrm{n}\left({S}_{t}\left(x,y\right) \right) \right) \times 255}{\mathrm{m}\mathrm{a}\mathrm{x}\left(\left({S}_{t}\left(x,y\right) -\mathrm{m}\mathrm{i}\mathrm{n}\left({S}_{t}\left(x,y\right) \right) \right) \right) } $

(2)

式中： $ {D}_{t}\left(x,y\right) $ 为帧差图像。

编码层的作用是将每一个像素值通过泊松编码成脉冲序列，脉冲发放频率与像素值成正比，对于基于STDP规则的更新规则，泊松编码有较高的效率^[23]。

编码层对兴奋层的连接采用STDP规则进行权重更新，STDP是调控自身神经元与其他神经元之间连接强度的生物学过程，其根据神经元之间输入脉冲的相对时序调整连接强度，输入脉冲之间存在时序依赖的连接增强，时序依赖弱的连接则不变或降低^[24]。本文所使用的STDP规则表达如式(3) 所示。

$ \left\{\begin{array}{l}\Delta w=\eta \left({x}_{\mathrm{p}\mathrm{r}\mathrm{e}}-{x}_{\mathrm{t}\mathrm{a}\mathrm{r}}\right) {\left({w}_{\mathrm{m}\mathrm{a}\mathrm{x}}-w\right) }^{\mu }\\ {\tau }_{{x}_{\mathrm{p}\mathrm{r}\mathrm{e}}}\dfrac{\mathrm{d}{x}_{\mathrm{p}\mathrm{r}\mathrm{e}}}{\mathrm{d}t}=-{x}_{\mathrm{p}\mathrm{r}\mathrm{e}}\end{array}\right.$

(3)

式中： $ \Delta w $ 为突触权重增量，在突触前神经元发放脉冲时进行更新， $ w $ 为当前时刻的突触权重， $ {w}_{\mathrm{m}\mathrm{a}\mathrm{x}} $ 为突触权重更新上限值。 $ \eta $ 为权重更新率， $ \mu $ 为确定更新对上一时刻权重的依赖性。 $ {\tau }_{{x}_{\mathrm{p}\mathrm{r}\mathrm{e}}} $ 为衰退的时间常量， $ {x}_{\mathrm{p}\mathrm{r}\mathrm{e}} $ 为突触前迹，其记录的是最近的突触前脉冲历史且随常量 $ {\tau }_{{x}_{\mathrm{p}\mathrm{r}\mathrm{e}}} $ 衰退，当突触前脉冲到达突触时， $ {x}_{\mathrm{p}\mathrm{r}\mathrm{e}} $ 设置为1， $ {x}_{\mathrm{t}\mathrm{a}\mathrm{r}} $ 为突触后神经元发放脉冲时的突触前迹值。

兴奋层和抑制层所使用的神经元为Diehl等^[25]调整后的LIF脉冲神经元模型，在数学角度上，脉冲神经元是一个复杂的系统：神经元根据生物物理方程改变自身状态，一般用微分方程表示，如随机性或确定性微分方程、普通或偏微分方程，它通过接收突触传来的脉冲信号引起膜电位、膜电压等变量的变化。本文LIF神经元动力学方程如式(4) 所示。

$ \left\{\begin{array}{l}\tau \dfrac{\mathrm{d}V}{\mathrm{d}t}=\left({E}_{\mathrm{r}\mathrm{e}\mathrm{s}\mathrm{t}}-V\right) +{g}_{{\rm{e}}}\left({E}_{\mathrm{e}\mathrm{x}\mathrm{c}}-V\right) +{g}_{{\rm{i}}}\left({E}_{\mathrm{i}\mathrm{n}\mathrm{h}}-V\right) \\ {\tau }_{{g}_{{\rm{e}}}}\dfrac{\mathrm{d}{g}_{{\rm{e}}}}{\mathrm{d}t}=-{g}_{{\rm{e}}}\\ {\tau }_{{g}_{{\rm{i}}}}\dfrac{\mathrm{d}{g}_{{\rm{i}}}}{\mathrm{d}t}=-{g}_{{\rm{i}}}\end{array}\right.$

(4)

式中： $ \tau $ 为膜时间常量，V为神经元膜电位，t为生物周期时刻， $ {E}_{\mathrm{r}\mathrm{e}\mathrm{s}\mathrm{t}} $ 为静息电位， $ {E}_{\mathrm{e}\mathrm{x}\mathrm{c}} $ 为兴奋性突触平衡电位， $ {E}_{\mathrm{i}\mathrm{n}\mathrm{h}} $ 为抑制性突触平衡电位， $ {g}_{{\rm{e}}} $ 为兴奋性突触电导， $ {g}_{{\rm{i}}} $ 为抑制性突触电导， $ {\tau }_{{g}_{{\rm{e}}}} $ 和 $ {\tau }_{{g}_{{\rm{i}}}} $ 分别为兴奋性突触和抑制性突触后电位的时间常数。

兴奋层神经元接收来自编码层与抑制层的信号，编码层神经元对兴奋层神经元一对一兴奋连接，且连接采用STDP规则进行权重更新。兴奋层对抑制层一对一兴奋连接且权重固定，抑制层对兴奋层全抑制连接(除了与之对应的兴奋神经元以外)且权重固定，便于调整抑制层的抑制程度。抑制层的作用是引入侧抑制机制，通过传递抑制信号降低未发放脉冲的兴奋神经元的膜电位，使其膜电位更难达到发放脉冲的阈值，由此降低噪声的同时抑制不活跃的区域，有利于突出动态区域。兴奋层的作用是确定动态区域，统计每个兴奋神经元的脉冲发放率，通过频率直方图，将低频率及高频率的神经元去除，余下的神经元对应的像素点即被选为动态区域。频率直方图设置为10个区间，动态区域选择为首次频率下降后的4个区间，动态区域的表达式如式(5) 所示。

$ \left\{\begin{array}{l}A=\left\{(x,y) |x\equiv i({\rm{mod}}w) ,y=⌊i÷w⌋+1,i\in I\right\}\\ I=\left\{i|{B}_{l}\le {N}_{i}\le {B}_{l+4},i=\mathrm{1,2},3,\cdot \cdot \cdot ,m\right\}\\ l={\rm{min}}\left\{i\left|\right({C}_{i}-{C}_{i-1}) \le 0,i=\mathrm{2,3},4,\cdot \cdot \cdot ,10\right\}\end{array}\right. $

(5)

式中：A为动态区域在图像中的二维坐标，w为图像的宽，I为被归为动态区域的兴奋神经元编号集合， $ {N}_{i} $ 为编号为i的兴奋神经元脉冲发放率， $ {B}_{l} $ 为频率直方图第i个区间左边界的脉冲发放率，m为动态检测模块里兴奋层神经元数目，l为被归为动态区域的首个区间， $ {C}_{i} $ 为第i个区间兴奋神经元的频率。

1.2 异常检测及修正

环境照明水平会影响基于图像处理技术的结霜检测方法的准确性。同样的，冷库制冷机运行的过程中，因为除霜过程起雾或灯光明暗变化，部分图像帧差操作后超出正常灰度范围，帧差操作后的图像会出现异常的高像素值或低像素值。并且，异常帧差图像在整体输入中占比少，出现的时间短以及会出现较高的灰度值波动。因此，可利用相邻帧差图像之间的变化差异超过平均变化值来判断异常。另外，由于相邻的帧差图像之间具有时序关系，因此以前一间隔的帧差图像作基准进行修正。

综上，异常帧差图像修正的算法设计思路如下：(1) 以当前时刻之前所有输入图像的灰度差的平均绝对值作为辅助判断的依据；(2) 以前一间隔时刻的帧差图像作为基准，采用逐像素平移修正。

当前时刻的图像与前一间隔时刻图像帧差后的 $ {D}_{t}\left(x,y\right) $ 的平均灰度表示为 $ {M}_{t} $ ，前一间隔时刻帧差后的 $ {D}_{t-1}\left(x,y\right) $ 的平均灰度表示为 $ {M}_{t-1} $ ，两个帧差图像平均灰度差的绝对值为

$ {U}_{t}=\left|{M}_{t}-{M}_{t-1}\right| $

(6)

若在当前时刻之前已输入t张帧差图像，则这t张帧差图像平均灰度差绝对值的平均值为

$ {\mathrm{A}\mathrm{V}\mathrm{G}{U}}_{t}=\frac{{\displaystyle\sum }_{i=1}^{t}{U}_{t}}{t} $

(7)

式中：以 $ {\mathrm{A}\mathrm{V}\mathrm{G}{U}}_{t}\times r $ 作为当前图像异常的基础判断阈值；r为阈值系数，取2.5。若当前时刻为t并且符合 $ {U}_{t}\ge {\mathrm{A}\mathrm{V}\mathrm{G}{U}}_{t}\times r $ 时，则认为 $ {D}_{t}\left(x,y\right) $ 帧差图像异常，对 $ {D}_{t}\left(x,y\right) $ 采用逐像素修正，判断修正过程如算法1所示。

算法1 　异常帧差图像检测及修正算法

　输入：该时刻帧差图像与前一时刻帧差图像。

　输出：修正后的该时刻帧差图像。

　a) 通过式(6) 计算 $ {{U}_{t} }$

　b) 通过式(7) 计算 $ { {\mathrm{A}\mathrm{V}\mathrm{G}U}_{t} }$

　c) 判断 $ {{U}_{t} }$ 是否大于阈值，若大于执行d) ，若小于则退出

　d) for 该时刻帧差图像所有像素点

　e) if 该点像素值大于 $ { {\mathrm{A}\mathrm{V}\mathrm{G}U}_{t}\times r }$

　f) 方向=该时刻像素值对应前一间隔时刻像素值的变化正负符号

　g) 修正像素值=前一间隔时刻像素值+方向 $ { {\times \mathrm{A}\mathrm{V}\mathrm{G}{U}}_{t-1}}$

　h) if end

　i) for end

　j) 返回修正后的该时刻帧差图像

算法分为两个层次，第一层在整体上判断帧差图像是否异常，当被整体判断为异常图像时，进入第二层循环异常帧差图像所有像素点，修正每一个异常的像素值，保证做到只修正异常的像素点，其余正常的不变。

1.3 结霜检测模块

不同于动态区域检测模块注重灰度的强度区别和位置分布，结霜检测模块更注重的是亮度的细微变化强度。由于对初始图像使用平均池化进行了放缩处理，所以放缩后图像的每一个像素点实际在原图上代表的是一片小的区域，而相邻时刻图像对应的像素点的差代表的是该区域的变化，由亮度低到亮度高的差为负，由亮度高到亮度低的差为正，亮度不变则差为零。因此，若当前时刻对于前一间隔时刻有结霜现象时，帧差数据正数占比多。在动态区域检测结果的基础上进行的帧差数值代表的是该时刻动态区域准确的结霜变化。并且，因为持续的兴奋输入才能使脉冲神经元发放脉冲，所以兴奋神经元脉冲发放率的累积值代表的是结霜动态区域的变化程度，即霜的累积程度。综上，结霜检测模块设计思路为：(1) 以时序上相邻的图像直接相减的帧差数据作为输入；(2) 编码层对兴奋层的全连接包含兴奋连接和抑制连接；(3) 以兴奋神经元的脉冲发放率构建结霜变化累积曲线，确定双阈值作为结霜判定依据。

结霜检测模块的网络结构如图2所示，包含编码层、兴奋层和判别器。当前时刻图像动态检测区域的灰度值与前一间隔时刻图像动态检测区域的灰度值进行减法操作得到帧差数据，帧差数据表达如式(8) 所示。

图 2 结霜检测模块网络结构 Figure 2 Network structure of frost detection module

${\mathrm{D}\mathrm{M}}_{t}\left(x,y\right) =\left\{{f}_{t}\left(x,y\right) -{f}_{t-1}\left(x,y\right) \left|\right(x,y) \in A\right\}$

(8)

式中： $ {\mathrm{D}\mathrm{M}}_{t}(x,y) $ 为帧差数据， $ A $ 为动态区域在图像中的二维坐标。

编码层对帧差数据的绝对值进行泊松编码，编码层神经元对兴奋层神经元的连接为全突触连接，并且突触发放的信号类型取决于编码层神经元对应帧差数据中数值的正负符号，若值为正则是兴奋信号，反之则是抑制信号。

兴奋层神经元的平均脉冲发放率反映的是当前时刻图像对于前一间隔时刻变化的程度。结霜是一个缓慢变化且速度不固定的过程，而每一次变化的总和组成结霜的整体过程。多个时序图像的平均脉冲发放率累积形成变化曲线，曲线的表达公式如式(9) 所示。

$ G\left(t\right) ={\sum }_{j=1}^{t}\frac{{\displaystyle\sum }_{i=1}^{m}{N}_{i}^{j}}{m}$

(9)

式中： $ G\left(t\right) $ 为t个时刻图像的累积变化值， $ {N}_{i}^{j} $ 为第i个兴奋神经元在第j个时刻图像的脉冲发放率，m为结霜检测模块中兴奋层神经元的总个数。

本文的判别器将结霜程度分为3个等级：轻度结霜、中度结霜和重度结霜。结霜程度表示函数如式(10) 所示。

$ F\left(t\right) =\left\{ {\begin{array}{*{20}{l}} {\rm{RG}},&0\le G\left(t\right) \le {K}_{1}\\ {\rm{MD}},&{K}_{1}\le G\left(t\right) \le {K}_{2}\\ {\rm{HY}},&{K}_{2}\le G\left(t\right) \end{array}} \right.$

(10)

式中：F(t) 为t时刻的图像结霜程度，K₁、K₂为判定结霜程度的双阈值。若G(t) 在0到K₁之间则将该时刻的图像归类为轻度结霜，F(t) 标志为RG；若G(t) 在K₁到K₂之间则将该时刻的图像归类为中度结霜，标志为MD；其余则归类为重度结霜，F(t) 标志为HY。

2 实验结果与分析

本文以具有centos7.5.0操作系统、512G内存，并且配有Intel(R) Xeon(R) Gold 6238 CPU的服务器为测试平台，以python3.7为编程环境。图像集采集自实际生产环境下的冷链冷库的5个摄像头。

2.1 动态区域检测实验

摄像头获取的初始图像尺寸为(3,1176,2304) ，经灰度化与8×8的过滤器平均放缩后图像尺寸为(147,288)。因此，动态区域模块的编码层、兴奋层、抑制层的神经元个数都为147×288=42336。为了合理化网络结构的生物意义，网络中的参数选取均在生物学的合理范围内，包括膜电位的时间常数为0.1 s、脉冲间隔为0.1 ms和时间窗口为0.2 s等。编码层与兴奋层神经元之间的突触权重在0~2.25之间随机生成，兴奋层与编码层神经元之间的兴奋突触固定为0.02，抑制突触固定为0.015。

实验采用5组摄像头24 h间隔1 min采集的图像，即每组1440张图像，每一组图像单独输入至脉冲神经网络中。其中第1，2组在一个冷库，第3，4，5组在另一个冷库。图3为所设实验组动态区域图的结果对比。

图 3 五组数据集的动态区域结果对比 Figure 3 Comparison of dynamic regional results of five data sets

在图3中，(a)为从每组数据集随机抽取作为代表的制冷机示例图像，(b)为兴奋神经元脉冲发放率的频率点图，(c)为兴奋神经元发放率的频率直方图，(d)为动态区域检测的结果。结合频率点图与输入图可以看出，发放率高的兴奋神经元集中在图像中部(即制冷机可结霜的区域)，神经元发放率从制冷机到环境背景逐渐降低，发放率低的兴奋神经元集中在图像边缘或特殊区域(即背景环境或制冷机非结霜的区域)。动态区域结果由兴奋神经元脉冲发放率与直方图通过式(5)得出，将动态区域结果和输入示例图作对比可发现，从视觉效果上看本文的动态区域检测模块能比较准确地找出制冷机结霜区的代表点，排除非蒸发器的区域，验证了模块的正确性。同时，根据冰晶的生成需要依附在冷表面或其他冰晶上的特性^[26]，冰晶成小片生长，因此动态区域结果的代表点能代表该点周围像素点的结霜变化情况。

为进一步对检测结果进行分析，本文将摄像头获取的原始图像划分成制冷机结霜区和非结霜区，然后将5组数据集的动态区域结果与原始图像进行像素对比。统计5组数据集的动态区域像素点数和其在总像素点数的占比，以及动态区域中非结霜区的像素点数和占比，实验结果如表1所示。

表 1 5组数据集的动态区域像素数及占比对比 Table 1 Comparison of the number and proportion of dynamic area pixels in five data sets

在表1中，5组动态区域像素点数在总像素点数的平均占比为15.29%，其中处于非结霜区的动态区域像素点的平均占比为4.438%。这说明本文检测模块的错误率低，被错误划分的像素点的输入量占比低，不足以影响结霜的判断，并且说明检测模块还能够较大地减少无效数据输入，降低计算量，从而加快运行速度。

2.2 异常检测及修正实验

冷链在工作过程中，为了节省能源，在夜间会将工作灯源关闭。此时采集的图像经帧差操作后会出现如图4所示短暂时刻的亮度异常变化，但进入夜间后由于只关注图像为前后间隔时刻的变化，帧差图像恢复正常。这说明使用帧差图像不仅能够有效捕捉异常情况，还能有效降低环境亮度变化带来的影响。另外，从图4可以看出，当冷库亮度发生变化或存在起雾情况时，帧差图像的平均灰度已经超过了正常范围。

图 4 异常情况示例 Figure 4 Examples of abnormal conditions

在本实验中，以 $ {\mathrm{A}\mathrm{V}\mathrm{G}{U}}_{t}\times 2.5 $ 为阈值进行异常判断，以 $ {\mathrm{A}\mathrm{V}\mathrm{G}{U}}_{t-1} $ 为增量将异常图像逐像素值修正至正常范围。不同时间维度中的异常图像修正过程如图5和图6所示。

图 5 异常情况及修正情况的三维曲面图对比 Figure 5 Three-dimensional surface chart comparison of abnormal conditions and corrected conditions

图 6 修正前后帧差图像绝对平均灰度差曲线对比 Figure 6 Comparison of absolute average gray difference curve of frame difference image before and after correction

从单时刻的角度出发。在图5中，异常帧差图像的三维曲面图的整体像素值处于波动大和不均匀的状态，其中灯光情况的异常集中体现在帧差图像边缘因背景引起的明显高灰度差，而起雾情况的异常体现在帧差图像整体的灰度变化不均匀。经修正后，三维曲面图的整体像素值处于均匀且波动小的状态，与常态帧差图像的三维曲面状态一致。

从整体时序图像的角度出发，由图6可以发现：(1) 未修正的阈值曲线在异常图像的干扰下，变化幅度比修正后大，并处于修正后的阈值曲线之上；(2) 修正后的绝对平均灰度差曲线趋于稳定，同时修正后的帧差图像会以下一时刻的 $ {\mathrm{A}\mathrm{V}\mathrm{G}{U}}_{t} $ 参与到后续图像的异常判断中，有利于给网络提供稳定且非异常的输入。

为了验证异常修正算法在网络中的作用，本文在图像输入动态区域检测模块前进行异常检测及修正，结果从图7可以看出，使用了修正算法比未使用修正算法的动态区域识别结果更集中在结霜区域，处于非结霜区的噪声更少。另外，修正后的动态区域中的非结霜区占比为3.934%，比未修正前占比低10.76%。

图 7 修正前后动态区域结果对比 Figure 7 Comparison of dynamic regional results before and after correction

综上实验结果，本文的异常修正算法不仅能准确识别异常图像，还能将异常图像修正为正常变化的图像，消除异常图像对网络带来的大部分干扰，从而提高动态区域检测的效果。

2.3 结霜检测实验

结霜检测模块的兴奋神经元个数为400，编码层至兴奋层的全突触连接权值在0.2~0.3之间随机选择，其中连接突触类型取决于输入的帧差矩阵数值符号。实验数据为4组(A组、B组、C组、D组)摄像头时间间隔1 min采集的一次完整结霜图像，其中A组和B组用于得出结霜检测模块的双阈值，C组和D组作为测试集对所得的双阈值进行测试。实验前让10位冷库工作人员对C组和D组数据集进行人为标注结霜程度，取10人中占比最高的标注作为图像最终标签，以避免人为标注带来的主观偏差，其中标签结果分为3个等级：轻度结霜、中度结霜、重度结霜。

首先，在进行结霜检测前，对实验所检测的制冷机提前进行预备动态区域检测，动态检测与结霜检测数据集相互独立，前者为后者提前一天采集的图像。然后，基于各数据集的动态区域过滤结霜检测数据，并以时序顺序输入至网络，统计每一输入时刻兴奋神经元的平均脉冲发放率，并且不断累积以形成结霜曲线。

图8为A组和B组图像集的结霜变化累积曲线，其表示的是制冷机结霜变化累积的情况。所得结果的累积曲线上升趋势基本相同，并且当t大于1300时，两组曲线均增长缓慢。这说明此时制冷机实际结霜情况已经超过严重程度，结霜变化小，帧差矩阵数值接近为0，从而单个时刻的平均脉冲发放率接近0。以两组曲线的最大结霜变化累积值的平均值2180为上界，0为下界，将纵轴划分为三等份，以划分点726、1453作为阈值K₁、K₂。从图8所划分的三个等级的数据中，各自随机抽取一个时刻的图像，观察其实际的制冷机图像。图9为图8中各点对应的实际制冷机图像，从中可以看出，抽取的图像在视觉上能对应其被划分的结霜程度。

图 8 结霜变化累积曲线 Figure 8 Frost accumulation curve

图 9 不同数据集的单时刻制冷机图像 Figure 9 Single time refrigerating machine images from different datasets

为验证所划分K₁、K₂阈值的合理性和准确性，本实验把C组和D组测试集分别独立地使用本文方法进行结霜检测。并且，由于目前基于传统图像处理技术的结霜检测方法大部分都如文献[13]和文献[14]，采用像素灰度值加阈值的方式对图像进行结霜检测，所以也使用灰度值加阈值的检测方式对C组和D组测试集进行实验。另外，为进一步验证动态区域的稳定性和适用性，还将动态区域与灰度值加阈值的检测方式相结合进行实验。实验结果的混淆矩阵及各矩阵的F1-score如图10所示。

图 10 各方法结霜检测结果的混淆矩阵及F1-score对比 Figure 10 Comparison of confusion matrix and F1-score of frost detection results of various methods

从图10(a)可以发现，因为结霜等级呈递进形式并且输入的图像有时序的特性，所以轻度结霜和重度结霜相互之间不会出现误判，即不会出现越级的误判。另外，由于图像有时序的特性，对于同一数据集若存在被误判为中度结霜等级的轻度结霜图像，则必不会出现误判为轻度结霜等级的中度结霜图像，即仅会出现单向误判。由此降低误判情况类型的发生，在一定程度上稳定了检测模块的效果。从图10(b)和图10(c)中可以发现，灰度值加阈值方法的检测结果中，近一半的图像都被判别成轻度结霜，这是因为在夜间的生产环境下灯光被关闭，夜间获取的图像灰度值偏低，所以一半的中度结霜和重度结霜图像被误判成轻度结霜。并且对比图10(b)与图10(c)发现，结合了动态区域的灰度值加阈值的检测方法比未结合的方法判定正确的图像数更多，而且在图10(d)中的宏平均值为0.059。这进一步说明动态区域的效果较好，能降低图像中的与结霜检测无关数据，并能提高其他基于图像处理技术的结霜检测方法的效果。

图10(d)为各混淆矩阵的F1-score和宏平均值，从中可以发现本文检测方法的宏平均要远高于基于灰度值加阈值的检测方法，更加体现出后者难以处理复杂的环境变化情况，在出现灰度差异大的情况时会极大地影响其检测效果，但其优势在于没有时序依赖，可对单独时刻的图像进行判别。本文的检测模块使用两个时刻的帧差矩阵作为输入，在夜间整体灰度暗的境况下仅会关注图像灰度的变化，不会关注图像本身的灰度大小，并且异常修正算法将明暗交替时刻出现的异常帧差数据修正，因此不会受灯光变化的影响，在复杂的情况下依然能保持灵活且准确的判别。

3 结论

本文针对传统图像处理技术在冷链制冷机结霜检测上的局限提出了一种基于脉冲神经网络的制冷机结霜检测方法。网络中基于STDP规则和侧抑制机制的动态检测模块以时序的帧差图像为输入，以制冷机动态变化区域为输出，实现环境自适应的同时降低噪声输入和计算量，提高检测精度和计算效率。针对冷库出现起雾变化和灯光变化提出帧差图像逐像素修正算法。以结霜检测模块中兴奋神经元的平均脉冲发放率累积形成的变化曲线为基础，划分出结霜程度判断的双阈值K₁和K₂。

实验证明，本文提出的脉冲神经网络有效地自适应检测出冷链制冷机图像的结霜动态区域，同时输入网络的数据量平均降低至15.29%且检测平均误差率为4.43%；异常修正算法将动态区域检测误差率降低10.76%；结霜判断的双阈值确定为K₁=726和K₂=1453，结霜检测模块的宏平均为0.955。

在后续工作中，将调整动态区域识别模块的具体结构和抑制策略，以扩大动态区域结果覆盖面的同时降低检测误差率；将增加输入数据预处理的步骤，以降低更复杂的环境噪声带来的影响；将冷库温度与湿度等环境数据与结霜检测模块结合，以得出更合理且准确的动态阈值；采用多时间尺度间隔进行帧差操作，捕捉更敏感的信息。

参考文献

[1]	辛修瑞, 牛继开, 白鑫源, 等. 冷库发展现状以及节能与环保[J]. 家电科技, 2018(3): 22-23. DOI: 10.3969/j.issn.1672-0172.2018.03.010.
[2]	慕飞鸿. 从节能高效简述土建冷库的建筑优化设计[J]. 绿色环保建材, 2019(8): 76-77. DOI: 10.16767/j.cnki.10-1213/tu.2019.08.059.
[3]	WANG W, FENG Y C, ZHU J H, et al. Performances of air source heat pump system for a kind of mal-defrost phenomenon appearing in moderate climate conditions[J]. Applied Energy, 2013, 112(C): 1138-1145.
[4]	JIANG Y Q, DONG J K, QU M L, et al. A novel defrosting control method based on the degree of refrigerant superheat for air source heat pumps[J]. International Journal of Refrigeration, 2013, 36(8): 2278-2288. DOI: 10.1016/j.ijrefrig.2013.05.016.
[5]	BUICK T R, MCMULLAN J T, MORGAN R, et al. Ice detection in heat pumps and coolers[J]. International Journal of Energy Research, 1978, 2(1): 85-98. DOI: 10.1002/er.4440020109.
[6]	GE Y J, SUN Y Y, WANG W, et al. Field test study of a novel defrosting control method for air-source heat pumps by applying tube encircled photoelectric sensors[J]. International Journal of Refrigeration, 2016, 66: 133-144. DOI: 10.1016/j.ijrefrig.2015.07.004.
[7]	ZHU J, SUN Y, WEI W, et al. A novel Temperature-Humidity-Time defrosting control method based on a frosting map for air-source heat pumps[J]. International Journal of Refrigeration, 2015, 54: 45-54. DOI: 10.1016/j.ijrefrig.2015.02.005.
[8]	MATSUMOTO K, KOSHIZUKA M, HONDA M, et al. Measurement on nano scale by scanning probe microscope for obtaining real ice adhesion force[J]. International Journal of Refrigeration, 2014, 41: 181-189. DOI: 10.1016/j.ijrefrig.2014.01.009.
[9]	WANG F, LIANG C, YANG M, et al. Effects of surface characteristic on frosting and defrosting behaviors of fin-tube heat exchangers[J]. Applied Thermal Engineering, 2015, 75(C): 1126-1132.
[10]	侯普秀, 蔡亮, 虞维平. 霜层生长初期冰晶体结构实验研究及分形分析[J]. 应用科学学报, 2007(2): 193-197. HOU P X, CAI L, YU W P. Experimental study and fractal analysis of ice crystal structure at initial period of frost formation[J]. Journal of Applied Sciences, 2007(2): 193-197. DOI: 10.3969/j.issn.0255-8297.2007.02.016.
[11]	CAI L, WANG R, HOU P, et al. Study on restraining frost growth at initial stage by hydrophobic coating and hygroscopic coating[J]. Energy and Buildings, 2011, 43(5): 1159-1163. DOI: 10.1016/j.enbuild.2010.09.012.
[12]	LIU Y M, LIU Z L, HUANG L Y. Experimental and theoretical investigations of the fractal characteristics of frost crystals during frost formation process[J]. Experimental Thermal and Fluid Science, 2011, 36(1): 217-223.
[13]	ZHENG X J, SHI R, YOU S J, et al. Experimental study of defrosting control method based on image processing technology for air source heat pumps[J]. Sustainable Cities and Society, 2019, 51(C): 101667.
[14]	LI Z Y, WANG W, SUN Y Y, et al. Applying image recognition to frost built-up detection in air source heat pumps[J]. Energy, 2021(5): 121004.
[15]	YU Q, TANG H J, TAN K C, et al. Rapid feedforward computation by temporal encoding and learning with spiking neurons[J]. IEEE Transactions on Neural Networks and Learning Systems, 2013, 24(10): 1539-1552. DOI: 10.1109/TNNLS.2013.2245677.
[16]	BOHTE S M, KOK J N, POUTRÉ H L. Error-backpropagation in temporally encoded networks of spiking neurons[J]. Neurocomputing, 2002, 48(1): 17-37.
[17]	MASQUELIER T, THORPE S J. Unsupervised learning of visual features through spike timing dependent plasticity[J]. PLoS Computational Biology, 2007, 3(2): e31. DOI: 10.1371/journal.pcbi.0030031.
[18]	ORCHARD G, MEYER C, ETIENNE-CUMMINGS R, et al. HFirst: a temporal approach to object recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(10): 2028-40. DOI: 10.1109/TPAMI.2015.2392947.
[19]	CAI R T, WU Q, PING W, et al. Moving target detection and classification using spiking neural networks[C]// Proceedings of the Second Sino-foreign-interchange conference on Intelligent Science and Intelligent Data Engineering: Springer, Berlin, Heidelberg, 2011: 210-217.
[20]	蔺想红, 王向文, 张宁, 等. 脉冲神经网络的监督学习算法研究综述[J]. 电子学报, 2015, 43(3): 577-586. LIN X H, WANG X W, ZHANG N, et al. Supervised learning algorithms for spiking neural networks: a review[J]. Acta Electronica Sinica, 2015, 43(3): 577-586. DOI: 10.3969/j.issn.0372-2112.2015.03.024.
[21]	FENG J, BROWN D. Integrate-and-fire models with nonlinear leakage[J]. Bulletin of Mathematical Biology, 2000, 62(3): 467-81. DOI: 10.1006/bulm.1999.0162.
[22]	MOON J, WU Y T, ZHU X J, et al. Neural connectivity inference with spike-timing dependent plasticity network[J]. Science China Information Sciences, 2021, 64(6): 10.
[23]	徐彦, 杨静. 脉冲神经元序列学习方法的影响因素研究[J]. 计算机工程, 2015, 41(11): 194-201. XU Y, YANG J. Research on affect factors of spiking neuron sequence learning method[J]. Computer Engineering, 2015, 41(11): 194-201. DOI: 10.3969/j.issn.1000-3428.2015.11.034.
[24]	GISON M, MASQUELE R T, HUGUES E. STDP allows fast rate-modulated coding with poisson-like spike trains[J]. PLoS Computational Biology, 2011, 7(10): 100-111.
[25]	DIEHL P U, COOK M. Unsupervised learning of digit recognition using spike-timing-dependent plasticity[J]. Frontiers in Computational Neuroscience, 2015, 9: 99.
[26]	张洋念. 霜层生长过程实验研究与分形模拟[D]. 南京: 东南大学, 2005.