2. 特殊环境机器人技术四川省重点实验室(西南科技大学), 四川 绵阳 621010
2. State Key Laboratory of Robot Technology Used for Special Environment(Southwest University of Science and Technology), Mianyang Sichuan 621010, China
图像在采集及传输过程中极易受到噪声的污染,严重影响图像质量,导致有用信息丢失,使得后续的图像处理,如分割、边缘检测等变得困难,因此图像去噪是数字图像处理中重要的研究内容之一[1]。
2005年Buades等[2]提出了非局部均值(Non-Local Means,NLM)算法,利用图像中存在的大量结构相似的冗余信息来去噪,其性能已被证明优于其他经典的去噪算法,如中值滤波、小波阈值等。
为得到更好的去噪效果,研究人员对NLM进行了改进和完善,但NLM算法存在产生伪影、细节模糊、参数需要手动调节和运算复杂度高等问题,学者们对此进行了大量研究,Chaudhury等[3]提出用欧氏中值代替欧氏均值的NLEM(Non-Local Euclidean Medians)算法,克服了NLM算法在边缘处易产生模糊的缺点,特别适用于噪声较大的情况;黄智等[4]采用混合相似性权重替换传统NLM算法中的高斯核函数,能更好地保留纹理细节和边缘信息,并在噪声标准差较大的情况下具有有效性和鲁棒性;蔡斌等[5]提出了基于图像块相似度度量的非局部均值去噪算法,并加入了预滤波处理,在噪声较大时具有更好的去噪效果;文献[6]和文献[7]将边缘检测引入非局部均值去噪算法,通过预处理突出图像中的细节信息,调节相似性权重,提高了算法的去噪能力,改善了图像的视觉质量。Lan等[8]将NLM算法中的相似性权重看作模糊变量,通过迭代更新权重的值,相比传统NLM算法,在数值指标和视觉效果上均取得了改善;李新春等[9]将新余弦函数与高斯核函数相结合,并引入邻域相似函数度量相似性,解决了NLM算法中的权值分配问题,去噪性能得到提升;Hemalate等[10]提出基于字典学习的非局部均值算法,通过对不同场景下的高分辨率图片进行学习建立字典集,减少搜寻相似图像块的时间,在减小NLM算法的时间复杂度同时保证了去噪效果;Wu等[11]提出的PNLM(Probabilistic Non-Local Means)算法,用概率权重代替传统NLM中的权重,更好地表示了图像块之间的相似性,提高了算法的去噪性能,降低了时间复杂度;Li等[12]将灰度理论与非局部均值算法结合起来,能更好地去除噪声,保留细节,并且减小了计算复杂度;Deledalle等[13]在进行相似性度量时采用不同形状的图像块代替常用的方形图像块,改善了去噪效果,并应用快速傅里叶变换提高了算法速度。
然而上述算法并没有解决NLM算法中滤波参数需要手动调节的缺点,去噪后边缘模糊的问题也没有得到较好的改善,因此本文提出了一种基于图像分割的非局部均值去噪算法(Image Segmentation based Non-Local Means, ISNLM)。整个算法分两个阶段:在第一阶段首先根据噪声大小及图像结构自适应决定滤波参数,并采用传统NLM进行去噪,得到去噪结果图;第二阶段则首先将该去噪结果图分割为细节部分与平滑部分,并采用反向投影得到二阶段的去噪参考图,采用NLM对其去噪时,将细节部分和平滑部分分开处理,不仅能更好地去除噪声,还能更有效地保留图像的纹理细节和边缘结构。
1 NLM去噪算法NLM算法利用自然图像的自相似性来去除噪声,令y代表噪声图像,x代表原始无噪图像,n为加性高斯白噪声,则有:
$ \mathit{\boldsymbol{y}} = \mathit{\boldsymbol{x}} + \mathit{\boldsymbol{n}} $ | (1) |
噪声图像中某像素i的邻域称为相似窗,用Ni表示,可采用大小形状均不同的相似窗,一般取以i为中心的一个预先确定大小的正方形窗口。
采用NLM算法去噪后的图像用
$ {{\mathit{\boldsymbol{\hat x}}}_i} = \sum\limits_{j \in {\mathit{\boldsymbol{S}}_i}} {\mathit{\boldsymbol{\omega }}_{i, j}^y{\mathit{\boldsymbol{y}}_j}} $ | (2) |
其中:
$ \mathit{\boldsymbol{\omega }}_{i, j}^y = \frac{1}{{{\mathit{\boldsymbol{Z}}_i}}}\exp \left( { - \parallel {\mathit{\boldsymbol{y}}_i} - {\mathit{\boldsymbol{y}}_j}{\parallel ^2}/{h^2}} \right) $ | (3) |
其中:‖yi-yj‖2为图像块yi和yj之间的欧几里得距离,该值越小表明两图像块相似度越高;
针对NLM去噪时滤波参数无法自适应调节,及边缘细节信息易丢失的缺点,本文提出了一种基于图像分割的非局部均值算法ISNLM,算法流程如图 1所示,整个算法分为两阶段:第Ⅰ阶段首先进行噪声估计,根据估计的噪声标准差和图像纹理复杂度设定滤波参数,并用常规NLM去噪得到第Ⅰ阶段的去噪结果图
ISNLM算法第Ⅰ阶段采用传统NLM去噪,需要确定滤波参数h的值。若h过大,去噪后的图像会产生过平滑现象,若h过小则不能较好地去除噪声,一般取h与噪声标准差相关,即h=c×σ。因此本文算法会首先估算噪声标准差,将整幅图像分为5×5的图像块,计算每个图像块的标准差,再统计出现次数最多的标准差值,将其作为估算标准差,实验证明采用该方法得出的标准差与实际标准差的误差在±5%之内。确定噪声标准差之后就可确定常数c的最佳值,本算法定义去噪后峰值信噪比最高时对应的c值为最佳值,记为c*,c*的值与图像纹理复杂度、NLM算法的搜索窗尺寸及噪声标准差大小有关。本算法采用15×15的搜索窗、7×7的相似窗,在此前提下,可采用曲线拟合得到c*与图像能量和噪声方差的关系:
$ {c^*} = {\rm{1}}{\rm{.06}} - {\rm{0}}{\rm{.00066}}E - {\rm{0}}{\rm{.0047}}\sigma $ | (4) |
其中:E为图像能量;σ为噪声标准差。本文将在3.1节具体讨论这些参数对c*的影响。
由于第Ⅰ阶段的去噪结果图
Ⅰ阶段去噪可以去除大部分噪声,但仍有噪声残留,同时也有少部分结构信息被去除。为了进一步消噪并保留更多的结构信息,本文算法采用了反向投影的方式,该方法可以有效地利用方法噪声图像来改善去噪结果[14]。反向投影的概念是指通过将滤波后得到的噪声加回到去噪图像中得到新的噪声图像,即:
$ \mathit{\boldsymbol{\hat y}} = {{\mathit{\boldsymbol{\hat x}}}_0} + \mu \left( {\mathit{\boldsymbol{y}} - {{\mathit{\boldsymbol{\hat x}}}_0}} \right) $ | (5) |
其中μ∈(0, 1) 为反向投影常数,由式(5) 可知,当μ→0时,
对Ⅰ阶段去噪结果图
本文算法采用方差来进行区域分割,方差反映了随机变量的可能取值在其均值周围的分散程度。在图像中,求每一个像素点与其周围像素点区域的方差,在细节区域方差较大,而在平滑的背景区域方差较小,采用所有像素的方差均值为阈值,大于阈值的部分视为细节,记作
通过反向投影得到去噪参考图
为验证ISNLM算法的有效性,在4幅尺寸为512×512的自然图像上进行了仿真实验,如图 2所示,分别为Lena、Fingerprint、Flinstones和Pentagon图,其中既包含了目标与背景灰度差异较大的图像,也包含了目标与背景灰度值相近、噪声杂糅的图像,很适合验证噪声的有效性。实验中给每幅图像加上均值为0、方差为σ的高斯白噪声,σ的取值范围为10到50,图像像素的取值范围为0到255。实验平台为Matlab R2012b,计算机的配置为2.6GHz Intel Core i5-3230 CPU以及8.0GB内存。
由于本文算法着眼于提高去噪性能,因此实验中不对计算复杂度进行讨论。对去噪后的图像,采用主观视觉和客观指标两种评价方式[15]。主观视觉是指通过直接观察图像,根据视觉感受对图像质量作出判断;客观指标则是指采用定量方式来评价图像质量[16],本文采用峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)和结构相似度(Structural SIMilarity index, SSIM)[17]两个指标来验证算法有效性。PSNR利用像素点间的平均灰度差异来衡量图像之间的相似度,值越大则图像相似度越高,其计算公式如下:
$ PSNR = {\rm{10}}\;{\rm{lg}}\frac{{255 \times 255}}{{\frac{1}{{MN}}{{\sum\limits_{\left( {i, j} \right) \in \mathit{\Omega} } {\left( {\mathit{\boldsymbol{\hat x}}\left( {i, j} \right) - \mathit{\boldsymbol{x}}\left( {i, j} \right)} \right)} }^2}}} $ | (6) |
PSNR基于误差敏感,并未考虑人眼视觉感受,常会出现评价结果与人眼感受不一致的情况,而SSIM分别从亮度、对比度、结构三方面分别度量图像相似性,与人眼感受较为一致,其值越接近1代表两幅图像相似度越高,其计算公式如下:
$ SSIM = \frac{{\left( {2{\mu _x}{\mu _y} + {c_1}} \right)\left( {2{\sigma _{xy}} + {c_2}} \right)}}{{\left( {\mu _x^2 + \mu _y^2 + {c_1}} \right)\left( {\sigma _x^2 + \sigma _y^2 + {c_2}} \right)}} $ | (7) |
其中:μ代表均值;σ代表方差;σxy代表x和y之间的协方差;c1=(k1L)2和c2=(k2L)2是用来维持稳定的常数;L为像素值的动态范围,一般取k1=0.01,k2=0.03。
3.1 参数影响ISNLM算法中共有3个参数需要设定:1) 搜索窗及相似窗尺寸大小;2) 滤波参数h;3) 反向投影常数μ。相似窗的尺寸由搜索窗尺寸决定,应当小于搜索窗的一半;而搜索窗的尺寸在NLM算法中非常重要,理论上搜索窗可取整幅图像,从而捕捉较多的局部信息,但相应的计算复杂度也会呈几何倍数增加,Salmon[18]证明当搜索窗尺寸超过15×15时,去噪后PSNR反而会下降,如表 1所示。对Lena图像加入方差为50的噪声时,采用不同尺寸的搜索窗,只要滤波参数h取值恰当,PSNR值相差不大,但搜索窗尺寸太大或太小时,去噪后的图像都容易出现伪影现象。如图 3所示,可看出当搜索窗为15×15时,去噪效果较好,图像对比度较高,保留结构信息较完整,因此本文算法中采用15×15的搜索窗,并设定相似窗尺寸为7×7。
滤波参数h的值对于去噪结果影响很大,由于h=c*σ,所以需要确定常数c的最佳值c*,本文通过实验得出如下结论:
1) 对不同图像来说,c*的取值有所变化,主要跟图像的结构有关,当图像结构信息较丰富时c*的取值相对较小而当图像较平滑时,c*的取值较大;
2) 由于搜索窗尺寸及滤波参数都会影响去噪结果,故当搜索窗尺寸发生变化时,c*取值也不同,如表 1列出了不同尺寸搜索窗对应的c*取值;
3) 去噪评价指标PSNR和SSIM随常数c的变化基本一致,如表 2所示,以噪声标准差为20和30为例,当c较小时,PSNR和SSIM随c的增加而增加,到达峰值后,若继续增加c,PSNR和SSIM会下降,从该表还可看出,当噪声标准差不同时,c*取值不同,说明c*的确与噪声标准差相关,但在c*左右小范围变化对PSNR和SSIM影响均较小。
通过以上讨论可以看出,确定c*需要考量图像纹理复杂度和噪声大小,噪声大小采用前述图像块标准差确定,而图像纹理复杂则采用小波能量来表示。
对输入的图像进行2层小波分解,并计算单支平均能量,具体方法是将单层系数平方和除以该层系数总数。通过实验比较,当采用尺度2的低频系数时,有无噪声对其能量影响在误差范围±1%之内,如表 3所示,因此在有噪声时依然可采用尺度2的低频系数作为衡量图像结构信息的标准。从表 3可看出图像纹理越复杂,其能量越高,比如边缘结构丰富的Fingerprint和Flinstones的能量相对来说就高很多,因此采用尺度2的低频系数的能量作为衡量图像结构信息的标准,能量越高,图像结构信息越丰富。
反向投影系数μ决定了Ⅰ阶段去噪结果图
由于本算法为针对NLM的改进,因此将其与NLM及其改进算法进行比较,包括传统NLM算法[2]、NLEM算法[3]、文献[9]提出的改进算法和PNLM算法[11],进行主观视觉图像对比和客观指标PSNR及SSIM值的对比。对于NLM算法,采用Van De Ville等[19]的建议,取c2=7,搜索窗和相似窗分别为21和7;而NLEM、PNLM和NML-SAP算法中的参数设置均与原文献相同。
由于ISNLM算法的有效性与图像分割的结果有关,首先以Pentagon为例,展示了ISNLM算法在去噪中产生的图像,如图 4所示:图 4(a)为加了标准差为20的噪声图像,图 4(b)为Ⅰ阶段去噪结果,可以看到已去除了大部分噪声,虽然图像清晰度和细节保留不够理想,但以此图为参考可成功地将细节部分和背景部分分开,得到图 4(c)所示的区域分割图,图中黑色部分表示纹理较平滑的背景区域,而白色部分表示纹理较复杂的细节区域,图 4(d)则是通过反向投影得到的去噪参考图,可看出相比图 4(b),该图保留了原图像中丰富的纹理信息,为去噪提供了更完整的细节结构。
首先从主观视觉对4种算法进行比较,图 5展示了在噪声标准差等于20时,这几种算法对于Fingerprint图像的去噪结果对比,包含了完整图像和细节对比。首先从整体来看,NLM算法出现了明显的过平滑现象,边缘被模糊,NLEM和文献[9]算法在图像上方和下方灰度值较小处也出现了较明显的过平滑现象,丢失了一部分细节信息,PNLM和ISNLM没有出现明显的过平滑,但ISNLM算法产生的图像与原图像整体视觉效果更接近;再从细节处讨论,放大图像左下角区域,可以看到NLM、NLEM和文献[9]算法边缘模糊,对比度下降,PNLM算法出现了伪影,整个区域看起来很斑驳,而ISNLM算法对比度更高,区域更平滑,边缘更清晰,很好地保留了细节信息。
再从客观评价指标来比较4种算法的去噪效果,表 4分别对比了噪声大小不同时,对测试图像采用不同算法去噪后的PSNR和SSIM值。
从表 4中可以看出:在噪声标准差小于等于30时,ISNLM算法具有较明显的优势,其PSNR值和SSIM值均为最大;当噪声标准差增大到40及以上时,整体来看,ISNLM算法性能略差于PNLM,两种算法的PSNR值差别小于0.9,SSIM值差别小于0.05。但是需要注意的是,
对于图像Fingerprint和Flinstones来说,无论噪声多大,ISNLM的PSNR值和SSIM值始终最高,这是因为这两幅图像纹理复杂度较高,采用ISNLM将细节部分和背景部分分开去噪,减少了不相关图像块的影响,相比其他算法性能更好。
虽然对于Lena图像和Pentagon图像来说,PNLM在噪声较大时其PSNR和SSIM值超过ISNLM,但是从视觉效果来看,ISNLM算法更好。以Lena图像为例,图 6展示了图像标准差为40时,这两种算法的去噪对比,可看出:PNLM去噪后图像对比度下降,在头发和帽子连接处出现了斑驳和伪影;而ISNLM算法将细节部分和背景部分分开去噪,对目标图像块来说,去噪时与目标块纹理相似的图像块的权重更高,而与其纹理差别较大的图像块的权重为0,因此有较好的视觉效果,边缘更清晰,细节保留更完整。
本文提出了一种基于图像分割、参数自适应的非局部均值算法ISNLM,该算法可根据图像标准差和图像能量确定滤波参数的值,并且将图像中的细节部分和背景部分分开去噪,保证了较平滑的区域和结构丰富的区域在去噪时不会互相影响。与传统NLM及3种NLM的改进算法相比:对于纹理复杂度较高、目标和背景灰度接近的图像,ISNLM在主观视觉和客观指标方面均有较大的优势;而对于背景和目标灰度值相差较大的图像,虽然在噪声较大时,PSNR值和SSIM值略低于PNLM算法,但其图像结构信息更为丰富,边缘清晰,对比度更高,证明了ISNLM算法的有效性。对于纹理复杂度不同的区域,本文算法采用相同的去噪方法,下一步将研究如何针对其特性提升去噪性能。
[1] | LEVIN A, NADLER B. Natural image denoising:optimality and inherent bounds[C]//CVPR 2011:Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition Workshops. Washington, DC:IEEE Computer Society, 2011:2833-2840. |
[2] | BUADES A, COLL B, MOREL J M. A review of image denoising algorithms, with a new one[J]. Multiscale Modeling and Simulation, 2005, 4(2): 490-530. |
[3] | CHAUDHURY K N, SINGER A. Non-local Euclidean medians[J]. IEEE Signal Processing Letters, 2012, 19(11): 745-748. |
[4] | 黄智, 付兴武, 刘万军. 混合相似性权重的非局部均值去噪算法[J]. 计算机应用, 2016, 36(2): 556-562. (HUANG Z, FU X W, LIU W J. Non-local means denoising algorithm with hybrid similarity weight[J]. Journal of Computer Applications, 2016, 36(2): 556-562.) |
[5] | 蔡斌, 刘卫, 郑重, 等. 一种改进的非局部均值去噪算法[J]. 模式识别与人工智能, 2016, 29(1): 1-10. (CAI B, LIU W, ZHENG Z, et al. An improved non-local means denoising algorithm[J]. Pattern Recognition and Artificial Intelligence, 2016, 29(1): 1-10.) |
[6] | 许光宇, 檀结庆. 带结构检测的非局部均值图像去噪算法[J]. 计算机应用, 2011, 31(3): 749-752. (XU G Y, TAN J Q. Enhanced non-local means image denoising algorithm using structure detection[J]. Journal of Computer Applications, 2011, 31(3): 749-752.) |
[7] | GAN K, TAN J, HE L. Non-local means image denoising algorithm based on edge detection[C]//ICDH 2014:Proceedings of the 2014 International Conference on Digital Home. Piscataway, NJ:IEEE, 2014:117-121. |
[8] | LAN R, ZHOU Y, TANG Y Y, et al. Image denoising using non-local fuzzy means[C]//China SIP 2015:Proceedings of the 2015 IEEE China Summit and International Conference on Signal and Information Processing. Piscataway, NJ:IEEE, 2015:196-200. |
[9] | 李新春, 于抒平, 王波. 一种改进的非局部均值算法[J]. 计算机工程与应用, 2016, 52(5): 185-189. (LI X C, YU S P, WANG B. Improved non-local means algorithm[J]. Computer Engineering and Applications, 2016, 52(5): 185-189.) |
[10] | HEMALATE B, SUBHASIS C. Novel speed-up strategies for non-local means denoising with patch and edge patch based dictionaries[J]. IEEE Transactions on Image Processing, 2014, 23(1): 356-365. |
[11] | WU Y, TRACEY B, NATARAJAN P, et al. Probabilistic non-local means[J]. IEEE Signal Processing Letters, 2013, 20(8): 763-766. |
[12] | LI H, SUEN C Y. A novel Non-local means image denoising method based on grey theory[J]. Pattern Recognition, 2015, 49: 237-248. |
[13] | DELEDALLE C A, DUVAL V, SALMON J. Non-local Methods with Shape-Adaptive Patches (NLM-SAP)[J]. Journal of Mathematical Imaging and Vision, 2012, 43(2): 103-120. |
[14] | DONG W, ZHANG L, SHI G, et al. Nonlocal back-projection for adaptive image enlargement[C]//ICIP 2009:Proceedings of the 2009 IEEE International Conference on Image Processing. Piscataway, NJ:IEEE, 2009:349-352. |
[15] | 李彦丽, 金东瀚, 焦秉立. 几种典型的感知视频质量评价模型[J]. 计算机工程与应用, 2002, 38(13): 66-68. (LI Y L, JIN D H, JIAO B L. Several typical perceptual video quality assessment models[J]. Computer Engineering and Applications, 2002, 38(13): 66-68.) |
[16] | RAMPONI G. A rational edge-preserving smoother[C]//ICIP 1995:Proceedings of the 1995 IEEE International Conference on Image Processing. Piscataway, NJ:IEEE, 1995:151-154. |
[17] | WANG Z, BOVIK A C, SHEIKH H R, et al. Image quality assessment:from error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612. |
[18] | SALMON J. On two parameters for denoising with non-local means[J]. IEEE Signal Processing Letters, 2010, 17(3): 269-272. |
[19] | VAN DE VILLE D, KOCHER M. SURE-based non-local means[J]. IEEE Signal Processing Letters, 2009, 16(11): 973-976. |