近年来,随着成像技术和数字处理技术的快速发展,高动态范围图像以其更大的亮度范围、丰富的细节信息以及给人更好的视觉感受,吸引了越来越多的研究者的广泛关注[1]。
与低动态范围(Low Dynamic Range, LDR)图像类似,高动态范围(High Dynamic Range, HDR)图像在获取、处理、压缩、存储、和传输时也会存在不同程度的失真[2],这些失真会影响HDR图像的视觉效果。由于HDR图像有着更大的动态范围,如何对HDR图像进行有效的评估是当前研究的难点。主观质量评价方法需针对多个测试图像进行多次重复实验,耗时多、费用高,难以操作[3],所以需要一种客观质量评价方法。依据对参考图像的依赖程度,图像客观质量评价可分为全参考、半参考和无参考等3类。典型的全参考LDR图像质量评价方法有基于像素误差统计的均方误差(Mean Squared Error, MSE)方法[4],它计算简单,但不能很好地与人的主观感知保持一致;Wang等提出了基于结构相似度(Structural Similarity Index Metric, SSIM)的方法[5]和改进的多尺度结构相似性(Multi-scale Structure Similarity Index Metric, MSSIM)方法[6],其通过比较参考图像与失真图像的结构、亮度及对比度信息来综合评价图像质量,取得了不错的效果;Sheikh等提出了基于信息保真度的方法(Visual Information Fidelity, VIF)[7],它通过衡量失真图像和参考图像之间的共同信息的多少来评价失真图像的质量,由于其对人类视觉系统的合理建模,取得了较好的效果;Chandler等提出了基于小波变换的评价模型(Visual Signal-to-Noise Ratio, VSNR)[8],主要通过生理和心理学实验获得人类视觉系统的前端特征构建视觉模型,从而模拟人的视觉来对评价图像客观质量,但是该方法并没有得到令人满意的效果。
目前常用的HDR图像质量评价方法是Mantiuk等提出的视觉差异预测方法HDR-VDP-2(HDR Visual Difference Predictor, HDR-VDP-2) [9]及其权重修正的HDR-VDP-2.2[10]算法。其通过合理地模拟人类视觉系统,建立一系列人眼视觉模型,综合HDR图像的亮度和对比度特征,提出了一种HDR图像的客观全参考质量评价方法。由于其适应自然界图像的所有亮度范围,很好地模拟了人类对HDR图像的高亮度范围的感知,所以该评价方法得到了广泛的应用,但是,由于其只考虑了HDR图像的高亮度范围特征,对于HDR图像尤为重要的色度特征和对人类视觉感知影响重大的结构特征却没有进行良好度量,该评价方法存在一定的局限性。
本文在HDR-VDP-2.2的基础上结合HDR图像的色度相似度和结构相关度,提出了一种基于SVR的HDR图像客观质量评价模型。解决了经典LDR图像质量评价方法只能良好地对低亮度范围图像的处理的问题,又补充了当前HDR图像质量评价方法中缺少的色度和结构的度量。与当前HDR图像质量评价方法及经典的LDR图像质量评价方法进行了对比。实验表明,本文提出的方法与人类主观视觉感知具有更高的一致性。
1 评价模型HDR图像包含了更高的亮度范围、更丰富的细节信息,能够给人带来更好的视觉体验。对高动态范围图像质量的度量除了考虑亮度的范围之外,同时也应考虑普通图像所包含的对比度信息、感知结构以及对HDR图像尤为重要的色度信息。本文综合以上信息,建立更全面的感知质量评价模型,实现对HDR图像质量评价。具体的算法框图如图 1所示。
本文模型共包括三大部分。第一部分为HDR-VDP-2.2中通过模拟人眼来度量HDR图像的高亮度和对比度特征,从而得到两幅图像的差异的过程。其中,包括光学与视网膜路径、多尺度分解及池聚合等模块;第二部分考虑到HDR图像特有的鲜明的色度信息不可忽视,对色度特征度量。首先将HDR图像的RGB颜色空间转换为亮度与颜色容易分离的YIQ颜色空间,分别对I、Q颜色分量求色度相似度作为图像色度特征度量;第三部分对结构特征度量,通过对HDR图像的亮度分量Y求取结构相关度作为结构特征的度量。最后联合以上三部分内容,通过加权聚合和支持向量回归两种方案综合评价HDR图像的客观质量。
1.1 特征度量 1.1.1 HDR-VDP-2.2视觉差异预测器(Visible Difference Predictor, VDP)是一种有效评估图像保真度的算法。其利用算法来模拟人眼观看图像的过程,从而预测人眼所看到的两幅图像的差异。由Daly等[11]提出的针对普通低动态范围LDR图像的视觉差异预测器(VDP)在LDR图像的客观质量评价中得到了广泛的应用。HDR图像有着更大的动态范围,需要一个新的视觉模型去模拟人眼处理更大亮度范围的过程。HDR-VDP-2是目前较常用的预测HDR图像质量的客观评价方法。
HDR-VDP-2实现了模拟人眼对高动态范围图像的处理过程。其第一部分模拟人眼的光学和视网膜通路,模拟光在人眼内部的散射过程。第一步,通过调制传递函数模拟光通过眼角膜、晶状体到达视网膜的整个散射过程;第二步,在光散射到视网膜后,模拟感光器感光光谱的灵敏性;第三步,感光器根据进入人眼光的亮度来控制人的感知过程,模拟感光器对光亮度的非线性反应。第二部分通过多尺度分解来模拟视觉皮质中人眼对光照的不同空间频率和方向的选择过程,BT[f, o]和BR[f, o]分别表示左眼和右眼在f频率o方向人眼可感知到的光照。采用可操纵金字塔方法较好地实现空间频率和方向的分离;由于得到的两幅图像的差异可以认为是由不同的输入噪声引起的,而这些噪声是由独立噪声和非独立噪声两部分组成。所以,第三部分来模拟这两种噪声的形成,用对比度敏感函数(Contrast Sensitivity Function, CSF)来模拟独立噪声,对比度掩蔽(Masking)函数来模拟依赖于信号的非独立噪声。算法输出的D[f, o]即为人眼在某一频率和方向上可感知到的两幅图像的差异。最后把D[f, o]转换为评价HDR图像的客观质量分数,具体过程见参考文献[9-10]。
HDR-VDP-2.2在HDR-VDP-2的基础上对其中的不同频率、不同方向上的权重系数wf进行了修正,添加了约束条件,使得wf的设置更加合理,评价效果较之前的HDR-VDP-2有一定提升。用SVDP表示HDR-VDP-2.2的特征度量结果,聚合方程如式(1) 所示:
${{S}_{\text{VDP}}}=\frac{1}{F\cdot O}\sum\limits_{f=1}^{F}{\sum\limits_{o=1}^{O}{{{w}_{f}}}}\ln \left( \frac{1}{I}\sum\limits_{i=1}^{I}{{{D}^{2}}}\left[ f,o \right]\left( i \right)+\varepsilon \right)$ | (1) |
其中:i是像素指数;ε是小常数(10-5),以避免当D为0时产生奇点;I为像素的总数;wf为每个频带的权重。
1.1.2 色度相似度HDR-VDP-2.2只考虑了图像的亮度特征,其适用于自然界所有亮度范围。现实世界中的场景都是缤纷多彩的,并不是通常处理的灰度图像。所以,基于彩色图像的质量评价要比基于灰度图像的图像质量评价更加可靠,评价结果也要好于灰度图像。色度信息对人眼视觉系统的影响不可忽视,尤其对于色彩更加鲜明的HDR图像。本文在评价模型中引入色度特征度量,实现了对彩色图像的质量评价。
首先,将HDR图像的RGB颜色空间转换为更符合人类视觉系统感知且亮度和色度容易分离的颜色空间,因此,本文选择了广泛使用的YIQ颜色空间,其中,Y表示亮度信息,I和Q表示色度信息。将RGB颜色空间转换为YIQ颜色空间转换公式如式(2) 所示:
$\left[ \matrix{ \mathit{\boldsymbol{Y}} \hfill \cr \mathit{\boldsymbol{I}} \hfill \cr \mathit{\boldsymbol{Q}} \hfill \cr} \right] = \left[ \matrix{ 0.299\;\;\;\;\;0.587\;\;\;\;\;0.114 \hfill \cr 0.596\;\;\;\;{\rm{ - }}0.274\;\;\;\;{\rm{ - }}0.322 \hfill \cr 0.211\;\;\;\;{\rm{ - 0}}{\rm{.523}}\;\;\;\;\;\;{\rm{0}}{\rm{.312}} \hfill \cr} \right]\left[ \matrix{ \mathit{\boldsymbol{R}} \hfill \cr \mathit{\boldsymbol{G}} \hfill \cr \mathit{\boldsymbol{B}} \hfill \cr} \right]$ | (2) |
用Ix (Iy)和Qx (Qy)表示参考(测试)图像的I和Q色度通道的对应像素点位置的颜色分量值。分别对I和Q通道求颜色相似度。色度特征的相似度分别用SI,SQ表示,分别由式(3) 、(4) 确定:
${{S}_{\text{I}}}=\frac{2{{I}_{x}}\cdot 2{{I}_{y}}+{{C}_{1}}}{I_{x}^{2}+I_{y}^{2}+{{C}_{1}}}$ | (3) |
${{S}_{\text{Q}}}=\frac{2{{Q}_{x}}\cdot 2{{Q}_{y}}+{{C}_{2}}}{Q_{x}^{2}+Q_{y}^{2}+{{C}_{2}}}$ | (4) |
其中,C1和C2是正的小常数。因为I和Q分量动态范围几乎相同。所以本文令C1= C2。联合SI与SQ得到综合色度相似度度量方法,表示为SC:
${S_C} = {S_I} \cdot {S_Q}$ | (5) |
结构信息反映了场景中的主要结构特征,且结构特征是影响视觉感知的主要因素。一个良好的图像质量评价方法应符合人类视觉系统(Human Visual System, HVS)的主观感知。本文在建立的评价模型中实现了对结构特征度量。Wang等提出的通用质量评价模型(Usual Quality Index,UQI)[12]得到了广泛的应用,其中的相关度比较包含了结构的度量。本文对UQI模型进行整合,使其在HDR图像中同样适用。对1.1.2节中得到的YIQ颜色空间中的Y分量计算结构相关度SS,由式(6) 确定:
${S_S} = {{4{\sigma _{xy}} \cdot \bar x \cdot \bar y} \over {({{(\bar x)}^2} + {{(\bar y)}^2}) \cdot (\sigma _x^2 + \sigma _y^2)}}$ | (6) |
其中:x、y表示参考图像和测试图像,x、y分别为x和y对应块亮度的均值;而σx和σy分别为表示x和y对比度的方差;σxy为反映x和y之间结构信息相关度的相关系数。
1.2 质量预测方案一 HDR-VDP-2中的亮度度量与对比度度量SVDP和色度相似度度量SC以及结构相关度度量SS分别作为图像质量聚合模型中的3个部分。图像客观质量分数应与主观结果保持一致,因此,以SROCC值最大为约束条件,寻找最佳的聚合策略。为了得到最佳的聚合策略,本文测试了多种组合方法,最终得到如下聚合方式:
$S = \alpha {S_{{\rm{VDP}}}} + (1 - \alpha )({S_S} \cdot {S_C})$ | (7) |
其中:α(0≤α≤1) 为权重调节系数,调节SVDP与SS,SC分量之间的相对重要性。因为SVDP、SS、SC的值均在,所以整体质量值S也在。S越接近于1,表明测试图像与原始图像之间的差异越小,质量越好;而S越接近于0,表明测试图像与原始图像间的差异越大,质量越差。
方案二 由于人类视觉系统非常复杂,使用简单的加权聚合可能不能合理地体现特征之间的关系。而支持向量回归(Support Vector Regression, SVR)算法可以通过核函数来有效地解决非线性的问题。本文方案二以SVDP、SS、SC三个客观值作为特征,联合主观意见分值(Mean Opinion Score, MOS),以客观评价值与主观评价值之间的Spearman等级相关系数(Spearman Rank Order Correlation Coefficient, SROCC)最大为约束条件,通过SVR方法,建立感知质量评价模型,综合评价方法的性能。
2 实验结果与分析本文采用法国Nantes大学提供的HDR图像数据库[13]。该数据库包含10幅原始超高清(分辨率为1920×1080) HDR图像,每幅图像分别对应14种不同程度的失真,得到共140幅失真图像。该库同时提供每幅图像的主观意见分值MOS。实验依据VQEG (Video Quality Experts Group)的相关流程进行[14],将模型的输出值Q′作四参数Logistic函数非线性拟合,获得预测MOSp:
$MOSp = {{a - b} \over {1 + {\rm{exp}}\left( {{{ - (Q' - c)} \over {abs(d)}}} \right)}}{\rm{ + }}b$ | (8) |
其中a、b、c、d为常量。利用非线性回归后的客观模型预测值与主观意见分值的相关性来度量客观评价方法的性能。实验结果由3个常用的性能评价指标给出,分别是:1) Pearson线性相关系数(Pearson Correlation Coefficient, PCC),反映预测的精确性。是区间[-1,1]上的值,其绝对值越接近于1,表明主客观评价间的相关性越好。2) Spearman等级相关系数(Spearman Rank Order Correlation Coefficient, SROCC),表征了评价方法的单调性。也是区间[-1,1]的值,同PCC一样,其绝对值越接近于1,表明主客观评价间的一致性越好。3) 均方根误差(Root Mean Square Error, RMSE),表征了数据的离散程度。均方根误差越小,说明对模型的预测越准确;误差越大,则对模型的预测越不准确。
方案一 对于聚合关系式中权值的确定,本文通过多次实验,以客观质量评价值与主观意见分值(MOS)之间的SROCC值来确定最佳的α值。最终得出,当α=0.65时,评价性能最好。
方案二 SVR过程共包括训练和测试两个阶段。依据常用的训练过程,随机地将数据库中140幅HDR图像中的80%共112幅HDR图像用来训练,得到模型。剩余20%的28幅HDR图像用来对模型进行性能测试。为了保证训练结果的稳定性和可靠性,并尽可能多地消除偏差,随机地重复该过程(80%训练,20%测试)1000次,并取1000次迭代的中值作为最终性能评价结果。
目前,关于HDR图像质量评价的方法研究不多,较为常用的HDR图像质量评价方法是HDR-VDP-2及其权重修正的HDR-VDP-2.2。为了验证模型的有效性,将本文方法与HDR-VDP-2.2及MSE、SSIM、MSSIM、VSNR和VIF等这类经典LDR图像客观质量评价方法进行对比。表 1给出了各评价方法的各项性能指标。
由表 1可以看出,方案一和方案二的各项指标性能均优于HDR-VDP-2.2方法,且性能提升明显,说明色度和结构特征对HDR图像质量的影响比较重要,不可忽视,这与HDR图像鲜明的色彩信息和丰富的细节信息对应,较好地体现了本文模型所选图像特征的合理性和可靠性;方案二的各项性能优于方案一,说明支持向量回归的机器学习方法优于简单的加权聚合方法;同时可以看出,经典的低动态范围图像质量评价方法对HDR图像的客观评价性能普遍较差,将低动态范围图像的客观评价方法直接应用在高动态范围图像上是不合理的。LDR图像只能处理低亮度范围的自然图像及其失真图像,无法较好地对HDR图像中高亮度范围的区域进行处理,这也是传统质量评价无法较好地评价HDR图像的根本问题所在。综上可见,本文提出的新的评价模型优于HDR-VDP-2.2及经典LDR图像质量评价方法,且与主观视觉感知具有更好的一致性。
图 2给出了2种HDR图像质量评价方法的客观评价结果与主观意见分值(MOS)的散点图。其中,横坐标表示方法的客观质量分数,纵坐标表示图像的MOS值,曲线代表四参数拟合曲线。散点越集中,越接近拟合曲线,说明客观模型与主观感知的一致性越好。由图可以看出本文提出的图像客观质量评价模型散点图比较集中,与主观评价数据之间的吻合度较高,能较好地评价HDR图像的质量。
本文主要结合了HDR图像的色度信息、结构信息及HDR-VDP-2.2中的亮度信息、对比度信息和一些人眼视觉模型,利用加权聚合及SVR两种方案来综合评价HDR图像客观质量。实验结果表明,所提出的方法性能比当前广泛使用的HDR-VDP-2.2及一些经典的LDR图像质量评价方法更为有效,且预测性能均衡、稳定。在本文的基础上,考虑用无参考方法进行HDR图像质量评价,改善评价效果,是未来工作的研究方向。
[1] | NARWARIA M, DA SILVA M P, LE CALLET P. Study of high dynamic range video quality assessment[C]//Proceedings of SPIE 9599:Applications of Digital Image Processing XXXVIII. Bellingham, WA:SPIE, 2015:95990V. |
[2] | HANHART P, BERNARDO M V, PEREIRA M, et al. Benchmarking of objective quality metrics for HDR image quality assessment[J]. Eurasip Journal on Image and Video Processing, 2015, 39 (1) : 1-18. |
[3] | 蒋刚毅, 黄大江, 王旭, 等. 图像质量评价方法研究进展[J]. 电子与信息学报, 2010, 32 (1) : 219-226. ( JIANG G Y, HUANG D J, WANG X, et al. Overview on image quality assessment methods[J]. Journal of Electronics and Information Technology, 2010, 32 (1) : 219-226. ) |
[4] | ESKICIOGLU A M, FISHER P S. Image quality measures and their performance[J]. IEEE Transactions on Communications, 1995, 43 (12) : 2959-2965. doi: 10.1109/26.477498 |
[5] | WANG Z, BOVIK A C, SHEIKH H R, et al. Image quality assessment:from error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13 (4) : 600-612. doi: 10.1109/TIP.2003.819861 |
[6] | WANG Z, SIMONCELLI E P, BOVIK A C. Multiscale structural similarity for image quality assessment[C]//Proceedings of the 2004 Conference Record of the 37th Asilomar Conference on Signals, Systems and Computers. Piscataway, NJ:IEEE, 2004:1398-1402. |
[7] | SHEIKH H R, BOVIK A C. Image information and visual quality[J]. IEEE Transactions on Image Processing, 2006, 15 (2) : 430-444. doi: 10.1109/TIP.2005.859378 |
[8] | CHANDLER D M, HEMAMI S S. VSNR:a wavelet-based visual signal-to-noise ratio for natural images[J]. IEEE Transactions on Image Processing, 2007, 16 (9) : 2284-2298. doi: 10.1109/TIP.2007.901820 |
[9] | MANTIUK R, KIM K J, REMPEL A G, et al. HDR-VDP-2:a calibrated visual metric for visibility and quality predictions in all luminance conditions[J]. ACM Transactions on Graphics, 2011, 30 (4) : 76-79. |
[10] | NARWARIA M, MANTIUK R, CALLET P L, et al. HDR-VDP-2.2:a calibrated method for objective quality prediction of high dynamic range and standard images[J]. Journal of Electronic Imaging, 2015, 24 (1) : 010501. doi: 10.1117/1.JEI.24.1.010501 |
[11] | DALY S. The visible differences predictor:an algorithm for the assessment of image fidelity[M]//Digital Images and Human Vision. Cambridge, MA:MIT Press, 1993:179-206. |
[12] | WANG Z, BOVIK A C. A universal image quality index[J]. IEEE Signal Processing Letters, 2002, 9 (3) : 81-84. doi: 10.1109/97.995823 |
[13] | NARWARIA M, LE CALLET P. Tone mapping-based high-dynamic-range image compression:study of optimization criterion and perceptual quality[J]. Optical Engineering, 2013, 52 (10) : 190-197. |
[14] | Video Quality Experts Group. Final report from the video quality experts group on the validation of objective models of video quality assessment[EB/OL].[2016-01-04]. http://www.vqeg.org/. |