计算机视觉领域中,单应矩阵在相机标定、图像拼接、三维重建、目标追踪等过程中被广泛应用。估计出的单应矩阵模型精确度很大程度上影响了其应用系统的性能,因此,单应矩阵的估计一直是计算机视觉领域的研究热点。
单应矩阵表示空间平面投影到两个摄像机像平面之后像点之间的一一对应关系[1]。估计单应矩阵首先需要提取特征,常采用的特征有点、直线和二次曲线[2]。由于点特征对场景内容要求较低,且相较于其他特征,点的特征提取算法如尺度不变特征变换(SIFT)[3]、加速鲁棒特征(SURF)[4]、ORB算法[5]等定位精度更高,因而被广泛用于单应矩阵的估计中。针对点特征单应矩阵估计中出现的特征点错误配匹现象,人们开发出许多鲁棒性算法,如LMeds[6]、M估计子[7]、RANSAC[8]及其变种算法[9-10],但这类鲁棒性算法采用代数方法,估计单应矩阵的精度不能满足实际应用中的需求。此后学者们提出了梯度下降法[1]、Newton迭代法[1]、烈文博戈马奎特(L-M)算法来进一步优化鲁棒性算法的结果[11],然而这些优化算法大都未考虑特征点的误差分布信息,或者简单地将其假设为服从各向同性的高斯分布。基于此,Zeisl等[12]提出了针对SIFT和SURF特征定位误差的协方差估计算法;在此基础上Zhao等[13]将特征点误差分布假设为服从各向异性的高斯分布,提出了基于协方差权重的烈文博戈马奎特(CW L- M)算法。CW L- M算法考虑了特征点的定位误差分布信息,采用马氏距离度量单应矩阵优化过程中的损失函数,但此方法并未解决在概率相同的估计点处如何选择更优点的问题。
针对此问题,本文在假设特征点定位误差服从各向异性高斯分布下,提出了优化的CW L- M算法——归一化椭圆权重CW L- M(EW L- M)算法,将传统L-M算法的特点—欧式距离考虑到目标函数内,通过椭圆权重的形式,使得目标函数能在马氏距离下概率相同的估计点中,选择欧式距离更近的点作为最终估计值,来达到更高的估计精度和更快的迭代速度。
1 EW L- M算法 1.1 单应矩阵设空间平面上的点在第一个视角下第i个投影点的齐次坐标mi=(xi yi 1)T,第二个视角下的投影点齐次坐标为m′i=(x′i y′i 1)T,则此两点之间存在一个单应变换关系
$ s\mathit{\boldsymbol{m}}_i^\prime = \mathit{\boldsymbol{H}}{\mathit{\boldsymbol{m}}_i} $ | (1) |
式中,H是一个3×3非奇异矩阵,有8个自由度;s是比例因子。1对点可以提供两个约束方程,因此,至少需4对点才能估计出单应矩阵。
假设第i个特征点的测量误差服从N(0, Σi)分布,则CW L- M的目标函数如下
$ \left\{ {\begin{array}{*{20}{l}} {d = \arg \mathop {\min }\limits_\mathit{\boldsymbol{H}} \sum\limits_{i = 1}^N {\left[ {\frac{{{{\left( {\mathit{\boldsymbol{u}}_1^{\rm{T}}{\mathit{\boldsymbol{e}}_i}} \right)}^2}}}{{{\lambda _1}}} + \frac{{{{\left( {\mathit{\boldsymbol{u}}_2^{\rm{T}}{\mathit{\boldsymbol{e}}_i}} \right)}^2}}}{{{\lambda _2}}}} \right]} }\\ {{\mathit{\boldsymbol{e}}_i} = \mathit{\boldsymbol{m}}_i^\prime - \mathit{\boldsymbol{\widehat m}}_i^\prime = \mathit{\boldsymbol{m}}_i^\prime - \mathit{\boldsymbol{H}}{\mathit{\boldsymbol{m}}_i}} \end{array}} \right. $ | (2) |
式(2)中,λ1和λ2是协方差矩阵Σi的特征根,u1和u2是Σi特征根对应的特征向量,
图 1为CW L- M权重示意,可以看到在CW L- M的目标函数下,概率相同的点
EW L- M算法的目标函数如下
$ \begin{array}{l} d = \arg \mathop {\min }\limits_\mathit{\boldsymbol{H}} \sum\limits_{i = 1}^N {\left[ {\frac{{\sqrt {{\lambda _2}} {{\left( {\mathit{\boldsymbol{u}}_1^{\rm{T}}{\mathit{\boldsymbol{e}}_i}} \right)}^2}}}{{\left( {\sqrt {{\lambda _1}} + \sqrt {{\lambda _2}} } \right)}} + } \right.} \\ \;\;\;\;\;\;\;\;\;\;\frac{{\sqrt {{\lambda _1}} {{\left( {\mathit{\boldsymbol{u}}_2^{\rm{T}}{\mathit{\boldsymbol{e}}_i}} \right)}^2}}}{{\left( {\sqrt {{\lambda _1}} + \sqrt {{\lambda _2}} } \right)}}] \end{array} $ | (3) |
在二维各向异性的高斯分布中,等概率线是一个椭圆,而协方差矩阵的特征根则分别代表椭圆的长轴和短轴的平方。为了避免添加的权重使当前特征点残差在总残差中的配比发生较大变化并对总残差的分布产生较大干扰,首先对其进行归一化,归一化的分母选择椭圆长轴和短轴的总和;之后对椭圆等高线添加权重,以便能在L-M迭代过程中优先选择距观测点更近的估计值。
如图 2所示,EW L-M算法的权重曲线中,短轴的权重略大于长轴的权重,因为短轴附近的估计点在欧式距离上更接近实际值,故而添加更大的权重,保证L-M算法在迭代过程倾向于短轴方向,使找到的点更接近真实值,从而估计出更精确的单应矩阵。本方法综合了传统L-M和CW L- M两种方法的特点,通过添加椭圆权重的形式使得在注重马氏距离的同时不失欧式距离的优点,故而更合理。
为了综合测试本文方法的性能,分别用仿真数据和真实图像测试EW L- M算法优化结果的精确度和所需迭代次数,并与黄金标准L- M算法、CW L- M算法进行对比。选择单应矩阵的均方根残差平方和(RMSE)及迭代次数为评价指标。RMSE的计算公式如下
$ {e_{{\rm{RMSE}}}} = \sqrt {\frac{{\sum\limits_{i = 1}^N {{{\left( {\mathit{\boldsymbol{m}}_i^\prime - \mathit{\boldsymbol{\widehat H}}{\mathit{\boldsymbol{m}}_i}} \right)}^2}} }}{N}} $ | (4) |
式中,
在仿真实验中,仿真数据的产生步骤如下。
首先随机生成1000个空间共面点,然后根据针孔摄像机模型将空间点投影到两个摄像机的像平面上,从而获得每一个空间点投影后的图像坐标; 依据文献[12]的方法产生每个图像点在不同噪声级别下误差的协方差矩阵,再依据协方差矩阵为每一个图像点添加各向异性的高斯误差,获得携带误差的图像点;添加误差后,采用DLT算法计算单应矩阵,并作为L- M、CW L- M、EW L- M算法的初始值进行迭代优化;最后计算3种方法优化出的单应矩阵的RMSE和迭代次数。
仿真实验针对每个点产生10组协方差矩阵,对应的噪声等级分别为0.1, 0.2, …, 1,在每组协方差矩阵下,添加3 000次噪声后取RMSE和迭代次数的平均值。实验结果如图 3所示。
从图 3(a)可看出,考虑了协方差信息的CW L- M算法要比传统L- M算法精确,而本文提出的EW L- M算法的eRMSE误差更小,并且在不同等级噪声下仍能保持领先优势,算法稳定性更高。图 3(b)显示,在特征点噪声级别为0.1时,3种算法所需的迭代次数相差不大;但在噪声级别大于0.2时,本文算法所需迭代次数更少。实验结果表明,本文提出的EW L- M算法收敛速度更快,收敛的结果更优。
2.2 真实图像实验真实图像实验中,首先使用SIFT算法提取图像特征点,并采用文献[12]的算法估计每个特征点定位误差的协方差矩阵;然后采用随机采样一致性算法(RANSAC)估计出粗略的单应矩阵模型及内点集合;最后分别利用传统L- M、CW L- M、EW L- M算法对RANSAC的结果进行优化。由于RANSAC算法筛选出的内点存在一定随机性,为了降低这种随机性的影响,重复上述过程20次后取eRMSE和迭代次数的平均值。使用的真实图像对及特征匹配结果(亮色线条)如图 4所示,再由图像中代表空间中平面的书表面诱导出左右两视角对应点之间的单应矩阵,实验结果如图 5所示。
由图 5可以看出,在仿真实验中表现较好的CW L- M算法在真实图像中的估计精度和迭代次数都要差于L- M和EW L- M算法,原因是真实图像的内容比仿真数据复杂,提取出的特征点定位误差的协方差矩阵存在一定误差,CW L- M算法受此误差影响较大。而本文所提出的EW L- M算法既考虑到了误差分布信息,也保留了经典L-M算法的优势,拥有更强的鲁棒性,因此两个指标都明显优于另外两种算法。
3 结束语本文针对单应矩阵估计中的优化问题,提出了一种考虑特征定位噪声的归一化椭圆权重CW L- M优化算法EW L- M。该方法假设特征点服从各向异性的高斯分布,然后在目标函数中添加归一化的椭圆权重,使得迭代过程能选择概率较高且离测量点更近的点作为估计值,从而提高了单应矩阵的估计精确度,并且所需迭代次数更少。仿真及实验结果均表明,EW L- M算法优于黄金标准算法L- M和CW L- M算法,估计出的单应矩阵更精确,且所需迭代次数更少,在不同尺度的噪声中鲁棒性也更强。
[1] |
WU C F. Mathematical methods in computer vision[M]. Beijing: Science Press, 2008: 245-260.
|
[2] |
SERRADELL E, ÖZUYSAL M, LEPETIT V, et al. Combining geometric and appearance priors for robust homography estimation[C]//European Conference on Computer Vision Conference on Computer Vision. Crete, 2010: 58-72.
|
[3] |
LOWE D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision, 2004, 60(2): 91-110. DOI:10.1023/B:VISI.0000029664.99615.94 |
[4] |
BAY H. SURF: Speed-up robust features[C]//Proceedings of the 9th European Conference on Computer Vision-Volume Part I. Graz, 2006: 404-417.
|
[5] |
RUBLEE E, RABAUD V, KONOLIGE K, et al. ORB: An efficient alternative to SIFT or SURF[C]//2011 International Conference on Computer Vision. Barcelona, 2011.
|
[6] |
ROUSSEEUW R J. Least median of squares regression[J]. Journal of the American Statistical Association, 1984, 79(288): 871-880. |
[7] |
TORR P H S, ZISSERMAN A. MLESAC:a new robust estimator with application to estimating image geometry[J]. Computer Vision and Image Understanding, 2000, 78(1): 138-156. DOI:10.1006/cviu.1999.0832 |
[8] |
FISCHLER M A, BOLLES R C. Random sample consensus:a paradigm for model fitting with applications to image analysis and automated cartography[J]. Communications of the ACM, 1981, 24(6): 381-395. DOI:10.1145/358669.358692 |
[9] |
WANG H, MIROTA D, HAGER G D. A generalized kernel consensus-based robust estimator[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 32(1): 178-184. |
[10] |
MOISAN L, MOULON P, MONASSE P. Automatic homographic registration of a pair of images, with a contrario elimination of outliers[J]. Image Processing on Line, 2012, 2: 329-352. |
[11] |
MORE J J. Levenberg-Marquardt algorithm implementaion and theory[J]. Lecture Notes in Mathematics, 1978, 630: 105-116. DOI:10.1007/BFb0067690 |
[12] |
ZEISL B, GEORGEL P F, SCHWEIGER F, et al. Estimation of location uncertainty for scale invariant feature points[C]//British Machine Vision Conference. London, 2009.
|
[13] |
ZHAO C Y, ZHAO H C. Accurate and robust feature-based homography estimation using HALF-SIFT and feature localization error weighting[J]. Journal of Visual Communication and Image Representation, 2016, 40: 288-299. DOI:10.1016/j.jvcir.2016.07.002 |