人眼视觉特性与SIFT相结合的视频双水印算法

引用本文

陈淑琴, 李智, 程欣宇, 高奇. 人眼视觉特性与SIFT相结合的视频双水印算法[J]. 计算机应用, 2017, 37(7): 1936-1942.DOI: 10.11772/j.issn.1001-9081.2017.07.1936. 复制到剪切板

CHEN Shuqin, LI Zhi, CHENG Xinyu, GAO Qi. Dual watermarking algorithm based on human visual characteristics and SIFT[J]. Journal of Computer Applications, 2017, 37(7): 1936-1942. DOI: 10.11772/j.issn.1001-9081.2017.07.1936. 复制到剪切板

基金项目

国家自然科学基金资助项目（61462013，61661010）；贵州大学研究生创新基金资助项目（研理工2017079）

通信作者

李智, lizhigzu@163.com

作者简介

陈淑琴(1993-), 女, 湖北天门人, 硕士研究生, CCF会员, 主要研究方向:多媒体、信息隐藏、智能计算;
李智(1977-), 女, 贵州贵阳人, 副教授, 博士, CCF会员, 主要研究方向:多媒体、信息隐藏、智能计算;
; 程欣宇(1978-), 男, 贵州绥阳人, 副教授, 硕士, CCF会员, 主要研究方向:人工智能、图形图像;
高奇(1992-), 男, 山西平遥人, 硕士研究生, CCF会员, 主要研究方向:多媒体、信息隐藏、虚拟现实

文章历史

收稿日期：2017-01-10
修回日期：2017-02-25

Contents Abstract Full text Figures/Tables PDF

人眼视觉特性与SIFT相结合的视频双水印算法

陈淑琴, 李智, 程欣宇, 高奇

贵州大学计算机科学与技术学院, 贵阳 550025

收稿日期：2017-01-10；修回日期：2017-02-25

基金项目：国家自然科学基金资助项目（61462013，61661010）；贵州大学研究生创新基金资助项目（研理工2017079）

作者简介：陈淑琴(1993-), 女, 湖北天门人, 硕士研究生, CCF会员, 主要研究方向:多媒体、信息隐藏、智能计算;
李智(1977-), 女, 贵州贵阳人, 副教授, 博士, CCF会员, 主要研究方向:多媒体、信息隐藏、智能计算;
; 程欣宇(1978-), 男, 贵州绥阳人, 副教授, 硕士, CCF会员, 主要研究方向:人工智能、图形图像;
高奇(1992-), 男, 山西平遥人, 硕士研究生, CCF会员, 主要研究方向:多媒体、信息隐藏、虚拟现实

通信作者：李智, lizhigzu@163.com

摘要: 针对视频水印容易遭受几何攻击以及水印的鲁棒性与透明性的平衡问题，提出一种基于人眼视觉特性与尺度不变特征变换（SIFT）相结合的抗几何攻击视频双水印算法。首先获取视频序列中人眼视觉掩蔽阈值作为水印的最大嵌入强度。其次，将视频帧进行离散小波变换（DWT），对中高频子带系数提出基于视频运动信息的自适应水印算法；针对低频子带，提出基于小波低频系数统计特性的抗几何攻击视频水印算法。最后，以SIFT作为触发器判断视频帧是否遭受几何攻击，对遭受几何攻击的视频帧利用SIFT的尺度与方向不变性进行校正，并对校正后的视频帧提取水印信号；针对非几何攻击的视频帧，直接利用中高频提取算法。所提算法与实时性视频水印算法——基于小波域直方图的视频水印（VW-HDWT）算法比较，峰值性噪比值（PSNR）提高了7.5%；与基于特征区域的水印算法相比，水印嵌入容量提高约10倍。实验结果表明，在保证水印透明度较好的情况下，所提算法对常规几何攻击具有较强的鲁棒性。

关键词: 抗几何攻击人类视觉系统尺度不变特征变换双水印离散小波变换

Dual watermarking algorithm based on human visual characteristics and SIFT

CHEN Shuqin, LI Zhi, CHENG Xinyu, GAO Qi

School of Computer Science and Technology, Guizhou University, Guiyang Guizhou 550025, China

Foundation Item: This work is partially supported by the National Natural Science Foundation of China (61462013, 61661010), Graduate Innovation Funds of Guizhou University (Research Engineering 2017079)

Author introduction: CHEN Shuqin, born in 1993, M. S. candidate. Her research interests include multimedia, information hiding, intelligent computing;
LI Zhi, born in 1977, Ph. D., associate professor, Her research interests include multimedia, information hiding, intelligent computing;
CHENG Xinyu, born in 1978, M. S. candidate, associate professor. His research interests include artificial intelligence, graphics and image;
GAO Qi, born in 1992, M. S. candidate. His research interests include multimedia, information hiding, virtual reality

Abstract: Focusing on the issue that the video watermarking information is vulnerable to geometric attacks and the balance between robustness and adaptability of the watermarking algorithm, a dual watermarking scheme based on human visual characteristics and Scale Invariant Feature Transform (SIFT) was proposed. Firstly, the human visual threshold in the video sequence was taken as the maximum embedding strength of the watermark; secondly, the video frame was processed by Discrete Wavelet Transform (DWT). An adaptive watermarking algorithm based on video motion information was proposed for medium-high frequency subband coefficients; based on statistical properties of wavelet coefficients, an anti-geometric attack video watermarking scheme was proposed for low-frequency ones. Finally, SIFT was acted as the trigger to judge whether the video frame was subjected to geometric attacks. The video frames were corrected by using the SIFT scale and orientation invariance when it was under geometric attack, and the watermark signal of the video frame was extracted after correction. For video frame under non-geometric attack, the medium-high frequency extraction scheme was used directly. In comparison with the real-time robust video watermarking algorithm, called VW-HDWT (Video Watermarking based on Histogram in DWT domain) algorithm, the Peak Signal-to-Noise Ratio (PSNR) value was improved by 7.5%. Compared with the watermarking algorithm based on feature area, the capacity of watermark embedding could be increased by about 10 times. The experimental results show that the proposed scheme is robust to common geometric attacks in the condition of fine watermarking transparency.

Key words: anti-geometric attack Human Visual System (HVS) Scale Invariant Feature Transform (SIFT) dual watermarking Discrete Wavelet Transform (DWT)

0 引言

随着网络技术的快速发展，越来越多的数字媒体作品发布在互联网上，由于互联网的实时性和交互性，人们可以很方便地通过网络对媒体信息进行下载、存储以及传播。人们在感受到互联网带来便捷信息交互的同时，也导致媒体作品很容易被篡改与破坏，因此对数字作品进行有效的版权保护是信息安全领域一个急需解决的研究课题。

视频水印作为一种版权保护技术，通过将数字水印信号嵌入到视频序列中，实现保护视频版权的目的。为了更好地实现这一功能，不仅要求水印算法具有较好的鲁棒性，还进一步要求水印信号在嵌入到不同内容的载体中时水印算法具有基于载体内容的自适应性。对视频水印而言，Cox等^[1]提出基于扩频思想离散余弦变换(Discrete Cosine Transform，DCT)域的经典鲁棒水印算法，该算法巧妙地运用扩频思想结合加法及乘法法则多次进行水印的嵌入，但对不同的DCT系数，该算法的嵌入强度没有区别对待，人眼视觉特性也并未在该算法中进行考虑。伴随着自适应水印算法的发展，文献[2]中，利用人类视觉系统(Human Visual System，HVS)掩蔽效应的方法，通过使用块DCT和区域感知分类器技术，提出一种自适应水印技术。这种水印嵌入技术利用不同的方法对噪声的灵敏度进行分析，提高算法嵌入强度的自适应性。为提升水印的抗几何攻击性，进行视频水印算法研究，文献实现分块DCT系数和一阶离散小波变换(Discrete Wavelet Transform，DWT)系数之间快速转换方法，提出了一种基于小波域直方图的视频水印(Video Watermarking based on Histogram in DWT domain, VW-HDWT)算法，水印信号被嵌入在小波低频子带直方图中相邻系数级里。此算法主要适应于DCT编码的视频文件，算法侧重考虑水印嵌入和提取的实时性，水印的鲁棒性有待提高。文献[4-7]均为基于尺度不变特征变换(Scale Invariant Feature Transform，SIFT)的水印算法，其中文献[4]的作者利用SIFT特征描述子具有对旋转、缩放、平移变换保持有不变性的特征获取关键点，算法对关键点的9×9邻域进行DCT，并在得到的中频子带中选取一部分系数进行水印信号的嵌入和提取，在高压缩比的JPEG攻击和方差较大的高斯滤波攻击下该水印算法所提取的水印信息受损较为严重。文献[7]作者提出利用SIFT的尺度特征变换获取稳定特征点，通过稳定特征点信息构造几何协变区域和空域的奇偶量化进行水印信号的嵌入。该算法需要在SIFT产生的所有特征点里筛选出稳定特征点，并利用这些稳定特征点构建的几何协变区域中进行水印信号的嵌入，因此该算法嵌入的信息量有限。另外，SIFT并非完全仿射不变性，故对错切和组合仿射变换的抵抗性能不足，因此单纯使用SIFT特征点构造的几何协变区域抵抗多种几何攻击效果不够理想。文献[8]运用DWT实现盲视频水印算法，该算法对整个视频帧进行多层DWT，在DWT系数中完成水印信号的嵌入和提取，因为多级DWT的运算量较大，较难满足视频水印的实时性要求。此外，文中未提及水印的检测，算法的实用性不高。文献[9]描述了一个基于视频运动目标的数字双水印认证算法。该算法主要针对监控视频进行处理，因此文中只考虑从相对固定的背景中提取运动物体，在进行水印嵌入时，针对运动物体与背景采用不同的水印嵌入算法，但是该算法并没有对运动物体的运动特性和人眼视觉特性进行分析，并且双水印系统的不可见性是否产生影响也并未进行分析。文献[10]采用子采样与压缩感知技术相结合实现基于图像双水印算法，该算法首先通过对原图像进行子采样技术得到4个子图像，其次利用压缩感知算法将4个子图像变换至压缩感知域，最后将4个子图像分成2组，一组子图像在压缩感知域内嵌入水印信号，另一组子图像再进行DCT，在DCT系数嵌入水印信号，该算法利用多重变换提高水印的嵌入容量，为双水印的研究提供一种新的思路。

本文提出一种基于人眼视觉特性与SIFT相结合的视频双水印算法，该算法首先利用块匹配算法计算出视频帧所包含的运动特征，将视频帧通过DWT分解成中高频子带和低频子带。其次，对中高频子带系数，根据视频帧内所包含的运动信息，提出了一种基于人眼视觉掩蔽特性的自适应水印算法；根据小波低频子带系数的直方图具有几何不变性原理，在小波低频系数的直方图中，通过调节相邻条形区域的数量差值嵌入水印信号，从而实现抗几何攻击的视频水印算法。最后，利用SIFT作为触发器检验视频帧是否遭受几何攻击，对遭受几何攻击后的视频帧，利用SIFT尺度与方向不变性进行校正并准确提取水印信号；对非几何攻击的视频帧，则直接利用中高频水印提取算法获取水印信号。实验表明，本文所提出的基于人眼视觉特性与SIFT相结合的视频双水印算法在保证较高可视质量的条件下，对缩放、裁剪、帧长宽比改变等常见的几何攻击和信号增强、噪声干扰等非几何攻击均具有较强的鲁棒性。

1 双水印嵌入算法 1.1 人眼视觉掩蔽阈值计算

人眼视觉掩蔽效应是指，当一个现存信号的背景区域中加入另一个信号时，现存信号背景区域内的可见度范围增加，即背景区域的人眼视觉掩蔽阈值增大。

1) 为了使视频水印具有较高的透明性和自适应性，本文分析静态图像的人类视觉特性，包括亮度、边缘、纹理的掩蔽特性，并利用文献[11]中的算法，得到关于静态图像的人眼视觉掩蔽阈值JND_s(x, y)，用于确保水印嵌入强度与原静态图像内容相适应。

2) 视频序列中存在大量的运动物体，因此通过对视频帧中运动物体进行分析，并利用文献[12]中的算法，获取关于视频运动信息的人眼视觉掩蔽阈值JND_t(x, y)。

利用式(1) 将JND_s(u, v)与JND_t(u, v)相结合，得到基于人眼视觉掩蔽阈值JND(x, y)作为本文算法中水印的最大嵌入强度，以确保水印嵌入量与视频的静态和动态内容自适应：

$ \begin{array}{*{20}{l}} {JND\left( {x,y} \right) = {\delta _1}JN{D_s}\left( {u,v} \right) + {\delta _2}JN{D_t}\left( {u,v} \right) - {\delta _3} \times }\\ {\min \left\{ {JN{D_s}\left( {u,v} \right),JN{D_t}\left( {u,v} \right)} \right\};{\delta _1},{\delta _2},{\delta _3} \in (0,1]} \end{array} $

(1)

1.2 中高频子带水印嵌入算法

根据文献[12]的水印嵌入算法，表 1列出算法流程中的相关符号。

表 1 中高频子带水印嵌入算法中的相关符号 Table 1 Symbols used in medium-high frequency subband watermark embedding algorithm

中高频子带水印嵌入算法步骤如下。

输入:inputvideo.yuv，嵌入水印的密钥Key。

输出:outputvideo.yuv。

步骤1 本文生成一个原始的二值水印向量W={w_i|1≤i≤n_w, w_i∈{0, 1}}，利用随机函数与密钥Key生成一个二值混沌向量Q={l_i|1≤i≤n_w, l_i∈{0, 1}}，将原始水印向量W与二值混沌向量Q进行按位异或得到一个置乱后的水印向量M，M={m_i|1≤i≤n_w, m_i∈{0, 1}}，如式(2) 所示，M为真正的嵌入水印向量。

$ \boldsymbol{M} = \boldsymbol{W} \oplus \boldsymbol{Q} $

(2)

步骤2 本文选用的视频序列未经过MPEG压缩，在视频序列中每一帧图像的亮度通道Y嵌入水印信号，Y通道分成不重叠8×8图像块，每次选取相邻的两个图像块B₁(x₁, y₁)和B₂(x₂, y₂)进行DWT，利用变换后的中高频子带系数C₁(u₁, v₁)和C₂(u₂, v₂)进行水印嵌入。

步骤3 JND(x₁, y₁)和JND(x₂, y₂)分别表示图像块B₁(x₁, y₁)和B₂(x₂, y₂)的人眼视觉掩蔽阈值，将该组阈值的平均值avg(JND)作为B₁(x₁, y₁)和B₂(x₂, y₂)间的水印嵌入最大量，通过计算相邻图像块的avg(JND)与小波系数子带差值diff的大小关系，自适应嵌入水印。

具体算法如下。

for i=1:n_w

if (m_i=1) and (avg(JND)>diff)

$ \left\{ \begin{array}{l} C_1^*({u_1},{v_1}) = {C_1}({u_1},{v_1}) + {\beta _1} \times \left( {\frac{{JND({x_1},{y_1}) - diff}}{2}} \right)\\ C_2^*({u_2},{v_2}) = {C_2}({u_2},{v_2}) - {\beta _2} \times \left( {\frac{{JND({x_2},{y_2}) - diff}}{2}} \right) \end{array} \right. $

(3)

end

if (m_i=0) and ((－diff) < avg(JND))

$ \left\{ \begin{array}{l} C_1^*({u_1},{v_1}) = {C_1}({u_1},{v_1}) - {\beta _1} \times \left( {\frac{{JND({x_1},{y_1}) - diff}}{2}} \right)\\ C_2^*({u_2},{v_2}) = {C_1}({u_2},{v_2}) + {\beta _2} \times \left( {\frac{{JND({x_2},{y_2}) - diff}}{2}} \right) \end{array} \right. $

(4)

end

当m_i=1时，本文算法可以确保$\sum\limits_{{u_1}} {\sum\limits_{{v_1}} {C_1^*} } > \sum\limits_{{u_2}} {\sum\limits_{{v_2}} {C_2^*} } $, 且$\sum\limits_{{u_1}} {\sum\limits_{{v_1}} {C_1^*} } -\sum\limits_{{u_2}} {\sum\limits_{{v_2}} {C_2^*} } = {\rm{avg}}\left({JND} \right)$。

1.3 小波域系数统计特性

灰度直方图表示图像灰度范围内每个灰度级所对应的像素个数，反映每个灰度级在一幅图像内所出现的频率，因此，灰度直方图是图像关于灰度级的像素个数统计特性。当图像遭受几何攻击时，虽然像素点的空间位置发生改变，但是整幅图像所对应的直方图主体形状不会发生强烈的变化^[3]。在本文中选择图像尺寸为480×720，灰度级为256的图像进行分析。其中图 1(a)是原图，图 1(d)是其所对应灰度直方图；图 1(b)、1(c)分别是对原图进行缩放和旋转几何攻击后所得到的图像；图 1(e)、1(f)分别是图 1(b)、1(c)所对应的灰度直方图。通过两幅遭受几何攻击后的图像灰度直方图可见，虽然原图像遭受几何攻击后像素点的空间位置与主体区域内不同灰度级的像素数量均发生改变，但是相邻灰度级之间像素数量的相对关系几乎没有变化，因此，灰度直方图中相邻灰度级之间的像素数量相对关系应具有几何近似不变性。

图 1 图像直方图统计图 Figure 1 Image histogram statistics

从离散小波变换的基本原理可知，当图像经过DWT后获得的低频子带为原图在最大尺度、最小分辨率下的最优逼近，低频子带系数的统计特性与原始图像类似，因此，对低频子带的系数值进行直方图统计时，其系数值的直方图中，相邻条形区域之间像素数量相对关系也应对几何变换具有近似不变的性质^[3]。如图 2(a)~(d)所示，其中：图 2(a)为原始图像小波低频系数直方图，图 2(b)为原图缩小0.7倍进行小波变换后低频系数直方图，图 2(c)为原图旋转5°进行小波变换后低频系数直方图，图 2(d)为原图长宽比改变进行小波变换后低频系数直方图。

图 2 低频系数直方图统计图 Figure 2 Low frequency coefficient histogram statistics

1.4 低频子带水印嵌入算法

表 2列出低频子带水印嵌入算法中相关符号。

表 2 低频子带水印嵌入算法中的相关符号 Table 2 Symbols used in low frequency subband watermark embedding algorithm

低频子带水印信息的嵌入算法步骤如下。

输入:inputvideo.yuv，嵌入水印的密钥Key。

输出:outputvideo.yuv。

步骤1 与中高频子带水印生成算法相同，通过二值向量W与混沌向量Q按位异或，获取真正的水印向量M。

步骤2 利用每帧图像亮度通道Y中所有8×8图像块B(x, y)的小波低频子带系数生成系数直方图，求出所有图像块低频子带系数E(u, v)的最大值max(max(E(u, v)))与平均值avg(avg(E(u, v)))。为了将M中所有水印信号全部嵌入到小波系数直方图主体条形区域中且保证了算法的鲁棒性，主体条形区域R的宽度必须大于2n_w。本文利用E(u, v)的最大值和平均值比值的大小，在小波系数的直方图中定义一个主体条形区域，如式(5) 所示：

$ \begin{array}{l} R = [\left( {1 - \alpha } \right){\rm{avg}}\left( {{\rm{avg}}\left( {E\left( {u,v} \right)} \right)} \right),\left( {1 + \alpha } \right){\rm{avg}}\left( {{\rm{avg}}\left( {E\left( {u,v} \right)} \right)} \right)];{\rm{ }}\\ \alpha = \frac{{{\rm{avg}}\left( {{\rm{avg}}\left( {E\left( {u,v} \right)} \right)} \right)}}{{\max \left( {\max \left( {\left( {E\left( {u,v} \right)} \right)} \right)} \right)}} \end{array} $

(5)

步骤3 将主体条形区域R进行两两分组，分别用H₁和H₂表示直方图中两个相邻的条形区域，h₁和h₂分别是H₁和H₂所对应的系数个数，嵌入水印信号过程是通过调整h₁和h₂来实现，其中T值可用于调节水印鲁棒性和透明性，T值越大，水印鲁棒性越高，但水印的透明性会越低。

for i=1:n_w

if (m_i=1) and (h₁/h₂ < T)

从h₂中随机取I₀个系数增加到h₁中，使得(h₁+I₀)/(h₂-I₀)≥T；

end

elseif (m_i=0) and (h₂/h₁ < T)

从h₁中随机取I₁个系数增加到h₂，使得(h₂+I₁)/(h₁-

I₁)≥T；

end

分别利用中高频子带和低频子带水印嵌入算法对亮度通道Y进行水印嵌入，最终得到嵌有水印信号的视频帧。

2 双水印提取算法 2.1 SIFT作为触发器检测水印

SIFT算法是哥伦比亚大学David G. Lowe^[13]提出的一种图像匹配的算法。该算法对图像缩放、旋转、平移变换能保持不变，对于视觉变化、噪声等也保持一定的稳定性。该特征提取描述算子已经在物体识别、图像拼接、三维建模、视频识别、指纹与人脸识别等领域得到成功应用。本章利用SIFT特征信息来同步化水印信号。SIFT算法分为三个步骤：1) 在尺度空间中检测特征点；2) 指定特征点方向；3) 生成特征描述算子。

首先，通过高斯核生成图像的多尺度空间，如式(6)、(7) 所示：

$ {L\left( {x,y,\delta } \right) = I\left( {x,y} \right) \times G\left( {x,y,\delta } \right)} $

(6)

$ {G\left( {x,y,\delta } \right) = \frac{1}{{2\pi {\sigma ^2}}}{{\rm{e}}^{ - \left( {{x^2} + {y^2}} \right)/2{\sigma ^2}}}} $

(7)

其中：(x，y)为二维空间坐标，L(x，y，σ)为二维尺度空间的图像，I(x，y)为原图像，G(x，y，σ)表示方差为σ的高斯核函数。

特征点是由高斯差分(Difference of Gaussians, DoG)空间的局部极值点组成，在不同尺度上高斯核的差分算子即为DoG算子，如式(8) 所示：

$ \begin{array}{l} DoG\left( {x,y,\delta } \right) = \left( {D\left( {x,y,k} \right) - D\left( {x,y,\delta } \right)} \right) \times I\left( {x,y} \right) = \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;L\left( {x,y,k} \right) - L\left( {x,y,\delta } \right) \end{array} $

(8)

其中k为乘积因子，选取参数k=sqrt(2)。首先，通过D(x，y)中每个像素和它邻域内所有的点进行比较，从而获取DoG函数的极值点，如果D(x，y)为邻域内的最大值或最小值，则该像素(x，y)就为该邻域内的一个极值点。通过这种方法，初步检测出所有极值点。然后，计算出所有极值点的梯度方向直方图，检测出SIFT特征点，对接受检测的特征点进行归一化，求出特征描述算子。最后，通过计算关键点的欧氏距离作为两点相似性的判定度量。

图 3给出原图及遭受几何攻击后的图像，其中，图 3(a)为原图，图 3(b)为缩放1.2倍的图，图 3(c)是旋转5°得到的图。通过图 4(a)可对原图与遭受几何攻击的图像进行配准运算，获取大量配准后的特征点，从而为本文的后续工作提供很好的基础。

图 3 原图及几何攻击后的图像 Figure 3 Image and the image under geometric attacks

图 4 SIFT校正效果及攻击类型的判断 Figure 4 SIFT correction result and attack type judgment

2.2 利用SIFT特征点校正判断视频帧受到何种几何攻击

由上节所述可知，由于SIFT特征点对图像处理攻击及几何攻击均具有较好的稳定性和鲁棒性，因此，本文采用SIFT特征点计算仿射矩阵，通过得到的仿射矩阵判断视频帧是否遭受几何攻击以及遭受几何攻击的类型。利用仿射矩阵对几何攻击后的视频帧进行逆仿射变换以达到校正的目的。

数字图像遭受几何攻击后，只会改变图像像素的空间位置，而不会修改图像像素点的值。使用SIFT算法获取并配准原图与训练图的特征点集，根据仿射变换原理随机获得三对正确匹配点，根据这三对匹配点推算出仿射变换矩阵A。通过仿射变换矩阵来判断视频帧遭受何种几何攻击。如式(9) 所示：

$ \left[ {\begin{array}{*{20}{c}} x\\ y\\ 1 \end{array}} \right] = \boldsymbol{A}\left[ {\begin{array}{*{20}{c}} {x'}\\ {y'}\\ 1 \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {{a_{11}}}&{{a_{12}}}&{{a_{13}}}\\ {{a_{21}}}&{{a_{22}}}&{{a_{23}}}\\ 0&0&1 \end{array}} \right]\left[ {\begin{array}{*{20}{c}} {x'}\\ {y'}\\ 1 \end{array}} \right] $

(9)

图 4给出图像恢复的实验结果对比。

利用SIFT尺度不变性提取的图像特征向量，通过对特征向量进行配准运算得到匹配点，利用多对匹配点获取仿射变换矩阵。利用仿射变换矩阵估计图像的几何变换参数，恢复几何攻击前的图像信息，并同步恢复对应的水印信号。

2.3 中高频部分的水印提取算法

中高频子带水印提取算法用于提取水印信息，即利用1.2节所述算法提取在视频序列每一帧图像的亮度通道Y^*的小波中高频子带系数内的水印信息，假设解密密钥Key已知。

输入：inputvideo1.yuv，混沌向量的密钥Key，水印信号的长度n_w。

输出：水印向量wa′₁。

算法描述如下：

步骤1 与水印嵌入过程相似，获取遭受攻击后的视频帧，选择每帧图像的亮度通道Y^*进行水印的提取，将Y^*通道分割成不重叠8×8图像方块，选取相邻图像块的B′₁ (x, y)和B′₂ (x₂, y₂)进行一层二维DWT，得到对应的中高频子带C₁^* (u₁, v₁)和C₂^* (u₂, v₂)进行水印的提取。

步骤2 由下述算法流程提取水印信号：

for i=1:n_w

If ${\sum\limits_{{u_2}} {\sum\limits_{{v_2}} {C_2^*({u_2}, {v_2})} } \le \sum\limits_{{u_1}} {\sum\limits_{{v_1}} {C_1^*({u_1}, {v_1})} } }$

wa₁=1;

Else

wa₁=0;

End

步骤3 提取得到的wa₁用二值混沌向量Q和密钥Key进行解调，得到恢复后的水印向量wa′₁。

2.4 低频部分的水印提取算法

低频部分的水印提取算法用来提取利用1.4节中所述算法在视频每一帧图像亮度通道Y^*的小波低频子带系数里的水印信息。

输入:inputvideo1.yuv，密钥Key，水印信号的长度n_w。

输出：水印向量wa′₂。

算法描述如下：

步骤1 利用1.4节所述算法，得到每帧图像亮度通道Y^*中，所有8×8图像块的低频子带系数。

步骤2 通过主体条形区域控制参数α，计算得到主体条形区域R，将R中的所有条形区域进行两两分组，比较同一组中相邻条形区域所对应的系数个数，从而提取水印信号，提取水印过程的分组与嵌入水印过程的分组相同，h′₁和h′₂分别表示两个相邻条形区域的系数个数。

for i=1:n_w

if (h′₁/h′₂>=1)

wa₂=1

else

wa₂=0

end

步骤3 提取得到的wa₂用二值混沌向量Q和密钥Key和进行解调。得到恢复后的水印向量wa′₂。

3 仿真实验及攻击分析 3.1 算法实时性分析

仿真实验选取一个标准视频序列“inputvideo.yuv”，该视频序列大小为480×720，本文算法在嵌入和检测时长分别是3 700 ms和1 888 ms，文献[3]中，一般的水印嵌入算法为3 800 ms，可知本文算法能基本满足实时性要求。

3.2 视觉质量评价

峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)是一种客观评价图像质量的标准，PSNR值越高，图像的失真就越小。本文将嵌有水印信号的视频帧作为测试样本，选取视频序列中每10帧的平均PSNR值进行统计如图 5所示，由图可知PSNR值均大于40 dB。从视觉效果上看，嵌入前后的视频帧没有区别，这说明该算法对嵌入水印后视频序列具有较好的透明性。

图 5 水印信号嵌入后视频序列的PSNR曲线 Figure 5 PSNR curve of video sequence after embedding watermark signal

3.3 水印鲁棒性分析

仿真实验选取一个标准视频序列“inputvideo.yuv”，该视频序列长度100帧，大小为480×720，颜色格式为YCbCr；水印嵌入的载体为每一帧的亮度通道Y，对于每一帧的亮度通道进行8×8分块，对每一个8×8大小的方块进行一层二维DWT。水印信号在每个视频帧中嵌入数据比特数为8 164。文献[7]内水印嵌入容量为30 bit。

为了测试水印的鲁棒性，本文将二值水印向量嵌入到原始视频帧图像中后，对其进行一些攻击后，再将水印信号提取出来，提取的水印信号与原始的水印信号进行归一化相关(Normalized Correlation，NC)函数的计算，如式(10) 所示：

$ NC = \left[ {\sum\limits_{i = 1}^M {\sum\limits_{j = 1}^N {w\left( {i,{\rm{ }}j} \right)w\prime \left( {i,{\rm{ }}j} \right)} } } \right]/\left[ {\sum\limits_{i = 1}^M {\sum\limits_{j = 1}^N {w{{\left( {i,{\rm{ }}j} \right)}^2}} } } \right] $

(10)

其中：w(i, j)表示原水印信号，w′(i, j)表示遭受攻击后的视频序列中提取出来的水印信号。

相关系数(NC)是指用提取的水印信号与原水印信号进行比较，计算它们之间的相似程度，来说明水印的鲁棒性。它的取值范围一般在(0，1) 区间，如果两个水印信号的相同位数越多，其对应的NC值越高，如果两个水印信号的相同位数越少，其对应的NC值越低。

为了验证双水印算法的鲁棒性，对嵌入水印的视频序列进行以下攻击。具体攻击如下。

1) 仿射变换。

仿射变换是一种线性变换，即二维坐标到三维坐标之间的转化。

a)带裁剪的旋转攻击。

带裁剪的旋转攻击就是对图像进行旋转攻击，为了保证攻击后的图像和原图像的尺寸相同，对攻击后的图像边缘进行裁剪。本文实验结果如表 3所示：当旋转角度为1°至30°时NC值为1；当旋转角度为35°时，NC值为0.9375。

表 3 视频帧在各种攻击下的NC值 Table 3 NC value of video frames under various attacks

因此，水印算法对旋转攻击是鲁棒的。

b)缩放攻击。

缩放是一种常见的线性变换，缩放攻击分为两种：一种是图像的长宽等比例缩放；另一种为图像的长宽不等比例缩放，即长宽比改变。本文实验中，对嵌入水印的视频帧分别进行0.7，0.9，1.2和1.5倍的等比例缩放攻击。当缩放0.9倍，本文算法的NC值为0.9375；当缩放1.5倍，本文算法的NC值为1。在长宽比攻击实验中，当长宽比为4:3时，NC=0.9688；在长宽比为11:9时，NC=1。具体实验结果如表 3所示。

c)错切变换。

图像的错切变换是使图形发生一个扭曲变化。图像错切的原理就是让图像的某个方向的坐标不变，将另一个方向坐标进行变换或者两个方向都变换。图像错切一般分为两种情况：水平错切和垂直错切。在实验中分别进行水平错切10°、20°、30°，垂直错切10°、20°、30°，NC值均为1，因此水印算法对错切变换攻击是鲁棒的。

2) 低通滤波。

低通滤波是一种常见的信号攻击方式，对该水印算法进行高斯低通滤波攻击时，NC值为0.968 8，故该算法对高斯低通滤波具有较强的鲁棒性。

3) 噪声攻击。

噪声攻击是指在视频序列中添加一定的噪声，使原有视频序列中的水印信息受遭受破坏。本文选择在视频序列中每一帧分别加入一定量的高斯噪声和椒盐噪声信号，NC均为1实验结果如表 3所示。

4) 信号增强攻击。

信号增强攻击包括亮度、对比度增强，直方图均衡的攻击等，实验结果如表 3所示。在对视频帧进行亮度增强，对比度增强，直方图均衡的攻击下，NC均为1。

3.4 几种算法的实验结果对比

几种算法的平均位错率对比如表 4所示。

表 4 3种算法的平均位错率对比 Table 4 Average bit error rate comparison of three algorithms

4 结语

本文提出一种基于人眼视觉特性与SIFT相结合的视频双水印算法。该算法首先利用DWT将每个视频帧从空域变换至离散小波域，视频帧被分解成小波域低频子带和中高频子带。中高频部分的算法是利用视频中的块匹配算法计算出多种运动特性，通过这些运动特性计算出人眼视觉特性的掩蔽阈值JND(x, y)，然后根据视频帧内容自适应地嵌入最大水印强度；低频部分，根据水印嵌入规则在小波低频子带直方图中相邻条形区域里嵌入水印信号。最后利用SIFT特征的尺度不变性和方向不变性的特点作为触发器，检验视频帧是否受到几何攻击：当嵌有水印的图像遭受到几何攻击时，使用SIFT对遭受几何攻击的视频帧进行校正，进而采用低频部分的提取算法；针对非几何攻击，直接采用中高频部分的提取算法。通过一系列实验，证明本文算法在保持较高透明性的前提下，对常见的几何攻击和非几何攻击均具有较强的鲁棒性，因此，本文算法具有较好的鲁棒性和透明度。

参考文献(References)

[1]	COX I J, KILIAN J, LEIGHTON T, et al. A secure robust watermark for multimedia[C]//Proceedings of the 1996 International Workshop on Information Hiding. Berlin:Springer, 1996:185-206.
[2]	TAO B, DICKINSON B. Adaptive watermarking in the DCT domain[C]//ICASSP 1997:Proceedings of the 1997 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway, NJ:IEEE:IEEE, 1997:2985-2988.
[3]	王丽云. 抗几何攻击的视频水印算法研究[D]. 武汉: 华中科技大学, 2011: 88-104. WANG L Y. Video watermarking algorithm against geometric attacks[D]. Wuhan:Huazhong University of Science and Technology, 2011:88-104.
[4]	王若愚. 基于SIFT的数字水印算法研究[D]. 武汉: 华中科技大学, 2011: 8-42. WANG R Y. Research on digital watermarking algorithm based on SIFT[D]. Wuhan:Huazhong University of Science and Technology, 2011:8-42.
[5]	张金利, 李敏, 何玉杰. 基于SIFT特征点和交比值的水印图像抗攻击算法[J]. 通信学报, 2014, 35(11): 170-181. (ZHANG J L, LI M, HE Y J. Image watermarking algorithm against attacks based on SIFT feature point and cross-ratio value[J]. Journal on Communications, 2014, 35(11): 170-181.)
[6]	高虎明, 李凯捷, 王英娟. 基于SIFT抗几何攻击的数字水印算法[J]. 计算机应用, 2013, 33(3): 748-751. (GAO H M, LI K J, WANG Y J. Digital watermarking algorithm of anti-geometric attacks based on SIFT[J]. Journal of Computer Applications, 2013, 33(3): 748-751.)
[7]	罗海军. 基于图像特征的抗几何攻击水印研究[D]. 长沙: 湖南大学, 2011: 30-41. LUO H J. Research on digital watermarking against geometric attacks based on image features[D]. Changsha:Hunan University, 2011:30-41.)
[8]	SHUKLA D, SHARMA M. Video watermarking using dyadic filter and discrete wavelet transform[C]//WiSPNET 2016:Proceedings of the 2016 International Conference on Wireless Communications, Signal Processing and Networking. Piscataway, NJ:IEEE, 2016:1647-1650.
[9]	SHI Y J, QI M, YI Y, et al. Object based dual watermarking for video authentication[J]. Optik-International Journal for Light and Electron Optics, 2013, 124(19): 3827-3834. DOI:10.1016/j.ijleo.2012.11.078
[10]	段加姣. 变换域双水印算法研究[D]. 哈尔滨: 哈尔滨工业大学, 2015: 29-34. DUAN J J. Research of the dual watermarking algorithm in transform domain[D]. Harbin:Harbin Institute of Technology, 2015:29-34.
[11]	李智, 陈孝威. 基于内容自适应小波域鲁棒公开数字水印算法[J]. 计算机应用, 2005, 25(9): 2148-2150. (LI Z, CHEN X W. Content-based adaptive robust public watermarking algorithm[J]. Journal of Computer Applications, 2005, 25(9): 2148-2150.)
[12]	李智, 陈孝威. 基于熵模型的高透明性自适应视频水印算法[J]. 软件学报, 2010, 21(7): 1692-1703. (LI Z, CHEN X W. Adaptively imperceptible video watermarking algorithm using entropy model[J]. Journal of Software, 2010, 21(7): 1692-1703.)
[13]	LOWE D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision, 2004, 60(2): 91-110. DOI:10.1023/B:VISI.0000029664.99615.94