基于喷泉码及CDMA扩频的数字水印盲算法

张卫党, 吴 琳

(郑州大学 信息工程学院,河南 郑州 450001)

摘 要: 为了提高数字图像水印系统的鲁棒性和水印容量,提出一种基于喷泉码及CDMA扩频的数字图像水印算法.该算法首先对原始水印信息进行LT码预编码和CDMA扩频处理,然后将编码后的水印信息嵌入到载体图像的离散余弦变换DCT(Diserete Cosine Transform)域;在水印检测时,利用正交扩频码的互相关特性实现水印的盲检测,并且设定判决阈值将出错的水印比特删除,利用正确的水印比特进行LT码译码,提高了水印的鲁棒性.实验结果表明,该算法既能够保证水印系统具有良好的不可见性,又具有较大的水印容量,且对常见的水印攻击有较好的鲁棒性,尤其对JPEG压缩、噪声和剪切攻击有很强的鲁棒性.

关键词: 数字水印;CDMA;喷泉码;DCT;鲁棒性

0 引言

数字水印技术是一种信息隐藏技术,其基本思想是在数字图像、视频和音频等数字载体中嵌入水印信息,以达到版权保护、产品认证和信息隐藏等目的.数字水印技术可以看作一个通信系统,水印信息在传输过程中必然会受到有意或无意的攻击.很多通信技术被引入到数字水印技术中以提高水印系统的可靠性等性能.目前扩频(spread spectrum)技术已广泛应用到数字水印技术中,Cox等[1]首先提出直接序列扩频水印的思想,提高了水印系统的鲁棒性,但直接扩频水印容量较低.在通信系统中,码分多址CDMA(code division multiple access)是一种有效的通信方式,具有保密性好、容量大、可多址复用、抗噪声能力强等优点[2-4].许多研究者已经将CDMA扩频技术用到数字水印系统中,Silvestre等[5]给出了CDMA扩频水印在载体图像DCT变换域的数字水印方案;文献[6]提出了基于Gold码的CDMA扩频数字水印算法,仿真结果表明,CDMA扩频方案比直接序列扩频方法具有更好的鲁棒性;文献[7]给出了CDMA扩频与Turbo码在载体图像DCT和DWT(discrete wavelet transform)混合变换域的数字水印方案,实验结果表明,应用CDMA扩频技术不仅大大提高了水印的鲁棒性,也使得水印容量大大增加;文献[8]分析了CDMA扩频水印系统信息嵌入量、扩频码长与水印误码率之间的关系.

目前,很多研究者在数字水印系统中应用通信系统中的信道编码技术对水印信息进行预编码,以提高水印的鲁棒性.数字喷泉码[9-10](digital fountain code)是一种稀疏矩阵码,在删除信道下具有优越的性能.编码的发送端是由k个原始数据生成的任意数量的编码分组,在接收端只要能够接收到任意k(1+ε)个编码分组,即可实现完全译码,ε是译码开销,优良的喷泉码具有很小的译码开销ε.由于数字喷泉码的编译码方法简单,采用其对原始水印信息进行预编码不仅提高了水印安全性,而且可以大大提高水印的鲁棒性.LT码[11-13]是Michael Luby在2002年提出的第一种实用的喷泉码,文献[14]首先将LT码应用于数字水印系统,实验结果表明,采用LT码预编码的水印方案具有很强的抗剪切攻击能力;文献[15]给出了LT码和双伪随机序列扩频结合的水印方案,算法的鲁棒性得到了较好的改善.

基于LT码较低的编译码复杂度和良好的纠删性能以及CDMA扩频具有的抗干扰、容量大等特性,笔者提出一种新的基于LT码和CDMA扩频的载体图像DCT变换域数字图像水印盲算法.实验结果表明,该算法不仅具有较好的抗JPEG压缩能力、抗剪切攻击能力和抗噪声攻击能力,而且安全隐蔽性好,在大水印容量情况下也能完整地提取出水印信息.

第1节阐述了基于LT码编码和CDMA扩频处理的数字水印的生成方案;第2节给出了水印在载体图像DCT变换域的嵌入算法;第3节提出了水印的检测和提取方案;第4节给出了仿真实验的结果和分析,最后总结全文.

1 数字水印生成

1.1 LT码预编码

首先将原始水印图像转换成长度为r的一维二进制序列z′=T,然后对序列z′进行LT码编码,LT码的度分布函数采用鲁棒孤子度分布,其参数c=0.03,δ=0.2.设经LT码编码后的水印信息长度为L,构造出LT码的生成矩阵T,计算z=Tz′,即得到预编码后的二进制水印信息序列z=[z1,z2,…,zL]T.为平衡下节CDMA扩频处理后的混合信号,对水印序列z=[z1,z2,…,zL]T进行由{0,1}到{-1,1}的映射,即水印信息为“1”时映射为其本身,水印信息为“0”时映射为“-1”,则得到二值水印信息序列B′={b′(j)|j=1,2,…,L},其中b′(j)∈{-1,1}.

1.2 CDMA扩频水印生成

在CDMA系统中,扩频码要有良好的自相关和互相关特性,m序列、Gold码等虽然具有很好的自相关和互相关特性,但Gold码的互相关性并不理想,而m序列可用的地址码组数少.Walsh码在同步时具有理想的互相关特性,在数字水印系统中不考虑“用户”不同步问题,因此,笔者采用Walsh码作为扩频码.Walsh码可由Hadamard矩阵生成,依据密钥从Hadamard矩阵中选择K行组成Walsh码扩频码集G={gk(n)|k=1,2,…,Kn=1,2,…,N}.根据扩频码长度和可嵌入水印信息的载体图像DCT变换域系数的个数,将上节得到的二值序列B′进行分组,设共分为K组,则每组有R=L/K个元素,则经LT码编码后水印信息可以表示为

B={bk(i)|k=1,2,…,Ki=1,2,…,R},

(1)

其中,bk(i)∈{1,-1}表示第k个用户传输的第i个水印比特.应用CDMA扩频方法对水印信息扩频编码,最终生成的待嵌入水印信息表示为

(2)

式中:gk为集合G的第k个元素;wiN维向量.

2 水印嵌入算法

离散余弦变换是一种正交实变换,计算量适中且具有较好的去相关压缩能力,同时与压缩标准兼容,因此,本文水印信息选择嵌入到载体图像的DCT变换域的中频系数中.设载体图像为I,将其进行8×8分块,对每个8×8的图像子块进行DCT变换,依据密钥选取每个图像子块的DCT变换域的某些中频系数,将待嵌入水印信息依次嵌入,水印嵌入采用常用的加性嵌入规则,如式(3)所示.

(3)

式中为嵌入水印后的载体图像DCT变换域系数集;α为嵌入强度;X为嵌入水印前的载体图像系数集;wi为上节生成的待嵌入水印信息.

最后再对嵌入水印后的每个子图像块进行逆离散余弦变换,从而生成嵌有水印的载体图像Iw.

3 水印的检测和提取算法

水印检测是利用扩频码的线性相关特性,不需要原始载体图像和原始水印图像参与,实现了水印盲检测.首先将接收到的嵌有水印信息的载体图像Iw进行8×8分块,再对每个图像块进行DCT变换,根据嵌入时的密钥依次取出嵌有水印的DCT变换域中频系数,并且按照嵌入前水印信息的顺序构造出含有水印信息的系数矩阵,则水印检测端输入为

R.

(4)

然后在N维Hadamard矩阵中,根据密钥选择出与水印信息扩频时相同的Walsh码正交序列集G用于解扩.由于Walsh扩频码具有正交的特性,即不同码间的多址干扰为零.据此,将检测器输入端的载体图像DCT变换域系数集与扩频码gk作线性相关,其结果为

ηk,i

((X+αwi+n0gk)=

.

(5)

由于{gk}是正交的,即当且仅当j=k时,gj·gk为非零值,则上式可以写为

ηk,i=(X·gk)+(n0·gk)+αbk,i,

(6)

式中:ηk,i为检测出的第k个用户的第i个水印比特的相关值,它反映了提取出的DCT变换域中频系数与嵌入的水印信息的相关程度.由于载体图像DCT变换域系数和噪声与正交扩频码无关,使得相关检测值ηk,i的正负与水印比特bk,i保持一致.由于水印信息在传输过程中会受到各种攻击,因此在相关检测时设置判决阈值τ,当相关值ηk,i超过阈值τ时判定该系数中含有水印信息,并且根据ηk,i的正负判定嵌入的水印比特是“1”或者“-1”;否则,该处视为未检测出水印信息,并把LT码的编码生成矩阵T中的相应列删除.据此对相关检测结果进行如下判决:

(7)

其中为判决得到的第k个用户的第i个水印比特;τ为判决阈值,它依据实验确定.在水印嵌入时为平衡CDMA扩频后的信号,对LT码编码后的水印信息进行了“0”到“-1”的映射.因此在判决式(7)中,当相关值ηk,ilt;0时直接判决此时的水印比特为“0”.

最终,由提取出的信息及更新过的生成矩阵T进行LT码译码即可得到原始水印信息的估值序列

4 实验结果和分析

实验使用512×512的lena灰度图像作为原始载体图像,水印信息采用带“数字水印”文字标识的32×32的二值图像,分别如图1(a)、(b)所示.原始载体图像共可以划分成4 096个8×8子块,编码后的水印信息依据密钥依次嵌入到4 096个载体图像子块的DCT变换域中频系数中,用峰值信噪比(RPSN)来衡量嵌入水印后载体图像的失真情况.

实验原始水印信息的LT码编码长度L=4 096,为方便对其进行CDMA扩频处理,需将编码后的水印信息进行分组.由文献[8]分析结果可知,当嵌入载体图像的水印总能量一定时,用户数K的大小并不影响载体图像的RPSN值,因此对水印信息进行分组时选择合适的用户数即可.当水印系统满足一定不可见性,即在给定RPSN值的情况下,采用码长更长的扩频码对水印信息进行扩频,扩频后的水印信息能量增加,即嵌入载体图像的水印总能量增加,则嵌入强度α需要下降.因此,实验综合考虑了可嵌入水印信息的载体图像DCT变换域中频系数的个数和载体图像的RPSN值,选择合适的用户数K、扩频码长度N和嵌入强度α.实际应用中,一般认为载体图像的RPSN值大于38 dB时,嵌有水印的载体图像在视觉上不易被察觉.本实验嵌入水印信息的载体图像的RPSN值为40.9 dB,嵌入水印信息后的载体图像如图1(c)所示.用误码率(RBE)和相似性(NC)来衡量提取出的水印图像与原始水印图像的差别和相似度.

图1 载体图像和原始水印图像
Fig.1 Carrier image and original watermarking image

图2 不同算法在JPEG压缩攻击后提取出的水印误码率
Fig.2 BER during the JPEG compression attacks using different algorithms

为验证所提算法的鲁棒性性能,本实验给出了基于LDPC码和CDMA扩频的水印方案,采用非规则LDPC码,码率为1/4,校验矩阵的行重不固定,列重为3,译码方案为LLR-BP译码.该实验对嵌入水印的载体图像进行JPEG压缩攻击,图2为文献[6]方案、文献[15]算法、LDPC编码方案和本文算法提取出的水印误码率结果.从图2中可以看出,当压缩因子Q=10、20的情况下,图像压缩率较大,本文算法的水印误码率均低于其他3种方法;而在压缩因子Q=30、40时,此时JPEG压缩率减小.文献[6]方案由于采用非盲水印检测的方法,即检测时需要原始载体图像,提取出的水印误码率下降的较快;而本文算法采用盲检测的方式,此时检测出的正确水印比特不足以让LT码实现完全译码,因此误码率并没有降为零.实验结果表明,本文算法具有较好的抗JPEG压缩能力,且能有效抵抗高JPEG压缩.

表1给出了不同噪声和滤波攻击时3种方案提取出的水印图像和原始水印图像的相似值和误码率.实验中高斯低通滤波的窗宽为4×4,标准差为0.2,均值滤波和中值滤波的窗宽均为3×3.由表1实验结果可知,本文算法的抗高斯滤波和均值滤波性能低于文献[15]算法,这是因为在载体图像中嵌入水印信息相当于在图像中加入噪声,而本文算法水印信息仅嵌入了DCT变换域的某些中频系数.经过线性的均值滤波和高斯低通滤波后图像像素值改变较大导致相关检测时相关性降低,从而在水印提取时删除的水印比特过多,

而LT码不具有纠错能力,仅利用少量正确的水印信息不能完全译码,故其误码率增大.从表1可以看出,对水印化载体图像进行非线性的中值滤波时,与其他方案相比,本文算法具有较低的误码率.通过实验结果对比可知,嵌入水印的载体图像遭受不同程度噪声的攻击时,应用本文算法提取出的水印的误码率仍然很小,这表明该方案的抗噪声攻击的能力很强.

表2给出3种方案在剪切比分别为65%、25%、50%和中心剪切的剪切攻击下3种算法提取出的水印图像及误码率.实验中嵌有水印的载体图像被剪切的部分用白色像素替代.在剪切攻击时用白色像素填充的部分在水印相关检测时相关值低于判决阈值而被删除,提取时利用未被剪切部分检测出的正确水印信息进行LT码译码,恢复出原始水印信息.从表2可见,

表1 水印化图像在各种噪声和滤波攻击后提取出的水印相关值和误码率

Tab.1 Correlation values and BER during all kinds of noise and filtering attacks on watermarked image

攻击方式及参数本文算法文献15算法LDPC码编码方案NCRBE/%NCRBE/%NCRBE/%椒盐噪声(方差var=0.01)0.99451.85550.99312.34380.97389.8633椒盐噪声(方差var=0.1)0.940830.76170.936136.52340.932234.5703高斯噪声(方差var=0.05)0.961116.30860.944327.63670.953021.1914高斯噪声(方差var=0.1)0.958717.48050.946226.07420.946325.5859中值滤波(3×3)0.948922.65630.932257.51590.931235.7422高斯低通滤波(4×4)0.966813.08590.99372.14840.964613.5754均值滤波(3×3)0.915043.55470.972710.05860.925438.7695

表2 不同剪切比例下提取出的水印图像及误码率

Tab.2 The BER and recovedred watermark image caused by crop attacks

剪切图像本文算法文献[15]算法LDPC码编码方案水印RBE/%水印RBE/%水印RBE/%10.742219.628930.078100.78138.593807.7148000.48834.1016

本文算法采用LT码编码方式优于LDPC码编码方案;与文献[15]算法的对比结果表明,本方案采用CDMA扩频方式具有更好的鲁棒性.表2实验结果表明,本文算法在剪切比低于50%时均可无差错地恢复出原始水印信息,具有很强的抗剪切攻击能力.

针对该方案的水印容量问题,实验时选择合适的扩频码长度N和嵌入强度α,保证载体图像嵌入不同大小的水印信息后仍然能满足一定的不可见性,嵌入的水印信息均为二值图像,实验中最大的水印图像大小为64×64.图3给出了该算法在不同水印嵌入量且没有攻击时提取出的水印信息的误码率.当水印嵌入量为212 bit时,误码率为0.041 5;水印嵌入量小于212 bit时,均可无差错地提取出水印信息.实验结果表明,本文算法具有较大水印容量,且水印嵌入量较大时仍然具有较低的误码率,水印系统稳健性良好.

实验还通过考量3种水印方案在水印嵌入时所需的时间,以考察方案的复杂性和可实行性.3种方案均嵌入32×32的二值图像水印信息,仿真100次得到水印嵌入时间的平均值.本文算法、文献[15]算法和LDPC码编码方案的水印嵌入时间分别为72.7 s、65.3 s和344.2 s.本文算法采用LT码编码方式,较传统信道编码LDPC码的编码方案的水印嵌入时间大大减小,比文献[15]算法的水印嵌入时间略有增大.综合考虑可知,采用本文方案的水印系统具有较好的鲁棒性和较大的水印容量,说明本文方案具有一定的可行性.

图3 嵌入量对比特错误率的影响
Fig.3 The affect of RBE in different embedding quantity

5 结束语

笔者所提算法综合考虑了CDMA扩频水印模型各种指标之间的制约关系,并采用LT码对水印信息进行预编码,与传统的信道编码技术相比具有更低的编译码复杂度;同时采用CDMA扩频方式大大提高了水印容量,水印提取时不需要原始载体图像和水印图像,从而实现了完全意义上的水印盲检测.本文算法中生成扩频码集和选择载体图像DCT变换域系数均需要密钥控制,因此,水印检测提取时需要原始密钥,增强了水印系统的安全性.实验结果表明,本文算法不仅复杂度低,具有较大的水印容量,而且在高JPEG压缩比、高剪切比和噪声攻击下有很好的鲁棒性,并对其他常见图像处理和攻击也有较好的鲁棒性.为了进一步提高算法的稳健性,今后可以采用性能更优异的其他度分布函数来提高LT码的编译码性能,降低译码的误码率.因LT码不具有纠错能力,未来也可以采用其他实用的喷泉码作为水印的预编码方案,以提高数字水印系统的鲁棒性.

参考文献:

[1] COX I J, KILIAN J, LEIGHTON T. Secure spread spectrum watermarking for multimedia[J]. IEEE transactions on image processing, 1997, 6(12): 1673-1687.

[2] KHALIL M, ADIB A. Embedding and extracting multiple watermarks in audio signals using CDMA[C]//2014 9th International Conference on Intelligent Systems: Theories and Applications. Rabat: IEEE, 2014: 1-7.

[3] JURGEN G, MUHAMMAD K S. CDMA based reversible and blind watermarking scheme for images[J]. International journal of future computer and communication, 2013, 2(2): 138-141.

[4] KESHAV S R, DHEERENDRA S T. Digital watermarking schemes for authorization against copying or piracy of color images[J]. Indian journal of computer science and engineering, 2010, 1(4): 295-300.

[5] SILVESTRE G C M, DOWLING W J. Embeding data in digital images using CDMA techniques[C]//Proceedings of the 7th IEEE International Conference on Image Processing. Vancouver, Canada: IEEE, 2000: 589-592.

[6] 高琦,李人厚,王慧琴,等. 基于Gold码的扩频数字水印算法[J]. 西安交通大学学报, 2004, 38(2): 68-75.

[7] 许文丽,李磊,王育民. 抗噪声、几何失真和JPEG压缩攻击的鲁棒数字水印方案[J]. 电子与信息学报, 2008, 30(4): 933-936.

[8] 方艳梅,谷利民,黄继武. 利用边信息嵌入的CDMA水印信道性能研究[J]. 电子学报, 2006, 34(1): 45-50.

[9] OROZCO-VIVIAN L, SHAHRAM Y. Trapping sets of fountain codes[J]. IEEE communications letters, 2010, 14(8): 755-757.

[10] KORUS P, BIALAS J, DZIECH A. A new approach to high-capacity annotation watermarking based on digital fountain codes[J]. Multimedia tools and applications, 2014, 68(1): 59-77.

[11] GUO T C, LEI C, ZHENG H F. Analysis of the degree distribution for LT codes[J]. International journal of wireless and mobile computing, 2014, 7(3): 224-230.

[12] CHEN C M, CHEN Y P, SHEN T C, et al. A practical optimization framework for the degree distribution in LT codes[J]. Ieice transactions on communications, 2013, 96,B(11): 2807-2815.

[13] MICHAEL L. LT codes[C]//Proceedings of the 43rd Annual IEEE Symposium on the Foundations of Computer Science. Vancouver B C, Canada: IEEE, 2002: 271-280.

[14] 克兢,郭建新,唐升. 一种基于LT码的抗剪切攻击信息隐藏算法[C]//Proceedings of 2010 Asia-Pacific Conference on Information Network and Digital Content Security(2010APCID). 北京:中国人工智能学会智能数字内容安全专业委员会, 2010: 4-5.

[15] 张卫党,李方圆,陈美玲. 基于喷泉码的数字图像水印的研究[J]. 郑州大学学报(工学版), 2014, 35(6): 52-55.

[16] PARAH S A, ASHRAF S, ASHRAF A. Robustness analysis of a digital image watermarking technique for various frequency bands in DCT domain[C]//2015 IEEE International Symposium on Nanoelectronic and Information Systems. Indore: IEEE, 2015: 57-62.

Blind Digital Watermarking Algorithm Based on Fountain Code andCDMA Spread Spectrum

ZHANG Weidang, WU Lin

(School of Information Engineering, Zhengzhou University, Zhengzhou 450001, China)

Abstract: In order to improve the robustness and watermark capacity of digital image watermarking system, this paper presented a digital image watermarking algorithm based on fountain code and CDMA spread spectrum techniques. LT code for the purpose of encoding the original watermark was adopted, and then CDMA spread spectrum techniques was used to generate the encoded watermark information. The encoded watermark information was embedded in the DCT domain of the carrier image. Blind recovery of the embedded data was achieved by using the character of cross-correlation function of the orthogonal spread spectrum code. The error watermark bits would be deleted by setting decision threshold and then using the correct watermark bits to decode, which could ipmove the robustness of digital watermarking system. The result showed the scheme proposed in this paper could embed larger quantities of information and raise robustness, especially it was robust against JPEG compression, noise and cropping attacks.

Key words: digital watermarking;CDMA;fountain code;DCT;robustness

收稿日期:2017-03-26;

修订日期:2017-06-28

基金项目:国家自然科学基金资助项目(U1204607)

作者简介:张卫党(1958— ),男,河南郑州人,郑州大学教授,博士,主要从事信道编码研究,E-mail:iewzhang@zzu.edu.cn.

文章编号:1671-6833(2017)06-0023-06

中图分类号: TU528.1

文献标志码:A

doi:10.13705/j.issn.1671-6833.2017.06.005