基于JPEG双量化效应的图像盲取证

时间:2020-10-03 10:54:51 理工毕业论文 我要投稿

基于JPEG双量化效应的图像盲取证

  摘要:JPEG图像的双量化效应为JPEG图像的篡改检测提供了重要线索。根据JPEG图像被局部篡改后,又被保存为JPEG格式时,未被篡改的区域(背景区域)的离散余弦变换(DCT)系数会经历双重JPEG压缩,篡改区域的DCT系数则只经历了1次JPEG压缩。而JPEG图像在经过离散余弦变换后其DCT域的交流(AC)系数的分布符合一个用合适的参数来描述的拉普拉斯分布,在此基础上提出了一种JPEG图像重压缩概率模型来描述重压缩前后DCT系数统计特性的变化,并依据贝叶斯准则,利用后验概率表示出图像篡改中存在的双重压缩效应块和只经历单次压缩块的特征值。然后设定值,通过值进行分类判断就可以实现对篡改区域的自动检测和提取。实验结果表明,该方法能快速并准确地实现篡改区域的自动检测和提取,并且在第2次压缩因子小于第1次压缩因子时,检测结果相对于利用JPEG块效应不一致的图像篡改盲检测算法和利用JPEG图像量化表的图像篡改盲检测算法有了明显的提高。

  关键词:双量化效应;图像篡改;拉普拉斯分布;盲取证

  引言

  JPEG(Joint Photographic Experts Group)是当前主流的图像压缩标准,是目前静态图像中压缩比较高的,被广泛地应用于多媒体和网络程序中,而针对此类图像的伪造篡改也是越来越多,并且仅仅依靠人眼很难辨别出真伪。在这种情况下图像的真实性也就成为人们所关注的问题。因此,本文对此类图像的取证技术展开研究。当前数字图像取证技术主要分为两类:主动取证和被动取证。主动取证技术[1]是预先对数字图像嵌入脆弱水印或签名,通过提取水印、签名的手段进行取证; 相比之下,数字图像被动取证技术作为一种在不依赖任何预签名提取或预嵌入信息对图像的真伪和来源进行鉴别的技术,只需要依靠待检测图像就可以实施取证,具有更高的应用价值,但其取证难度大于主动取证。针对经历双重JPEG篡改图像,研究学者已经提出了各种盲取证算法。很多学者通过对图像第1次压缩量化表的估计来定位篡改区域[2-4];Farid[5]则通过使用不同的压缩因子对待测的JPEG图像进行再次压缩,当压缩因子与篡改区域的压缩因子相同时,篡改区域表现出的失真程度最小,由此来实现对图像篡改区域的检测。He等[6]通过分析JPEG图像的离散余弦变换(Discrete Cosine Transform, DCT)系数的双重量化效应,通过寻找局部二次压缩的痕迹,首次实现了对JPEG图像的篡改区域的自动检测和定位。Binghiamton大学的Fridrich研究小组运用将针对图像单个像素点的方法转化为对图像块的操作,提出了一种基于图像块的DCT量化系数分析的盲取证算法[7];李晟等[8]则用一定的压缩因子对图像进行再次压缩,根据篡改区域的失真程度大于非篡改区域的失真程度,实现对JPEG图像的篡改检测;文献[9]通过利用每个交流(Alternating Current, AC)系数频率项的光谱能量密度中的峰值点个数与量化步长之间差值为1的特点,估计出量化表,进一步计算得到图像的块特征,通过块特征之间的不连续性来检测图像是否经过篡改。

  然而,现有的大部分盲取证算法大都要求待检测图像是未压缩或者是压缩因子较高的图像,并且能够广泛应用的JPEG图像的篡改检测算法还比较少。本文基于JPEG图像压缩理论基础,通过对JPEG图像双量化效应的分析,利用其DCT域的AC系数的分布符合拉普拉斯分布,并采用局部邻域法对λ进行估计,依据贝叶斯准则,利用后验概率表示出篡改图像中存在的双重压缩效应的篡改块,实现对篡改区域的自动检测和提取。与文献[11]所采用的算法相比,本文方法的'检测性能有很大的提升,特别是在第2次压缩因子(QF2)比第1次压缩因子(QF1)小时,检测效果更好。

  一、JPEG压缩原理

  JPEG压缩和解压过程如图1所示,JPEG压缩是一种有损压缩,它是基于8×8像素块的压缩编码过程,主要由预处理、分块、离散余弦变换、量化、Huffman编码等构成。

  原始图像数据分成8×8的小块,经过DCT后,其低频分量都集中在左上角,高频分量分布在右下角,对于每一个8×8的小块,其中D(0,0)(即第1行第1列元素,D为8×8的图像块)代表了直流(Direct Current, DC)系数,其他的63个元素是AC系数。而低频分量包含了图像的主要信息(如亮度),其中量化的目的就是为了保持低频分量,抑制高频分量,达到压缩图像的目的。而DCT系数的量化这一步骤是不可逆的,量化步长越大,图像在进行反量化时,所丢失的高频信息也就会越多,图像失真也就会越明显。量化矩阵通常与一定的压缩因子相对应, 压缩因子是一个从1到100的整数。图像进行JPEG压缩时,通常需要指定一个压缩因子QF,一旦QF确定,量化矩阵QT就可以通过式(1)计算得出:

  QT=[(QTij×α(QF)+50)/100]; i, j∈{0,1,2,…,7} (1

  α(QF)=5000/QF,1≤QF<50

  200-2QF,50≤QF≤100

  其中:QTij是JPEG标准推荐亮度分量的量化矩阵,[・]表示四舍五入运算。

  二、JPEG图像合成篡改的数学模型

  JPEG合成篡改图像是指JPEG格式的图像的一部分被其他图像置换,如图2所示,图2(a)为一幅JPEG格式的背景图像P1,图2(b)为篡改来源图像P2,图2(c)为篡改合成图像P3,其数学模型可用式(2)描述:

  y(i, j)=A1⊙P1(i, j)+A2⊙P2(i, j)=A・P(i, j)(2)

  其中:y(i, j)为JPEG篡改合成图像;⊙表示Hadamard积;P1(i, j)为一幅JPEG格式的背景图像;P2(i, j)为其他图像(可以是JPEG格式的图像,也可以是其他无损压缩格式的图像);源图像P(i, j)=[P1(i, j),P2(i, j)]T;置换混合矩阵A=[A1,A2]。这里   A1=1, (i, j)∈U10, (i, j)∈U2

  A2=1, (i, j)∈U10, (i, j)∈U2

  其中:U1∪U2=U,U1∩U2=。本文的目的就是仅仅根据篡改合成图像分离出源图像P(i, j)中的篡改区域。

  三、JPEG图像双重压缩中的双量化效应

  JPEG图像进行第1次压缩时,需要用量化矩阵QT1对DCT系数进行量化,得到量化后的DCT系数。而进行第2次压缩时,则先把量化后的DCT系数乘以第一次量化矩阵QT1,再使用第2次量化矩阵QT2来进行量化操作。