The invention relates to the field of speech signal processing technology, and discloses a method of speech content forensics based on coefficient autocorrelation, which includes: original speech signal preprocessing, dividing the original speech signal into P frames, recording Ai as the first frame, dividing Ai into M segments, extracting features of coefficient autocorrelation, calculating coefficient autocorrelation of Ai and m from DCT coefficients. Degree feature; Watermarking is generated by binarization of frame number; Watermarking is embedded. The quantized coefficients C'i and m are inversely DCT, and the watermarking WM is embedded in Ai and m; Watermarking is extracted and tampered with; If an attacked voice frame is detected, the following consecutive N samples are detected until the validated consecutive N samples are found and then re-located. The difference between the two frame numbers before and after verification is defined as tampered content. This method of speech content forensics based on coefficient autocorrelation requires less embedded capacity. It can locate tampered content accurately and improve the security of watermarking system and the inaudibility of watermarking. Sex.
【技术实现步骤摘要】
一种基于系数自相关度的语音内容取证方法
本专利技术涉及语音信号处理
,特别涉及一种基于系数自相关度的语音内容取证方法。
技术介绍
数字语音信号作为重要的信息传播载体,在我们生活中发挥着越来越重要的作用。由于数字信号处理技术的发展和编辑攻击的丰富,对数字语音信号的编辑和伪造变得简单易行。伪造的数字语音信号表示的内容和原始信号相比,有着较大的区别,或者表示的意义完全不同。若伪造的语音信号的内容被用户接受,将会带来严重的后果。同时,大量存在的伪造的语音信号,已经影响了数字语音信号所表示内容的认可度。对数字语音的内容取证技术能够鉴别语音内容的真实性,而对该技术的研究也具有研究意义和实用价值。文献“Centroid-basedSemi-fragileAudioWatermarkinginHybridDomain”(H.X.Wang,M.Q.Fan,ScienceinChinaSeriesF-InformationSciences,vol.53,no.3,PP.619-633,2010)”提出了一种基于质心的语音内容取证方法。由语音信号的质心这样的特征生成水印,并将水印嵌入在基于DWT和DCT的混合域中。该方法中,生成水印的特征和嵌入水印的特征均是公开的。攻击者可以选择任意的一段语音信号,采用同样的方法,将水印嵌入在该段信号中,然后替换含水印的语音信号。验证端将检测不到替换的内容。于是,该方法存在较大的安全隐患。文献“Apseudo-Zernikemomentsbasedaudiowatermarkingschemerobustagainstdesynchron ...
【技术保护点】
1.一种基于系数自相关度的语音内容取证方法,其特征在于,包括以下步骤:S1、原始语音信号预处理将原始语音信号A分为长度为N且相互不重叠的P帧,第i帧记为Ai,其中,1≤i≤P;将Ai分为M段,M mod 2=0,第m段记为Ai,m,其中,1≤m≤M,每段的长为N1,N1=LA/(N×M),其中,LA为原始语音信号A的长度;S2、系数自相关度特征提取对Ai,m进行DCT,得到DCT系数记为Ci,m={c(1),c(2),…,c(N1)};根据公式(1)由Ci,m计算Ai,m的系数自相关度特征Di,m,
【技术特征摘要】
1.一种基于系数自相关度的语音内容取证方法,其特征在于,包括以下步骤:S1、原始语音信号预处理将原始语音信号A分为长度为N且相互不重叠的P帧,第i帧记为Ai,其中,1≤i≤P;将Ai分为M段,Mmod2=0,第m段记为Ai,m,其中,1≤m≤M,每段的长为N1,N1=LA/(N×M),其中,LA为原始语音信号A的长度;S2、系数自相关度特征提取对Ai,m进行DCT,得到DCT系数记为Ci,m={c(1),c(2),…,c(N1)};根据公式(1)由Ci,m计算Ai,m的系数自相关度特征Di,m,公式(1)中Di,m为Ai,m的系数自相关度特征,α和β为系统密钥,c(l)表示Ci,m中的第l个系数;h表示移位,当l+h>N1时,c(l+h)=c(l+h-N1);S3、生成水印Wi={w1,w2,…,wM}记为要嵌入在第i帧中的水印,Wi由W1i和W2i两部分组成,其中W1i和W2i均由第i帧的帧号二值化生成,即Wi=[W1i,W2i];S4、水印嵌入假设wm...
【专利技术属性】
技术研发人员:李艳丽,孙芳,何俊杰,刘正辉,
申请(专利权)人:信阳师范学院,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。