一种音频信号的可逆水印实现方法技术

技术编号:19347811 阅读:28 留言:0更新日期:2018-11-07 15:59
本发明专利技术公开了一种音频信号的可逆水印实现方法,包括:利用第一预测模型对左声道信号点的值进行预测,从而获得残差;利用残差来区分右声道信号的不同平滑区域,并利用优化算法选出最优的右声道信号滑度区域;利用第二预测模块对最佳的右声道信号滑度区域内各个点的值进行预测,并获得残差,再利用扩差法进行水印信息的嵌入与提取恢复。上述方法在提高音频嵌入容量的同时极大地降低了音频的嵌入失真,并且可以在提取水印后无损地恢复原始音频,可用于音频信号的真实性和无损性认证。

A reversible watermarking method for audio signals

The invention discloses a reversible watermarking method for audio signal, which includes: predicting the value of left channel signal points by using the first prediction model to obtain residual; distinguishing different smooth regions of right channel signal by residual, and selecting the optimal right channel signal slippage region by using optimization algorithm; and using the first prediction model to obtain the residual value; and using the second prediction model to select the optimal right channel signal slippage region; The second prediction module predicts the value of each point in the slip area of the best right channel signal, and obtains the residual. Then, the watermarking information is embedded and extracted by the spread-difference method. The above method not only improves the audio embedding capacity, but also greatly reduces the audio embedding distortion. It can recover the original audio losslessly after extracting the watermarking. It can be used for authenticity and non-destructive authentication of audio signals.

【技术实现步骤摘要】
一种音频信号的可逆水印实现方法
本专利技术涉及信息隐藏技术,尤其涉及一种音频信号的可逆水印实现方法。
技术介绍
由于传统加密方法对多媒体内容的保护和完整性认证方案无法防止再传播和盗用。数字水印技术作为加密技术的补充和延伸,在版权保护与完整性认证方面得到了迅猛的发展。数字水印技术是在数字媒体作品中嵌入作为标记的信号(图像、文字、签名、特殊含义的符号等),其目的是进行版权保护、所有权认证和完整性保护等,它是信息隐藏技术一个重要的研究方向。音频数字水印技术是指对数字音频嵌入水印信息,相对于传统的音频保护方法,音频数字水印技术无法移除,随意的更改剥离会影响音频的使用和质量;其次,音频数字水印利用了音频自身的相关性,降低了运算复杂度;更重要的是音频水印具有不可感知性,音频和水印的叠加不会影响人耳的听觉感受。音频水印按照其特性可以分为鲁棒性水印和脆弱水印两种,鲁棒性水印能够抵抗一定程度的恶意攻击(压缩、数模转换、延时等),在保证鲁棒性的同时提高水印的不可感知性,达到鲁棒性和不可感知性的最佳平衡,这种水印可以在恶劣的环境下达到保护音频版权的目的;脆弱水印不具有鲁棒性,如果音频内容发生了变化水印也会随之被更改,这种水印便于检测是否被篡改以及篡改的定位,其目的偏向于保护音频内容的完整性。然而,音频水印技术会对载体信息造成一定的损坏,接收方只能提取出嵌入的水印信息而无法完全地恢复出载体信号,这在某些实际应用中具有局限性。在对音质要求较高的商业场景中,对载体音频细微的修改也会影响音乐质量,所以原载体的无损恢复在某些领域中也体现出了需求的急迫性。可逆水印解决了这个问题,它允许原始数字音频被完全恢复,可逆信息隐藏技术能够实现在完全提取水印信息的同时无损的恢复出原始的语音载体信号,在语音中进行可逆信息隐藏处理适用于很多的应用场景,比如法律取证、刑事侦查、军事情报、高品质音乐需求方面,在这些应用中语音质量的降低、关键点模糊或者部分段的缺失都会带来严重的后果。此外,可逆信息隐藏技术还能认证语音的真实性和无损性。但是,目前的音频可逆水印在相同嵌入率下造成的音频失真相对较大,如何在相同嵌入率下降低音频的失真成为需要解决的技术问题。
技术实现思路
本专利技术的目的是提供一种音频信号的可逆水印实现方法,可用于音频信号的真实性和无损性认证。本专利技术的目的是通过以下技术方案实现的:一种音频信号的可逆水印实现方法,包括:利用第一预测模型对左声道信号点的值进行预测,从而获得残差;利用残差来区分右声道信号的不同平滑区域,并利用优化算法选出最优的右声道信号滑度区域组合;利用第二预测模块对最佳的右声道信号滑度区域组合内各个点的值进行预测,并获得残差,再利用扩差法进行水印信息的嵌入与提取恢复。由上述本专利技术提供的技术方案可以看出,在提高音频嵌入容量的同时极大地降低了音频的嵌入失真,并且可以在提取水印后无损地恢复原始音频。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。图1为本专利技术实施例提供的一种音频信号的可逆水印实现方法的流程图;图2为本专利技术实施例提供的音频左声道信号的示意图;图3为本专利技术实施例提供的音频右声道信号的示意图;图4为本专利技术实施例提供的音频库平均失真对比图。具体实施方式下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。本专利技术实施例提供一种音频信号的可逆水印实现方法,如图1所示,其主要包括如下步骤:1、利用第一预测模型对左声道信号点的值进行预测,从而获得残差。如图2所示,为音频左声道信号的示意图。左声道的第i个信号点的值与其上下文存在局部相关性,可以利用局部相邻信号点的值k<i<L'-k+1进行预测,公式如下:上式中,为的预测值;x为信号点的值,其下标为信号点的序号,上标L表示信号点属于左声道,L'为左声道信号点的数量;vp表示预测系数;将预测值与相减获得残差:特别的,本专利技术实施例中使用最小二乘回归的方法来获得向量形式的最优的预测系数vp:Xp*vp=yp;其中,当p=-3,-2,-1,1,2,3时,Xp是一个3×6矩阵,表示为:上式中,带有波浪符号的x表示预测值;vp=[v-1v-2v-3v1v2v3]T;则最优预测系数为:其中,上标T表示矩阵的转置,yp表示一个向量;w是为了避免NAN(notanumber)的问题所引入的正则项,为其寻找了一个如下经验值:上式中,e是科学计数法的一种表达方式,意思是1×10-5。2、利用残差来区分右声道信号的不同平滑区域,并利用优化算法选出最优的右声道信号滑度区域组合。根据残差的大小将右声道信号分为不同的平滑区域:上式中,l表示平滑区域,其下标j为平滑区域的序号;x为信号点的值,其下标为信号点的序号;上标R表示信号点或者平滑区域属于右声道;tr表示设定的平滑区域总数;在不同的平滑度区域内我们对其进行试嵌入,得到每个平滑度区域的嵌入容量以及对应的嵌入失真,根据指定的嵌入容量C,通过下式计算最优的平滑区域组合,使得满足嵌入容量C的前提下最小化嵌入失真:上式中,cj、dj对应的表示第j为平滑区域的嵌入容量、嵌入失真;最优解为:3、利用第二预测模块对最佳的右声道信号滑度区域组合内各个点的值进行预测,并获得残差,再利用扩差法进行水印信息的嵌入与提取恢复。本专利技术实施例中,对步骤2中所选中的最优的右声道信号滑度区域组合进行水印嵌入。如图3所示,为音频右声道信号示意图,后文主要是针对其中的各个信号点进行处理。为了防止前部信号点的修改对后部信号点的预测产生影响,假设需要预测的右声道信号点为N个,按照信号点的位置分为奇数集和与偶数集合,对这两个集合内的右声道信号点分别进行预测;1)第一轮对偶数集合进行预测,公式如下:上式中,x为信号点的值,其下标为信号点的序号,上标R表示信号点属于右声道;表示向量形式的偶数集合预测系数。通过求解下式来获得最优的偶数集合预测系数:如果N为偶数,则矩阵向量表示为:如果N为奇数,则矩阵向量表示为:从而能够计算出最优的偶数集合预测系数:上式中,d≤4;2)第二轮对奇数集合进行预测,公式如下:上式中,及均表示被嵌入水印后的信号点的值,也即,一个信号点的预测值被计算出来后则计算相应的残差并嵌入水印;表示向量形式的奇数集和预测系数。通过求解下式来获得最优的奇数集合预测系数:如果N为偶数,则矩阵向量表示为:如果N为奇数,则矩阵向量表示为:从而能够计算出最优的奇数集合预测系数:在获得各个信号点的预测值后,可以计算出相应的残差,从而利用扩差法进行水印信息的嵌入与提取恢复;具体如下:1)水印信息的嵌入时,首先计算残差:然后,根据下式进行水印信息的嵌入:上式中,b表示水印信息,t是决定嵌入容量的门限值;得到载密信号,表示为:左声道信号则不做任何修改和相应的嵌入水印的右声道信号一起合成双声道信号作为最终的载密信号。2)进行提取恢复本文档来自技高网
...

【技术保护点】
1.一种音频信号的可逆水印实现方法,其特征在于,包括:利用第一预测模型对左声道信号点的值进行预测,从而获得残差;利用残差来区分右声道信号的不同平滑区域,并利用优化算法选出最优的右声道信号滑度区域组合;利用第二预测模块对最佳的右声道信号滑度区域组合内各个点的值进行预测,并获得残差,再利用扩差法进行水印信息的嵌入与提取恢复。

【技术特征摘要】
1.一种音频信号的可逆水印实现方法,其特征在于,包括:利用第一预测模型对左声道信号点的值进行预测,从而获得残差;利用残差来区分右声道信号的不同平滑区域,并利用优化算法选出最优的右声道信号滑度区域组合;利用第二预测模块对最佳的右声道信号滑度区域组合内各个点的值进行预测,并获得残差,再利用扩差法进行水印信息的嵌入与提取恢复。2.根据权利要求1所述的一种音频信号的可逆水印实现方法,其特征在于,所述利用第一预测模型对左声道信号点的值进行预测,从而获得预测残差的步骤包括:左声道的第i个信号点的值与其上下文存在局部相关性,利用局部相邻信号点的值进行预测,公式如下:上式中,为的预测值;x为信号点的值,其下标为信号点的序号,上标L表示信号点属于左声道,L'为左声道信号点的数量;vp表示预测系数;将预测值与相减获得残差:3.根据权利要求2所述的一种音频信号的可逆水印实现方法,其特征在于,使用最小二乘回归的方法来获得向量形式的最优的预测系数vp:Xp*vp=yp;其中,当p=-3,-2,-1,1,2,3时,Xp是一个3×6矩阵,表示为:上式中,带有波浪符号的x表示预测值;vp=[v-1v-2v-3v1v2v3]T;则最优预测系数为:其中,上标T表示矩阵的转置,yp表示一个向量;w表示正则项,为其寻找了一个经验值:4.根据权利要求1所述的一种音频信号的可逆水印实现方法,其特征在于,利用残差来区分右声道信号的不同平滑区域,并利用优化算法选出最佳的右声道信号滑度区域组合的步骤包括:根据残差的大小将右声道信号分为不同的平滑区域:上式中,l表示平滑区域,其下标j为平滑区域的序号;x为信号点的值,其下标为信号点的序号;上标R表示信号点或者平滑区域属于右声道;tr表示设定的平滑区域总数;在不同的平滑度区域内我们对其进行试嵌入,...

【专利技术属性】
技术研发人员:张卫明俞能海吴媛欣姚远志
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1