使用相位修改给音频信号隐蔽地加水印制造技术

技术编号:3044460 阅读:331 留言:0更新日期:2012-04-11 18:40
音频信号的水印倾向于以音频内容中的变化不能被人类听觉系统所识别的方式来操作音频信号。本发明专利技术使用音频信号的相位修改,以减少水印的可听度和改进水印的鲁棒性。在频域中,根据参考相位序列来操作音频信号的相位,然后变换到时域中。由于在整个频率范围上的音频信号的相位改变是可听见的,因此仅仅在较高频率和/或有噪声的音频信号部分中的一个或更多个较小的频率范围内,根据心理声学来执行相位操作。优选地,根据心理声学原理来控制剩余的频率范围中的相位变化的可允许幅度。通过将加水印的音频信号与相应的逆变换后的候选参考相位序列进行相关,从加水印的音频信号中对水印进行解码。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于通过使用音频信号的相位修改来传输或取 回嵌入所述音频信号的水印数据的方法和设备。
技术介绍
音频信号的水印倾向于以音频内容中的变化不能被人类听觉系 统所识别的的方式来操作音频信号。大多数音频水印技术向原始的音 频信号添加覆盖该音频信号的整个频谱的扩频信号,或者向原始的音 频信号插入使用扩频信号调制的一个或更多个载波。存在或多或少可 听见的、以或多或少的鲁棒方式的水印的诸多可能性。当前最主要的技术使用心理声学整形的扩展频谱,例如参见WO-A-97/33391和 US-A-6061793。该技术提供了可听度与鲁棒性之间的良好折衷,尽管 其鲁棒性并不是最佳的。在另一技术中,通过相位编码将编码的数据(即水印)隐藏在原 始音频信号的相位中W. Bender, D. Gmhl, N. Morimoto, A. Lu, Techniques for Data Hiding, IBM Systems Journal 35 , Nos. 3&4, 1996, 第313-336页。另一技术是相位调制S.S. Kuo, J.D. Johnston, W, Turin, S.R. Quackenbusch, Covert Audio Watermarking using Perceptually Tuned Signal Independent Multiband Phase Modulation, IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2002年5月,vol.2 , IEEE Press,第1753-1756页。
技术实现思路
然而,对于某些类型的音频信号而言,不可能在解码器侧重新获 得扩展频谱并对其进行解码。如果使用通过扩频序列调制的载波,则 可能通过应用陷波滤波器而容易地移除载波。上述相位编码技术的缺点在于,该技术对于剪切而言不具有鲁棒 性,并且未实现可接受的数据速率,而且这两种与相位有关的技术均需要原始音频信号以用于解码,因而检测器以非隐蔽(non-blind)的 方式工作。本专利技术要解决的问题是提高解码器侧的水印检测可靠性和改进水 印信号的鲁棒性,从而仍然允许解码器中隐蔽(blind)的检测器操作。 该问题通过权利要求1和3中公开的方法来解决。在权利要求2和4中公 开了利用这些方法的设备。本专利技术使用音频信号的相位修改来嵌入水印信号数据。在解码器 侧的隐蔽检测是可行的,g卩,对水印信号的解码不需要原始音频信号。 在频域中,可以根据参考相位序列(例如相位值在-ti和71之间 且包括和7i的扩频序列或m序列或伪随机分布)的相位来操 作音频信号的相位。这可以包括将音频信号分离到重叠块中,使用傅 立叶或任何其它时域到频域的变换来变换这些块,并基于参考相位序 列的伪随机数和人类听觉系统模型来改变原始相位,将相位改变的频 谱逆(傅立叶)变换回时域中,并对该块执行重叠/相加。所产生的改 变后的音频信号听起来与原始音频信号相似。由于在整个频率范围上的音频信号相位的改变是可听见的,因此 仅在位于较高的频率和/或有噪声的音频信号部分中的一个或更多个 较小的频率范围内执行较强(例如-兀/+兀)的相位操作,相应的频率范 围根据心理声学原理来确定。在另一实施例中,也可以在剩余的频率范围中改变相位值,根据 心理声学原理来控制可允许的相位改变程度。此外,可以根据心理声学原理来改变(可听度较低的)频点的幅度,以允许更大的(不可听 见的)相位改变。通过将接收的音频信号与在编码中使用的相应的逆(傅立叶)变 换的候选参考相位序列进行相关,或者通过使用匹配滤波器代替相关,在解码器侧对加水印的音频信号进行解码。本专利技术实现了鲁棒性与可听度之间的良好的折衷,实现了高数据 速率,有利于实时处理并且适用于嵌入式系统。原则上,本专利技术的方法适用于通过使用音频信号的相位修改而把 数据加水印嵌入所述音频信号的方法,所述方法包括以下步骤-根据所述水印数据的当前比特值来控制相应的参考数据序列的 选择或产生;-根据所述相应的参考数据序列,来修改所述音频信号的当前的 时域到频域转换后的块中的相位值,由此通过与心理声学有关的计算, 来确定在所述当前块中针对预定的最大数量的所述相位值修改的可允 许的一个或多个频率范围;-对所述音频信号的所述当前块的修改后的版本进行频域到时域 的转换;-输出加水印的音频信号的相应部分。本专利技术的设备大体上适用于通过使用音频信号的相位修改而把 数据加水印嵌入所述音频信号的设备,所述设备包括-装置,适用于根据所述水印数据的当前值来控制相应的参考数 据序列的选择或产生;-装置,适用于根据所述相应的参考数据序列来修改所述音频信 号的当前的时域到频域转换后的块中的相位值,由此通过与心理声学 有关的计算,来确定在所述当前块中针对预定的最大数量的所述相位 值修改的可允许的一个或多个频率范围;-装置,适用于对所述音频信号的所述当前块的修改后的版本进 行频域到时域的转换,以及适用于输出加水印的音频信号的相应部分。原则上,本专利技术的水印解码适用于取回通过使用音频信号的相位 修改而嵌入所述音频信号的水印数据,其中所述水印数据的当前比特 值由相应的参考数据序列的选择或产生来控制,而且,根据所述相应 的参考数据序列,对所述音频信号的当前的时域到频域转换后的块中 的相位值进行修改,由此通过与心理声学有关的计算,来确定在所述 当前块中针对预定的最大数量的所述相位值修改的可允许的一个或多个频率范围,并对所述音频信号的所述当前块的修改后的版本进行频 域到时域的转换,以形成加水印的音频信号的相应部分,所述方法包 括以下步骤-将所述加水印的音频信号的当前块与所述参考数据序列候选的 频域到时域转换后的版本进行相关或匹配;-根据所述相关或匹配的结果来确定所述水印数据的比特值。 原则上,本专利技术的水印解码设备取回通过使用音频信号的相位修 改而被嵌入所述音频信号的水印数据,其中所述水印数据的当前比特 值是通过相应的参考数据序列的选择或产生来控制的,而且,根据所 述相应的参考数据序列,对所述音频信号的当前的时域到频域转换后 的块中的相位值进行修改,由此通过与心理声学有关的计算,来确定 在所述当前块中针对预定的最大数量的所述相位值修改的可允许的一 个或多个频率范围,并对所述音频信号的所述当前块的修改后的版本 进行频域到时域的转换,以形成加水印的音频信号的相应部分,所述 设备包括-装置,适用于产生或存储所述参考数据序列候选的频域到时域 转换后的版本;-装置,适用于将所述加水印的音频信号的当前块与所述参考数 据序列候选的频域到时域转换后的版本进行相关或匹配,以及适用于根据所述相关或匹配的结果来确定所述水印数据的比 特值。在各个从属权利要求中公开了本专利技术的有益的附加实施例。 附图说明参照附图描述了本专利技术的示例性实施例,其中示出了.-图1是本专利技术的水印编码器和解码器的简化的框图; 图2是更详细的水印编码器框图;图3示出了时域中的原始音频信号和加水印的音频信号;图4是水印解码器框图;图5示出了相关结果;图6示出了音频信号频谱的特定区域中的是/否相位变化; 图本文档来自技高网
...

【技术保护点】
一种用于通过使用音频信号(AUI)的相位修改(PHCHM,PHCH)而把数据(PD)加水印嵌入所述音频信号的方法,所述方法包括以下步骤:    -根据所述水印数据(PD)的当前比特值来控制(BVMOD,RPHS)相应的参考数据序列(SPRSEQ,p)的选择或产生;    -根据所述相应的参考数据序列,来修改(PHCHM,PHCH)所述音频信号(AUI)的当前的时域到频域转换(FTR)后的块中的相位值,由此通过与心理声学有关的计算(PSYA,PHLC),来确定在所述当前块中针对预定的最大数量的所述相位值修改的可允许的一个或多个频率范围;    -对所述音频信号的所述当前块的修改后的版本进行频域到时域的转换(IFTR);    -输出加水印的音频信号(WMAU)的相应部分。

【技术特征摘要】
【国外来华专利技术】EP 2005-9-16 05090261.81、一种用于通过使用音频信号(AUI)的相位修改(PHCHM,PHCH)而把数据(PD)加水印嵌入所述音频信号的方法,所述方法包括以下步骤-根据所述水印数据(PD)的当前比特值来控制(BVMOD,RPHS)相应的参考数据序列(SPRSEQ,p)的选择或产生;-根据所述相应的参考数据序列,来修改(PHCHM,PHCH)所述音频信号(AUI)的当前的时域到频域转换(FTR)后的块中的相位值,由此通过与心理声学有关的计算(PSYA,PHLC),来确定在所述当前块中针对预定的最大数量的所述相位值修改的可允许的一个或多个频率范围;-对所述音频信号的所述当前块的修改后的版本进行频域到时域的转换(IFTR);-输出加水印的音频信号(WMAU)的相应部分。2、 一种用于通过使用音频信号(AUI)的相位修改(PHCHM, PHCH)而把数据(PD)加水印嵌入所述音频信号的设备,所述设备 包括-装置(BVMOD, RPHS),适用于根据所述水印数据(PD)的 当前比特值来控制相应的参考数据序列(SPRSEQ, p)的选择或产生;-装置(PHCHM, PHCH),适用于根据所述相应的参考数据序列 来修改所述音频信号(AUI)的当前的时域到频域转换(FTR)后的块 中的相位值,由此通过与心理声学有关的计算(PSYA, PHLC),来确 定在所述当前块中针对预定的最大数量的所述相位值修改的可允许的 一个或多个频率范围;-装置(IFTR),适用于对所述音频信号的所述当前块的修改后的 版本进行频域到时域的转换,以及适用于输出加水印的音频信号 (WMAU)的相应部分。3、 一种用于取回通过使用音频信号(AUI)的相位修改(PHCHM,PHCH)而嵌入所述音频信号的水印数据(WMO)的方法,其中所述 水印数据(PD)的当前比特值由相应的参考数据序列(SPRSEQ, p) 的选择或产生来控制(BVMOD, RPHS),而且,根据所述相应的参考 数据序列,对所述音频信号(AUI)的当前的时域到频域转换(FTR) 后的块中的相位值进行修改(PHCHM, PHCH),由此通过与心理声学 有关的计算(PSYA, PHLC),来确定在所述当前块中针对预定的最大 数量的所述相位值修改的可允许的一个或多个频率范围,并对所述音 频信号的所述当前块的修改后的版本进行频域到时域的转换(IFTR), 以形成加水印的音频信号(WMAU)的相应部分,所述方法包括以下 步骤-将所述加水印的音频信号(WMAU)的当前块与所述参考数据 序列候选(DSPRSEQ; w_l, w_0)的频域到时域转换后的版本进行 相关(CORR)或匹配;-根据所述相关或匹配的结果来确定所述水印数据(WMO)的比 特值。4、 一种用于取回通过使用音频信号(AUI)的相位修改(PHCHM, PHCH)而被嵌入所述音频信号的水印数据(WMO)的设备,其中所 ...

【专利技术属性】
技术研发人员:沃尔特弗斯辛彼得乔治鲍姆
申请(专利权)人:汤姆森许可贸易公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1