用于实时地频域水印处理多声道音频信号的方法和装置制造方法及图纸

技术编号:8387590 阅读:278 留言:0更新日期:2013-03-07 08:16
数字音频信号实时水印在具有有限处理能力的环境下是困难的。根据本发明专利技术,关于水印重要性将在基于数据块的音频多声道信号中的声道优先级化,从而声道优先级可以为不同的输入信号数据块而改变。对于当前输入信号块,水印最重要的声道并确定要求的处理时间。如果此要求的处理时间短于预定的取决于应用的阈值,则标记次重要的声道并且确定额外要求的处理时间等等。由于包括块重叠/相加的音频水印基于块的本质并且由于对抗块假象的产生的音频质量的敏感度,解决若干个问题以便于引向可接受的性能和质量。本发明专利技术最优化一方面的水印鲁棒性和安全性和另一方面的实时处理限制之间的折中。

【技术实现步骤摘要】

本专利技术涉及用于实时地频域水印处理多声道音频信号的方法和装置,其中对于水印处理音频信号的当前输入部分的全部声道,在任何情况下,都没有足够处理能力可用,并且其中,对于水印处理,以重叠/相加方式每个声道地处理音频信号。
技术介绍
实时数字音频信号水印在处理能力有限的环境下是困难的。这是例如嵌入式平台的情况,其中,由于成本、热量和音量原因而通常使用低功率处理单元,或者是服务器的情况,在其中强力的处理器必须平行地实时水印多个数据流。通常,音频水印系统基于如下的基于块的方式操作,水印(WM)嵌入器取得N个输入信号样本的块,WM处理此块并返回N个改进输出信号样本的块。实时意味着用于信号数据块的WM处理的时间周期小于用来获得 下一个信号数据块的时间周期。如果WM处理时间较长,则违背了实时的限制并且在嵌入器的输入将发生缓冲溢出,这导致样本的丢失和可听假象(audible artefact)以及音频质量的退化。此外,嵌入水印所要求的处理时间经常是取决于音频信号内容的。
技术实现思路
所以,确保音频数据流的水印处理而不违背实时限制是重要的。一方面,这意味着在绝大多数情况下不是全部多声道数据流的声道都可以被标记。另一方面,水印尽可能多的音频数据流的声道以便于增加水印的鲁棒性和安全性是有利的。在5. I声道音频中,例如,如果仅中央声道被水印而不是左、中央和右声道或全部6个声道,则WM的鲁棒性和安全性大幅降低。为了在上述受限环境中保证实时处理,必须找到对于其水印嵌入器将需要最长的处理时间的最坏情况输入信号。基于这样的时间周期,可以计算可以实时标记的最大数量的声道。但是,这样的解决方案的缺点是,绝大多数输入信号可以比上述最坏情况输入信号更快地被处理,并且绝大多数时候,嵌入器水印比可以水印的声道更少的声道,而这降低鲁棒性和安全性。本专利技术要解决的问题是,提供具有实时限制的水印处理,在其中可以水印尽可能多的音频输入信号声道。用权利要求I中公开的方法解决此问题。在权利要求4中公开利用此方法的装置。根据本专利技术,关于水印重要性将在基于数据块的音频多声道信号中的声道优先级化,从而对于不同的输入信号数据块可以改变声道优先级。对于当前输入信号块,水印最重要的声道,例如5. I设置中的中央声道,并且确定所要求的处理时间。如果,此所要求的处理时间比预定的取决于应用的阈值小,则标记次重要的声道(例如,左声道),且确定额外要求的处理时间。以此方式,为当前输入信号块连续标记重要性降序的声道,直到总的所要求的处理时间大于预定处理时间阈值。此后,不水印剩余的声道,而仅进行必须的音频处理,从而不发生块假象(blocking artifact)。这样的“抗块处理”(参见下面的描述)通常远快于完全WM嵌入处理,并且因而此例程的方式将保证遵守实时限制。由于音频编码和水印基于块的本质并由于与对抗块假象产生的音频质量的敏感度,所以必须解决若干问题以便于引向可接受的性能和质量。本专利技术最优化一方面的WM鲁棒性和安全性与另一方面的实时处理限制之间的折中。大体上,本专利技术方法适用于实时地频域水印处理多声道音频信号,其中对于水印处理所述音频信号的当前输入部分的全部声道,在任何情况下都没有足够的处理能力,并且其中,对于所述水印处理,对所述音频信号的当前输入部分和所述音频信号的随后的输入部分,以重叠/相加方式每个声道地处理所述音频信号,所述方法包括如下步骤a)对于所述音频信号的所述当前输入部分,确定或考虑声道优先级列表;b)如果有足够的处理能力可用于水印处理所述声道优先级列表的第一声道,则水·印所述第一声道的音频内容,其中该水印处理包括-级联所述音频信号的所述当前输入部分的此声道的输入数据块和所述音频信号的随后的数据块;-幅度加权、频率变换、水印和逆频率变换所述级联的输入数据块;-幅度加权并相加两个产生的数据块,其中对于所述音频信号的数据流的全部声道的第一部分,将对应的数据块幅度加权并且相加而没有先前水印处理;否则,不水印此声道的音频内容,并略过对应的数据块;c)对所述音频信号的所述当前输入部分的剩余声道重复步骤b),并对所述音频信号的随后的输入部分继续用步骤b)和第一声道。大体上,专利技术性的装置适用于实时地频域水印处理多声道音频信号,其中,对于水印处理音频信号的当前输入部分的全部声道,在任何情况下都没有足够处理能力可用,并且其中对所述音频信号的当前输入部分和所述音频信号的随后输入部分以重叠方式/相加方式每个声道地处理所述水印处理所述音频信号,所述装置包括适配用于以下的部件a)对于所述音频信号的所述当前输入部分,确定或考虑声道优先级列表;b)如果有足够的处理能力可用于水印处理所述声道优先级列表的第一声道,则水印所述第一声道的音频内容,其中该水印处理包括-级联所述音频信号的所述当前输入部分的此声道的输入数据块和所述音频信号的随后的数据块;-幅度加权、频率变换、水印和逆频率变换所述级联的输入数据块;-幅度加权并相加两个产生的数据块,其中对于所述音频信号的数据流的全部声道的第一部分,将对应的数据块幅度加权并且相加而而没有先前水印处理;否则,不水印此声道的音频内容,并略过对应的数据块;c)对所述音频信号的所述当前输入部分的剩余声道重复步骤b),并对所述音频信号的随后的输入部分继续用处理b)和第一声道。本专利技术的有利的、额外的实施例在各自的独立权利要求中公开。附图说明参考所附附图描述本专利技术的示例性实施例,所附附图如下示出图I加权重叠-相加处理的示例;图2随着时间推移,周期中每个音频信号数据块使用的平均、最大和当前处理器负载;图3专利技术性处理的流程图;图4标记声道(MarkChannel)步骤的更具体的流程图;图5不标记声道(NotMarkChannel)步骤的更具体的流程图;图6从状态“处理(PROCESS)”到状态“略过(PASSTHROUGH)”的转变图7从状态“略过”到状态“处理”的逆转变具体实施方式 绝大多数音频处理算法,无论是音频编码还是音频水印,都是基于块的,其中,在相同的时间处理N个输入信号样本的块并生成N个输出样本。这样的基于块的处理的原因是,在频域实现部分处理而输入样本在时域,其中典型地用快速傅里叶变换(FFT)或改进离散余弦变换(MDCT)变换N个时域样本的块并将其在频域处理并使用对应的逆变换将其变换回时域。因为这样的变换对于二的指数的长度是非常高效的,所以512或1024大小的样本最常使用。基于块的音频处理的直接方式是从包含k*N到(k+l)*N-l的输入样本的大小N的第k个输入块Ik中直接生成包含k*N到(k+1 )*N-1的输出样本的大小N的第k个输出块0k。但是,输入音频信号在块边界是连续的,即,在输入块Ik和Ik+1之间的界线,并且如果独立地处理块Ik和Ik+1的内容,则将发生的是输出块Ok和0,+1之间的转变不是连续的,引起可听的微响假象。此问题的熟知解决方案是使用加权重叠-相加(WOLA)变换,其中,加权和重叠、变换、逆变换原始音频信号输入块,并且当形成输出信号时加权并相加该原始音频信号输入块,参见 J. B. Alien 的 “Short Term Spectral Analysis, Synthesis, and Modificationby Discre本文档来自技高网...

【技术保护点】
一种用于实时地频域水印处理(CC、WT、WA、35)多声道音频信号的方法,其中对于水印处理所述音频信号的当前输入部分的全部声道,在任何情况下都没有足够的处理能力,并且其中,对于所述水印处理,对所述音频信号的当前输入部分和所述音频信号的随后的输入部分,以重叠/相加方式每个声道地处理所述音频信号,所述方法包括如下步骤:a)对于所述音频信号的所述当前输入部分,确定或考虑声道优先级列表;b)如果有足够的处理能力可用于水印处理所述声道优先级列表的第一声道(32),则水印(35)所述第一声道的音频内容,其中该水印处理包括:?级联(CC)所述音频信号的所述当前输入部分的此声道的输入数据块(J0,J1)和所述音频信号的随后的数据块;?幅度加权、频率变换、水印和逆频率变换(WT0)所述级联的输入数据块;?幅度加权并相加(WA)两个产生的数据块,其中对于所述音频信号的数据流的全部声道的第一部分,将对应的数据块(J0)幅度加权并相加而没有先前水印处理;否则,不水印(39)此声道的音频内容,并略过(PASSTHROUGH)对应的数据块;c)对所述音频信号的所述当前输入部分的剩余声道重复步骤b),并对所述音频信号的随后的输入部分继续用步骤b)和第一声道。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:PG鲍姆U格里斯M阿诺德陈晓明
申请(专利权)人:汤姆森特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1