用于从压缩多媒体内容中生成散列的方法技术

技术编号:3604893 阅读:149 留言:0更新日期:2012-04-11 18:40
描述了用于生成表示多媒体信号的散列信号的方法和设备。该方法包括接收包括压缩多媒体信号的比特流、从比特流中选择地读取预定参数以及从这些参数中导出散列函数。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及适合于生成表示多媒体信号的散列信号的方法和设备。
技术介绍
散列函数通常使用在密码术领域中,其中这些散列函数通常用于概括和验证大量数据。例如,由MIT(麻省理工学院)的R L Rivest教授开发的MD5算法具有作为输入的任意长度的消息,并且产生作为输出的128-比特“指纹”、“签名”或者输入的“散列”。人们推测两个不同消息具有相同散列在统计上是非常不可能的。所以,这种密码术散列算法是验证数据完整性的有用途径。在许多应用中,包括音频和/或视频内容的多媒体信号的标识是人们所希望的。然而,可以以各种文件格式频繁发送多媒体信号。例如,存在用于音频文件的若干不同文件格式,如WAV、MP3和Windows媒体,以及存在各种压缩或者质量等级。诸如MD5的密码术散列基于二进制数据格式,并因此将为相同多媒体内容的不同文件格式提供不同散列值。这使得密码术散列不适合概括多媒体数据,为此需要相同内容的不同质量版本产生相同散列或者至少产生相似散列。对于数据处理是相对恒定的多媒体内容的散列(只要处理保持可接受的内容质量)被称作稳健(robust)概括、稳健签名、稳健指纹、感知散列或者稳健散列。稳健散列捕获利用人类听觉系统(HAS)和/或人类视觉系统(HVS)所感知的音频-视频内容的感知基本部分。稳健散列的一个定义是与多媒体内容的每个基本时间单位即相对于利用HAS/HVS所感知的内容相似性是连续的半独特的比特序列相关联的函数。换言之,如果HAS/HVS把两段音频、视频或者图像识别为非常相似,则相关联的散列也应当是非常相似的。特别地,原始内容和压缩内容的散列应当是相似的。另一方面,如果两个信号确实代表不同的内容,则稳健散列应当能够辨别这两个信号(半独特)。所以,稳健散列允许内容标识,这是许多应用的基础。由Jaap Haitsma、Ton Kalker和Job Oostveen在Content BasedMultimedia Indexing 2001,Brescia,Italy,September 2001公开的“Robust Audio Hashing for Content Identification(内容标识的稳健音频散列)”一文公开了一种稳健音频散列技术,并且还公开了采用以下技术的技术方案,该技术允许通过散列内容以及将其与稳健散列值的数据库进行比较来识别未知音频内容。该提议的技术计算用于音频信号的基本窗口时间间隔的稳健散列值。音频信号因而被划分成帧,并且随后通过傅里叶变换计算每个时间帧的频谱表示。该技术的目的是提供模仿HAS行为的稳健散列函数,即提供模仿收听者将感知的音频信号内容的散列值。在这种散列技术中,如图1所示,由比特流解码器110接收包括编码音频信号的比特流。比特流解码器对比特流进行充分解码,以产生音频信号。该音频信号随后被传递到成帧单元120。该成帧单元把音频信号划分成一系列基本窗口时间间隔。这些时间间隔最好重叠,以使得从后续帧得到的散列值非常相似。每个窗口时间间隔信号随后被传送到傅里叶变换单元130,该单元130为每个时间窗口计算傅里叶变换。绝对值计算单元140随后用来计算傅里叶变换的绝对值。执行该计算是因为人类听觉系统(HAS)对相位比较敏感,并且仅仅保留频谱的绝对值,这是因为它对应于人耳将听到的音调。为了允许对于频谱内预定系列频带中的每一个计算单独的散列值,选择器151、152、……158、159用来选择对应于预期频带的傅里叶系数。用于每个频带的傅里叶系数随后被传送到相应的能量计算级161、162、……168、169。每个能量计算级随后计算每个频带的能量,并且然后把已计算的能量传送到比特导出电路170,该电路170计算散列比特(H(n,x),其中x对应于相应的频带,而n对应于相关的时间帧间隔)并将其发送到输出180。在最简单情况下,这些比特可以是指示能量是否大于预定阈值的符号。通过对应于单个时间帧整理这些比特,为每个时间帧计算散列字。类似地,由J.C.Oostveen、A.A.C.Kalker,J.A.Haitsma在SPIE,数字图像处理XXIV的应用,2001年7月31日至8月3日,圣地亚哥,USA的文章“Visual Hashing of Digital VideoApplication andTechniques(数字电视的可视散列应用和技术)”公开了用于从活动图像序列中提取基本感知特征的技术,并且通过有效地将短分段的散列值与预先计算的散列值的大型数据库相匹配来识别任何足够长的未知视频分段的技术。由于该技术涉及可视散列,因此感知特征涉及将利用HVS观看的那些特征,即,其目的是对于HVS认为是相同的内容产生相同(或者相似)的散列信号。所建议的算法看来考虑了从亮度分量或者可选择地从色度分量提取的特征,这些分量是在像素块上计算出的。在上述的音频和视频稳健散列方案中,从被划分成帧的比特流中解码相应的信息(音频或视频)信号,然后从这些帧中提取感知特征,并用于计算散列信号。
技术实现思路
本专利技术的一般目的是提供一种稳健散列技术。本专利技术的另一个目的是提供用于确定比特流内编码的多媒体信号的散列的方法和安排。在第一方面中,本专利技术提供了一种生成表示多媒体信号的散列信号的方法,该方法包括以下步骤接收包括压缩的多媒体信号的比特流;从比特流中选择地读取预定参数;以及从所述参数中导出散列函数。在第二方面中,本专利技术提供了表示多媒体信号的一种散列信号,该散列信号是通过从包括压缩版本的多媒体信号的比特流中选择地读取涉及多媒体信号的感知特性的预定参数而生成的。在另一方面中,本专利技术提供了一种被安排来生成表示多媒体信号的散列信号的设备,该设备包括接收机,被安排来接收包括压缩多媒体信号的比特流;解码器,被安排来从比特流中选择地读取预定参数;处理单元,被安排来从所述参数中导出散列函数。在从属权利要求中定义了本专利技术的其它特征。附图说明为了更好地理解本专利技术,并且为了更好地显示本专利技术的实施例如何可以实现,现在参考附图通过实例对本专利技术进行详细说明,其中图1是用于从比特流内编码的音频信号中提取散列信号的已知安排的示意图;和图2是根据本专利技术的一个实施例用于从编码的多媒体信号中提取散列信号的安排的示意图。具体实施例方式现有技术的稳健散列方案要求从已编码信号(即比特流)中解码相应信息信号,对已解码的信息信号进行抽样,以提取相关的感知信息。该感知信息随后被用来确定散列函数。本专利技术人已经认识到,传输信号的完全解码是不需要的。相反,在许多实例中,可以从比特流表示中直接确定散列函数。通常使用源编码对多媒体信号进行编码,以形成信息源的有效描述。然后,可以在比特流中有效地发送源编码的数据。为了使多媒体信号在解码时可以被识别,编码信号必须包含涉及多媒体信号的感知特征的信息。例如,变换、子带和参数编码的音频信号都包含音频信号的频谱表示。本专利技术人还认识到,这样的感知信息可以从包含编码多媒体信号的比特流中进行提取,并且直接用来计算散列函数,而不对整个比特流信号进行解码。这改善了正常的散列函数计算,而正常的散列函数计算需要对已编码比特流的解码进行相对复杂的运算,并且还需要对已解码多媒体信号的频谱表示(或其它感知特性)进行后续推导。接着,对于预定频带组中的本文档来自技高网
...

【技术保护点】
生成表示多媒体信号的散列信号的一种方法,该方法包括以下步骤:接收包括压缩多媒体信号的比特流;从比特流中选择地读取预定参数;和从所述参数中导出散列函数。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:AWJ奥门AACM卡尔克J米德詹斯JA海特斯马
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1