用于自动检测和标识广播音频或视频节目信号的方法和装置制造方法及图纸

技术编号:3053274 阅读:181 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及对广播节目的自动检测和标识,例如通过收音机、电视、因特网或其他媒质广播的音乐、演讲或视频。“广播”意味着任意的有效内容资源,不论是已知的还是今后发明专利技术的,其包括流线型、对等传输或者网络流量的检测。通过在节目期间为许多短时间段的每一个导出数字代码,以及通过存储数字代码的序列和参考节目标识来登记已知的节目。输入信号的检测和标识通过类似地从其上抽取出数字代码,以及通过比较检测的数字代码的序列和存储的序列而进行输入信号的检测和标识。提供可以优化存储节目的正确检测率的测试标准。其他的在比较处理中优化被用来加快比较进程。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
和内容本专利技术涉及广播节目的自动检测和标识,例如音乐或演讲,其通过收音机、电视或因特网或电视信号被广播,无论该广播是以模拟、数字或通过英特网上的数字。通过“广播”意味着任意有效的内容源,无论是现在已知的还是今后专利技术的,包括,例如流线型、对等传输或下载或流动或者网络流量的检测,包括当前内容传送功率。该系统最初存储已知的节目,通过数字采样该节目并把数字采样流分成大的时间上的片断(segment)集合。接着处理这些片断来抽取特定的特征集合,即片断的特征。本专利技术处理每一组特征来产生数字代码,其代表用于已知节目特定片断的特征集合。这些代码和标识节目的存储数据存在作为系统一部分的数据库中。一旦完成了一个或更多的存储,通过从输入信号中抽取特征集合,为每一个时间片断产生输入到系统中的数字代码并接着比较检测的数字代码和存储在数据库中的数字代码的序列,该系统接着可以检测并标识广播信号中寄存节目的存在。在比较处理中应用各种测试标准来减少假阳性(false positive)、假阴性(false negative)的比率并增加对寄存节目的正确检测。本专利技术还具有一定的改进并优化了比较处理使得其在相对短的时间里执行。 附图说明图1媒体广播监控系统的组成单元。图2从一系列的音频节目帧到节目标识的检测的检测算法的数据流程图解。图3模式(pattern)产生模块的流程图。图4初始频带边界如何导致模式在初始帧特征和以快速播放的相同音频节目的特征之间失配的例子。图5如果改变频带边界以获得在初始音频节目和以快速和慢速播放的相同音频节目的帧特征之间改善匹配的例子。图6新的频带边界设置导致音频检测算法的稳定,即使在音频节目中具有+/-2%的速度变化。图7DBS操作流程的图解。图8SRR算法的流程图。表1-5计算频带边界的例子。具体实施例方式背景本专利技术涉及一种自动标识大范围传播的节目,例如收音机、电视或通过因特网数字化传送内容。在包括广告客户的广播节目中的版权所有者,需要测量他们的节目已经何时以及何地被广播,以便正确的计算演出版税,遵守领土限制或者验证按照日程安排已经播出的特定广告。传统的用于监控收音机或者电视的方法已经包括使用人员收听或者收看并且接着记录他们所听到或者看到的,或者可选的,基于收音机和电视台的广播记录。这是工作强度处理,其受限于效率或精确度。本专利技术的一个目标是使用改善的计算系统以使得该处理完全自动化。如此,音频或视频内容记录在系统,并且接着,在检测音频的情况下,来自电视或者其他广泛传播音频内容的其他源的无线电、声道被输入到系统中。在(检测)视频的情况下,视频信号从任何一种源被输入到系统中。通过本专利技术的方式,对所记录的节目内容的检测和标识会自动发生。现有技术有很多方法用来自动检测广播节目。这些技术通常属于两种类型的其中之一提示(cue)检测或模式标识。在Miwa等人申请的美国专利NO1,225,967、Crosby申请的3,845,391,Greenberg申请的4,547,804举例说明了提示检测方法。这些技术是基于在发送之前插到节目中嵌入的提示。这些方法在本领域中并没有得到支持。在音频中,节目中的提示信号的放置已经限制了该方法的接受,因为,它需要节目所有者和/或广播公司的合作,这使得该方法是不切实际的。模式标识方法通常依赖于其内容本身的光谱特征以产生唯一的标识码或标记(signature)。这样,标识内容的技术包括两个步骤第一个是从已知的内容片断中抽取标记以提示到数据库中,以及第二个是从检测的内容片断中抽取标记并在数据库中寻找标记匹配以标识检测的内容。这样,优选的方法基于广播内容本身的特征来建立该内容独有的标记。例如,Thomas等人申请的US专利NO.4,739,398公开了一种系统,其采用一种已知的电视节目并为每一个视频帧在该帧内建立音频和视频信号之外的标记代码。最近,提出了用于因特网分配内容的类似检测系统,例如,Ikeyoze等人提出的PCT申请WO01/62004A1。对于音频本身,Moon提出的U.S.专利NO.3,919,471公开了一种音频识别系统,其中只使用了音频信号,但是它在使用上是受限的,因为它目的在于使有效的时间片段(slice)表示的音频节目与输入的广播信号相关。Moon中公开的匹配方法是非常密集型的计算,因为它依赖于直接的信号相关性。另外,该方法是不受欢迎的,因为发现其在精确性上存在限制,尤其是,如果节目是时间压缩的或者在检测之前用其他的方式改变。它还倾向于伪造正确的标识并且如果扩展时间片断的大小来改善其正确的标识的话,其在计算上又会不经济。Lert等人提出的U.S.专利NO.4,230,990中提出了一种减轻相关性的计算工作量的方法,其通过把其和第一种编码方法进行组合来实现在指示节目部分的开始的节目中检测人工编码或者一些其他的自然产生的标记,接着在预定数量的时间之后测量特征标记。该方法也只限于在音频上应用,其中音频编码必须提示到音频中以建立提示,这样,降低了它的价值或者需要内容源的合作,或者依赖于表示非常不可信的新的音频节目开始的自然标记。在Lert等人提出的U.S.专利NO.4,677,466还描述了一种对本专利技术的改进,其在测量和计算标记之前一直等待直到在信号中发生“可靠的情况”,但是该方法地可靠性受限于采样时间片断的大小。Thomas等人提出的U.S.专利NO.4,739,398通过在输入到本专利技术的标记产生进程中,随机的选择部分信号以采样,提供了一种数据处理负载问题。Ellis等人提出的U.S.专利NO.5,436,653和NO.5,612,729公开了一种更复杂的计算唯一标记的方法,其中通过比较指定视频帧和在先前的视频帧中的相同测量之间的每一个预定数量的频带中能量的改变,得到相应于给定视频帧的音频标记。然而,匹配技术依赖于音频和视频前面的组合或者使用自然标记,在这种情况下,节目的开始和结束。因此,该方法具有和Lert有关只用于音频节目的相同的问题。另外,Blum等人提出的U.S.专利NO.5,918,223公开了一种在音频节目中使用可听特征来为每一个音频节目创建单一标记值,尤其是,振幅、斜度(即,基频)、带宽、低音(即,节奏分析)、亮度(即,节目中频率响应的形状)和Mel-频倒谱(cepstral)系数的组。这些横跨视频周期的详细特征的集合产生很多不同的结果,并且在实际的广播环境中并不具有足够的稳定性。Kenyon等人提出的U.S.专利NO.5,210,820和NO.4,843,562公开了一种数字电路,其在音频信号中使用包络(例如,音量)特征来建立标记。该方法通过使用时间变形技术被设计用于时间压缩问题。基于音量会有其他的稳定性问题,即在实际环境中使用中存在困难。Well,Maxwell等人提出的U.S.专利NO.20030086341公开了一种系统,其中使用预定数量的数字采样来建立音频标记,该数量从音乐的开始点的预定位置开始计数。该方法在用于广播或者以模拟的形式检测音频的情况,或者节目重放已经改变了速度,或者已经应用了原始轨迹的频率均衡,或者把音频配音提示到节目片断中的情况。本专利技术描述了一种系统和方法,借此,可以对已知音频和视频节目标识而不依赖于一前一后的视频信号(在音频本文档来自技高网...

【技术保护点】
一种由数字信号处理系统执行的方法,其产生有关已知信号的标记,该标记包括一组至少有一个元素的数值,并且对应于至少的信号时间帧,这种已知信号由标识索引来标识并且这种时间帧由时间帧索引来标识,包括:把至少一个信号的时间帧转换到频域上,使得 对于这样的时间帧来说,具有预先确定数量的以至少一个预定宽度的频带分组的频率幅度值;为每一个频带计算一个单独的数值,其等于预定的在频带内分组的频率幅度值函数;在计算机数据库中存储与其相应的时间帧索引和标识索引相关的标记。

【技术特征摘要】
【国外来华专利技术】US 2004-2-26 60/547,9311.一种由数字信号处理系统执行的方法,其产生有关已知信号的标记,该标记包括一组至少有一个元素的数值,并且对应于至少的信号时间帧,这种已知信号由标识索引来标识并且这种时间帧由时间帧索引来标识,包括把至少一个信号的时间帧转换到频域上,使得对于这样的时间帧来说,具有预先确定数量的以至少一个预定宽度的频带分组的频率幅度值;为每一个频带计算一个单独的数值,其等于预定的在频带内分组的频率幅度值函数;在计算机数据库中存储与其相应的时间帧索引和标识索引相关的标记。2.根据权利要求1所述的方法,其中所述的预先确定包括其中之一(i)线性组合,(ii)二次函数,(iii)矩心,(iv)方差,或者(v)第n个排序矩,其中n是预定的数字。3.根据权利要求2所述的方法,还包括在相应的频带中,用预定数量的频率幅度值分割的函数结果。4.根据权利要求1所述的方法,其中所述函数是线性组合,其中每一组线性组合的系数基本上等于在由预定常数分割的频带范围内的频率幅度值的按序索引。5.根据权利要求1所述的方法,其中所述预定频带的数量在10和100之间。6.根据权利要求1所述的方法,其中所述频带占用大约0Hz和近似等于和低于4000Hz的范围。7.根据权利要求4所述的方法,其中所述预定的常数基本上等于相应频带中频率幅度值的总和。8.根据权利要求7所述的方法,还包括在相应频带中用预定数量的频率幅度值分割的函数结果。9.根据权利要求1所述的方法,其中所述频带的宽度设成基本上大于由已知信号的重放速度的预定最大变化量产生的频率幅度偏移量,这种将被测量的偏移位于频带的上边界或下边界。10.根据权利要求9所述的方法,其中所述频带的上边界等于下边界加上一个数值,该数值等于最相关的重放速度变量值乘以下边界乘以常数的绝对值,其中所述常数的范围在1和100之间。11.根据权利要求10所述的方法,其中所述常数在10和50之间。12.根据权利要求9所述的方法,其中所述对于每一个频带,频带的上边界基本上等于频带的下边界乘以一加预定值的和。13.根据权利要求10所述的方法,其中所述预定的数值基本上在0和近似10之间。14.一种由信号处理系统执行的方法,其用来确定连续时间帧持续时间的预定数量的一部分的检测信号是否是基本上与来自多个已知信号的部分至少一个已知信号相同的信号,多个已知信号的每一部分包含多个连续时间帧的持续时间并且已知信号的每个时间帧具有标识索引和时间帧索引,包括为至少一个已知信号的至少一个时间帧,计算第一个标记,其包括从在时间帧期间检测的预定数量的频率幅度值中分离出来的一组序号;在计算机数据块中存储各个第一个标记,其具有相应的信号标识索引和所述已知信号的实际开始的时间帧的邻近时间位置;为检测的信号的至少一个时间帧计算第二个标记,其包括从在时间帧期间检测的频率数值的预定字中分离出来的一组数字;从存储的第一标记集合中选择第一标记,这些第一标记与第二标记满足预定的匹配标准,其中所述这种选择作为检测信号中的每一个新的时间帧的到达结果而重复发生。15.根据权利要求14所述的方法,其中所述第一个标记和第二个标记被计算并用权利要求1、2或9所述的方法存储。16.根据权利要求14所述的方法,其中所述预定匹配标准包括计算一组差值的绝对值,该差值是每一个包括第一标记的号码集合的按序成员和每一个这种元的对应于包括第二标记的号码集合的按序成员之间的差;计算绝对值的和;以及确定该和是否产生小于预定值的绝对值。17.根据权利要求14所述的方法,其中所述预定的匹配标准包括计算一组差值的绝对值,该差值是每一个包括第一标记的号码集合的按序成员和每一个这种元的对应于包括第二标记的号码集合的按序成员之间的差;计算绝对值集合的总和;以及确定该和是否是所有检测的第一标记的最小和。18.根据权利要求14所述的方法,其中所述预定的匹配标准包括用下面组之一计算差值(i)第一标记到第二标记的近似矢量间距;(ii)第一标记和第二标记之间的近似L-1标准;(iii)在第一标记中的任一成员和其相应的在第二标记中的成员之间的近似最大差值;(iv)在第一标记中的任一成员和其相应的在第二标记中的按序成员之间的近似最小差值;(v)在第一标记中的所有成员和他们在第二标记中的相应成员之间近似平均差值。19.根据权利要求14所述的方法,还包括步骤确定第一标记的成员是否满足预定的匹配标准并具有相同的标识索引,该索引等于或者大于K+1和2K+1之间的并包括这两个值的数字,其中所述K被估计,使得2K+1等于时间帧的预定数量。20.根据权利要求14所述的方法,其中所述匹配标准包括与被检测信号匹配时间帧的时间帧索引值相比,确定相应于与相同的标识索引匹配的第一标记匹配的时间帧索引值增加是否基本没有变化。21.根据权利要求14所述的方法,其中所述匹配标准包括确定相应于与相同的标识索引匹配的第一标记匹配的时间帧索引值是否基本上是与被检测信号的匹配时间帧...

【专利技术属性】
技术研发人员:C关
申请(专利权)人:媒介向导有限公司
类型:发明
国别省市:US[美国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利