音视频签名、导出签名的方法以及比较音视频数据的方法技术

技术编号:7133265 阅读:351 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及用于生成音视频内容签名的音频和/或视频信号的特性分析。为了确定音频签名,在音频签名数据中标识例如高熵的感兴趣区域。然后,将该感兴趣区域提供作为具有偏移信息的音频签名。还提供了视频签名。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频和/或视频信号的特性分析。具体地,本专利技术涉及音视频内容签 名(signature)的生成和使用。
技术介绍
越来越多的广播装置对生成音频、视频或音视频内容的指纹、或签名,以及对一个 或多个音频、视频或音视频数据文件中和/或处于传输链、或音频和视频内容的并行传输 链中的一个或多个位置的这种内容的指纹或签名的比较感兴趣。已知许多获取指纹、或签名的不同方法。本专利技术试图提供一种新的签名以及用于 获得并使用扩展现有技术可用的一系列技术的签名的技术。本专利技术的签名尤其适用于要求 小签名尺寸的应用。
技术实现思路
根据本专利技术的一个方面,提供了一种导出多个音频样本的签名特性的方法,包括 以下步骤确定代表音频样本的音频签名数据;确定形成感兴趣区域的音频签名数据的部 分;以及提供该音频签名数据部分和标识(identify)音频签名数据内感兴趣区域的位置 的位置数据作为音频签名。根据本专利技术的第二方面,提供了一种导出视频数据和相关联音频样本的多个字段 或帧的签名特性的方法,包括以下步骤根据本专利技术确定音频签名;根据视频字段或帧中 的图像信息值确定视频字段或帧的空间分布数据;由空间分布数据构成视频签名;以及提 供音频签名和视频签名作为音视频签名。根据本专利技术的第三方面,提供了一种导出视频数据的多个字段或帧的签名特性的 方法,包括以下步骤根据视频字段或帧中的图像信息值确定视频字段或帧的空间分布数 据;以及由空间分布数据构成签名。根据本专利技术的第四方面,提供了一种比较视频或音视频数据的方法,其中,在从第 一视频或音视频序列的一个或多个字段或帧中导出的第一视频签名数据与在第二视频或 音视频序列内的多个时间位置处导出的第二视频签名数据之间进行多次比较,建立视频签 名数据的最佳匹配的时间位置。根据本专利技术的第五方面,提供了一种比较音频或音视频数据的方法,其中,在从第 一音频或音视频序列的两个或多个音频样本中导出的第一音频签名数据与在第二音频或 音视频序列内的多个时间位置处导出的第二音频签名数据之间进行多次比较,建立音频签 名数据的最佳匹配的时间位置。根据本专利技术的第六方面,提供了一种计算机程序产品,包括适于实施根据本专利技术 的方法的代码。 根据本专利技术的第七方面,提供了 一种装置,适于实施根据本专利技术的方法。根据本专利技术的第八方面,提供了一种用于音视频数据的签名,包括视频签名;以及包括音频签名数据和标识感兴趣区域的位置的偏移数据的音频签名。 附图说明 现在将参照附图描述本专利技术的实例,其中图1示出了可以实施本专利技术的监控系统的纵览;图2是根据第一示例性实施方式的用于生成音频签名数据的电路的框图;图3示出了示例性音频签名;图4示出了来自示例性音频签名的代表段的选择;图5示出了音频签名数据所选段内的转换距离(transition distance)计数的示 例性直方图;图6示出了示例性视频空间签名检测窗口 ;图7示出了示例性实施方式中的主AV内容分析器的操作;以及图8是第二示例性实施方式的框图。具体实施例方式现在将参照附图描述本专利技术。本专利技术可以应用于流式音视频数据的分析,并且还 可以应用于音视频数据文件或音视频序列的其他表示的分析。可以比较由流式音视频数据 和/或音视频数据文件的分析所产生的签名数据,以建立音视频内容的身份,测量音频数 据与标称捕获时间(例如,时间码)之间和/或视频数据与标称捕获时间(例如,时间码) 之间的延迟,和/或测量音频数据和视频数据之间的相对延迟。现在将参照广播链中两个点处的流式音视频信息之间的音视频内容的比较来描 述本专利技术的第一实施例。图1示出了可以实施本专利技术的监控系统的纵览。携带表示特定音视频(AV)内容 的AV数据的通信信道2具有插入其中的第一 AV内容分析器6和第二 AV内容分析器8。这 些分析器可以生成元数据,并将其附加至通信信道2上所携带的数据。第一 AV内容分析器 6经由辅助通信信道10与第二 AV内容分析器8耦合,使指令和数据能够在第一 AV内容分 析器6和第二 AV内容分析器8之间交换。该辅助信道10可以是控制和监控信道,并且可 以以任何已知的方式来实施。通常,辅助信道10与信道2的带宽相比较是低带宽。在第一 AV内容分析器6和第二 AV内容分析器8之间的信道2中存在未知信道处 理12。未知信道处理12通过但不限于以下处理来示例音频或视频噪声降低;音频或视频 压缩;视频标识插入;视频色域合法化;音频或视频同步;视频嵌入/去嵌入的音频输入/ 输出;视频标准转换;以及音频或视频格式或压缩自动译码。该处理可以改变AV数据和/ 或改变不同点处音频数据和视频数据之间的延迟。从而,比较第一 AV内容分析器6中的AV 数据和第二 AV内容分析器8中的AV数据,以验证第一 AV内容分析器6和第二 AV内容分 析器8中的AV内容是否相同是令人满意的。此外,比较每个分析点处的音频和视频数据之 间的相对延迟是有用的。显然,对于本领域的技术人员而言本专利技术可以应用于其他系统配置将是显而易见 的。例如,本专利技术可用于比较音视频数据内容和测量来自摄制作品处理(以及在很多其他 情况下)的描绘相同内容的多个音视频馈送之间的相对延迟。现在将 描述所示系统的主要操作。在以下描述中,假设第二 AV内容分析器8为 “主”AV内容分析器,其指示第一 AV内容分析器6生成AV签名,并将其自身的AV签名与第 一 AV内容分析器6所生成的AV签名进行比较。然而,对于本领域的技术人员而言可选地, 该系统可以被配置为使得第一AV内容分析器6用作主内容分析器将是显而易见的;或者使 得独立的设备用于指示第一和第二 AV内容分析器6、8以生成并报告各自的AV签名。在第一步骤中,选择应该执行AV分析的时间。在所示实施例中,用作主内容分析 器的第二 AV内容分析器8选择应该执行AV分析的时间,并指示第一 AV内容分析器6在所 选时间生成AV签名。第二 AV内容分析器8也在所选时间生成AV签名。考虑到用作主内容分析器的第二 AV内容分析器8和第一 AV内容分析器6之间的 辅助信道10中的任何延迟,应选择时间,使得当由第一 AV内容分析器6接收在该时间生成 AV签名的指令时,该时间仍在将来。所选时间通常涉及AV内容自身的特征。因此,在一种 配置中,执行AV分析的时间的选择可以通过指定生成AV签名的、用AV数据分配或嵌入AV 数据中的特定时间码来实现。确定何时执行AV分析的其他方法也是可以的,例如,可以以 规则的时间码间隔和/或在确定字段、帧或样本块的数目之后,或者当检测到程序改变或 其他程序特征时执行AV分析。在第二步骤中,在指定时间生成用于AV内容的AV签名。在所示实施例中,第一和 第二 AV内容分析器6、8均生成用于AV内容的AV签名数据。通常,第一和第二 AV内容分 析器6、8中的每一个都首先捕获预定的持续时间的AV内容,并将所捕获的AV内容存储在 本地存储器中。显然,如同通常的情况,在第一和第二 AV内容分析器6、8之间的信道2和辅助信 道10中存在任何延迟,则第一和第二 AV内容分析器6、8中AV内容的捕获将不会同时实时 发生。然而,所捕获的AV内容将是标称地相同AV内容,因为AV内容的捕获是通过AV内容 自身的特征检测来开始的,例如所示实施例中的时间码。本文档来自技高网...

【技术保护点】
一种导出多个音频样本的签名特性的方法,包括以下步骤:  确定代表所述音频样本的音频签名数据;  确定形成感兴趣区域的所述音频签名数据的部分;以及  提供形成感兴趣区域的所述音频签名数据部分作为音频签名。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:乔纳森·迪金斯
申请(专利权)人:史诺有限公司
类型:发明
国别省市:GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1