当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于快速音频搜索的方法和设备技术

技术编号:5814778 阅读:212 留言:0更新日期:2012-04-11 18:40
根据本申请中公开的主题的实施例,可使用一种强劲的并行搜索方法,在多处理器系统中为目标音频剪辑搜索大的音频数据库。该大的音频数据库可划分成多个更小的组,这些组动态调度到系统中的可用处理器。处理器可通过将每个组划分成更小的段,从段中提取声学特征,以及使用公共分量高斯混合模型(“CCGMM”)为段建模来并行处理已调度的组。一个处理器也可从目标音频剪辑提取声学特征并使用CCGMM为其建模。可进一步计算在目标音频剪辑与每个段之间的库尔贝克-莱布勒(KL)距离。基于KL距离,可确定匹配目标音频剪辑的段;和/或可跳过多个随后的段。

【技术实现步骤摘要】
【国外来华专利技术】
本公开概要地涉及信号处理和多媒体应用,并且更具体但不排他 地,涉及用于快速音频搜索和音频指紋的方法和设备。2.背景纟支术音频搜索(例如,为某个音频剪辑搜索大的音频流,即使该大的 音频流损坏/失真)具有许多应用,包括广播音乐/商业广告的分析、 因特网上的版权管理或查找未标记音频剪辑的元数据等等。典型的音 频搜索系统是串行的并设计用于单个处理器系统。通常,此类搜索系 统在大的音频流中搜寻目标音频剪辑要^L长的时间。然而,在许多情 况下,要求音频搜索系统在大的音频数据库中高效工作,例如,以在 极短的时间(例如,接近实时)内搜索大的数据库。另外,音频数据 库可能已部分或完全失真、损坏和/或压缩。达要求音频搜索系统足够 强劲,以识别与目标音频剪辑相同那些音频段,即使那些音频段可能 已失真、损坏和/或压缩。因此,希望具有为目标音频剪辑能够迅速和 强劲地搜索大的音频数据库的音频搜索系统。附图说明从下面的主题的详细说明中将明白公开的主题的特征和优点,其中图l示出一个示例计算系统,其中可使用音频搜索模块执行强劲 的并行音频搜索;图2示出另一示例计算系统,其中可使用音频搜索模块执行强劲 的并行音频:溲索;图3示出仍有的另一示例计算系统,其中可使用音频搜索模块执行强劲的并行音频搜索;图4是执行强劲的音频搜索的示例音频搜索模块的框图5是示出图4所示强劲的音频搜索模块如何工作的示例;图6是在多处理器系统中执行强劲的并行音频搜索的示例音频搜索模块的框图7A、 7B和7C示出将大的音频数据库划分成更小的组以便在 多处理器系统中实现强劲的并行音频搜索的方法;以及图8是示出用于在多处理器系统中执行强劲的并行音频搜索的示 例过程的伪代码。具体实施例方式根据本申请中公开的主题的实施例,可使用 一种强劲的并行搜索 方法,在多处理器系统中为目标音频剪辑搜索大的音频流或大的音频 数据库。大的音频数据库可划分成多个更小的组。这些更小的组可动 态调度以便由多处理器系统中的可用处理器或处理核处理。处理器或 处理核可通过将每个组划分成更小的段,从段中提取声学特征,以及 使用公共分量高斯混合模型("CCGMM,,)为段建模来并行处理已调 度的组。这些段的长度可与目标音频剪辑的长度相同。在处理任何组 之前, 一个处理器或处理核可从目标音频剪辑提取声学特征并使用 CCGMM为其建模。可进一步计算在目标音频剪辑的模型与组的每个 段之间的库尔贝克-莱布勒(Kullback-Leibler ) (KL)或KL -最大 (KL-max)距离。如果该距离等于或小于预定值,则对应的段被识别 为目标音频剪辑。如果距离大于预定值,则处理器或处理核可跳过一定数量的段并 继续搜寻目标音频剪辑。 一旦处理器或处理核完成搜索某个组,新的 组便可提供给它处理以便搜寻目标音频剪辑,直至搜索了所有组。可 确定组的大小以致于减少负载失衡和重叠计算。此外,输入/输出(1/0)可优化以提高多个处理器或处理核对音频组的并行处理的效率。说明书对公开的主题的"一个实施例"或"实施例"的引用指结合该 实施例描述的特定特征、结构或特性包括在公开的主题的至少 一个实 施例中。因此,在说明书通篇各个位置出现的短语"在一个实施例中" 不一定全部指同 一个实施例。图1示出一个示例计算系统100,其中可使用音频搜索模块120 执行强劲的并行音频搜索。计算系统100可包括耦合到系统互连115 的一个或多个处理器110。处理器110可具有多个或许多处理核(为 描述简明起见,术语"多个核"将在下文用于包括多个处理核和许多处 理核)。处理器110可包括音频搜索模块120以通过多个核进行强劲 的并行音频搜索。音频搜索模块可包括几个组件,如划分机制、调度 和多个音频搜索器(参阅下面图4-6的更详细说明)。音频搜索模块 的一个或多个组件可位于一个核中,而其它组件位于另 一核中。音频搜索模块可先将大的音频数据库划分成多个更小的组或者将 大的音频流划分成更小的部分重叠的子流。其次, 一个核可处理要4叟 寻的音频剪辑("目标音频剪辑")以为目标音频剪辑建立模型。同时, 音频搜索模块动态调度更小的音频组/子流到多个核,这些核并行地将 每个组/子流划分成段,并且为每个音频段建立模型。每个段的大小可 等于目标音频剪辑的大小。高斯混合^^莫型("GMM")具有对包括目标音频剪辑和音频数据库/流的所有音频#爻公共的多个高斯分量,可用于 为每个音频段和目标音频剪辑建模。 一旦为音频段建立了模型,便可计算在段模型与目标音频剪辑模型之间的库尔贝克-莱布勒("KL") 或KL-最大距离。如果距离不大于预定值,则音频段可被识别为目标 音频剪辑。搜索过程可继续,直至处理了所有音频组/子流。计算系统IOO也可包括耦合到系统互连115的芯片组130。芯片 组130可包括一个或多个集成电^各封装或芯片。芯片组130可包:^舌一 个或多个装置接口 135以支持数据传输到计算系统100的其它组件 160和/或从其传输,其它组件160例如,BIOS固件、键盘、鼠标、存储装置、网络接口等。芯片组130可耦合到外围组件互连(PCI)总线 170。芯片组130可包括提供到PCI总线170的接口的PCI桥145。 PCI 桥145可提供处理器110以及其它组件160与例如音频装置180和磁 盘驱动器190等外围装置之间的数据路径。虽然未示出,但其它装置 也可耦合到PCI总线170。另外,芯片组130可包括耦合到主存储器150的存储器控制器 125。主存储器150可存储由处理器110的多个核或系统中包括的任 何其它装置运行的指令的序列和数据。存储器控制器125可访问主存 储器150以响应与处理器IIO的多个核和计算系统100中其它装置相 关联的存储器事务。在一个实施例中,存储器控制器150可位于处理 器IIO或一些其它电路系统中。主存储器150可包括提供可寻址存储 位置的各种存储器装置,存储器控制器125可从这些位置读取数据和 /或将数据写入这些位置。主存储器150可包括一个多个不同类型的存 储器装置,如动态随机访问存储器(DRAM)装置、同步DRAM (SDRAM) 装置、双倍数据速率(DDR) SDRAM装置或其它存储器装置。图2示出另一示例计算系统200,其中可使用音频搜索模块240 执行强劲的并行音频搜索。系统200可包括多个处理器,如处理器O 220A。系统200中的一个或多个处理器可具有许多核。系统200可包 括音频搜索模块240以通过多个核进行强劲的并行音频搜索。音频4叟 索模块可包括几个组件,如划分机制、调度和多个音频搜索器(参阅 下面图4-6的更详细说明)。音频搜索模块的一个或多个组件可位于 一个核中,而其它组件位于另一核中。系统200中的处理器可l吏用系 统互连210相互连接。系统互连210可以是前端总线(FSB)。每个处理 器可通过系统互连连接到输入/输出(IO)装置及存储器230。所有核可 从存储器230接收音频数据。图3示出仍有的另一示例计算系统300,其中可4吏用音频4叟索才莫 块340执行强劲的并行音频搜索。在系统300中,连接多个处理器(例 如,320A、 320B、 320C和320D)的系统互连310是基于链路的点对本文档来自技高网...

【技术保护点】
一种用于在多处理器系统中为目标音频剪辑搜索音频数据库的方法,包括: 将所述音频数据库划分成多个组; 为所述目标音频剪辑建立模型; 动态调度所述多个组到所述多处理器系统中的多个处理器;以及 由所述多个处理器并行处理所述 已调度的组以搜寻所述目标音频剪辑。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:Y陈
申请(专利权)人:英特尔公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1