用于改进音频签名的检测的方法和装置制造方法及图纸

技术编号:34075444 阅读:22 留言:0更新日期:2022-07-11 17:32
公开了改进音频签名的检测的方法、装置和制品。示例装置包括:TDOA确定器,所述TDOA确定器用于确定计量器的第一音频传感器和所述计量器的第二音频传感器的第一到达时间差、以及所述第一音频传感器和所述计量器的第三音频传感器的第二到达时间差;TDOA匹配器,所述TDOA匹配器用于:通过将所述第一到达时间差与第一虚拟源到达时间差和第二虚拟源到达时间差进行比较来确定匹配性;响应于确定所述第一到达时间差与所述第一虚拟源到达时间差匹配,将第一虚拟源位置识别为媒体呈现设备的位置;以及去除所述第二音频传感器的音频记录以减少处理器的计算负担。少处理器的计算负担。少处理器的计算负担。

【技术实现步骤摘要】
【国外来华专利技术】用于改进音频签名的检测的方法和装置
[0001]相关申请
[0002]本专利要求于2019年6月27日提交的申请号为16/455,025的美国专利申请的优先权和权益。该美国专利申请的全部内容通过引用并入本文。


[0003]本专利技术总体上涉及媒体监控,并且更具体地,涉及改进音频签名的检测的方法和装置。

技术介绍

[0004]监控公司期望了解用户如何与诸如智能手机、平板电脑、膝上型电脑、智能电视等的媒体设备交互。为了促进这种监控,监控公司招募小组成员并在这些小组成员的媒体呈现位置安装计量器。计量器监控媒体呈现并将媒体监控信息传输到监控公司的中央设施。此类媒体监控信息使媒体监控公司除了其他方面之外能够监控广告的播放率、确定广告有效性、确定用户行为、识别与各种人口统计信息相关联的购买行为等。
附图说明
[0005]图1是根据本专利技术的教导构造的以改进音频签名的检测的示例系统的框图。
[0006]图2是图1的示例计量器的框图。
[0007]图3是图2的音频分析器的框图。
[0008]图4是图1和/或图2的示例计量器的示例前视图。
[0009]图5是图1和/或图2的示例计量器的示例后视图。
[0010]图6是图1和/或图2的示例计量器的示例俯视图。
[0011]图7是表示用于校准图1和/或图2的计量器的示例虚拟音频源环境的图。
[0012]图8是表示图7的示例虚拟音频源环境的示例实现方式的图。
[0013]图9是表示可以被执行以实现图1和/或图2的计量器,以确定音频传感器对的虚拟到达时间差的示例机器可读指令的流程图。
[0014]图10是表示可以被执行以实现图1和/或图2的示例计量器,以去除不必要的音频记录,从而改进音频签名的检测的示例机器可读指令的流程图。
[0015]图11是根据本专利技术的教导的能够执行图9和/或图10的机器可读指令的示例处理器平台的框图。
[0016]这些附图不是按比例绘制的。通常,在整个附图和随附的书面描述中使用相同的附图标记,以指代相同或相似的部分。
[0017]当识别可单独提及的多个元件或组件时,本文使用描述符“第一”、“第二”、“第三”等。除非基于其使用上下文另有规定或理解,否则此类描述符不旨在赋予任何优先级、物理顺序、或列表中的排列的含义,或者在时间上排序,而仅仅是用作标记,用于分别指代多个元件或组件,以便于理解所公开的示例。在一些示例中,描述符“第一”可用于指代具体实施
方式中的元件,而同一元件可在权利要求中用不同的描述符(例如“第二”或“第三”)来指代。在这种情况下,应当理解,使用这种描述符仅仅是为了便于引用多个元件或组件。
具体实施方式
[0018]基于指纹或签名的媒体监控技术通常在监控时间间隔期间使用被监控媒体的一个或多个固有特征来为媒体生成基本上唯一的代理。这种代理被称为签名或指纹,并且可以采用代表(一个或多个)媒体信号(例如,形成被监控的媒体呈现的音频和/或视频信号)的任何的(一个或多个)方面的任何形式(例如,一系列数字值、波形等)。签名可以是在定时器间隔内连续收集的一系列签名。好的签名在处理相同的媒体呈现时是可重复的,但相对于其他(例如,不同的)媒体的其他(例如,不同的)呈现是独有的。因此,术语“指纹”和“签名”在本文中可互换地使用并且在本文中被定义为意指用于标识由媒体的一个或多个固有特征生成的媒体的代理。
[0019]基于签名的媒体监控通常涉及确定(例如,生成和/或收集)表示由被监控媒体设备输出的媒体信号(例如,音频信号和/或视频信号)的(一个或多个)签名,并将(一个或多个)被监控签名与对应于已知(例如,参考)媒体源的一个或多个参考签名进行比较。可以评估各种比较标准,例如互相关值、汉明(Hamming)距离等,以确定被监控签名是否与特定的参考签名匹配。当发现被监控签名与参考签名之一之间的匹配时,可以将被监控媒体识别为对应于由与被监控签名匹配的参考签名所代表的特定参考媒体。因为为参考签名收集了诸如媒体的标识符、呈现时间、广播频道等的属性,所以这些属性然后可以与如下被监控媒体相关联,该被监控媒体的被监控签名与参考签名匹配。用于基于代码和/或签名来识别媒体的示例系统早就已知,并且首次公开在Thomas的美国专利5,481,294中,该专利的全部内容通过引用并入本文。
[0020]历史上,音频指纹识别技术已经使用音频信号的最响亮的部分(例如,具有最多能量的部分等)来创建时间片段中的指纹。然而,在某些情况下,这种方法有几个严重的局限性。在一些示例中,音频信号的最响亮部分可能与噪声(例如,不想要的音频)相关联,而不是来自感兴趣的音频。例如,尝试从嘈杂的区域(例如,有一群人在看电视的房间)对媒体进行指纹识别,捕获的音频信号中最响亮的部分可能是这群人之间的对话,而不是音频信号。在该示例中,音频信号的许多采样部分将是背景噪声而不是媒体,这会降低生成的指纹的有用性。因此,使用现有方法生成的指纹通常不包括较高频率范围内的样本。
[0021]本文公开的示例方法和装置通过基于经变换的音频信号之间的相位差从指纹处理中去除音频信号(例如,音频记录)以减少处理器的计算负担,来克服上述问题。本文公开的示例基于经变换的音频之间的相位差去除音频信号,从而使得识别与指纹相关联的媒体的准确性增加。此外,本文公开的示例利用经变换的音频信号来生成指纹。同样地,本文公开的示例利用经变换的音频信号的各部分的峰值,从而减少了在指纹识别计算期间要处理的音频量(例如,处理器不需要处理整个音频信号)。
[0022]如本文所使用的,“虚拟源位置”和“虚拟音频源位置”是指生成虚拟(例如,计算机生成的)音频的音频源的虚拟(例如,计算机生成的)位置。也就是说,“虚拟音频源位置”表示基于音频的已知原理和属性(例如,声速等)的计算机生成的音频源位置。如本文所使用的,“媒体”是指音频和/或视觉(静止或移动)内容和/或广告。在一些示例中,为了识别带水
印的媒体,(一个或多个)水印被提取并用于访问映射到媒体标识信息的参考水印表。
[0023]图1是根据本专利技术的教导构造的为改进音频签名的检测的示例受众测量系统的示图。在图1所示示例中,示例媒体呈现环境102包括示例小组成员104、106、从示例媒体源112接收媒体的示例媒体呈现设备110和示例计量器114。计量器114识别由媒体呈现设备110呈现的媒体并通过示例网关140和示例网络180向示例受众测量实体的示例中央设施190报告媒体监控信息。
[0024]在图1所示示例中,示例媒体呈现环境102是家庭的房间(例如,小组成员住宅中的房间,例如“尼尔森家庭”住宅中的房间)。在图1所示示例中,已经统计地选择了家庭的示例小组成员104、106来针对感兴趣的人群/人口统计信息形成媒体收视率数据(例如,电视收视率数据)。人们例如通过媒体设备上呈现的用户界面(例如,通过媒体呈现设备110、通过网站等)成为小组成员。人们以附加或替选的方式成为小组成员,例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种装置,包括:TDOA确定器,所述TDOA确定器用于基于来自计量器的第一音频传感器的第一音频记录和来自所述计量器的第二音频传感器的第二音频记录来确定所述第一音频传感器和所述第二音频传感器的第一到达时间差,以及基于所述第一音频记录和来自所述计量器的第三音频传感器的第三音频记录来确定所述第一音频传感器和所述第三音频传感器的第二到达时间差;以及TDOA匹配器,所述TDOA匹配器用于:通过将所述第一到达时间差与i)第一虚拟源到达时间差和ii)第二虚拟源到达时间差进行比较来确定匹配性;响应于确定所述第一到达时间差与所述第一虚拟源到达时间差匹配,将第一虚拟源位置识别为呈现媒体的媒体呈现设备的位置;以及去除所述第二音频记录以减少处理器的计算负担。2.如权利要求1所述的装置,其中,所述计量器包括位于所述计量器上的第一位置的所述第一音频传感器、位于所述计量器上的第二位置的所述第二音频传感器、位于所述计量器上的第三位置的所述第三音频传感器、以及位于所述计量器上的第四位置的第四音频传感器。3.如权利要求2所述的装置,其中,基于所述第一位置、所述第二位置、所述第三位置和所述第四位置来确定所述第一虚拟源位置和第二虚拟源位置。4.如权利要求1所述的装置,还包括虚拟源确定器,所述虚拟源确定器用于:确定围绕所述计量器径向定位的第一虚拟音频源的所述第一虚拟源位置、和围绕所述计量器径向定位的第二虚拟音频源的第二虚拟源位置,所述第一虚拟源位置不同于所述第二虚拟源位置;以及基于所述第一虚拟源位置确定所述计量器的第一对音频传感器的所述第一虚拟源到达时间差,以及基于所述第二虚拟源位置确定所述计量器的第二对音频传感器的所述第二虚拟源到达时间差。5.如权利要求4所述的装置,其中,所述第一对音频传感器包括所述第一音频传感器和所述第二音频传感器,并且所述第二对音频传感器包括所述第一音频传感器和所述第三音频传感器。6.如权利要求5所述的装置,其中,所述虚拟源确定器用于:基于第一虚拟源与所述第一音频传感器的距离和声速来计算第一虚拟信号到达所述第一音频传感器的第一时间;基于所述第一虚拟源与所述第二音频传感器的距离和所述声速来计算所述第一虚拟信号到达所述第二音频传感器的第二时间;以及基于所述第一时间与所述第二时间之间的差来确定所述第一虚拟源到达时间差。7.如权利要求5所述的装置,其中,所述虚拟源确定器用于:基于第二虚拟源与所述第一音频传感器的距离和声速来计算第二虚拟信号到达所述第一音频传感器的第三时间;基于所述第二虚拟源与所述第三音频传感器的距离和所述声速来计算所述第二虚拟信号到达所述第三音频传感器的第四时间;以及
基于所述第三时间与所述第四时间之间的差来确定所述第二虚拟源到达时间差。8.如权利要求1所述的装置,还包括音频变换器,所述音频变换器用于:使用短时傅里叶变换处理所述第一音频记录以获得具有第一时间

频率段的第一音频变换;使用所述短时傅里叶变换处理所述第二音频记录以获得具有第二时间

频率段的第二音频变换;以及使用所述短时傅里叶变换处理所述第三音频记录以获得具有第三时间

频率段的第三音频变换。9.如权利要求8所述的装置,其中,所述TDOA确定器用于:计算所述第一音频变换和所述第二音频变换之间的第一频道间时间差,所述第一频道间时间差表示所述第一到达时间差;以及计算所述第一音频变换和所述第三音频变换之间的第二频道间时间差,所述第二频道间时间差表示所述第二到达时间差。10.一种方法,包括:通过使用处理器执行指令,基于来自计量器的第一音频传感器的第一音频记录和来自所述计量器的第二音频传感器的第二音频记录来确定所述第一音频传感器和所述第二音频传感器的第一到达时间差,以及基于所述第一音频记录和来自所述计量器的第三音频传感器的第三音频记录来确定所述第一音频传感器和所述第三音频传感器的第二到达时间差;通过使用所述处理器执行指令,通过将所述第一到达时间差与i)第一虚拟源到达时间差和ii)第二虚拟源到达时间差进行比较来确定匹配性;响应于确定所述第一到达时间差与所述第一虚拟源到达时间差匹配,通过使用所述处理器执行指令,将第一虚拟源位置识别为呈现媒体的媒体呈现设备的位置;以及通过使用所述处理器执行指令,去除所述第二音频记录以减少所述处理器的计算负担。11.如权利要求10所述的方法,其中,所述计量器包括位于所述计量器上的第一位置的所述第一音频传感器、位于所述计量器上的第二位置的所述第二音频传感器、位于所述计量器上的第三位置的所述第三音频传感器、以及位于所述计量器上的第四位置的第四音频传感器,其中,基于所述第一位置、所述第二位置、所述第三位置和所述第四位置来确定所述第一虚拟源位置和第二虚拟源位置。12.如权利要求10所述的方法,还包括:确定围绕所述计量器径向定位的第一虚拟音频源的所述第一虚拟源位置、和围绕所述计量器径向定位...

【专利技术属性】
技术研发人员:Z
申请(专利权)人:格雷斯诺特有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1