使用散列键识别媒体的方法和装置制造方法及图纸

技术编号:23027797 阅读:30 留言:0更新日期:2020-01-03 17:55
公开了使用散列键识别媒体的方法和装置。示例性方法包括:利用处理器访问第一计量散列键和与所述第一计量散列键相关联的第一基准元数据;利用所述处理器访问与和所述第一计量散列键相邻的第二散列键相关联的第二基准元数据;利用所述处理器确定所述第一计量散列键是否为非预期的;当所述第一计量散列键为非预期的时,利用所述处理器使用所述第一计量散列键和所述第二散列键的第一逐位比较来生成误差级;利用所述处理器确定所述误差级是否满足阈值;以及当所述处理器确定所述误差级满足所述阈值时,利用所述处理器将所述第二散列键存储为所述第一计量散列键。

Method and device of using hash key to identify media

【技术实现步骤摘要】
使用散列键识别媒体的方法和装置本申请是申请日为2014年12月1日、申请号为201480077840.6、专利技术名称为“使用散列键识别媒体的方法和装置”的中国专利申请的分案申请。
本专利技术总体涉及受众测量,且更特别地涉及使用散列键识别媒体的方法和装置。
技术介绍
媒体(诸如电视、音乐、电影、收音机、因特网网站、流媒体、视频游戏等)的受众测量通常通过监控小组成员的媒体接触来进行,该小组成员被选择成表示特定人口统计组。使用各种统计方法处理所捕获的媒体接触数据以确定针对感兴趣的节目的受众规模和人口统计构成。受众规模和人口统计信息对广告商、广播商和/或其它实体有价值。例如,受众规模和人口统计信息可以用作选择广告投放时的因素,且可以用作评估在特定节目期间的商业时段的价值的因素。附图说明图1示出根据本专利技术的教导构造的示例性系统,该示例性系统具有与受众测量实体通信以监控媒体呈现的媒体计量器。图2示出图1的基准数据库的示例性实现,该基准数据库可用于存储与对应媒体的基准散列键相关联的基准元数据。图3示出可用于存储由图1的示例性散列键管理器生成的印象记录的示例性数据结构。图4示出图1的示例性基准散列键生成器的示例性实现,该示例性基准散列键生成器可用于生成图2的示例性基准记录。图5示出图1的示例性散列键管理器的示例性实现,该示例性散列键管理器可用于将计量散列键与基准散列键相比较以生成监控报告和/或将印象存储在监控数据库中。图6A和图6B示出图5的示例性散列键分析器的示例性配置,该示例性散列键分析器用于将计量散列键与基准散列键相比较和/或用于检测计量散列键中的误差。图7示出图5的用于校正计量散列键中的误差的示例性误差处理器的示例性实现。图8示出可用于存储由图1的媒体计量器生成的计量散列键以检测非预期的散列键的示例性数据结构。图9为表示可被执行以实现图1和/或图5的将计量散列键与基准散列键相比较的散列键管理器的示例性机器可读指令的流程图。图10为表示可被执行以实现图6A和图6B的将计量散列键与基准散列键相比较的散列键分析器的示例性机器可读指令的流程图。图11为表示可被执行以实现图7的恢复无效散列键的误差处理器的示例性机器可读指令的流程图。图12A和图12B为表示可被执行以实现图5、图6A、图6B和/或图7的将计量散列键与基准散列键相比较的散列键分析器、误差处理器和/或接触债权人的示例性机器可读指令的流程图。图13为表示可被执行以实现图1和/或图4的生成图2的基准记录的基准散列键生成器的示例性机器可读指令的流程图。图14为表示可被执行以实现图1和图5的检测和/或校正非预期的散列键的散列键管理器的示例性机器可读指令的流程图。图15为示例性处理器系统的框图,该示例性处理器系统可执行由图9、图10、图11、图12A、图12B、图13和/或图14表示的机器可读指令中的任一者以实现图1、图4、图5、图6A、图6B和/或图7的装置。具体实施方式本文中所公开的示例可用于使用与媒体相关联的散列键识别媒体(例如电影、音乐、电视节目、电台节目、电视广告、电台广告、视频游戏等)。在2014年8月26日递交的序列号为14/469,245、名称为“SIGNATURERETRIEVALANDMATCHINGFORMEDIAMONITORING”的美国专利申请中公开了可连同本文中所提供的示例一起采用的另外的使用散列键识别媒体的示例性技术,该美国专利申请的全部内容通过引用并入在本文中。为了为感兴趣的媒体的多个部分创建可加索引的标识符,在本文中所公开的示例中,以特定频率(例如15Hz、30Hz、64Hz等)对媒体采样。使用一种或多种指纹分析技术,诸如稳健音频散列,基于媒体的样本生成散列键。在一些稳健音频散列示例中,二进制值表示样本的频带之间的能量差。在一些这类示例中,散列键的位长对应于用于创建散列键的能带的数目(例如64位长的散列键对应于65个能带之间的差)。例如,可以根据由Haitsma等人在名称为“RobustAudioHashingforContentIdentification”的文章中所描述的技术对媒体的样本求散列值。通过散列键生成过程,媒体的连续样本不产生连续散列键。例如,由媒体的第一样本生成的散列键可以为0x712F,且由第一样本之后(且对应于该媒体的相邻片段)的该媒体的下一样本生成的散列键可以为0x003A。在现有技术中,无法基于当前样本所对应的散列键辨别来自先前样本(例如时间上在当前样本之前)的散列键和来自下一样本(例如时间上在当前样本之后)的散列键。为了生成基准散列键,以采样频率(例如15Hz、30Hz、64Hz等)对基准版本的媒体采样。在一些示例中,基准媒体为质量与通常由用户获得和/或向用户呈现的媒体相同或比其更高质量的媒体(例如歌曲、电视节目、电台节目、视频点或剪辑和/或音频点或剪辑、广告、流媒体等)。在一些示例中,基准媒体没有噪声(例如白噪声、粉红噪声、褐噪声等)和/或使用无损格式(例如自由无损音频编解码(FLAC)、波形音频文件格式(WAV)、无损音频编解码(ALAC)等)来存储和/或解码。例如,音频的基准版本(或基准媒体)(例如在受控环境(诸如录音室)中收集)可以为歌曲的高质量、无损数字副本,然而同一音频的流式版本(例如被测媒体)由于环境噪声、传输损耗等而在其再现和回放中将通常展现较低质量和欠准确性。在本文中公开的示例中,通过生成用于基准媒体的样本的基准散列键来构造基准记录。与样本相关的元数据(例如对应媒体的名称、样本所对应的媒体中的时间和/或偏移等)被存储在与基准散列键相关联的基准记录中。在一些示例中,相邻的先前(例如时间上)基准样本所对应的散列键和相邻的后续(例如时间上)样本所对应的散列键也被存储在与基准散列键和元数据相关联的同一基准记录中。因此,在本文中公开的一些示例中,基准记录具有存储在其中的三个基准散列键,即当前散列键(其为基准记录的主题或焦点)、相邻的先前散列键(其对应于发生在当前散列键的样本之前(时间上)的样本)、和相邻的后续散列键(其对应于发生在当前散列键的样本之后(时间上)的样本)。尽管被称为“相邻的先前基准散列键”和/或“相邻的后续基准散列键”,但在本文中公开的一些示例中,相邻的先前基准散列键和相邻的后续基准散列键所对应的样本无需在时间上与当前基准散列键所对应的样本邻接。例如,在相邻的先前基准散列键和当前散列键所对应的样本之间和/或在当前基准散列键和相邻的后续基准散列键之间,可以具有媒体的非采样部分。在一些示例中,存储在与当前基准散列键相关联的基准记录中的先前基准散列键和后续基准散列键不对应于与当前基准散列键的样本紧邻的样本。即,先前基准散列键和当前基准散列键所对应的样本在二者之间可具有一个或多个中介样本。附加地或可替选地,在当前基准散列键和后续基准散列键所对应的样本之间可具有一个或多个中介样本。在其它示例中,不具有中介样本,且散列键对应于在时间上邻接的样本。...

【技术保护点】
1.一种方法,包括:/n利用处理器访问第一计量散列键和与所述第一计量散列键相关联的第一基准元数据;/n利用所述处理器访问与和所述第一计量散列键相邻的第二散列键相关联的第二基准元数据;/n利用所述处理器确定所述第一计量散列键是否为非预期的;/n当所述第一计量散列键为非预期的时,利用所述处理器使用所述第一计量散列键和所述第二散列键的第一逐位比较来生成误差级;/n利用所述处理器确定所述误差级是否满足阈值;以及/n当所述处理器确定所述误差级满足所述阈值时:/n利用所述处理器将所述第二散列键存储为所述第一计量散列键。/n

【技术特征摘要】
20140407 US 61/976,238;20140829 US 14/473,6701.一种方法,包括:
利用处理器访问第一计量散列键和与所述第一计量散列键相关联的第一基准元数据;
利用所述处理器访问与和所述第一计量散列键相邻的第二散列键相关联的第二基准元数据;
利用所述处理器确定所述第一计量散列键是否为非预期的;
当所述第一计量散列键为非预期的时,利用所述处理器使用所述第一计量散列键和所述第二散列键的第一逐位比较来生成误差级;
利用所述处理器确定所述误差级是否满足阈值;以及
当所述处理器确定所述误差级满足所述阈值时:
利用所述处理器将所述第二散列键存储为所述第一计量散列键。


2.如权利要求1所述的方法,其中,当与所述第一基准元数据相关联的标题和媒体标识中的至少一者不匹配于与所述第二基准元数据相关联的标题和媒体标识中的至少一者时,所述第一计量散列键是非预期的。


3.如权利要求1所述的方法,其中,所述阈值被设定为所述第一计量散列键的位长的百分比。


4.如权利要求1所述的方法,还包括:
当所述处理器确定所述误差级不满足所述阈值时:
利用所述处理器将所述第一计量散列键存储为有效散列键。


5.如权利要求1所述的方法,其中,所述第一逐位比较包括异或函数。


6.如权利要求1所述的方法,其中,所述误差级指示在所述第一计量散列键与所述第二散列键之间的不相同的位的数目。


7.如权利要求1所述的方法,其中,当所述误差级小于或等于所述阈值时,满足所述阈值。


8.一种装置,包括:
误差处理器,所述误差处理器用于:
访问第一计量散列键和与所述第一计量散列键相关联的第一基准元数据;
访问与和所述第一计量散列键相邻的第二散列键相关联的第二基准元数据;
确定所述第一计量散列键是否为非预期的;
当所述第一计量散列键为非预期的时,使用所述第一计量散列键和所述第二散列键的第一逐位比较来生成误差级;
确定所述误差级是否满足阈值;以及
当所述误差级满足所述阈值时:
将所述第二散列键存储为所述第一计量散列键。


9.如权利要求8所述的装置,其中,当...

【专利技术属性】
技术研发人员:丹尼尔·纳尔逊
申请(专利权)人:尼尔森美国有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1