数据内容识别制造技术

技术编号:2949229 阅读:188 留言:0更新日期:2012-04-11 18:40
检测输入数据内容的版本的方法,所述数据内容有多个不同的版本,其中:所述数据内容按照分段模式被安排为两个或多个分段;以及所述数据的所述版本通过相应的识别数据模式是可识别的,为此至少某些所述分段具有相应的识别数据;所述方法包括以下步骤:(i)对于所述输入数据内容的所述分段检测所述识别数据;(ii)把所述检测的识别数据与相应于所述数据内容的所述不同版本的所述识别数据模式进行比较;以及(iii)如果在所述检测的识别数据与某个版本的所述识别数据模式之间得到的匹配数超过阈值,则检测所述输入数据内容是否包括来自所述数据内容的某个版本的至少一个贡献。

【技术实现步骤摘要】

技术介绍
专利
本专利技术涉及数据内容识别。这样的内容的例子包括一个或多个视频内容、音频内容、元数据内容、文本内容、图像内容等等,例如视听(audio visual)内容。现有技术描述包括数字设备和高速度网络的新的数字基础设施的发展,与不断增长的处理器能力相组合,使得内容创建、处理、和分发更加简单和快速。虽然这大大地帮助合法地使用内容,但缺点是这样的内容(特别是版权内容)的非法滥用或“盗版”,诸如非法复制或分发,变得越来越容易和越来越损害内容拥有者。这种情形变得更加复杂,因为商业考虑需要内容拥有者允许潜在的客户尝试地查看或使用内容-这或许是作为内容的专业评审的一部分,或在向拥有者承诺购买内容使用权之前。例如在电影的情形下,该内容的许多拷贝以这样的方式被发布。已经提出,使用所谓的“指纹”技术把识别数据加到内容上。虽然这不能防止非法复制,但它允许检测出非法复制品的来源。可应用于视频信号的指纹技术在GB-A-2383221和US-A-5664018中描述。然而,这种技术的实现会花费很长的时间。使用在本申请之前的日期的当前的技术,可能会花费例如10小时来把指纹处理应用到一部完整长度的电影。专利技术概要本专利技术提供检测输入数据内容的版本的方法,所述数据内容有多种不同的版本,其中所述数据内容按照分段模式安排为两个或多个分段;以及所述数据的所述版本通过相应的识别数据模式是可识别的,按照所述相应的识别数据模式,至少一些所述分段具有各自的识别数据;所述方法包括以下步骤(i)对于所述输入数据内容的所述分段检测所述识别数据;(ii)对所述检测到的识别数据与相应于所述数据内容的所述不同的版本的所述识别数据模式进行比较;以及(iii)如果在所述检测到的识别数据与一个确定的版本的所述识别数据模式之间的得到的匹配的数目之和超过阈值数,则检测所述输入数据内容是否包括来自所述数据内容的所述这个确定的版本的至少一个组成部分。本专利技术建立在一个未公布的建议方案的基础上,它建议通过组合内容的多个主拷贝的部分或“分段”(它们之中至少某些带有指纹数据)来生成加指纹的内容。(这里,术语“指纹”是指把识别数据保密地加到内容上,理想地是这样加入的,即它的存在对于用户几乎是不会觉察的。)这些分段按照对于该内容拷贝的特定用户是独特的或准独特的分段模式进行组合。这个未公布的建议的优点在于,内容的独特的指纹拷贝能以比起把全部指纹处理加到每个单独的拷贝所需要的时间短得多的时间被生成。如果发现内容的可疑的盗版拷贝,则能够识别藉以复制该盗版的内容来源是有用的。这可以识别盗版的拷贝的制造者或识别由允许由另外的人制作盗版的拷贝的用户造成的保密性失效。在未公布的建议中,这需要检测在每个分段上检测的指纹数据与被使用于发布给用户的版本中的每个分段的已知的指纹数据之间的100%的匹配。然而,这种基本检测技术没有考虑在一个或多个加指纹的分段中对检测指纹的失败。如果内容受到过某种处理,诸如在电影的情形下所谓的“摄像机盗版”,就会出现这样的失败。这种基本检测技术也没有考虑所谓的“串通攻击”,其中盗版的拷贝被做成为多个合法拷贝的组合,试图去除或冲淡指纹数据。本专利技术通过提供在检测到的识别数据与用户的版本的识别数据模式之间的匹配数之和的阈值以检测用户的版本是非法拷贝的源而解决至少某些这样的问题。特别是在其中各个分段可以产生多个识别数据的串通攻击的情形下,为了确信想要的虚假确信检测率(false positive detectionrate),最好从在对于输入数据内容的分段检测到的识别数据得出阈值数。具体地,最好是阈值数取决于对于输入数据内容的每个分段,识别数据有多少个事例被检测。优选地,阈值数这样来设置,以使得在对于输入数据内容的每个分段上检测到的识别数据的事例是给定的数目的情况下,输入数据内容被错误地检测为一个确定的版本的统计机会要小于阈值概率。在替换的/附加的技术中,优选地,该方法包括按照对于输入数据内容的该分段检测到的识别数据的事例的数目,对于在输入数据内容的分段上检测到的识别数据之间的匹配进行加权,各匹配之和是匹配的加权和值。当加权是这样进行的,以致于一个其中检测到了识别数据的多个事例的分段,比起一个其中检测到了识别数据的单个事例的分段,对于特定的版本的检测的贡献更小的场合下,预期将得到更可靠的结果。然而,与直观相反,在原型的某些实验测试中检测到当加权是这样进行的,以致于一个其中检测到识别数据的多个事例的分段,比起一个其中检测到识别数据的单个事例的分段,对于特定的版本的检测的贡献更大的场合下,将得到更好的结果。为了缓和某些分段不产生识别数据的问题,最好是,如果对于输入数据内容的两个或多个分段没有检测到识别数据,则这些分段被组合成两个或多个分段的组,以及对于分段的所述组合后的组进行识别数据的检测。这个过程优选地可迭代地重复进行。优选地,阈值数代表小于分段总数的分段数,和/或小于在该识别数据模式中具有相关的识别数据的分段总数的分段数。虽然可以使用那些其中只有某些分段载有识别数据的识别模式,但最好是数据内容的版本是可以通过相应的识别模式识别的,其中几乎所有的分段都依据所述相应的识别模式而具有各自的识别数据。本专利技术也提供把识别数据应用到输入数据内容的方法,所述方法包括以下步骤(i)生成所述输入数据内容的n个事例,其中n大于1,至少除了一个以外的所有的所述事例载有各自的识别数据,载有各自的识别数据的每个所述事例的所述识别数据对于由其他所述事例所载有的所述各自的识别数据是独特的;以及(ii)通过从所述n个事例中选择分段而生成所述输入数据内容的版本,从而按照一个相关的识别数据模式,所述输入数据内容的每个所述版本载有来自所述事例的识别数据;接着是以下步骤的一次或多次迭代(iii)生成所述输入数据内容的m个另外的事例,其中m是1或大于1,每个所述m个事例载有各自对于所有其他所述事例独特的识别数据;以及(iv)通过从所述m个事例中选择分段来生成所述输入数据内容的另外的版本,一组所述事例包括所述m个事例或所有的所述生成的事例,从而按照一个相关的识别数据模式,所述输入数据内容的每个版本载有来自所述事例的识别数据。为了更好地检测盗版的拷贝的来源,最好是在步骤(i)中所有的事例要载有各自的对于其他事例独特的识别数据。本专利技术也提供把识别数据应用到输入数据内容的方法,所述方法包括以下步骤(i)提供所述输入数据内容的n个事例,其中n大于1,至少除了一个以外的所有的所述事例载有各自的的识别数据,载有各自的识别数据的每个所述事例的所述识别数据对于由其他所述事例所载有的所述各自的识别数据是独特的;以及(ii)通过从所述n个事例中按预定的分段模式选择分段来生成所述输入数据内容的版本,从而按照一个相关的识别数据模式,所述输入数据内容的每个所述版本载有来自所述事例的识别数据;其中所述分段模式使得在所述输入数据内容内至少一个所述分段是不相邻的。本专利技术的这个方面可以提供避免所谓的串通攻击的优点,其中加指纹的数据的多个拷贝被加以组合。通过使用非相邻的分段,一组串通者(colluder)更难识别分段边界。本专利技术特别适用于包括具有多个接续图像的视频内容的数据内容。优选地,识别数据被编码在代表至少某些图像的数据内,例如在至少某些图像本文档来自技高网...

【技术保护点】
检测输入数据内容的版本的方法,所述数据内容有多个不同的版本,其中:所述数据内容按照分段模式被安排为两个或多个分段;以及所述数据的所述版本通过相应的识别数据模式是可识别的,按照所述的相应的识别数据模式,至少一些所述分段具有各自 的识别数据;所述方法包括以下步骤:(i)对于所述输入数据内容的所述分段检测所述识别数据;(ii)对所述检测的识别数据与相应于所述数据内容的所述不同的版本的所述识别数据模式进行比较;以及(iii)如果在所述检测 的识别数据与一个确定的版本的所述识别数据模式之间的得到的匹配的数目之和超过阈值数,则检测所述输入数据内容是否包括来自所述数据内容的所述确定的版本的至少一个组成部分。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:JC佩尔利DW塔普森MJ鲁斯塞尔
申请(专利权)人:索尼英国有限公司
类型:发明
国别省市:GB[英国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1