流识别和过滤制造技术

技术编号:10732395 阅读:46 留言:0更新日期:2014-12-10 09:59
一种方法获得第一数据项的第一数据项签名,第一数据项签名包括第一数据项中的多个同步点与对应的多个块签名之间的关联。处理尝试在第二数据项中找到所述多个同步点中的一个;并且,如果找到这样的同步点,则通过将哈希函数应用于第二数据项中对应的比特块来确定第二数据项中的所述对应的比特块的块签名。所述处理查明来自第二数据项的所述同步点和所述对应的块签名是否对应于第一数据项签名中的同步点和块签名。如果预定数量的同步点和对应的块签名匹配,则第一和第二数据项被认为匹配。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】一种方法获得第一数据项的第一数据项签名,第一数据项签名包括第一数据项中的多个同步点与对应的多个块签名之间的关联。处理尝试在第二数据项中找到所述多个同步点中的一个;并且,如果找到这样的同步点,则通过将哈希函数应用于第二数据项中对应的比特块来确定第二数据项中的所述对应的比特块的块签名。所述处理查明来自第二数据项的所述同步点和所述对应的块签名是否对应于第一数据项签名中的同步点和块签名。如果预定数量的同步点和对应的块签名匹配,则第一和第二数据项被认为匹配。【专利说明】流识别和过滤版权声明本专利文档包含受版权保护的资料。版权所有人不反对美国专利商标局的文件中的本专利文档或任何相关资料的复制,但在其它方面保留任何所有的版权。
本专利技术涉及流识别和过滤。 【专利附图】【附图说明】 当参照附图考虑以下描述和所附权利要求时,本专利技术的其它目的、特征和特性、以及结构的相关元件的功能和操作的方法、以及部件的结合和制造的经济性将变得更清楚,所有的附图形成本说明书的一部分。 图1 (a)描绘数据流; 图1 (b)描绘同步点和对应的比特块; 图1 (c)描绘图1 (A)的数据流的流签名; 图2 (a) -2 (d)描绘数据流的处理; 图3 (a) -3 (b)示出用于对多个流进行处理的结构; 图4 (a) -4 (b)描绘多个流的处理; 图5示出用于对流进行处理的示例性数据结构; 图6 (a) -6 (c)示出使用图5的数据结构处理的示例流; 图7示出典型的分组; 图8是计算机系统的示意图。 【具体实施方式】 背景和概述 检查存储在设备上或者在设备之间传输的数据以便试图确定该数据是否对应于其它已知的数据通常是有用的且期望的。例如,确定存储在设备上的数据是否对应于或者是其它数据的整个或部分副本可能是有用的或期望的。作为另一个示例,确定在两个设备之间发送的数据流是否对应于(或者是)其它数据(的整个或部分副本)可能是有用的或期望的。 描述 数据流(或流)包括比特序列。流中的比特序列可以表示某一类型的数据项(例如,电影或图像或音乐、数据库等)或者对某一类型的数据项进行编码。可以对流中的比特序列进行加密和/或压缩。本领域技术人员在阅读本描述时将认识并理解到,本专利技术不受底层比特序列所表示的内容限制。 如本文中所使用的,数据指的是任何任意的数据,而不管底层数据表示什么,也不管如何对底层数据进行格式化、编码或存储。 参照图1 (a)_l (b),流100包括多个同步点(在图中该流被示出具有i个同步点,这些同步点被表示为SP1, SP2, SP3,…,SPi,其统称为SPp。在该流中跟在每个同步点后面的是比特块(在图中第j个块被表示为Bj)。 如图1(b)中所示,第i个同步点(SPi)由k个比特(Kb1-K)组成,并且第i个比特块(Bi)由j个比特(Ctl(VCj)组成。 尽管第j个比特块在图中被示为紧跟在第j个同步点的后面,但是应当明白,第j个比特块可以与第j个同步点间隔某个已知量。 在目前优选的实现中,存在十六(16)个同步点,每个同步点由32个比特组成,并且每个比特块由256个字节组成。在另一实现中,存在十(10)个同步点,每个同步点由64个比特组成,并且每个比特块由256个字节组成。如本文中所使用的,流中的比特的数量被称为流的大小,同步点中的比特的数量被称为同步点的大小,并且比特块中的比特的数量被称为比特块的大小。本领域技术人员在阅读本描述时将认识并理解到,可以使用除以上示出的数量之外的不同的和/或其它的数量的同步点,同步点可以具有与以上示出的数量不同的大小,比特块可以具有与以上示出的数量不同的大小。 本领域技术人员在阅读本描述时将认识并理解到,同步点的数量在某些情况下可以被确定为比特流的大小的函数。 与每个比特块Bj对应的是通过将函数(h)应用于该比特块而确定的值H」,以使得: Hj = h (Bj) 值%在本文中也被称为第j个比特块的块签名。 函数h应当具有以下性质:对于任何两个任意的比特块Ba和Bb,如果Ba等于Bb,贝丨J h (Ba) = h (Bb) ο 函数h的其它可期望性质包括: (a)Bi中的小变化有可能导致Ii(Bi)的不同值; (b)函数h相对简单并且快速地计算。 函数h可以是任何哈希函数。在一些实现中,可以使用诸如MD5或SHA-1等的消息摘要函数,尽管优选地可以使用更简单并且更轻量的函数。优选地,哈希函数生成32比特值。 本领域技术人员在阅读本描述时将认识并理解到,函数h不需要(并且可能将不会)对于每一个比特块生成唯一值。 每个流具有对应的流签名。现在参照图l(a)-l(c),具有i个同步点(SP1, SP2,SP3,…,SPi)的流的签名由i对〈SPj,h(Bj)>组成,j = 1-1o图1(c)中的示图示出了图1(a)的流100的签名102的逻辑表示。 参照图2(a)和图2(b)描述数据流的流签名的创建。如图2(a)中所示,初始设定200对流S进行处理以生成流签名202。参照图2(b)中的流程图更详细地描述初始设定200的处理。初始设定处理200将创建由一定数量(k)的对〈SPj,h (Bj) >组成的流签名202,j = I…k,k为某个值。k的值优选地被预设(例如,10、15、20等),但是,如以上所提到的,还可以将k的值确定为流S的大小的函数。 在对流200进行处理中,初始设定202可以首先确定流S的大小(在204处)。该大小信息可以被用于例如确定该流所需的同步点的数量(k)和/或该流内的同步点的间隔。如当阅读本描述时将变得清楚的,对于任何给定的流(S),优选的是使同步点分布在整个流⑶上。 处理202然后(在206处)确定流S中的下一个(第i个)同步点(SPi)以及对应的比特块(Bi)15对于比特块Bi确定值H (Bi)(在208处),并且将对<SPj,H (Bj) >存储在流S的签名中(在210处)。在208处计算的函数“H”对应于以上所描述的函数h,并且优选为诸如MD5或SHA等的哈希函数的消息摘要。 处理202然后确定对于该流S是否已经确定了充分的〈同步点,值〉对(在212处)。如果是,则存储该流的签名(SS)(在214处),否则确定另一个同步点(在206处)。在对流(S)处理的结束时,生成(例如,图1(c)中所示的形式的)流签名,并且将该流签名与流S)相关联地存储。 如在阅读本描述时对于本领域技术人员将清楚的,两个流具有同样的流签名(使用本文中所描述的处理而确定)的事实不一定暗示这两个流是同样的。例如,第一个流可以由数百万个比特组成,而流签名可以仅由十个或二十个〈同步点,比特块值〉对组成,其中,同步点随机地分布在该流上,并且其中,每个同步点仅使用128个比特,并且每个比特块仅使用512个比特。在这种情况下,如果第二个流具有完全相同的〈同步点,比特块值〉对,则它可能对应于第一个流,但是它可能不对应于第一个流。然而,如果第二个流不具有与第一个流相同的〈同步点,比特块值 > 对,则它不对应于第一个流。 专利技术人认识到,对于一些应用,确定数据流是否充分地对应本文档来自技高网...
流识别和过滤

【技术保护点】
一种由硬件结合软件实现的计算机实现的方法,所述方法包括:确定数据项中的多个同步点,所述数据项由任意的比特序列组成,并且每个同步点由所述数据项中的比特序列组成;对于所述多个同步点中的每一个,确定所述数据项中对应的比特块;对于每个比特块,通过将哈希函数或消息摘要函数应用于所述比特块来确定对应的块签名;通过将所述多个同步点中的每一个与所述对应的比特块的对应的块签名相关联来形成数据项签名。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:R·萨吉N·梅约米
申请(专利权)人:阿尔特耐特股份有限公司
类型:发明
国别省市:美国;US

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1