面向内容发布订阅系统的数据结构及其混合事件匹配方法技术方案

技术编号:10313709 阅读:148 留言:0更新日期:2014-08-13 16:03
本发明专利技术公开了一种面向内容发布订阅系统的数据结构及其相应的混合事件匹配方法,包含同谓偏序订阅列表、同谓偏序谓词表、混合订阅列表、混合谓词表,通过增加订阅、删除订阅和事件匹配三个阶段,将订阅信息组织成考虑了谓词间和订阅间关联关系的索引结构,把订阅覆盖关系从匹配网络算法中剥离,并引入到谓词索引结构中去,进而达到了在订阅频繁增加、删除、变更情况下仍保持高效事件匹配的效果。本发明专利技术能够在频繁订阅情况下提供高效的匹配,从而能够满足相关应用的需求。

【技术实现步骤摘要】
面向内容发布订阅系统的数据结构及其混合事件匹配方法
本专利技术涉及面向内容发布订阅系统的混合事件匹配算法
技术介绍
在日益涌现的分布虚拟环境与算法交易等应用中,有越来越多的场景要求底层的事件匹配算法在高效匹配的同时满足频繁订阅变更的要求。已有的相关研究中,核心问题都是解决事件代理采用何种算法实现事件和大量订阅者之间的高效匹配。然而,伴随着系统应用领域和范围的不断扩大,诞生了对内容发布/订阅的新需求。例如当前比较流行的算法交易(highfrequencyalgorithmictrading,HFT),其交易量在美国甚至占到了总额的73%。算法交易与已有的应用不同,在交易日算法交易往往应用了不同的线性回归、博弈论、神经网络、遗传算法等,对交易过程的订阅细节进行干预,这就带来了对订阅的大量动态变更。因此交易系统中就要求在满足高效匹配的前提下能够应对用户频繁更改查询(订阅)条件的需求,如果匹配算法不能同时支持频繁更改查询和高效匹配,将给客户带来不可估量的损失。又如分布式虚拟环境(distributedvirtualenvironment,DVE)中,虚拟对象通过具有较强表达能力的谓词来描述自身的订阅信息,系统中的每个路由节点上则将对象发布信息与订阅信息进行匹配,并根据匹配结果实现数据转发。整个虚拟环境的信息量非常大,交互节点间关联关系复杂,随着试验过程的推进,各节点间频繁变更交互(订阅)关系。事件匹配与订阅变更的效率,不仅决定了系统的实时性是否能得到满足,而且会制约着整个系统的可扩展性,可能造成系统拥塞和网络瓶颈,形成系统失真进而严重影响系统的实用性。目前有以下几种算法:1计数算法(Countingalgorithm)。计数法的思想是测试所有谓词建立一个表保存谓词和订阅的映射关系,即谓词被哪些订阅满足。匹配时,遍历这个表找出满足一个订阅的谓词数目,将之与这个订阅包含的谓词数目进行比较,如果相等则说明事件与订阅相匹配。计数法虽然避免了一个谓词被多次测试,但是它总会对订阅中所有的谓词进行测试,而实际上当一个订阅中的某谓词无法匹配时其他后续测试都不需要继续进行。由于计数法使用了谓词索引结构,能够很好的支持订阅动态变更;但是由于无法利用不同谓词之间以及不同订阅间的相关性,匹配效率不高。在后续的计数索引算法的改进算法中,虽然对匹配效率进行了进一步优化,但仍未考虑订阅覆盖等因素,制约了匹配效率提高。2CEEM算法、ICCounting算法及其同类算法,。算法采用以谓词表为核心的数据结构,对谓词族进行了划分,并对每个谓词族用排序或者散列表的方式进行了索引,使得在对每个谓词进行匹配时能获得一定的效率;同时利用谓词间的关联性来加快匹配速度。这类算法虽然建立在谓词索引结构上支持动态的订阅;但是事件匹配过程中仅考虑了谓词间的关联关系,不能很高效的完成事件匹配。3汉森算法(Hansonalgorithm)及其扩展算法等。其主要思想都是对不同的订阅谓词分别进行索引及计数,并根据其结果是否满足要求进行匹配过滤。算法通过采用较为高效的测试先淘汰相当部分的订阅,然后在剩余的订阅中进行比较运算,以提高算法的匹配效率。这类算法一般都使用了谓词索引方式,掩盖了部分的谓词关联关系,但考虑了订阅覆盖关系。由于对订阅覆盖的抽取基于K-D树等机制,使得其在提高匹配效率的同时丧失了订阅的高效动态更新能力。4基于覆盖网络的算法(Testingnetworkbasedalgorithm)。这类算法能够充分利用各个订阅及谓词间的相关性,来提高匹配效率;受限于图的动态维护代价,算法往往只支持静态订阅或动态订阅效率处理效率不高。Siena根据订阅之间的覆盖关系将其组织成为偏序集(partiallyorderedset,Poset),但是Poset结构在添加和取消订阅时会引入大量的订阅覆盖关系的判断。同时,在事件匹配过程中,不同订阅的同一个谓词可能会被多次测试,这样会对匹配的性能造成不良的影响。Gryphon系统采用了并行搜索树来解决事件和订购的匹配效率问题及消息组播技术来节省网络带宽,但基于并行搜索树的算法限定于处理等值谓词判定。Gryphon系统采用基于大粒度的整体订购式的覆盖技术,当订购表达式属性维数较多时,订购式之间的覆盖关系程度降低,从谓词角度来看,存在着很大的冗余。5基于匹配树的算法(Testingtreebasedalgorithm)。这类算法一般在预处理阶段将订阅组织成图(匹配网络、树)的结构,事件从图的入口进入,经过各个中间节点的过滤,直到出口判定匹配结果。这类算法能够充分利用谓词间的相关性,从而能够实现较高的匹配效率。但受限与图的动态维护代价,算法往往只支持静态订阅或动态订阅效率处理效率不高。匹配网络类型的算法比较多,依据其对谓词和订阅关系抽象的不同可做如下分类:1)基于二叉决策图(binarydecisionsdiagrams,BDD)的算法将订阅组织成为一个BDD,其中非终点的节点表示一个谓词,出边被标识为0或1,由此将订阅的匹配转化成了对BDD的判定问题。MBDD修改了BDD并且使用订阅的历史信息、谓词间的逻辑关系等提高了事件路由和匹配的性能。2)Silvia等人提出了基于分布式R-trees的匹配路由算法,根据MBR原理构建一棵分布式R-trees来实现事件的匹配路由,然而该算法的不足之处是空间复杂度较大,路由信息维护困难。通过上述对各类匹配算法在是否采用谓词索引结构、是否考虑谓词间关系、是否考虑订阅间覆盖三方面的分析不难发现,当前对匹配算法的研究已经相对成熟,只是高效的订阅结构(谓词索引结构)无法提供高效的事件匹配,而高效的事件匹配机制(匹配网络)无法提供高效的动态频繁订阅更改。即高效的订阅结构无法和高效的匹配机制很好结合,才造成了当前匹配算法无法直接支持频繁订阅类应用的情况。而且,在已有研究中不难发现汉森算法及其扩展算法和CEEM算法都试图既采取谓词索引结构完成订阅,又应用谓词间与订阅间关系来进行匹配。只是CEEM算法采取了“欠融合”的方式,即在索引结构下没有充分利用订阅间的关联关系;汉森算法及其扩展算法又采取了“过融合”的方式,即在索引结构下考虑了过多的订阅间关联关系,使得索引结构实际演化成了匹配网络结构,故而无法提供动态频繁订阅的支持。
技术实现思路
针对现有技术的不足,本专利技术的一个专利技术目的在于提供一种面向内容发布订阅系统的数据结构,另一目的在于提供一种面向内容发布订阅系统的混合事件匹配方法,在频繁订阅情况下提供高效的匹配,以满足相关应用的需求。在订阅系统中,将订阅信息组织成考虑了谓词间和订阅间关联关系的索引结构,把订阅覆盖关系从匹配网络算法中剥离,并引入到谓词索引结构中去,进而达到了在订阅频繁增加、删除、变更情况下仍保持高效事件匹配的效果。本专利技术的一个专利技术目的通过以下技术方案来实现:一种面向内容发布订阅系统的数据结构,包含同谓偏序订阅列表(P-list)、同谓偏序谓词表(P-table)、混合订阅列表(M-list)、混合谓词表(M-table),其特征在于:所述同谓偏序订阅列表(P-list)由符合偏序关系且谓词相同的订阅组成;所述同谓偏序谓词表(P-table)由满足同谓偏序关系数量最多的K组同谓偏序关系订阅的谓词组成;本文档来自技高网
...
面向内容发布订阅系统的数据结构及其混合事件匹配方法

【技术保护点】
一种面向内容发布订阅系统的数据结构,包含同谓偏序订阅列表、同谓偏序谓词表、混合订阅列表、混合谓词表,其特征在于:所述同谓偏序订阅列表由符合偏序关系且谓词相同的订阅组成;所述同谓偏序谓词表由满足同谓偏序关系数量最多的K组同谓偏序关系订阅的谓词组成;所述混合订阅列表由无法加入同谓偏序订阅列表的订阅组合;混合订阅列表中设置有匹配界限,匹配界限是根据事件中所有属性的值来确定;所述混合谓词表为混合订阅列表所对应谓词表,并将同一订阅中的谓词用指针链接起来,最后都指向混合订阅列表的具体订阅。

【技术特征摘要】
1.一种面向内容发布订阅系统的数据结构,包含同谓偏序订阅列表、同谓偏序谓词表、混合订阅列表、混合谓词表,其特征在于:所述同谓偏序订阅列表由符合偏序关系且谓词相同的订阅组成;所述同谓偏序谓词表由满足同谓偏序关系数量最多的K组同谓偏序关系订阅的谓词组成;所述混合订阅列表由无法加入同谓偏序订阅列表的订阅组合;混合订阅列表中设置有匹配界限,匹配界限是根据事件中所有属性的值来确定;所述混合谓词表为混合订阅列表所对应谓词表,并将同一订阅中的谓词用指针链接起来,最后都指向混合订阅列表的具体订阅。2.一种面向内容发布订阅系统的混合事件匹配方法,包含增加订阅、删除订阅和事件匹配三个阶段,其特征在于所述增加订阅包含如下步骤:1.1)、在同谓偏序订阅列表中,找到距离需增加的订阅最近的前驱和后继,如果该订阅的前驱和后继是直接相连的,或者前驱、后继有一个不存在,则说明其是可插入的,将该订阅插入同谓偏序谓词表,跳至1.3);如果前驱或后继都不存在或不是直接相连,将该订阅加入混合订阅列表,进行1.2);1.2)、在混合谓词表中,按照从上往下的顺序,在订阅所包含的每个谓词族中通过二分法查找相应位置,并将对应的阈值插入混合谓词表中;在谓词插入的过程中,将插入的谓词按从上至下的顺序逐一进行链接,最后指向混合订阅列表中的对应位置;1.3):在同谓偏...

【专利技术属性】
技术研发人员:周庆熊智勇尤涛
申请(专利权)人:中国航空无线电电子研究所西北工业大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1