当前位置: 首页 > 专利查询>东北大学专利>正文

同构对称发布订阅系统的近似动态环匹配方法技术方案

技术编号:7024939 阅读:286 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种同构对称发布订阅系统的近似动态环匹配方法,包括以下步骤:步骤1:获得订阅概率;步骤2:计算阈值位置间隔宽度和域中近似分界线;步骤3:估算节省的存储空间比例。本发明专利技术方法适用于任意数据分布的近似动态环匹配,能够应用在实时环境中,精确度提高了平均15个百分点。本发明专利技术方法的节省空间比例预测公式可计算任何数据分布类型,且具有高精确度,进一步挖掘订阅被匹配的概率在整个域尺寸空间的分布及分析各订阅维度之间的关系和不同维数据的分布特点,运用降低维度等策略使得预测结果更加接近真实值,可以得到更好的预测效果。

【技术实现步骤摘要】

本专利技术属于计算机数据库领域,特别涉及一种。
技术介绍
发布订阅系统是一个满足信息的生产者和消费者互动的分布式中间件系统。发布者除了发布信息,还需要具有选择订阅的能力,即发布和订阅的角色是对称的。在对称的应用中,用户拥有和需求的信息采用相同的数据结构来描述,这是同构对称的概念。同构对称发布/订阅系统(HSPUB/SUB)有着越来越广泛的应用,如易物交换服务和住房交换等,其中环匹配是HSPUB/SUB系统必须要解决的关键问题之一。根据订阅的索引结构,发布/订阅的匹配方法可以分为如下四类。基于一维索引。一维索引结构,如红黑树,哈希表,B+树等,用来索引订阅中定义的谓词并对符合条件的谓词进行计数。一般的,用相同的操作在相同的属性中定义的谓词被索引在一个索引结构中。主要有两种基于一维索引的算法=Coimt算法和Hanson算法。基于多维索引。在多维空间中,一个订阅被视为一个对象,并且匹配操作和查找操作是相同的。主要思想是用多维索引来为订阅直接建立索引,或者把一个d维超立方体转换成2d维的点,从而避免多维空间中的严重交叉。基于网络测试。基于测试网络的技术,首先把订阅信息存储到匹配树上。和谓词索引不同,网络测试技术根据订阅信息模块建立订阅信息索引树。每一个非叶子结点包含一个测试,该结点的边代表测试的结果。一个叶子节点包含一个订阅信息和代表测试结果的边。匹配就是通过执行每个结点描述的测试和跟踪测试结果形成的边来遍历这棵匹配树。基于图。基于图匹配的基本观点要,有向图中找到环,该有向图由同构对称的发布 /订阅应用中的订阅建立。图中的每个结点代表一个订阅。如果订阅Sl和S2匹配,就可以建立一条从Sl到S2的带权有向边。前三种匹配方法的目标是在订阅之间高效地找到一对一匹配,不能直接用于对称的匹配。基于图方法的目标是找到环匹配的最优集,该图形结构不适用于频繁插入和删除操作的实时应用,而且是NP难问题,实际的结果质量取决于具体的应用环境。例如在动态环境里利用动态更新的环匹配方法找环匹配。但生成的环匹配数量随着环的长度的增加成指数增长,需要大量的存储空间。在2010东北大学硕士论文中,谭贤婷提出一种基于阈值的对中间结果处理的策略,但是这种方法应用范围有一定的局限性。它只适用于每一维数据的分布都是均勻的且独立的,而且得到预测节省空间比例的公式精确度不高。
技术实现思路
为了解决已有技术的不足,本专利技术提出一种,适用于任意数据分布的近似动态环匹配。本专利技术采用的技术方案是长度为MaxLength-I (MaxLength代表系统定义的环最大长度)的链订阅插入到订阅数据库中之前,计算链订阅被匹配的概率,如果概率小于阈值,那么该订阅将会被抛出以节省存储空间,通过挖掘订阅被匹配的概率在整个域尺寸空间的分布以及分析个订阅维度之间的关系,运用降低维度等策略求解出更加精确的节省空间比例的上下限。本专利技术方法涉及到的匹配和环匹配的定义如下定义1 :(匹配)对于都具有2d个属性的两个订阅Si、S2和1彡i彡d,如果 Iai e Sl和Iai+d e S2有交集,那么我们称Sl与S2单向拥有-需要匹配,简称“单向匹配”,如附图说明图1(a)所示。如果同时S2与Sl也单向匹配,称Sl和S2为“匹配”,具体如图1(b) 所示。定义2 (环匹配)对于订阅集CN= {Sl,. . .,Si,. . .,SN},其中N > 2,如果Si和 Si+Ι相匹配(1彡i彡N-1),并且SN与Sl相匹配,则CN叫做长度为N的环匹配。如图2 (a) 所示,订阅链与环匹配的不同之处在于环匹配中SN必须与Sl相匹配。因此环匹配也是一个链,可以把长度为N环匹配看作一个链,来创建长度为N+1的环匹配如图2(b)所示。定义3 (链订阅)对于一个订阅集,Ln = (S1, . . .,Si, . . .,、},其中N > 2。如果 Si和Si+1相匹配(1彡i彡N-1),则Ln叫做长度为N的链。Ln由和S1相同的需求谓词和与 、相同的拥有谓词组成,被认为和处理成一个订阅,因此也叫链订阅。图2(a)显示了一个链订阅的例子。本专利技术包括以下步骤步骤1:获得订阅概率用统计信息来评估概率。在一个订阅中有两组谓词拥有谓词和需求谓词。如果拥有谓词和需求谓词的概率分别定义成ftx)。和ftxv那么一个订阅被匹配的概率是权利要求1.,其特征在于包括以下步骤步骤1 获得订阅概率用统计信息来评估概率,在一个订阅中有两组谓词拥有谓词和需求谓词,如果拥有谓词和需求谓词的概率分别定义成ftx)。和ftxv那么一个订阅被匹配的概率是 Pron 能够被估算为全文摘要本专利技术提供一种,包括以下步骤步骤1获得订阅概率;步骤2计算阈值位置间隔宽度和域中近似分界线;步骤3估算节省的存储空间比例。本专利技术方法适用于任意数据分布的近似动态环匹配,能够应用在实时环境中,精确度提高了平均15个百分点。本专利技术方法的节省空间比例预测公式可计算任何数据分布类型,且具有高精确度,进一步挖掘订阅被匹配的概率在整个域尺寸空间的分布及分析各订阅维度之间的关系和不同维数据的分布特点,运用降低维度等策略使得预测结果更加接近真实值,可以得到更好的预测效果。文档编号G06F17/30GK102298624SQ20111023355公开日2011年12月28日 申请日期2011年8月15日 优先权日2011年8月15日专利技术者信俊昌, 王波涛, 王立军, 马素华 申请人:东北大学本文档来自技高网
...

【技术保护点】
1.同构对称发布订阅系统的近似动态环匹配方法,其特征在于:包括以下步骤:步骤1:获得订阅概率用统计信息来评估概率,在一个订阅中有两组谓词:拥有谓词和需求谓词,如果拥有谓词和需求谓词的概率分别定义成Proo和Prow,那么一个订阅被匹配的概率是:Proo能够被估算为:(math)??(mrow)?(msub)?(mi)Pro(/mi)?(mi)o(/mi)?(/msub)?(mo)=(/mo)?(mover)?(mfrac)?(mi)OwnPredicateMatchedTimes(/mi)?(mi)TotalNumber(/mi)?(/mfrac)?(mrow)?(mi)Pro(/mi)?(mo)=(/mo)?(mi)Pr(/mi)?(msub)?(mi)o(/mi)?(mi)o(/mi)?(/msub)?(mo)×(/mo)?(msub)?(mi)Pro(/mi)?(mi)w(/mi)?(/msub)?(/mrow)?(/mover)?(mo),(/mo)?(/mrow)?(/math)其中Own Pr edicateMatchedTimes是拥有谓词被匹配的次数总数,记录当前订阅数据库的快照信息;TotalNumber是订阅的总数,同样的,Prow能够被估算为:(math)??(mrow)?(msub)?(mi)Pro(/mi)?(mi)w(/mi)?(/msub)?(mo)=(/mo)?(mfrac)?(mi)WantPredicateMatchedTimes(/mi)?(mi)TotalNumber(/mi)?(/mfrac)?(/mrow)?(/math)步骤2:计算阈值在域中对应宽度W和域中近似分界线步骤2.1:计算阈值在域中对应宽度W订阅的每个属性的描述信息可以用与该属性对应空间上的一段间隔来表示,定义间隔的基本单位是1,间隔[S,E]的间隔宽度为W=E-S+1,假设域尺寸是N,设间隔[S,E]被匹配的概率Pi,计算任何数据分布的节省空间上限和下限,首先假设数据的概率密度为f(x),某一区间的连续性随机变量的概率是该区间上的概率密度在这段区间的定积分,于是计算Pi的计算公式一般的表示为公式(1),其中N是域尺寸的大小,W是对角线位置的间隔宽度即W=E-S+1,并且Proo=Prow,(math)??(mrow)?(msub)?(mi)p(/mi)?(mi)i(/mi)?(/msub)?(mo)=(/mo)?(mn)1(/mn)?(mo)-(/mo)?(mo)[(/mo)?(msup)?(mrow)?(mo)((/mo)?(msubsup)?(mo)∫(/mo)?(mn)1(/mn)?(mi)S(/mi)?(/msubsup)?(mi)f(/mi)?(mrow)?(mo)((/mo)?(mi)x(/mi)?(mo))(/mo)?(/mrow)?(mi)dx(/mi)?(mo))(/mo)?(/mrow)?(mn)2(/mn)?(/msup)?(mo)+(/mo)?(msup)?(mrow)?(mo)((/mo)?(msubsup)?(mo)∫(/mo)?(mi)E(/mi)?(mi)N(/mi)?(/msubsup)?(mi)f(/mi)?(mrow)?(mo)((/mo)?(mi)x(/mi)?(mo))(/mo)?(/mrow)?(mi)dx(/mi)?(mo))(/mo)?(/mrow)?(mn)2(/mn)?(/msup)?(mo)](/mo)?(mo)-(/mo)?(mo)-(/mo)?(mo)-(/mo)?(mrow)?(mo)((/mo)?(mn)1(/mn)?(mo))(/mo)?(/mrow)?(/mrow)?(/math)其中d代表拥有谓词或者需求谓词的维数,由公式(1)得到:(math)??(mrow)?(mn)1(/mn)?(mo)-(/mo)?(mroot)?(mi)pro(/mi)?(mrow)?(mn)2(/mn)?(mi)d(/mi)?(/mrow)?(/mroot)?(mo)-(/mo)?(msup)?(mrow)?(mo)((/mo)?(msubsup)?(mo)∫(/mo)?(mi)E(/mi)?(mi)N(/mi)?(/msubsup)?(mi)f(/mi)?(mrow)?(mo)((/mo)?(mi)x(/mi)?(mo))(/mo)?(/mrow)?(mi)dx(/mi)?(mo))(/mo)?(/mrow)?(mn)2(/mn)?(/msup)?(mo)=(/mo)?(msup)?(mrow)?(mo)((/mo)?(msubsup)?(mo)∫(/mo)?(mn)1(/mn)?(mi)...

【技术特征摘要】

【专利技术属性】
技术研发人员:王波涛信俊昌王立军马素华
申请(专利权)人:东北大学
类型:发明
国别省市:89

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1