The present invention discloses a new space mining method for efficient co location mode, according to the distance threshold of adjacent relation between each instance; through the calculation of 2 order spatial neighborhood relation co location model example; the calculation of each feature according to the mode of the utility table instance participation rate; then the utility participation rate the utility to determine the weights of each feature, then calculate the utility mode; then judge PUI (c) is greater than the threshold. If the utility of PUI (c); < E, shear branches using high order modes to the maximum utility rate algorithm, that is no longer the calculation mode of C all high order modes; generate k+1 order candidate mode, processing of k+1 order candidate patterns to repeat this; when it is no longer possible to generate the candidate model of high order, get the full space efficient mode set. To solve the case with the co utility space location mining model with high efficiency.
【技术实现步骤摘要】
空间高效用co-location模式挖掘方法
本专利技术属于空间并置模式挖掘
,特别是涉及一种空间高效用co-location模式挖掘方法。
技术介绍
空间co-location模式是指空间特征的实例在邻近区域内频繁同时出现的空间特征子集。例如在公共交通领域,交通拥堵、车祸现场和警察的出现频繁并置(co-located)。空间co-location模式挖掘是空间数据挖掘领域的一个重要研究方向。在空间数据库中,不同的空间特征代表了不同类型的空间对象,通常用F={f1,f2,....,fn}来表示空间数据库中出现的特征集合。在空间数据库中所挖掘到的空间co-location模式c是F的一个子集,一个模式c的长度称为此co-location模式的阶,例如{A,B,C}是一个3阶co-location模式。在空间数据库中,每个特征都包含了许多属于该特征的空间实例,通常用三元组<特征名,实例编号,地理位置>表示一个空间实例,如图1中A.1。如果两个空间实例的欧几里得距离满足用户给定的距离阈值d,那么就称这两个空间实例满足邻近关系,在图中用实线连接,如图1中A.2和B.1。设有一个空间实例集I={i1,i2,...,im},如果I中两两实例都满足邻近关系,那么就称I是一个团实例。如果团实例I包含了co-location模式c中的所有特征,并且I中没有任何一个子集包含c中所有的特征,那么I被称为模式c的一个行实例,co-location模式c的所有行实例的集合称为表实例,记为table_instance(c)。例如图1中,模式{A,B,E}的表实例为t ...
【技术保护点】
一种空间高效用co‑location模式挖掘方法,其特征在于,按照以下步骤进行:步骤A:根据距离阈值获得各个实例间的邻近关系;步骤B:通过邻近关系计算得到2阶的空间co‑location模式的表实例,所有的2阶模式形成2阶候选模式C2;k阶候选模式表示为Ck;步骤C:针对每个Ck中的模式c,先计算每个特征在模式c中的效用参与率FUR(fi,c);然后通过效用参与率确定每个特征的效用权重ω(fi,c),再计算模式c的模式效用度PUI(c);步骤D:若PUI(c)≥效用阈值ξ,则模式c是高效用模式,将其放入高效用模式集Uhigh中;若PUI(c)<ξ,可使用最小特征参与率算法或最大特征参与率算法进行剪枝;最小特征参与率剪枝:首先可获得该模式的相关模式Sc(c)以及相关特征,接着判断模式c中
【技术特征摘要】
1.一种空间高效用co-location模式挖掘方法,其特征在于,按照以下步骤进行:步骤A:根据距离阈值获得各个实例间的邻近关系;步骤B:通过邻近关系计算得到2阶的空间co-location模式的表实例,所有的2阶模式形成2阶候选模式C2;k阶候选模式表示为Ck;步骤C:针对每个Ck中的模式c,先计算每个特征在模式c中的效用参与率FUR(fi,c);然后通过效用参与率确定每个特征的效用权重ω(fi,c),再计算模式c的模式效用度PUI(c);步骤D:若PUI(c)≥效用阈值ξ,则模式c是高效用模式,将其放入高效用模式集Uhigh中;若PUI(c)<ξ,可使用最小特征参与率算法或最大特征参与率算法进行剪枝;最小特征参与率剪枝:首先可获得该模式的相关模式Sc(c)以及相关特征,接着判断模式c中都有FUR(fi,c)<ξ,且c的相关特征在Sc(c)中的效用参与率的最小值中的最大值小于ξ,那么,模式c的所有高阶模式不可能是高效用模式,将c模式并入Pp集合中;最大特征效用率剪枝:同样先获得该模式的相关模式Sc(c)以及相关特征,将每个相关特征在各个相关模式中的交集表示为Ifi(fi,c),接着判断模式c中所有特征的效用参与率FUR(fi,c)是否小于效用率阈值ξ,当所有的FUR(fi,c)都小于ξ时,计算相关特征的最大特征参与率RUR(fi,c),若RUR的最大值<ξ,可对模式c的高阶模式进行剪枝,将c模式加入Pp集合中;步骤E:生成k+1阶候选模式,所有k+1阶模式均为候选模式;将Pp集合中模式的高阶模式从k+1阶候选模式中删...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。