This invention discloses a method of mining association rules based on the concept lattice extension theory, which includes the following steps: extracting the object, attribute and attribute value of the data set according to the concerned relation, constructing the formal background of the target data set, constructing the theory by using the basic concept lattice, and analyzing the concept nodes; and the concept of the concept. The element on the lattice is determined and the irreducible element set on the concept lattice L (FC) is calculated. According to the support and credibility of the set, the association rules are reduced to further improve the computational efficiency of the algorithm. Finally, the complexity of the method is calculated, which can be used to indicate the computation. On the basis of traditional formal concept analysis extraction of association rules, this invention extends the narrow sense concept lattice theory, and explores the similarity between the objects fully while paying attention to the difference between the objects of the data set. At the same time, the corresponding attribute and rule reduction algorithm is adopted to ensure the efficiency of the method. It is fast, stable and efficient.
【技术实现步骤摘要】
一种基于概念格扩展理论的关联规则挖掘方法
本专利技术属于计算机、大数据和云计算领域,涉及一种数据集对象和属性之间的关联规则挖掘方法。
技术介绍
在数据挖掘关联规则发现领域中,由二元关系构建的概念格是一种非常直观的形式概念分析方法,它利用概念的内涵(属性)和外延(对象)以及知识概念之间的泛化和特化关系,能够充分反映对象和属性之间的蕴含规则。但是目前的概念格方法过于强调对象之间的差异性,却没有充分考虑它们的相似性,这在偶发性极强的商业数据分析领域,往往忽略了对象之间某些细微的共性,导致规则挖掘过于苛刻而错过一些细微且关键的规则发现;一些新兴算法加入了对象间的相似性考量,却因为由此引发的关联规则过于复杂而造成算法时效性太差,资源占用过高,无法在实时性要求高的领域发挥作用。
技术实现思路
为解决上述问题,本专利技术提出了一种基于概念格扩展理论的关联规则挖掘方法,可在传统形式概念分析提取关联规则的基础上,将狭义概念格理论扩展,在关注数据集对象之间差异性的同时,充分探索对象之间的相似性。同时采用相应的属性和规则约简算法,保证方法的计算效率。本专利技术的技术方案为:一种基于概念格扩展理论的关联规则挖掘方法,其特征在于:所述方法包括以下步骤:A.在基础概念格构建理论的基础上,引入容限范围内的二元关系,将数据集中的对象、属性以及属性值依据所关注的关系提取,允许对象之间具有一定的差异性,构建出目标数据集的形式背景;B.对概念格上的元素进行判定,计算出概念格上的不可约元集;C.根据设置的支持度和可信度,对关联规则进行缩减,进一步提高算法的计算效率;D.计算方法复杂度,指示计算量。进 ...
【技术保护点】
一种基于概念格扩展理论的关联规则挖掘方法,其特征在于:所述方法包括以下步骤:A.在基础概念格构建理论的基础上,引入容限范围内的二元关系,将数据集中的对象、属性以及属性值依据所关注的关系提取,允许对象之间具有一定的差异性,构建出目标数据集的形式背景;B.对概念格上的元素进行判定,计算出概念格上的不可约元集;C.根据设置的支持度和可信度,对关联规则进行缩减,进一步提高算法的计算效率;D.计算方法复杂度,指示计算量。
【技术特征摘要】
1.一种基于概念格扩展理论的关联规则挖掘方法,其特征在于:所述方法包括以下步骤:A.在基础概念格构建理论的基础上,引入容限范围内的二元关系,将数据集中的对象、属性以及属性值依据所关注的关系提取,允许对象之间具有一定的差异性,构建出目标数据集的形式背景;B.对概念格上的元素进行判定,计算出概念格上的不可约元集;C.根据设置的支持度和可信度,对关联规则进行缩减,进一步提高算法的计算效率;D.计算方法复杂度,指示计算量。2.如权利要求1所述的基于概念格扩展理论的关联规则挖掘方法,其特征在于:所述步骤A的具体实现方式为:用三元组定义目标数据集的形式背景,记为FC=(U,D,R),其中U表示数据集中对象的集合,D表示对象的描述符——属性的集合,R表示U和D之间的某个二元关系,其中该关系表述为“对象U具有属性D”,记作uRd,其中u∈U,R∈R,d∈D,R只需满足对称性和自反性即可作为此处的二元关系,此时R允许对象之间具有容限内的差异性,并且关系R可以不具备传递性;幂集U和D之间的伽罗华关系记为如下两个函数f1和f2:进一步,将上述两个函数定义成以下两个算式:显然,u*计算得到了共同具有U中对象的全体属性集,d*计算得到了共同具有D中属性的全体对象集;满足上述两个算式的序对(ui,di)即为形式背景FC上的形式概念,所有形式概念构成的集合记为L(FC),其中L(FC)的所有的对象概念集记为LU(FC)={u|(u,d)∈L(FC)},相应的属性概念集记为LD(FC)={d|(u,d)∈L(FC)}。3.如权利要求2所述的基于概念格扩展理论的关联规则挖掘方法,其特征在于:所述步骤B的具体实现方式为:利用求解不可约元集来约简形式背景的属性的算法如下:对于步骤A中所述的形式背景FC=(U,D,R),假设FCD=(U,D,RD)是FC的子形式背景,不可约元集分为交不可约元集和并不可约元集,在此记L(FC)的交不可约元集为Ise(L(FC)),并不可约元集为Sma(L(FC));由属性概念集和对象概念集的性质,可得:另外,设a,b,c∈L(FC),则由不可约元集的定义,可推得下式:由上述两算式可得,若(ui,di)∈Ise(L...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。