一种属性图模型中挖掘满足同质性要求的属性的方法技术

技术编号:20916400 阅读:33 留言:0更新日期:2019-04-20 09:40
本发明专利技术涉及一种属性图模型中挖掘满足同质性要求的属性的方法。具体是图数据、数据挖掘算法等技术领域。本方法采用划分子图,对子图欲量化评价;计算加权平均数值,算平均数值后的子图中进行标准差计算,针对得到的标准差的不同,得到该值所对应的属性对同质性的满足程度。本发明专利技术提供的属性图模型中挖掘满足同质性要求的属性的方法,将大规模图数据简化处理的方法。可以将属性类别较多的大规模图数据的后续挖掘问题简化,降低计算和存储开销。

A Method of Mining Attributes Meet Homogeneity Requirements in Attribute Graph Model

The invention relates to a method for mining attributes satisfying homogeneity requirements in attribute graph model. Specifically, it is in the technical fields of graph data, data mining algorithm and so on. In this method, subgraphs are divided and evaluated quantitatively; weighted average values are calculated and standard deviations are calculated in subgraphs after average values are calculated. According to the difference of standard deviations, the degree of homogeneity satisfaction of attributes corresponding to the values is obtained. The method of mining attributes satisfying the homogeneity requirement in the attribute graph model provided by the invention simplifies the processing method of large-scale graph data. It can simplify the subsequent mining of large-scale graph data with more attribute categories and reduce the computational and storage overhead.

【技术实现步骤摘要】
一种属性图模型中挖掘满足同质性要求的属性的方法
本专利技术涉及一种属性图模型中挖掘满足同质性要求的属性的方法。具体是图数据、数据挖掘算法等

技术介绍
一直以来,传统的关系数据模型在数据建模领域一直处于统治地位。但是随着相关技术的进步和时代的发展,传统的关系模型使用的范围越来越大,于是出现了一些关系模型无法适用的场景,比如在社交网络,交通网络等对实体间关系操作频繁的场景之中,因为传统的关系型数据库在处理关系问题时需要大量的关联表去记录一系列复杂的关系。在引入更多实体之后,将需要越来越多的关联表,从而使得基于关系型数据库的解决方案繁琐易错。数据模型的缺陷也使得这种数据不易扩展,不适应当前数据快速增长的现状。在此情境下,图数据库应运而生,图数据库起源于欧拉和图理论,也可称为面向图的数据库。其基本含义是以图这种数据结构存储和查询数据,它的数据模型主要以节点和边来体现,优点是可以快速解决复杂的关系问题。随着图数据库的蓬勃发展,工程和科研人员在许多实际场景之中都会选择图模型对数据进行建模,因此关于图数据的相关算法研究也日趋火热。在种种相关算法中,又以属性加权图挖掘算法的相关研究最为热门本文档来自技高网...

【技术保护点】
1.一种属性图模型中挖掘满足同质性要求的属性的方法,其特征在于:方法如下:1)、基于图和属性集通过网络结构划分子图;采用模块 “度”作为参数调节划分程度,将子图划分为子图1、子图2直至子图n;2)、区分每个子图中有序类别型属性与无序类别型属性;对每个有序类别型属性进行欲量化评价;3)、针对步骤2)针对量化后的有序类别型属性的子图1、子图2直至子图n中的每个子图计算加权平均数值;4)、针对步骤3)计算平均数值后的子图中进行标准差计算,针对得到的标准差的不同,得到该值所对应的属性对同质性的满足程度。

【技术特征摘要】
1.一种属性图模型中挖掘满足同质性要求的属性的方法,其特征在于:方法如下:1)、基于图和属性集通过网络结构划分子图;采用模块“度”作为参数调节划分程度,将子图划分为子图1、子图2直至子图n;2)、区分每个子图中有序类别型属性与无序类别型属性;对每个有序类别型属性进行欲量化评价;3)、针对步骤2)针对量化后的有序类别型属性的子图1、子图2直至子图n中的每个子图计算加权平均数值;4)、针对步骤3)计算平均数值后的子图中进行标准差计算,针对得到的标准差的不同,得到该值所对应的属性对同质性的满足程度。2.根据权利要求1所述的属性图模型中挖掘满足同质性要求的属性的方法,其特征在于:步骤1)中所述的“度”为评价划分得到的子图中的连边...

【专利技术属性】
技术研发人员:赵子豪杨汉玮
申请(专利权)人:南京邮电大学盐城大数据研究院有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1