一种存储数据的方法和装置制造方法及图纸

技术编号:11383584 阅读:106 留言:0更新日期:2015-05-01 08:36
本发明专利技术实施例公开了一种存储数据的方法和装置,该方法包括:一种存储数据的方法,所述方法包括:获取原始数据集;从原始数据集中提取表示信息网络图结构的信息;其中,所述表示信息网络图结构的信息至少包括:节点信息,节点属性信息,边信息,和边属性信息;所述节点信息至少包括:节点标识和节点属性关键码;所述节点属性关键码与所述节点属性信息具有对应关系;所述边信息至少包括:边标识和边属性关键码;所述边属性关键码与所述边属性信息具有对应关系;所述边用于描述节点与节点之间的联系;存储所述提取的节点信息,节点属性信息,边信息,和边属性信息。本发明专利技术实施例提供的方案,使得研究人员还可以关注节点之间关系。

【技术实现步骤摘要】

本专利技术涉及数据存储领域,具体涉及一种存储数据的方法和装置
技术介绍
信息网络(Information Networks)的概念,是对现实空间中海量、多维、复杂结构数据的一般性抽象。信息网络在社区网络分析、合作者网络分析、交通运输网络能力计算、蛋白质网络接收成分分析、犯罪网络分析等领域都具有重要价值。在信息网络环境中,用户关注的主题信息由简单的数值度量值(如销售总量,利润值),演化成为关注复杂的网络,如销售网络,其中每个节点(Vertex)代表一种商品,节点间的连线(即:边,Edge)表示不同类物品的共同销售关系,参见图1所示的销售网络。经典的在线分析处理(OLAP,Online Analysis Processing)数据仓库模型是多维数据模型。多维数据模型是一个多维空间,“维”是人们观察数据的不同角度,可以用于表示某个事物的不同属性。例如,在分析产品销售数据时,涉及时间维,产品维,地区维等。现阶段没有统一的多维数据模型。其中,经典的OLAP数据仓库模型有三种,即:星形模式,雪花模式,和星座模式。星形模式是多维数据模型的基本结构,其组成包括:中心事实表和维表。其中,中心事实表是星形模式中的核心表,存储事实的度量值及各个维表的关键码;维表用于保持维的信息,即每个维成员,包括维的属性信息等。中心事实表通过所存储的每个维表的关键码值和各维表进行连接。雪花模式是星形模式的变种,在星形模式的基础上对某些维表进行规范分解。星座模式可以看成是星形模式的汇聚,能满足多个实施表共享某些维表,进而实现多主体建模。如图2所示,对于经典的产品销售数据来说,星形模式能够很好的解决其数据组织。对于销售数据,可以从四个维度考虑,分别是:时间维(Time),商品维(Item),商店维(Branch)和位置维(Location)。该模式包含一个中心事实表(Sales),该中心事实表包含四个维的关键码(如图2中所示,Time_key,Branch_key,Item_key,Location_key)和两个度量(如图2中所示Dollars_sold,Unit_sold)。星形模式与雪花模式只适合对单个主题建模,无法对多主题进行建模。星座模式能满足多个事实表共享某些维表进而实现多主题建模,但信息网络中的主题数据演化成复杂的图网络,需要同时保存信息维、拓扑维的信息,星座模式也不适用于在线图处理的建模。在传统OLAP中,科研工作者关注数值型的度量,比如商场中商品的销售数量,销售额等数值型数据。多维数据模型是面向传统OLAP提出的,并不适用于信息网络中以图为结构的数据组织。现在科研工作者更加关注商品与商品之间的共同销售关系,这就涉及对象与对象之间连接关系的建模问题。目前越来越多的数据以网络图的形式出现,如社交网络,合作者网络,蛋白质网络等,在这些网络中科研工作者更加关注实体间的连接关系。传统的多维数据模型不能合理的对网络图数据关系进行存储及表示,不能合理的关注实体间的连接关系。
技术实现思路
本专利技术实施例提供了一种存储数据的方法和装置,克服了传统的多维数据模型不能合理的对网络图数据关系进行存储及表示的问题。本专利技术实施例第一方面提供了一种存储数据的方法,所述方法包括:获取原始数据集;从原始数据集中提取表示信息网络图结构的信息;其中,所述表示信息网络图结构的信息至少包括:节点信息,节点属性信息,边信息,和边属性信息;所述节点信息至少包括:节点标识和节点属性关键码;所述节点属性关键码与所述节点属性信息具有对应关系;所述边信息至少包括:边标识和边属性关键码;所述边属性关键码与所述边属性信息具有对应关系;所述边用于描述节点与节点之间的联系;存储所述提取的节点信息,节点属性信息,边信息,和边属性信息。本专利技术实施例第一方面的第一种可能的实现方式中,所述节点信息还包括:节点度量值;所述边信息还包括:边度量值。结合本专利技术实施例第一方面,和本专利技术实施例第一方面的第二种可能的实现方式中,所述提取的节点信息存储在节点事实表中;所述提取的边信息存储在边事实表中;所述提取的节点属性信息存储在拓扑维表中;所提取的边属性信息存储在信息维表中;由于所述边用于描述节点与节点之间的联系,则所述节点事实表中的信息与所述边事实表中的信息具有对应关系;所述节点属性关键码与所述节点属性信息具有对应关系;则所述拓扑维表中的信息与所述节点事实表中的信息具有对应关系;由于所述边属性关键码与所述边属性信息,则所述信息维表中的信息与所述边事实表中的信息具有对应关系。本专利技术实施例第一方面的第三种可能的实现方式中,所述存储所述提取的节点信息,节点属性信息,边信息,和边属性信息之后,所述方法还包括:对需要查询的数据,在所述存储的所述节点信息,节点属性信息,边信息,和边属性信息中进行定位;从定位后的所述节点信息,节点属性信息,边信息,或者边属性信息中其中之一中进行查询。本专利技术实施例第一方面的第四种可能的实现方式中,所述存储所述提取的节点信息,节点属性信息,边信息,和边属性信息之后,所述方法还包括:根据所述提取的节点信息,节点属性信息,边信息,和边属性信息,进行在线图处理操作。结合本专利技术实施例第一方面的第四种可能的实现方式中,本专利技术实施例第一方面的第五种可能的实现方式中,所述在线图处理操作至少包括:信息维上卷(I-OLGP),拓扑维上卷(T-OLGP),异步上卷,下钻,切片,切块,数据透视其中之一。结合本专利技术实施例第一方面的第五种可能的实现方式中,本专利技术实施例第一方面的第六种可能的实现方式中,若所述提取的边属性信息存储在信息维表中,则所述信息维上卷具体包括:对信息维表中存储的边的一种属性的信息,或者一种以上属性的信息进行上卷操作。结合本专利技术实施例第一方面的第五种可能的实现方式中,本专利技术实施例第一方面的第七种可能的实现方式中,若所述提取的节点属性信息存储在拓扑维表中,则所述拓扑维聚集操具体包括:对拓扑维表中存储的节点的一种属性的信息,或者一种以上属性的信息进行上卷操作。本专利技术实施例第二方面提供的一种存储数据的装置,所述装置包括:获取单元,提取单元,和存储单元;所述获取单元,用于获取原始数据集;所述提取单元,用于从原始数据集中提取表示信息网络图结构的信息;其中,所述表示信息网络图结构的信息至少包括:节点信息,本文档来自技高网
...

【技术保护点】
一种存储数据的方法,其特征在于,所述方法包括:获取原始数据集;从原始数据集中提取表示信息网络图结构的信息;其中,所述表示信息网络图结构的信息至少包括:节点信息,节点属性信息,边信息,和边属性信息;所述节点信息至少包括:节点标识和节点属性关键码;所述节点属性关键码与所述节点属性信息具有对应关系;所述边信息至少包括:边标识和边属性关键码;所述边属性关键码与所述边属性信息具有对应关系;所述边用于描述节点与节点之间的联系;存储所述提取的节点信息,节点属性信息,边信息,和边属性信息。

【技术特征摘要】
1.一种存储数据的方法,其特征在于,所述方法包括:
获取原始数据集;
从原始数据集中提取表示信息网络图结构的信息;其中,所述表示信息
网络图结构的信息至少包括:节点信息,节点属性信息,边信息,和边属性
信息;
所述节点信息至少包括:节点标识和节点属性关键码;
所述节点属性关键码与所述节点属性信息具有对应关系;
所述边信息至少包括:边标识和边属性关键码;
所述边属性关键码与所述边属性信息具有对应关系;
所述边用于描述节点与节点之间的联系;
存储所述提取的节点信息,节点属性信息,边信息,和边属性信息。
2.根据权利要求1所述方法,其特征在于,
所述节点信息还包括:节点度量值;
所述边信息还包括:边度量值。
3.根据权利要求1或者2所述方法,其特征在于,
所述提取的节点信息存储在节点事实表中;
所述提取的边信息存储在边事实表中;
所述提取的节点属性信息存储在拓扑维表中;
所提取的边属性信息存储在信息维表中;
由于所述边用于描述节点与节点之间的联系,则所述节点事实表中的信
息与所述边事实表中的信息具有对应关系;
所述节点属性关键码与所述节点属性信息具有对应关系;则所述拓扑维
表中的信息与所述节点事实表中的信息具有对应关系;
由于所述边属性关键码与所述边属性信息,则所述信息维表中的信息与
所述边事实表中的信息具有对应关系。
4.根据权利要求1所述方法,其特征在于,所述存储所述提取的节点信
息,节点属性信息,边信息,和边属性信息之后,所述方法还包括:
对需要查询的数据,在所述存储的所述节点信息,节点属性信息,边信
息,和边属性信息中进行定位;
从定位后的所述节点信息,节点属性信息,边信息,或者边属性信息中
其中之一中进行查询。
5.根据权利要求1所述方法,其特征在于,所述存储所述提取的节点信
息,节点属性信息,边信息,和边属性信息之后,所述方法还包括:
根据所述提取的节点信息,节点属性信息,边信息,和边属性信息,进
行在线图处理操作。
6.根据权利要求5所述方法,其特征在于,所述在线图处理操作至少包
括:
信息维上卷(I-OLGP),拓扑维上卷(T-OLGP),异步上卷,下钻,切片,
切块,数据透视其中之一。
7.根据权利要求6所述方法,其特征在于,若所述提取的边属性信息存
储在信息维表中,则所述信息维上卷具体包括:
对信息维表中存储的边的一种属性的信息,或者一种以上属性的信息进
行上卷操作。
8.根据权利要求6所述方法,其特征在于,若所述提取的节点属性信息
存储在拓扑维表中,则所述拓扑维聚集操具体包括:
对拓扑维表中存储的节点的一种属性的信息,或者一种以上属性的信息
进行上卷操作。
9.一种存储数据的装置,其特征在于,所述装置包括:获取单元,提取...

【专利技术属性】
技术研发人员:刘志容李川
申请(专利权)人:华为技术有限公司四川大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1