一种关系网络构建方法和装置、计算机可读存储介质制造方法及图纸

技术编号:21115776 阅读:34 留言:0更新日期:2019-05-16 08:59
本申请公开了一种关系网络构建方法和装置、计算机可读存储介质,所述方法包括:获取构建关系网络所需的数据;将数据映射至以下至少之一的空间:绝对空间、行政区划空间、点位空间,绝对空间包含数据对应的经纬度位置信息,行政区划空间包含数据对应的行政区位置信息,点位空间包含数据对应的相对预设的参照物的位置信息;按照预设的关系抽取算子,抽取映射的空间数据中的关系。本申请通过将数据映射至以下至少之一的空间:绝对空间、行政区划空间、点位空间,有效实现了对多源数据的处理,比一般通过基本事件挖掘出的关系更丰富,能提供多种事件关系联合查询,提高了关系构建的效率,便于构建适合多源场景的大规模关系规则系统。

【技术实现步骤摘要】
一种关系网络构建方法和装置、计算机可读存储介质
本申请涉及但不限于数据挖掘
,尤其涉及一种关系网络构建方法和装置、计算机可读存储介质。
技术介绍
关系网络是指在网络挖掘、金融分析、公共安全以及相关的链接关系分析领域中,专家定义或识别抽取的一系列实体及其间的关系所构成的网络结构。这些新场景中的关系网络类似在线社交网络,但是其容纳和覆盖的实体更丰富多样。在关系网络中,实体是指具有扩展属性的个体。例如,出行中的个人,社交中的特定人。在关系网络中,对应的实体间的关系规则可以将现实世界中的人、物等实体之间的关系抽象为链接。透过多层次、多维度的数据集实现对于某一个人、某一件事或某一种社会状态的现实态势的聚集,并在时间序列上将离散的、各不相关的数据集合关联,找到一种或多种与人的活动、事件的发展以及社会的信息的有机联系。通过对这些连续性数据分析处理,进行数据的碰撞和互联,可以找出数据背后的潜在关联。通过实体关系网络,可以将其相关联的任一实体和事件做挖掘与碰撞比对。关系规则是指这些场景中所定义的实体间的相似、相近或相关关系的领域知识。例如,出行中的同住、同路线关系;金融中的账户交易关系;通讯工具中的联系与群组沟通等关系。这些规则知识用于建立实体之间的关系,在关系网络的构建中,关系规则大量用于甄别相近、形成网络等数据抽取任务中。关系规则常用于网络挖掘、群体分析、金融关联和公共安全等诸多涉及到关系分析的领域场景。关系规则大多需要专家通过经验和分析等来指定。但是,很多场景下涉及到上百种通用规则,并需要一些算法功能集的辅助支持,以发现数据间联系,实现打破数据孤岛状态。传统的关系规则识别和设计大多依赖人力,无法应对复杂场景。
技术实现思路
本专利技术实施例提供了一种关系网络构建方法和装置、计算机可读存储介质,能够有效实现对多源数据的处理。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供了一种关系网络构建方法,包括:获取构建关系网络所需的数据;将所述数据映射至以下至少之一的空间:绝对空间、行政区划空间、点位空间,所述绝对空间包含所述数据对应的经纬度位置信息,所述行政区划空间包含所述数据对应的行政区位置信息,所述点位空间包含所述数据对应的相对预设的参照物的位置信息;按照预设的关系抽取算子,抽取所述映射的空间数据中的关系。在一实施例中,在将所述数据映射至所述空间之前,所述方法还包括:根据预先制定的规则提取模板,将所述数据中的多个字段映射至对应的特征数据上;检测所述特征数据是否需要添加以下至少之一的位置信息:所述经纬度位置信息、所述行政区位置信息、所述相对预设的参照物的位置信息;如果需要添加所述位置信息,则为所述特征数据添加对应的所述位置信息。在一实施例中,所述特征数据包括以下至少之一:主体信息、时间信息、事件信息、位置信息,所述位置信息包括以下至少之一:经纬度位置信息、行政区位置信息、相对预设的参照物的位置信息。在一实施例中,将所述数据映射至所述至少之一的空间时,每个所述空间中的数据按照所述主体信息、所述时间信息、所述位置信息的格式进行存储。本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如以上任一项所述的关系网络构建方法的步骤。本专利技术实施例还提供了一种关系网络构建装置,包括处理器及存储器,其中:所述处理器用于执行存储器中存储的程序,以实现如以上任一项所述的关系网络构建方法的步骤。本专利技术实施例还提供了一种关系网络构建装置,包括数据获取模块、空间映射模块和关系抽取模块,其中:数据获取模块,用于获取构建关系网络所需的数据;空间映射模块,用于将所述数据映射至以下至少之一的空间:绝对空间、行政区划空间、点位空间,所述绝对空间包含所述数据对应的经纬度位置信息,所述行政区划空间包含所述数据对应的行政区位置信息,所述点位空间包含所述数据对应的相对预设的参照物的位置信息;关系抽取模块,用于按照预设的关系抽取算子,抽取所述映射的空间数据中的关系。在一实施例中,所述数据获取模块还用于:根据预先制定的规则提取模板,将所述数据中的多个字段映射至对应的特征数据上;检测所述特征数据是否需要添加以下至少之一的位置信息:所述经纬度位置信息、所述行政区位置信息、所述相对预设的参照物的位置信息;如果需要添加所述位置信息,则为所述特征数据添加对应的所述位置信息。在一实施例中,所述特征数据包括以下至少之一:主体信息、时间信息、事件信息、位置信息,所述位置信息包括以下至少之一:经纬度位置信息、行政区位置信息、相对预设的参照物的位置信息。在一实施例中,所述空间映射模块将所述数据映射至所述至少之一的空间时,按照所述主体信息、所述时间信息、所述位置信息的格式存储所述数据。本专利技术实施例的技术方案,具有如下有益效果:本专利技术实施例提供的关系网络构建方法和装置、计算机可读存储介质,通过将数据映射至以下至少之一的空间:绝对空间、行政区划空间、点位空间,有效实现了对多源数据的处理,提高了关系构建的效率,便于构建适合多源场景的大规模关系规则系统。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1为本专利技术实施例的一种关系网络构建方法的流程示意图;图2为本专利技术实施例的一种空间划分示意图;图3为本专利技术实施例的一种火车出行事件的空间映射示意图;图4为本专利技术实施例的一种时空数据的结构示意图;图5为本专利技术实施例的一种关系网络构建装置的结构示意图;图6为本专利技术实施例的一种针对多源数据的关系抽取流程示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在关系挖掘的世界里,实体是具有扩展挖掘属性的单一个体,通过每个实体可以将其相关联的任一实体和事件做挖掘与碰撞比对。关系规则常用于网络挖掘、群体分析、金融关联和公共安全等诸多涉及到关系分析的领域场景中。关系规则是指社交网络分析、实体关系分析等场景中的一些相似、相近、相关关系的识别领域知识。关系规则的产生大多依赖专家的历史经验和大量数据案例分析得到。关系规则可以刻画实体间的联系。在系统中主要体现物理世界中各种千丝万缕的联系,使得数据在逻辑层可以真实反映物理世界中的各种关联图谱,例如人与人之间的好友关系,同车、同住关系等。事件是在特定时空维度刻画实体间关系的一类对象,在系统中会被用来记录事物的发生,例如交通违章事件、通话事件、聊天事件等。针对大量数据的规则技术基础在于实体关联关系发现,虽然近期已经有一些响应的探索,但是在领域适配性上仍有不足。特征提取和关联证据(属性名,数据类型,阈值、统计值、信息检索与数据挖掘的加权(TermFrequency–InverseDocumentFrequency,TF-IDF)等),数据去重(数据绑定(DataBinning)算法O(n2)到O(n)),主动学习和持续训练(主要用于数据去重),聚类和记录整合、把描述同一实体的数据聚类到一起。在多源数据关系规则发现方面,相关学术研究多侧本文档来自技高网
...

【技术保护点】
1.一种关系网络构建方法,其特征在于,包括:获取构建关系网络所需的数据;将所述数据映射至以下至少之一的空间:绝对空间、行政区划空间、点位空间,所述绝对空间包含所述数据对应的经纬度位置信息,所述行政区划空间包含所述数据对应的行政区位置信息,所述点位空间包含所述数据对应的相对预设的参照物的位置信息;按照预设的关系抽取算子,抽取所述映射的空间数据中的关系。

【技术特征摘要】
1.一种关系网络构建方法,其特征在于,包括:获取构建关系网络所需的数据;将所述数据映射至以下至少之一的空间:绝对空间、行政区划空间、点位空间,所述绝对空间包含所述数据对应的经纬度位置信息,所述行政区划空间包含所述数据对应的行政区位置信息,所述点位空间包含所述数据对应的相对预设的参照物的位置信息;按照预设的关系抽取算子,抽取所述映射的空间数据中的关系。2.根据权利要求1所述的方法,其特征在于,在将所述数据映射至所述空间之前,所述方法还包括:根据预先制定的规则提取模板,将所述数据中的多个字段映射至对应的特征数据上;检测所述特征数据是否需要添加以下至少之一的位置信息:所述经纬度位置信息、所述行政区位置信息、所述相对预设的参照物的位置信息;如果需要添加所述位置信息,则为所述特征数据添加对应的所述位置信息。3.根据权利要求2所述的方法,其特征在于,所述特征数据包括以下至少之一:主体信息、时间信息、事件信息、位置信息,所述位置信息包括以下至少之一:经纬度位置信息、行政区位置信息、相对预设的参照物的位置信息。4.根据权利要求3所述的方法,其特征在于,将所述数据映射至所述至少之一的空间时,每个所述空间中的数据按照所述主体信息、所述时间信息、所述位置信息的格式进行存储。5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至4中任一项所述的关系网络构建方法的步骤。6.一种关系网络构建装...

【专利技术属性】
技术研发人员:杨杰李洪武任鑫琦姚俊杰梁秀钦
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1