基于图的关联关系获取方法、装置及计算机设备制造方法及图纸

技术编号:23852339 阅读:18 留言:0更新日期:2020-04-18 09:17
本发明专利技术实施例提供了一种基于图的关联关系获取方法、装置、计算机设备及存储介质。该方法包括接收客户端发送的查询信息;获取与查询信息中各查询词条分别对应的关联对象;获取各关联对象之间的关联对象相似度组成关联对象相似度集合;获取关联对象相似度集合中超出预设的相似度阈值的关联对象相似度组成目标关联对象相似度集合;获取其中目标关联对象相似度对应的关联对象组成目标关联对象集合;将所述目标关联对象集合中各目标关联对象作为目标顶点并获取各目标顶点之间的关联对象相似度作为连接边的系数,得到与所述目标关联对象集合对应的无向图信息并发送客户端。该方法实现大数据存储的关联查询,有利于利用大数据存储系统进行关联分析。

Graph based method, device and computer equipment for obtaining association relationship

【技术实现步骤摘要】
基于图的关联关系获取方法、装置及计算机设备
本专利技术涉及关联关系
,尤其涉及一种基于图的关联关系获取方法、装置及计算机设备。
技术介绍
数据分析中常见的场景之一是对关联关系进行分析,传统的数据库例如Mysql可以进行关联查询,但是对于大数据来说,Mysql进行关联查询很容易导致服务器宕机或者运行时间非常慢,此外大数据存储系统出了Hive、Sparksql外,其余的数据存储系统对Join的支持并不是很好。
技术实现思路
本专利技术实施例提供了一种基于图的关联关系获取方法、装置、计算机设备及存储介质,旨在解决现有技术中大数据存储的关联查询运行慢及容易导致服务器宕机的问题。第一方面,本专利技术实施例提供了一种基于图的关联关系获取方法,其包括:接收客户端发送的查询信息;其中,所述查询信息中包括多个查询词条;获取与各查询词条分别对应的关联对象;获取各关联对象之间的关联对象相似度,以组成关联对象相似度集合;获取所述关联对象相似度集合中超出预设的相似度阈值的关联对象相似度,以组成目标关联对象相似度集合;获取所述目标关联对象相似度集合中每一目标关联对象相似度对应的目标关联对象,以组成目标关联对象集合;将所述目标关联对象集合中各目标关联对象作为目标顶点,并获取各目标顶点之间的关联对象相似度作为连接边的系数,得到与所述目标关联对象集合对应的无向图信息;将所述无向图信息发送所述客户端。第二方面,本专利技术实施例提供了一种基于图的关联关系获取装置,其包括:接收单元,用于接收客户端发送的查询信息;关联对象获取单元,用于获取与各查询词条分别对应的关联对象;关联对象相似度集合获取单元,用于获取各关联对象之间的关联对象相似度,以组成关联对象相似度集合;目标关联对象相似度集合获取单元,用于获取所述关联对象相似度集合中超出预设的相似度阈值的关联对象相似度,以组成目标关联对象相似度集合;目标关联对象集合获取单元,用于获取所述目标关联对象相似度集合中每一目标关联对象相似度对应的目标关联对象,以组成目标关联对象集合;无向图构建单元,用于将所述目标关联对象集合中各目标关联对象作为目标顶点,并获取各目标顶点之间的关联对象相似度作为连接边的系数,得到与所述目标关联对象集合对应的无向图信息;发送单元,用于将所述无向图信息发送所述客户端。第三方面,本专利技术实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于图的关联关系获取方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于图的关联关系获取方法。本专利技术实施例提供了一种基于图的关联关系获取方法、装置、计算机设备及存储介质。该方法包括接收客户端发送的查询信息;其中,所述查询信息中包括多个查询词条;获取与各查询词条分别对应的关联对象;获取各关联对象之间的关联对象相似度,以组成关联对象相似度集合;获取所述关联对象相似度集合中超出预设的相似度阈值的关联对象相似度,以组成目标关联对象相似度集合;获取所述目标关联对象相似度集合中每一目标关联对象相似度对应的目标关联对象,以组成目标关联对象集合;将所述目标关联对象集合中各目标关联对象作为目标顶点,并获取各目标顶点之间的关联对象相似度作为连接边的系数,得到与所述目标关联对象集合对应的无向图信息;将所述无向图信息发送所述客户端。该方法通过以关联对象作顶点以及关联对象相似度作边构建无向图,实现大数据存储的关联查询,有利于利用大数据存储系统进行关联分析。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的基于图的关联关系获取方法的应用场景示意图;图2为本专利技术实施例提供的基于图的关联关系获取方法的流程示意图;图3为本专利技术实施例提供的基于图的关联关系获取方法的子流程示意图;图4为本专利技术实施例提供的基于图的关联关系获取方法的另一子流程示意图;图5为本专利技术实施例提供的基于图的关联关系获取装置的示意性框图;图6为本专利技术实施例提供的基于图的关联关系获取装置的子单元示意性框图;图7为本专利技术实施例提供的基于图的关联关系获取装置的另一子单元示意性框图;图8为本专利技术实施例提供的计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。请参阅图1和图2,图1为本专利技术实施例提供的基于图的关联关系获取方法的应用场景示意图;图2为本专利技术实施例提供的基于图的关联关系获取方法的流程示意图,该基于图的关联关系获取方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。如图2所示,该方法包括步骤S110~S170。S110、接收客户端发送的查询信息;其中,所述查询信息中包括多个查询词条。在本实施例中,当用户在客户终端(如智能手机、平板电脑等)打开网站的用户交互界面,其中,所述用户的交互界面由服务器提供,所述客户端根据需要查询的内容录入查询信息,服务器会接收所述客户端发送的查询信息;其中,所述查询信息可以包括所述客户端所录入的多个查询词条。所述查询词条可以是与关联对象名称相关的名称、特征词语或者字段组合等。S120、获取与各查询词条分别对应的关联对象。在本实施例中,当接收所述客户端发送的查询信息之后,读取所述查询信息中所包括的多个查询词条,从而获取与各查询词条分别对应的关联对象。其中,可以选择代表所述关联对象特征的字段例如公司的名称、编号,或者几个特征的组合例如以法人、主要产品、股本文档来自技高网...

【技术保护点】
1.一种基于图的关联关系获取方法,其特征在于,包括:/n接收客户端发送的查询信息;其中,所述查询信息中包括多个查询词条;/n获取与各查询词条分别对应的关联对象;/n获取各关联对象之间的关联对象相似度,以组成关联对象相似度集合;/n获取所述关联对象相似度集合中超出预设的相似度阈值的关联对象相似度,以组成目标关联对象相似度集合;/n获取所述目标关联对象相似度集合中每一目标关联对象相似度对应的目标关联对象,以组成目标关联对象集合;/n将所述目标关联对象集合中各目标关联对象作为目标顶点,并获取各目标顶点之间的关联对象相似度作为连接边的系数,得到与所述目标关联对象集合对应的无向图信息;/n将所述无向图信息发送所述客户端。/n

【技术特征摘要】
1.一种基于图的关联关系获取方法,其特征在于,包括:
接收客户端发送的查询信息;其中,所述查询信息中包括多个查询词条;
获取与各查询词条分别对应的关联对象;
获取各关联对象之间的关联对象相似度,以组成关联对象相似度集合;
获取所述关联对象相似度集合中超出预设的相似度阈值的关联对象相似度,以组成目标关联对象相似度集合;
获取所述目标关联对象相似度集合中每一目标关联对象相似度对应的目标关联对象,以组成目标关联对象集合;
将所述目标关联对象集合中各目标关联对象作为目标顶点,并获取各目标顶点之间的关联对象相似度作为连接边的系数,得到与所述目标关联对象集合对应的无向图信息;
将所述无向图信息发送所述客户端。


2.根据权利要求1所述的基于图的关联关系获取方法,其特征在于,所述获取与各查询词条分别对应的关联对象,包括:
读取存储数据集合中与各查询词条分别对应的多个字符串词条;
获取与各字符串词条分别对应的多个关联对象。


3.根据权利要求1所述的基于图的关联关系获取方法,其特征在于,所述获取各关联对象之间的关联对象相似度,以组成关联对象相似度集合,包括:
将各关联对象通过基于概率统计分词模型进行分词,得到与各关联对象分别对应的分词结果;
通过用于将单词转化为向量的Word2Vec模型获取各分词结果中各分词对应的词向量;
根据各关联对象对应的词向量,获取各关联对象对应的语义向量;
将各关联对象分别对应的语义向量进行余弦相似度的运算,得到各关联对象之间的相似度,组成所述关联对象相似度集合。


4.根据权利要求3所述的基于图的关联关系获取方法,其特征在于,所述根据各关联对象对应的词向量,获取各关联对象对应的语义向量之后,还包括:
将各关联对象分别对应的语义向量进行欧氏距离的运算,得到各关联对象之间的相似度,组成所述关联对象相似度集合。


5.根据权利要求1所述的基于图的关联关系获取方法,其特征在于,所述获取所述关联对象相似度集合中超出预设的相似度阈值的关联对象相似度,以组成目标关联对象相似度集合,包括:
获取所述关联对象相似度集合中的各关联对象相似度;
判断各关联对象相似度是否超出预设的相似度阈值;
将超出预设的相似度阈值的关联对象相似度组成所述目标关联对象相似度集合;
将未超出预设的相似度阈值的关联对象相似度剔除。


6.一种基于图的关联关系获...

【专利技术属性】
技术研发人员:何海龙李如先申志彬
申请(专利权)人:深圳前海环融联易信息科技服务有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1