【技术实现步骤摘要】
基于Elasticsearch的数据处理方法、系统、计算机及可读存储介质
本申请涉及互联网
,特别是涉及基于Elasticsearch的数据处理方法、系统、计算机设备和计算机可读存储介质。
技术介绍
Elasticsearch索引存储图数据是指,利用Elasticsearch分别建立实体索引和关系索引,将图数据中的实体信息和关系信息分别存储在对应的索引中。虽然当前有很多图数据库可以用来存储图数据,但对于检索和图谱并存,且图计算能力要求不高的场景,同时部署Elasticsearch和图数据库略显笨重,而且图数据库的检索效率往往不如Elasticsearch。
技术实现思路
本申请实施例提供了一种基于Elasticsearch的数据处理方法、系统、计算机设备和计算机可读存储介质,实现轻量部署高效检索图数据。第一方面,本申请实施例提供了一种基于Elasticsearch的数据处理方法,包括:数据获取步骤,用于获取待处理源数据并抽取所述待处理源数据中的实体数据、关系数据;所述 ...
【技术保护点】
1.一种基于Elasticsearch的数据处理方法,其特征在于,包括:/n数据获取步骤,用于获取待处理源数据并抽取所述待处理源数据中的实体数据、关系数据;/n索引存储步骤,用于基于Elasticsearch的乐观锁并发写入操作分别将所述实体数据、关系数据进行索引存储,得到至少一实体索引和关系索引,其中,每一所述实体索引对应多个实体文档,每一所述关系索引对应多个关系文档;/n实体检索步骤,用于基于获取待检索实体信息并基于所述待检索实体在所述实体索引中进行检索,得到与所述待检索实体信息匹配的实体或实体集合。/n
【技术特征摘要】
1.一种基于Elasticsearch的数据处理方法,其特征在于,包括:
数据获取步骤,用于获取待处理源数据并抽取所述待处理源数据中的实体数据、关系数据;
索引存储步骤,用于基于Elasticsearch的乐观锁并发写入操作分别将所述实体数据、关系数据进行索引存储,得到至少一实体索引和关系索引,其中,每一所述实体索引对应多个实体文档,每一所述关系索引对应多个关系文档;
实体检索步骤,用于基于获取待检索实体信息并基于所述待检索实体在所述实体索引中进行检索,得到与所述待检索实体信息匹配的实体或实体集合。
2.根据权利要求1所述的基于Elasticsearch的数据处理方法,其特征在于,进一步包括:图谱构建步骤,用于获取所述实体集合中实体ID,根据所述关系索引对所述实体ID进行关系拓展,以构建图谱。
3.根据权利要求1或2所述的基于Elasticsearch的数据处理方法,其特征在于,所述实体检索步骤进一步包括:
属性值检索步骤,用于获取待检索实体信息中实体属性值,并通过检索属性值获取匹配所述属性值的实体集合;
实体ID检索步骤,用于获取待检索实体信息中实体ID,并通过检索所述实体ID获取匹配所述实体ID的实体;
主键值检索步骤,用于获取待检索的实体信息中唯一标识,并通过检索所述唯一标识获取匹配所述唯一标识的实体。
4.根据权利要求2所述的基于Elasticsearch的数据处理方法,其特征在于,所述图谱构建步骤进一步包括:
关系扩展步骤,用于通过检索所述关系索引中的主体实体ID和/或客体实体ID获取匹配主体实体ID和/或客体实体ID的关系,并从获取的关系中获取关系的对端实体ID,以根据所述对端实体ID进行实体检索,扩展所述关系对端的实体信息;
循环步骤,用于循环执行所述关系扩展步骤,以扩展实体的全部关系及实体构成的图谱数据。
5.一种基于Elasticsearch的数据处理系统,其特征在于,包括:
数据获取模块,用于获取待处理源数据并抽取所述待处理源数据中的实体数据、关系数据;
索引存储模块,用于基于Elasti...
【专利技术属性】
技术研发人员:杜芳,
申请(专利权)人:北京明略软件系统有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。