【技术实现步骤摘要】
数据实体关系识别方法、设备及存储介质
[0001]本申请涉及数据处理
,特别是一种数据实体关系识别方法、设备及存储介质。
技术介绍
[0002]在数字化时代,随着新数据的不断出现,海量数据所形成的大数据的存储和分析是各企业的宝贵财富。数据的累积依赖于数据挖掘,现行的数据研发或数据挖掘人员在数据挖掘或数据开发过程中,对获取的源数据的管理依赖于现有代码或源数据的属主,需要与之沟通,沟通成本较高。
技术实现思路
[0003]本申请提供一种数据实体关系识别方法、设备及存储介质,可以实现对数据实体之间的关系进行自动化梳理,以及基于所有数据实体之间的关系形成关系图谱。
[0004]为了解决上述技术问题,本申请采用的一个技术方案是:提供一种数据实体关系识别方法,该方法包括:获取包含数据实体的查询语句文本;识别查询语句文本中的联表查询关键字,确定出与联表查询关键字对应的至少两个实体表;在联表查询关键字对应的查询语句中确定出至少两个实体表之间的数据实体的初始关系;筛选初始关系,得到至少两个实体表之间的数据实体的最 ...
【技术保护点】
【技术特征摘要】
1.一种数据实体关系识别方法,其特征在于,所述方法包括:获取包含数据实体的查询语句文本;识别所述查询语句文本中的联表查询关键字,确定出与所述联表查询关键字对应的至少两个实体表;在所述联表查询关键字对应的查询语句中确定出所述至少两个实体表之间的数据实体的初始关系;筛选所述初始关系,得到所述至少两个实体表之间的数据实体的最终关系,并显示所述最终关系。2.根据权利要求1所述的方法,其特征在于,所述识别所述查询语句文本中的联表查询关键字,确定出与所述联表查询关键字对应的至少两个实体表,包括:识别所述查询语句文本中的联表查询关键字;确定所述联表查询关键字对应的查询语句;在所述查询语句中确定出与所述联表查询关键字对应的至少两个实体表。3.根据权利要求2所述的方法,其特征在于,所述在所述查询语句中确定出与所述联表查询关键字对应的至少两个实体表,包括:在所述查询语句中,将所述联表查询关键字之前的连续字符作为第一实体表,以及将所述联表查询关键字之后的连续字符作为第二实体表。4.根据权利要求1所述的方法,其特征在于,所述在所述联表查询关键字对应的查询语句中确定出所述至少两个实体表之间的数据实体的初始关系,包括:识别出所述查询语句中的连接关系标识;为所述连接关系标识对应的所述至少两个实体表之间的数据实体建立初始关系。5.根据权利要求1所述的方法,其特征在于,所述筛选所述初始关系,包括:对具有所述初始关...
【专利技术属性】
技术研发人员:陈文捷,
申请(专利权)人:平安银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。