【技术实现步骤摘要】
数据关联关系的确定方法、装置、电子设备和介质
[0001]本公开涉及数据处理
,尤其涉及一种数据关联关系的确定方法、装置、电子设备和介质。
技术介绍
[0002]结构化数据也被称为行数据,即能够存储在数据库里,且可以用二维表结构来逻辑表达实现的数据。结构化数据中存储着多个行数据,且每个行数据之间具有一定的相似性,从而,能够表征出该结构化数据的内部相似度。
[0003]结构化数据的内部相似度能够直观反映出该结构化数据的数据安全性,且能够根据内部相似度对每组结构化数据进行有效的数据管理。因此,结构化数据中数据间的关联关系的确定是非常重要的。
[0004]现有技术中,主要是通过追溯结构化数据中每一内部数据的来源,来确定出该内部数据之间是否具有关联关系,但是,对于某些数据来源不准确的内部数据,使用该方法难以准确确定出该内部数据之间的关联关系。
技术实现思路
[0005]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种数据关联关系的确定方法、装置、电子设备和介质。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种数据关联关系的确定方法,其特征在于,所述方法包括:获取第一结构化数据和第二结构化数据,所述第一结构化数据和所述第二结构化数据同属于一个目标数据中;基于文本相似度算法,计算所述第一结构化数据和所述第二结构化数据之间的相似度;根据所述第一结构化数据和所述第二结构化数据之间的相似度,确定所述第一结构化数据和所述第二结构化数据的关联关系。2.根据权利要求1所述的方法,其特征在于,所述获取第一结构化数据和第二结构化数据,包括:从目标数据包含的所有结构化数据中选取任一结构化数据作为第一结构化数据,从目标数据中剩余的结构化数据中选取任一结构化数据作为第二结构化数据,所述剩余的结构化数据中不包括所述第一结构化数据;或者,从目标数据包含的所有结构化数据中选取任一结构化数据作为第二结构化数据,从目标数据中剩余的结构化数据中选取任一结构化数据作为第一结构化数据,所述剩余的结构化数据中不包括所述第二结构化数据。3.根据权利要求1所述的方法,其特征在于,所述基于文本相似度算法,计算所述第一结构化数据和所述第二结构化数据之间的相似度,包括:将所述第一结构化数据和所述第二结构化数据进行交操作,得到所述第一结构化数据和所述第二结构化数据的交数据;将所述第一结构化数据和所述第二结构化数据进行并操作,得到所述第一结构化数据和所述第二结构化数据的并数据;根据所述交数据和所述并数据,确定所述第一结构化数据和所述第二结构化数据之间的相似度。4.根据权利要求3所述的方法,其特征在于,所述根据所述交数据和所述并数据,确定所述第一结构化数据和所述第二结构化数据之间的相似度,包括:计算所述交数据与预设数值的乘积,得到第一数值;计算所述并数据与所述交数据之和,得到第二数值;将所述第一数值和所述第二数值的比值作为所述第一结构化数据和所述第二结构化数据之间的相似度。5.根据权利要求1所述的方法,其特征在于,所述根据所述第一结构化数据和所述第二结构化数据之间的相似度,确定所述第一结构化数据和所述第二结构化数据...
【专利技术属性】
技术研发人员:毕凯峰,王健,张佳发,黄潜,胡健,王劲午,母天石,李慧娟,邓子杰,周磊,
申请(专利权)人:南方电网数字电网研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。