一种家庭知识图谱的生成和数据处理方法技术

技术编号:30274908 阅读:25 留言:0更新日期:2021-10-09 21:34
本申请公开了一种家庭知识图谱的生成和数据处理方法。由于本申请通过向量分别表示目标家庭样本集中的第一目标,以及该第一目标对应的关联关系,而该向量是在随机生成的向量的基础上,根据该目标家庭中的第一目标以及第一目标对应的关联关系,不断进行个性化的训练得到的,使得目标家庭中该第一目标以及该关联关系对应的向量是不可预计的,即使后续出现查询家庭知识图谱的电子设备输出查询到的数据被窃取,窃取者由于无法解读出窃取到的数据中的向量的含义,也无法确定窃取到的属性信息所归属的第一目标,提高了家庭知识图谱中存储的数据的隐私安全。据的隐私安全。据的隐私安全。

【技术实现步骤摘要】
一种家庭知识图谱的生成和数据处理方法


[0001]本申请涉及智能家居设备
,尤其涉及一种家庭知识图谱的生成和数据处理方法、装置、设备及介质。

技术介绍

[0002]现有技术中,家庭知识图谱作为图数据库,其存储了家庭中用户的大量个人信息,可以基于该家庭知识图谱中存储的数据,进行相应的处理,从而实现为用户提供服务。其中,家庭知识图谱因为所存储的数据都是家庭场景中的用户的个人信息,这些信息具有高度隐私的特性。而用户通过客户端发起服务请求时,通常需要从家庭知识图谱中获取足够的用户信息,才能实现向用户提供服务,因此,如何保证家庭知识图谱的隐私安全是人们日益关注的问题。
[0003]在实际应用过程中,如果在查询家庭知识图谱的电子设备上,根据其存储的数据,直接进行查询等处理,便可向用户提供服务的话,那么只要保证该查询家庭知识图谱的电子设备的安全,即可保证其存储的数据的安全。
[0004]由于上述的方法中,查询家庭知识图谱的电子设备只能提供查询、推理、关联等功能,不能进行如推荐、预测、分类等复杂处理,该电子设备只能向用户提供一些简单的服务。对于一些需要大量的复杂处理,如推荐、分析、预测等处理,才能向用户提供的服务来说,查询家庭知识图谱的电子设备获取到服务器发送的数据查询请求中包含的目标的标识信息以及目标关联关系,进行相应的处理,将该目标、与该目标存在目标关联关系的其他目标分别对应的目标属性信息发送至服务器,其中,目标为人、物体、房间等。然后,服务器获取到电子设备发送的数据后,进行相应的处理,从而向用户的客户端反馈封装后的处理结果(Response)。最后,客户端接收服务器发送的携带的处理结果,根据处理结果为用户提供服务。
[0005]由于上述方法中,在将该目标、与该目标存在目标关联关系的其他目标及其分别对应的目标属性信息发送至服务器的过程中,如果服务器不为用户家庭边缘处理设备,或为第三方监管设备,则仅保证该查询家庭知识图谱的电子设备的安全,已无法保证家庭知识图谱中存储的数据的隐私安全,可能出现该目标、与该目标存在目标关联关系的其他目标及其对应的属性信息均被非法窃取,并且该被窃取的数据均是明文显示的,窃取者很容易解读出目标家庭的信息,从而对该目标家庭的信息进行如信息泄露、信息倒卖、非授权存储、非授权转发等非法操作,导致无法保证家庭知识图谱中存储的数据的隐私安全。

技术实现思路

[0006]本申请提供了一种家庭知识图谱的生成和数据处理方法、装置、设备及介质,用以解决现有家庭知识图谱中的信息被窃取后,无法保证家庭知识图谱中存储的数据的隐私安全的问题。
[0007]第一方面,本申请提供了一种家庭知识图谱的生成方法,所述方法包括:
[0008]训练目标家庭样本集中的第一目标对应的第一标识信息的第一中间态向量,以及所述第一目标对应的关联关系的第二标识信息的第二中间态向量,直至根据存在所述关联关系的两个第一中间态向量之间的距离与所述关联关系对应的第二中间态向量和预设标准向量的距离的第一差值,及当前训练确定的所述关联关系对应的距离阈值,确定的损失值满足预设的收敛条件,将所述第一中间态向量确定为第一向量,并将所述第二中间态向量确定为第二向量;
[0009]保存所述关联关系及第二标识信息的对应关系,以及所述第一标识信息、所述第一向量、所述第二标识信息及所述第二向量的对应关系,并保存所述第一向量及所述目标家庭样本集中所述第一目标的属性信息的对应关系。
[0010]第二方面,本申请还提供了一种数据处理方法,所述方法包括:
[0011]根据获取到的数据查询请求中携带的第二目标对应的第三标识信息、目标关联关系,以及保存的目标家庭的家庭知识图谱,确定所述第三标识信息对应的第三向量,以及所述目标关联关系对应的第四向量;
[0012]获取保存的向量中,与所述第三向量的距离等于所述第四向量与预设标准向量的距离的第五向量;
[0013]发送所述第三向量、所述第五向量及其分别对应的目标属性信息。
[0014]第三方面,本申请还提供了一种数据处理方法,所述方法包括:
[0015]基于获取到的服务请求,生成携带有第二目标对应的第三标识信息、目标关联关系的数据查询请求并发送;
[0016]获取第三向量、第五向量及其分别对应的目标属性信息;
[0017]根据预先保存的向量与标识信息的对应关系,确定所述第三向量和所述第五向量分别对应的目标标识信息;
[0018]根据所述目标标识信息及其分别对应的目标属性信息,进行相应的处理,生成处理结果并发送。
[0019]第四方面,本申请还提供了一种家庭知识图谱的生成装置,所述装置包括:
[0020]训练单元,用于训练目标家庭样本集中的第一目标对应的第一标识信息的第一中间态向量,以及所述第一目标对应的关联关系的第二标识信息的第二中间态向量,直至根据存在所述关联关系的两个第一中间态向量之间的距离与所述关联关系对应的第二中间态向量和预设标准向量的距离的第一差值,及当前训练确定的所述关联关系对应的距离阈值,确定的损失值满足预设的收敛条件,将所述第一中间态向量确定为第一向量,并将所述第二中间态向量确定为第二向量;
[0021]存储单元,用于保存所述关联关系及第二标识信息的对应关系,以及所述第一标识信息、所述第一向量、所述第二标识信息及所述第二向量的对应关系,并保存所述第一向量及所述目标家庭样本集中所述第一目标的属性信息的对应关系。
[0022]第五方面,本申请还提供了一种数据处理装置,所述装置包括:
[0023]确定模块,用于根据获取到的数据查询请求中携带的第二目标对应的第三标识信息、目标关联关系,以及保存的目标家庭的家庭知识图谱,确定所述第三标识信息对应的第三向量,以及所述目标关联关系对应的第四向量;
[0024]获取模块,用于获取保存的向量中,与所述第三向量的距离等于所述第四向量与
预设标准向量的距离的第五向量;
[0025]发送模块,用于发送所述第三向量、所述第五向量及其分别对应的目标属性信息。
[0026]第六方面,本申请还提供了一种数据处理装置,所述装置包括:
[0027]发送单元,用于基于获取到的服务请求,生成携带有第二目标对应的第三标识信息、目标关联关系的数据查询请求并发送;
[0028]获取单元,用于获取第三向量、第五向量及其分别对应的目标属性信息;
[0029]确定单元,用于根据预先保存的向量与标识信息的对应关系,确定所述第三向量和所述第五向量分别对应的目标标识信息;
[0030]处理单元,用于根据所述目标标识信息及其分别对应的目标属性信息,进行相应的处理,生成处理结果;
[0031]所述发送单元,还用于发送所述处理结果。
[0032]第七方面,本申请还提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述所述家庭知识图谱的生成方法的步骤,或者实现如上述应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种家庭知识图谱的生成方法,其特征在于,所述方法包括:训练目标家庭样本集中的第一目标对应的第一标识信息的第一中间态向量,以及所述第一目标对应的关联关系的第二标识信息的第二中间态向量,直至根据存在所述关联关系的两个第一中间态向量之间的距离与所述关联关系对应的第二中间态向量和预设标准向量的距离的第一差值,及当前训练确定的所述关联关系对应的距离阈值,确定的损失值满足预设的收敛条件,将所述第一中间态向量确定为第一向量,并将所述第二中间态向量确定为第二向量;保存所述关联关系及第二标识信息的对应关系,以及所述第一标识信息、所述第一向量、所述第二标识信息及所述第二向量的对应关系,并保存所述第一向量及所述目标家庭样本集中所述第一目标的属性信息的对应关系。2.根据权利要求1所述的方法,其特征在于,所述保存所述第一向量及所述目标家庭样本集中所述第一目标的属性信息的对应关系之前,所述方法还包括:若所述第一目标的属性信息包括的任一子属性信息对应的属性类型与任一预设的隐私属性类型匹配,则获取预设的匹配的隐私属性类型对应的取值区间,确定该子属性信息所在的目标取值区间对应的目标区间标识信息,并根据所述目标区间标识信息对该子属性信息进行更新。3.根据权利要求1或2所述的方法,其特征在于,所述保存所述第一向量及所述目标家庭样本集中所述第一目标的属性信息的对应关系,包括:获取所述第一向量对应的索引值;根据预设的加密算法,确定所述索引值对应的加密信息;保存所述加密信息及所述目标家庭样本集中所述第一目标的属性信息的对应关系。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:随机生成干扰加密信息及其对应的属性信息并对应保存。5.根据权利要求1所述的方法,其特征在于,确定的损失值是否满足预设的收敛条件,包括:若所述损失值小于预设的损失阈值,则确定所述损失值满足预设的收敛条件;和/或若所述损失值为最小损失值,则确定所述损失值满足预设的收敛条件。6.根据权利要求1所述的方法,其特征在于,所述根据存在所述关联关系的两个第一中间态向量之间的距离与所述关联关系对应的第二中间态向量和预设标准向量的距离的第一差值,及当前训练确定的所述关联关系对应的距离阈值,确定损失值包括:确定当前训练确定的所述关联关系对应的距离阈值,与所述第一差值的第二差值;根据所述第二差值,确定损失值。7.一种数据处理方法,其特征在于,所述方法包括...

【专利技术属性】
技术研发人员:张淯易陈维强高雪松
申请(专利权)人:青岛海信电子产业控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1