一种关键词隐私信息检索方法及装置制造方法及图纸

技术编号:37419093 阅读:9 留言:0更新日期:2023-04-30 09:42
本发明专利技术公开了一种关键词隐私信息检索方法及装置,用于降低电子设备计算开销和通信开销,保护用户检索条件和检索结果。该方法为:接收用户输入的用于检索隐私信息的待查关键词和用于混淆待查关键词的混淆词的第一数量M,接收服务器发送的数据总量X;根据第一数量,对数据总量X进行分组,获得第二数量N;根据第二数量N和待查关键词,获得目标筛选信息;将第二数量N和目标筛选信息发送给服务器,接收服务器反馈的目标索引列表,目标索引列表中包括将第二数量N和目标筛选信息代入预设筛选条件得到的Y个密文索引;根据目标索引列表,从服务器中获得目标索引列表对应的包含隐私信息的子数据集,从子数据集中,获得待查关键词对应的隐私信息。隐私信息。隐私信息。

【技术实现步骤摘要】
一种关键词隐私信息检索方法及装置


[0001]本专利技术涉及计算机
,尤其涉及一种关键词隐私信息检索方法及装置。

技术介绍

[0002]目前,数据安全与隐私保护是大数据时代业务开展不可忽视的两个重点需求。在数据查询业务中,用户B有隐私保护需求,即查询过程中不希望安全企业A知道自己的查询条件和查询结果,而信息安全企业A也有数据安全需求,即不希望让用户B知道查询结果以外的其他数据,因此,如何满足信息安全企业A和用户B的需求,成为亟需解决的问题。
[0003]相关技术中,为满足信息安全企业A和用户B的需求,一般采用以下几种方案:
[0004]方案1:电子设备向服务器发送数据获取请求,然后服务器将加密后的数据库中的所有数据发送给电子设备,电子设备对所有数据执行解密操作,以确定其实际所要获取的隐私数据。
[0005]然而,采用方案1时,服务器存储的数据的数量越多,电子设备自身计算的量越大,即存在电子设备计算开销大的问题。
[0006]方案2:电子设备随机生成预设数量的假关键词,将该预设数量的假关键词与目标搜索关键词一起发送给服务器,该服务器对假关键词和目标关键词进行检索,并将检索后的信息加密后发送给电子设备,电子设备对获得的信息进行解密,获得目标搜索关键词的信息。
[0007]然而,采用方案2时,由于电子设备随机生成的假关键词,可能被服务器识别,从而暴露电子设备真实的查询需求,降低了用户的使用体验。
[0008]综上,相关技术中,当前关键词隐私信息检索方法存在电子设备计算开销大,以及假关键词容易被识别导致的目标关键词被泄露的技术问题。

技术实现思路

[0009]本专利技术实施例提供一种关键词隐私信息检索方法及装置,用于降低电子设备计算开销和通信开销,保护用户检索条件和检索结果。
[0010]第一方面,提供一种关键词隐私信息检索方法,所述方法包括:
[0011]接收用户输入的用于检索隐私信息的待查关键词和用于混淆所述待查关键词的混淆词的第一数量M,以及,接收服务器发送的数据总量X;
[0012]根据所述第一数量M,对所述数据总量X进行分组,获得第二数量N;并根据所述第二数量N和所述待查关键词,获得目标筛选信息;其中,所述目标筛选信息用于从所述服务器的数据库中筛选数据;所述第二数量N用于表征对所述数据总量X分组后所获得的分组个数;
[0013]将所述第二数量N和所述目标筛选信息发送给所述服务器,接收所述服务器反馈的目标索引列表,其中,所述目标索引列表中包括Y个密文索引;所述Y个密文索引是所述服务器的数据库中隐私信息所对应的密文索引,所述Y个密文索引是将第二数量N和目标筛选
信息代入预设筛选条件得到的;
[0014]根据所述目标索引列表,从所述服务器中获得所述目标索引列表对应的包含隐私信息的子数据集,并从所述子数据集中,获得所述待查关键词对应的隐私信息。
[0015]在一种可能的实施方式中,根据所述第二数量N和所述待查关键词,获得目标筛选信息,包括:
[0016]将所述第二数量N和所述待查关键词,代入以下公式:
[0017]result=H(keyword)%N
[0018]其中,result用于表征所述目标筛选信息,H(keyword)用于表征对所述待查关键词进行哈希运算且对哈希结果取整,keyword用于表征所述待查关键词,%用于表征取模运算。
[0019]在一种可能的实施方式中,在获得目标筛选信息之后,所述方法还包括:
[0020]生成随机数;
[0021]根据预设加密算法,结合所述随机数和所述服务器中对数据进行加密所用的公钥,对所述待查关键词进行加密,获得加密待查关键词,并将所述加密待查关键词发送给所述服务器,以使所述服务器对所述加密待查关键词进行二次加密,获得二次加密待查关键词。
[0022]在一种可能的实施方式中,根据所述目标索引列表,从所述服务器中获得所述目标索引列表对应的包含隐私信息的子数据集,并从所述子数据集中,获得所述待查关键词对应的隐私信息,包括:
[0023]根据所述随机数,对所述服务器反馈的二次加密待查关键词进行去盲处理,获得目标子索引;所述目标子索引与所述数据库中的密文索引的格式相同;
[0024]在所述目标索引列表中,查找与所述目标子索引匹配的索引,获得匹配索引,并将所述匹配索引在所述目标索引列表中的序号,作为目标索引;
[0025]从所述子数据集,查找与所述目标索引对应的子数据,作为所述待查关键词对应的隐私信息。
[0026]在一种可能的实施方式中,根据所述第一数量M,对所述数据总量X进行分组,获得第二数量N,包括:
[0027]将所述数据总量X和所述第一数量M,代入以下公式:
[0028]N=X//M
[0029]其中,//用于表征取整除运算。
[0030]第二方面,提供一种关键词隐私信息检索装置,所述装置包括:
[0031]接收单元,用于接收用户输入的用于检索隐私信息的待查关键词和用于混淆所述待查关键词的混淆词的第一数量M,以及,接收服务器发送的数据总量X;
[0032]第一处理单元,用于根据所述第一数量M,对所述数据总量X进行分组,获得第二数量N;并根据所述第二数量N和所述待查关键词,获得目标筛选信息;其中,所述目标筛选信息用于从所述服务器的数据库中筛选数据;所述第二数量N用于表征对所述数据总量X分组后所获得的分组个数;
[0033]第二处理单元,用于将所述第二数量N和所述目标筛选信息发送给所述服务器,接收所述服务器反馈的目标索引列表,其中,所述目标索引列表中包括Y个密文索引;所述Y个
密文索引是所述服务器的数据库中隐私信息所对应的密文索引,所述Y个密文索引是将第二数量N和目标筛选信息代入预设筛选条件得到的;
[0034]获得单元,用于根据所述目标索引列表,从所述服务器中获得所述目标索引列表对应的包含隐私信息的子数据集,并从所述子数据集中,获得所述待查关键词对应的隐私信息。
[0035]在一种可能实施方式中,所述第一处理单元,具体用于:
[0036]将所述第二数量N和所述待查关键词,代入以下公式:
[0037]result=H(keyword)%N
[0038]其中,result用于表征所述目标筛选信息,H(keyword)用于表征对所述待查关键词进行哈希运算且对哈希结果取整,keyword用于表征所述待查关键词,%用于表征取模运算。
[0039]在一种可能的实施方式中,所述装置还包括第三处理单元,用于:
[0040]生成随机数;
[0041]根据预设加密算法,结合所述随机数和所述服务器中对数据进行加密所用的公钥,对所述待查关键词进行加密,获得加密待查关键词,并将所述加密待查关键词发送给所述服务器,以使所述服务器对所述加密待查关键词进行二次加密,获得二次加密待查关键词。
[0042]在一种可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关键词隐私信息检索方法,其特征在于,所述方法包括:接收用户输入的用于检索隐私信息的待查关键词和用于混淆所述待查关键词的混淆词的第一数量M,以及,接收服务器发送的数据总量X;根据所述第一数量M,对所述数据总量X进行分组,获得第二数量N;并根据所述第二数量N和所述待查关键词,获得目标筛选信息;其中,所述目标筛选信息用于从所述服务器的数据库中筛选数据;所述第二数量N用于表征对所述数据总量X分组后所获得的分组个数;将所述第二数量N和所述目标筛选信息发送给所述服务器,接收所述服务器反馈的目标索引列表,其中,所述目标索引列表中包括Y个密文索引;所述Y个密文索引是所述服务器的数据库中隐私信息所对应的密文索引,所述Y个密文索引是将第二数量N和目标筛选信息代入预设筛选条件得到的;根据所述目标索引列表,从所述服务器中获得所述目标索引列表对应的包含隐私信息的子数据集,并从所述子数据集中,获得所述待查关键词对应的隐私信息。2.如权利要求1所述的方法,其特征在于,根据所述第二数量N和所述待查关键词,获得目标筛选信息,包括:将所述第二数量N和所述待查关键词,代入以下公式:result=H(keyword)%N其中,result用于表征所述目标筛选信息,H(keyword)用于表征对所述待查关键词进行哈希运算且对哈希结果取整,keyword用于表征所述待查关键词,%用于表征取模运算。3.如权利要求2所述的方法,其特征在于,在获得目标筛选信息之后,所述方法还包括:生成随机数;根据预设加密算法,结合所述随机数和所述服务器中对数据进行加密所用的公钥,对所述待查关键词进行加密,获得加密待查关键词,并将所述加密待查关键词发送给所述服务器,以使所述服务器对所述加密待查关键词进行二次加密,获得二次加密待查关键词。4.如权利要求3所述的方法,其特征在于,根据所述目标索引列表,从所述服务器中获得所述目标索引列表对应的包含隐私信息的子数据集,并从所述子数据集中,获得所述待查关键词对应的隐私信息,包括:根据所述随机数,对所述服务器反馈的二次加密待查关键词进行去盲处理,获得目标子索引;所述目标子索引与所述数据库中的密文索引的格式相同;在所述目标索引列表中,查找与所述目标子索引匹配的索引,获得匹配索引,并将所述匹配索引在所述目标索引列表中的序号,作为目标索引;从所述子数据集,查找与所述目标索引对应的子数据,作为所述待查关键词对应的隐私信息。5.如权利要求1

4任一所述的方法,其特征在于...

【专利技术属性】
技术研发人员:王真汤旭陈磊李德全高翔
申请(专利权)人:北京神州绿盟科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1