【技术实现步骤摘要】
一种个性化检索方法
[0001]本专利技术属于数据隐私保护
,具体地,涉及一种个性化检索方法。
技术介绍
[0002]随着信息社会的快速发展,个人和公司每秒钟都在产生大量的数据。云计算可以为数据的存储和应用提供极大的便利,然而,云计算中的安全和隐私问题阻碍了其进一步发展。为了保证数据的机密性,数据拥有者先使用传统加密方案对数据进行加密后再外包给云服务器,然而,它使得高效搜索成为不可能。
[0003]可搜索加密SE可以解决这种紧张关系,然而,大多数现存的SE方案忽略了拼写错误和关键词语义扩展,同时,在搜索过程中没有考虑用户的个性化特征,在加密数据上也不能支持个性化检索服务。
技术实现思路
[0004]针对现有技术中存在的问题,本专利技术提供了一种个性化检索方法,该个性化检索方法针对用户的搜索请求能够结合用户的兴趣模型智能的进行多关键词精确检索和模糊语义检索,并返回精确的前k个搜索结果。
[0005]为实现上述技术目的,本专利技术所采用的技术方案是:一种个性化检索方法,具体包括如下步骤:r/>[0006]步本文档来自技高网...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种个性化检索方法,其特征在于,具体包括如下步骤:步骤1、数据拥有者将明文文档集合中的每一个明文文档通过加密秘钥加密成密文文档,发送给共有云服务器,并生成同态加密的私钥和公钥;步骤2、数据拥有者从明文文档集合中随机抽取若干个关键词,将关键词组成关键词字典;步骤3、将关键词字典中的每个关键词生成关键词指纹以及指纹索引链表,并发送给私有云服务器;依次将每一个关键词遍历每一个明文文档,计算出关键词与每一个明文文档的相关度得分,进行加密,插入到倒排索引中,通过倒排索引组织明文文档,并将倒排索引发送给公有云服务器;步骤4、数据用户输入自己感兴趣的查询关键词,对查询关键词进行语义扩展,计算查询关键词与扩展关键词之间的语义相似度,生成陷门,并根据用户兴趣度模型生成查询关键词、扩展关键词的兴趣度值;步骤5、将生成兴趣度值的查询关键词、扩展关键词与私有云服务器上的关键词进行精确匹配,若精确匹配,将与查询关键词、扩展关键词精确匹配的关键词生成关键词候选索引;否则,将查询关键词、扩展关键词生成查询关键词指纹,在私有云服务器上通过模糊匹配算法查找与查询关键词指纹最接近的关键词,生成关键词候选索引;步骤6、公有云服务器根据关键词候选索引获取候选密文文档集合,计算候选密文文档与陷门的综合兴趣相关度,按照综合兴趣相关度对搜索的密文文档进行降序排序,将前k个密文文档返回给数据用户;步骤7、数据用户通过密钥解密返回的前k个密文文档。2.根据权利要求1所述的一种个性化检索方法,其特征在于,步骤3包括如下子步骤:步骤3.1、数据拥有者对每一个关键词kw
i
∈KW执行关键词指纹生成算法生成关键词指纹并将关键词指纹插入到指纹索引链表中,并发送给私有云服务器;其中,KW表示关键词字典,KW=(kw1,...,kw
i
,...,kw
n
),kw
i
表示关键词字典中的第i个关键词,n表示关键词的总数量;步骤3.2、数据拥有者对每一个明文文档df
j
∈DF创建文档标识符DID
j
,其中,DF表示明文文档集合,DF=(df1,...,df
j
,...,df
m
),df
j
表示第j个明文文档,m为明文文档的总数量;步骤3.3、将关键词kw
i
遍历每一个明文文档df
j
∈DF,若关键词kw
i
∈df
j
,数据拥有者计算关键词kw
i
与明文文档df
j
的相关度分数使用全同态加密算法对相关度分数进行加密,得到加密相关度分数其中,TF表示关键词在密文文档中出现的次数,IDF表示关键词的重要性程度;步骤3.4、将文档标识符DID
j
和加密相关度得分作为关键词文档候选FS
i
插入关键词文档候选集FS中,并将关键词文档候选FS
i
按照文档标识符DID
j
升序排列,将升序排列的关键词文档候选集FS
′
技术研发人员:刘国秀,王池社,周强,翟洪军,马冀,丁凯孟,
申请(专利权)人:金陵科技学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。