一种语义理解的密文空间关键字检索方法及系统技术方案

技术编号:27130628 阅读:36 留言:0更新日期:2021-01-25 20:01
本发明专利技术公开了一种语义理解的空间关键字密文检索方法及系统,包括密钥模块、语义信息提取模块、加密索引构建模块、陷门生成模块和查询模块。通过提取空间对象和用户查询的语义特征,使用户可以在密文上查询到符合自己查询意图并且距离近的空间对象。此发明专利技术采用的密文索引构建方式提高了密文空间关键字检索的精度,同时满足了用户针对距离和文本的查询需求。此外,本方案的密文查询算法在保证了空间对象数据以及用户检索信息的安全性和隐私性的同时提高了查询效率。的同时提高了查询效率。的同时提高了查询效率。

【技术实现步骤摘要】
一种语义理解的密文空间关键字检索方法及系统


[0001]本专利技术涉及可搜索加密
,具体为一种语义理解的密文空间关键字检索方法及系统。

技术介绍

[0002]空间关键字检索涉及大量的空间对象数据,其查询过程需要耗费大量计算开销。此时,数据拥有者往往选择将空间对象数据外包至云服务器,让云服务器来进行存储和计算。然而,由于数据拥有者丧失了对外包数据的直接控制,数据安全性和隐私性无法得到保障。尤其是空间对象数据中包含位置坐标等敏感信息,对空间对象数据进行加密必不可少。
[0003]传统的空间关键字查询算法只针对明文数据,用户无法直接查询云服务器中存储的密文数据。其次,传统的空间关键字查询算法也无法提取用户检索的关键字的语义信息,导致无法获取用户查询意图,查询精确度不高。
[0004]钱志虎在其发表的论文“基于语义理解的空间关键字查询”(苏州大学.2018)中提出了一种基于语义理解的空间关键字查询方法。该方法在传统的空间关键字查询基础上加入了对空间对象文本描述的语义信息提取。其具体方法为,针对文本语义,利用隐含狄利克雷分布主题模型本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语义理解的密文空间关键字检索方法,其特征在于,包括以下步骤:步骤1、生成AES密钥,以及可搜索加密算法密钥;步骤2、提取空间对象文本描述的文本-主题概率分布向量,以及每个词语在主题上的词语-主题概率分布向量,根据文本-主题概率分布向量确定出文本集-主题概率分布向量,根据文本-主题概率分布向量和词语-主题概率分布向量确定词语在文本集上的词语-文本集概率分布向量;步骤3、根据空间对象的文本-主题概率分布向量和对应空间位置坐标,给每个空间对象构建明文索引,并对明文索引进行加密,形成密文索引;步骤4、根据步骤2中得到的文本集-主题概率分布向量、词语-主题概率分布向量以及词语-文本集概率分布向量,提取查询语句中关键字的查询-主题概率分布向量,将数据使用者的空间位置坐标与查询-主题概率分布向量结合生成查询向量,采用可搜索加密算法密钥对查询向量进行加密,得到查询陷门;步骤5、根据查询陷门和密文索引确定空间对象与查询语句之间的混合相似度并排序,将排序靠前的k个密文索引对应的空间对象的加密数据发送给数据使用者,数据使用者利用AES密钥对其解密。2.根据权利要求1所述的一种语义理解的密文空间关键字检索方法,其特征在于,步骤2利用自然语言处理模型提取每个空间对象的文本描述在各个主题上的文本-主题概率分布向量V
D
,以及每个词语在各个主题上的词语-主题概率分布向量V
K
。3.根据权利要求1所述的一种语义理解的密文空间关键字检索方法,其特征在于,步骤2中确定词语-文本集概率分布向量的方法如下:数据拥有者将所有对象文本描述的文本-主题概率分布向量V
D
相加并除以对象个数,获取反映各个主题在文本集出现的文本集-主题概率分布向量P
t
;数据拥有者根据文本集-主题概率分布向量P
t
以及每个词语的词语-主题概率分布向量V
K
,计算各个词语在文本集中出现的词语-文本集概率分布向量P
ω
。4.根据权利要求1所述的一种语义理解的密文空间关键字检索方法,其特征在于,步骤3中构建密文索引的方法如下:将空间对象位置坐标添加在文本-主题概率分布向量后面并进行合并形成明文索引D
i
,对明文索引的维度进行扩充,采用可搜索加密算法密钥SK对扩充后的明文索引进行加密,从而得到空间对象的密文索引I
i
。5.根据权利要求4所述的一种语义理解的密文空间关键字检索方法中的明文索引分割和加密方法,其特征在于,所述扩充后的明文索引加密时,首先对其进行分割,然后对分割得到的和分别进行加密;分割规则如下:若可搜索加密算法密钥SK中的二进制向量S的第j位为0,和都置为若S的第j位为1,和置为两个随机数,其和为加密过程如下:用可搜索加密算法密钥SK中的{M1,M2}分别点乘得到每个空间对象o
i
的密文索引
6.根据权利要求1所述的一种语义理解的密文空间关键字检索方法,其特征在于,步骤4中所述查询语句中关键字的查询-主题概率分布向量Q
w
的确定方法如下:其中,P
t
为文本集...

【专利技术属性】
技术研发人员:马建峰李佳忆苗银宾杨帆李颖莹马卓然
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1