密文索引信息处理方法、装置和计算机设备制造方法及图纸

技术编号:36757085 阅读:13 留言:0更新日期:2023-03-04 10:49
本申请提供一种密文索引信息处理方法、装置和计算机设备,属于数据检索技术领域。所述方法包括:对待处理文本进行分词处理,得到至少一个分词词元和各所述分词词元的属性信息,所述属性信息包括如下至少一项:各所述分词词元的索引位置以及类型;对各所述分词词元进行加密处理,得到与各所述分词词元对应的加密后词元;对各所述加密后词元、所述属性信息进行编码处理,得到字符长串,并将所述字符长串发送至数据服务器,所述字符长串用于指示如下至少一项:所述待处理文本中的加密后词元、各所述分词词元的索引位置和类型。本申请可以达到提高数据处理的安全性的效果。提高数据处理的安全性的效果。提高数据处理的安全性的效果。

【技术实现步骤摘要】
密文索引信息处理方法、装置和计算机设备


[0001]本申请涉及数据检索
,具体而言,涉及一种密文索引信息处理方法、装置和计算机设备。

技术介绍

[0002]随着计算机技术和互联网技术的发展,人们经常会将一些数据或者文本上传到数据库中,为了提高存储的安全性,一般还会将信息进行加密存储。但是,人们经常需要对数据库中存储的一些加密的数据或文本进行全文检索。
[0003]相关技术中,相关技术人员经常会基于弹性搜索(Elasticsearch,简称ES)集群来进行数据的全文检索,一般地,由于ES集群不支持密文索引,因此在将数据或文本全部上传到ES集群中,由ES集群对数据或文本进行分词并建立明文索引,然后再将数据或文本进行加密存储在ES集群中,那么就可以通过明文索引信息来检索ES集群中存储的数据或文本。
[0004]这样就导致相关技术的方案存在数据处理的安全性较差的问题。

技术实现思路

[0005]本申请的目的在于提供一种密文索引信息处理方法、装置和计算机设备,可以达到提高数据处理的安全性的效果。
[0006]本申请的实施例是这样实现的:
[0007]本申请实施例的第一方面,提供一种密文索引信息处理方法,应用于终端设备,所述方法包括:
[0008]对待处理文本进行分词处理,得到至少一个分词词元和各所述分词词元的属性信息,所述属性信息包括如下至少一项:各所述分词词元的索引位置以及类型;
[0009]对各所述分词词元进行加密处理,得到与各所述分词词元对应的加密后词元;
[0010]对各所述加密后词元、所述属性信息进行编码处理,得到字符长串,并将所述字符长串发送至数据服务器,所述字符长串用于指示如下至少一项:所述待处理文本中的加密后词元、各所述分词词元的索引位置和类型。
[0011]可选地,所述对各所述加密后词元、所述属性信息进行编码处理,得到字符长串,包括:
[0012]将各所述加密后词元、各所述分词词元的索引位置以及类型按照预设编码算法分别进行编码处理,得到各所述加密后词元对应的字符串,所述字符串用于指示所述加密后词元、所述分词词元的索引位置和类型;
[0013]将各所述字符串拼接,得到所述字符长串。
[0014]可选地,所述将各所述字符串拼接,得到所述字符长串,包括:
[0015]按照随机顺序将各所述字符串排列,得到字符串序列;
[0016]在所述字符串序列中各相邻字符串之间分别插入拼接标记,将插入所述拼接标记之后的字符串序列作为所述字符长串。
[0017]可选地,所述根据各所述加密后词元生成字符长串,并将所述字符长串发送至数据服务器之后,所述方法还包括:
[0018]获取检索语句,并对所述检索语句进行分词处理,得到至少一个检索词;
[0019]对各所述检索词进行加密处理,得到与各所述检索词对应的加密后检索词,其中,所述检索词的加密处理算法与所述分词词元的加密处理算法相同;
[0020]将各加密后检索词拼接成检索字符串,并将所述检索字符串发送至所述数据服务器;
[0021]接收所述数据服务器发送的检索结果。
[0022]可选地,所述对各所述分词词元进行加密处理,包括:
[0023]使用预设加密算法对所述分词词元进行加密处理,其中,预设加密算法包括如下任意一项:哈希函数、对称加密算法、非对称加密算法。
[0024]本申请实施例的第二方面,提供了一种密文索引信息处理方法,应用于数据服务器,所述方法包括:
[0025]接收终端设备发送的字符长串,所述字符长串用于指示如下至少一项:待处理文本中的加密后词元、分词词元的索引位置和类型;
[0026]对所述字符长串进行解码,得到各所述加密后词元和各所述分词词元的属性信息,所述属性信息包括如下至少一项:各所述分词词元的索引位置以及类型;
[0027]根据各所述加密后词元、所述属性信息生成待处理文本的密文索引。
[0028]可选地,所述对所述字符长串进行解码,得到各所述加密后词元和各所述分词词元的属性信息,包括:
[0029]根据各拼接标记将各所述字符长串分割为多个字符串;
[0030]对各所述字符串进行解码,得到各所述加密后词元、各所述分词词元的索引位置以及类型。
[0031]可选地,所述根据各所述加密后词元的内容、所述属性信息生成待处理文本的索引信息之后,所述方法还包括:
[0032]接收并解析所述终端设备发送的检索字符串,得到至少一个加密后检索词;
[0033]分别匹配各所述加密后检索词与多个待匹配文本对应的密文索引,计算所有的所述加密后检索词与各所述待匹配文本的匹配度;
[0034]根据所述加密后检索词与各所述待匹配文本的匹配度确定至少一个检索结果,并将各所述检索结果发送给所述终端设备。
[0035]本申请实施例的第三方面,提供了一种密文索引信息处理装置,应用于终端设备,所述装置包括:
[0036]分词模块,用于对待处理文本进行分词处理,得到至少一个分词词元和各所述分词词元的属性信息,所述属性信息包括如下至少一项:各所述分词词元的索引位置以及类型;
[0037]加密模块,用于对各所述分词词元进行加密处理,得到与各所述分词词元对应的加密后词元;
[0038]编码发送模块,用于对各所述加密后词元、所述属性信息进行编码处理,得到字符长串,并将所述字符长串发送至数据服务器,所述字符长串用于指示如下至少一项:所述待
处理文本中的加密后词元、各所述分词词元的索引位置和类型。
[0039]本申请实施例的第四方面,提供了一种密文索引信息处理装置,应用于数据服务器,所述装置包括:
[0040]接收模块,用于接收终端设备发送的字符长串,所述字符长串用于指示如下至少一项:待处理文本中的加密后词元、分词词元的索引位置和类型;
[0041]解码模块,用于对所述字符长串进行解码,得到各所述加密后词元和各所述分词词元的属性信息,所述属性信息包括如下至少一项:各所述分词词元的索引位置以及类型;
[0042]生成模块,用于根据各所述加密后词元、所述属性信息生成待处理文本的密文索引。
[0043]本申请实施例的第五方面,提供了一种计算机设备,所述计算机设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述第一方面和上述第二方面所述的密文索引信息处理方法。
[0044]本申请实施例的第六方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面和上述第二方面所述的密文索引信息处理方法。
[0045]本申请实施例的有益效果包括:
[0046]本申请实施例提供的一种密文索引信息处理方法,通过对待处理文本进行分词处理,得到至少一个分词词元和各分词词元的属性信息,对各分词本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种密文索引信息处理方法,其特征在于,应用于终端设备,所述方法包括:对待处理文本进行分词处理,得到至少一个分词词元和各所述分词词元的属性信息,所述属性信息包括如下至少一项:各所述分词词元的索引位置以及类型;对各所述分词词元进行加密处理,得到与各所述分词词元对应的加密后词元;对各所述加密后词元、所述属性信息进行编码处理,得到字符长串,并将所述字符长串发送至数据服务器,所述字符长串用于指示如下至少一项:所述待处理文本中的加密后词元、各所述分词词元的索引位置和类型。2.如权利要求1所述的密文索引信息处理方法,其特征在于,所述对各所述加密后词元、所述属性信息进行编码处理,得到字符长串,包括:将各所述加密后词元、各所述分词词元的索引位置以及类型按照预设编码算法分别进行编码处理,得到各所述加密后词元对应的字符串,所述字符串用于指示所述加密后词元、所述分词词元的索引位置和类型;将各所述字符串拼接,得到所述字符长串。3.如权利要求2所述的密文索引信息处理方法,其特征在于,所述将各所述字符串拼接,得到所述字符长串,包括:按照随机顺序将各所述字符串排列,得到字符串序列;在所述字符串序列中各相邻字符串之间分别插入拼接标记,将插入所述拼接标记之后的字符串序列作为所述字符长串。4.如权利要求1所述的密文索引信息处理方法,其特征在于,所述根据各所述加密后词元生成字符长串,并将所述字符长串发送至数据服务器之后,所述方法还包括:获取检索语句,并对所述检索语句进行分词处理,得到至少一个检索词;对各所述检索词进行加密处理,得到与各所述检索词对应的加密后检索词,其中,所述检索词的加密处理算法与所述分词词元的加密处理算法相同;将各加密后检索词拼接成检索字符串,并将所述检索字符串发送至所述数据服务器;接收所述数据服务器发送的检索结果。5.如权利要求1

4任一项所述的密文索引信息处理方法,其特征在于,所述对各所述分词词元进行加密处理,包括:使用预设加密算法对所述分词词元进行加密处理,其中,预设加密算法包括如下任意一项:哈希函数、对称加密算法、非对称加密算法。6.一种密文索引信息处理方法,其特征在于,应用于数据服务器,所述方法包括:接收终端设备发送的字符长串,所述字符长串用于指示如下至少一项:待处理文本中的加密后词元、分词词元的索引位置和类型;对所述字符长串进行解码,得到各所述加密后词元和各所述分词词元的属性信息,所述属性信息包括如下至少一项:各所述分词词元的索引位置以及类型;根据各所述加密后词元、所述属性信息生成待处理文本的密文索引。7.如权利要求6所述的密文索引信息处理方法...

【专利技术属性】
技术研发人员:毕权忠谭少卿
申请(专利权)人:南京中孚信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1