System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及搜索,特别是涉及一种数据搜索方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
1、随着互联网和数字技术的快速发展,数据成为现代社会的核心资产之一。部分数据涉及个人隐私、企业机密或国家安全等多个层面,因此,为了保证数据安全,通常将这些数据进行加密形成加密数据,对加密数据进行存储。在使用数据时,通过输入待搜索内容,进而从大量加密数据中搜索出与待搜索内容匹配的数据。传统技术中,通常通过获取全量的加密数据,对全量的加密数据解密后获得明文数据,将明文数据与待搜索内容一一精确匹配,最终获得与待搜索内容相匹配的明文数据。
2、然而,对全量的加密数据解密后再与待搜索内容精确匹配的方式,导致加密数据被泄露的风险大,数据安全性低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高加密数据的安全性的数据搜索方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种数据搜索方法,包括:
3、获取输入文本,将所述输入文本解析为多个文本片段构成的文本片段序列;
4、针对所述文本片段序列中的每个文本片段,将所针对文本片段映射为对应的特征值;
5、从所述所针对文本片段对应的预配置的索引表中,确定包含所述特征值的索引记录,从所述索引记录中确定与所述所针对文本片段匹配的数据标识;
6、从所述文本片段序列中各个文本片段所匹配的数据标识中,筛选出与所述文本片段序列中每个文本片段
7、获取所述目标数据标识对应的预加密文本并解密,获得明文候选文本;
8、将所述输入文本和所述明文候选文本进行文本匹配,获得针对所述输入文本的数据搜索结果。
9、第二方面,本申请还提供了一种数据搜索装置,包括:
10、解析模块,用于获取输入文本,将所述输入文本解析为多个文本片段构成的文本片段序列;
11、特征值映射模块,用于针对所述文本片段序列中的每个文本片段,将所针对文本片段映射为对应的特征值;
12、数据搜索模块,用于从所述所针对文本片段对应的预配置的索引表中,确定包含所述特征值的索引记录,从所述索引记录中确定与所述所针对文本片段匹配的数据标识;从所述文本片段序列中各个文本片段所匹配的数据标识中,筛选出与所述文本片段序列中每个文本片段均匹配的目标数据标识;获取所述目标数据标识对应的预加密文本并解密,获得明文候选文本;将所述输入文本和所述明文候选文本进行文本匹配,获得针对所述输入文本的数据搜索结果。
13、第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
14、获取输入文本,将所述输入文本解析为多个文本片段构成的文本片段序列;
15、针对所述文本片段序列中的每个文本片段,将所针对文本片段映射为对应的特征值;
16、从所述所针对文本片段对应的预配置的索引表中,确定包含所述特征值的索引记录,从所述索引记录中确定与所述所针对文本片段匹配的数据标识;
17、从所述文本片段序列中各个文本片段所匹配的数据标识中,筛选出与所述文本片段序列中每个文本片段均匹配的目标数据标识;
18、获取所述目标数据标识对应的预加密文本并解密,获得明文候选文本;
19、将所述输入文本和所述明文候选文本进行文本匹配,获得针对所述输入文本的数据搜索结果。
20、第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
21、获取输入文本,将所述输入文本解析为多个文本片段构成的文本片段序列;
22、针对所述文本片段序列中的每个文本片段,将所针对文本片段映射为对应的特征值;
23、从所述所针对文本片段对应的预配置的索引表中,确定包含所述特征值的索引记录,从所述索引记录中确定与所述所针对文本片段匹配的数据标识;
24、从所述文本片段序列中各个文本片段所匹配的数据标识中,筛选出与所述文本片段序列中每个文本片段均匹配的目标数据标识;
25、获取所述目标数据标识对应的预加密文本并解密,获得明文候选文本;
26、将所述输入文本和所述明文候选文本进行文本匹配,获得针对所述输入文本的数据搜索结果。
27、第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
28、获取输入文本,将所述输入文本解析为多个文本片段构成的文本片段序列;
29、针对所述文本片段序列中的每个文本片段,将所针对文本片段映射为对应的特征值;
30、从所述所针对文本片段对应的预配置的索引表中,确定包含所述特征值的索引记录,从所述索引记录中确定与所述所针对文本片段匹配的数据标识;
31、从所述文本片段序列中各个文本片段所匹配的数据标识中,筛选出与所述文本片段序列中每个文本片段均匹配的目标数据标识;
32、获取所述目标数据标识对应的预加密文本并解密,获得明文候选文本;
33、将所述输入文本和所述明文候选文本进行文本匹配,获得针对所述输入文本的数据搜索结果。
34、上述数据搜索方法、装置、计算机设备、存储介质和计算机程序产品,将输入文本解析为多个文本片段构成的文本片段序列,将每个文本片段映射为对应的特征值,进而通过文本片段对应的预配置的索引表确定匹配的数据标识,由于索引表中索引记录包含的是文本片段对应的特征值,即索引表记录的是密文数据,而且每条索引记录所记录的密文数据对应于文本片段,提高了通过索引表破解出完整文本的难度;而且,从文本片段序列中各个文本片段所匹配的数据标识中,筛选出与文本片段序列中每个文本片段均匹配的目标数据标识,再获取目标数据标识对应的预加密文本并解密,获得明文候选文本,再将输入文本和明文候选文本进行文本匹配获得数据搜索结果,可见,目标数据标识对应的预加密文本仅是全量的预加密文本中的一部分,仅将这一部分的预加密文本解密,在实现与输入文本精确匹配的同时,提高了全量的预加密文本的数据安全性,即提高了加密数据的数据安全性。
本文档来自技高网...【技术保护点】
1.一种数据搜索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述文本片段序列包括文字片段,所述针对所述文本片段序列中的每个文本片段,将所针对文本片段映射为对应的特征值,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述字母序列中两两相邻的字母间的差异,确定所述字母序列对应的跳跃度特征值,包括:
4.根据权利要求2所述的方法,其特征在于,所述文本片段序列包括符号片段和文字片段,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述文字片段包括由单个汉字形成的汉字片段、由所述输入文本中连续的英文字母形成的英文片段、或由单个数字形成的数字片段;
6.根据权利要求1所述的方法,其特征在于,所述从所述文本片段序列中各个文本片段所匹配的数据标识中,筛选出与所述文本片段序列中每个文本片段均匹配的目标数据标识,包括:
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
8.一种数据搜索装置,其特征在于,所述装置包括:
9.一种计算
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种数据搜索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述文本片段序列包括文字片段,所述针对所述文本片段序列中的每个文本片段,将所针对文本片段映射为对应的特征值,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述字母序列中两两相邻的字母间的差异,确定所述字母序列对应的跳跃度特征值,包括:
4.根据权利要求2所述的方法,其特征在于,所述文本片段序列包括符号片段和文字片段,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述文字片段包括由单个汉字形成的汉字片段、由所述输入文本中连续的英文字母形成的英文片段、或由单个数字形成的数字片段...
【专利技术属性】
技术研发人员:张民遐,许金明,
申请(专利权)人:深圳高灯计算机科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。