当前位置: 首页 > 专利查询>中山大学专利>正文

一种数据存储方法、终端设备及计算机可读存储介质技术

技术编号:22883918 阅读:30 留言:0更新日期:2019-12-21 07:17
本申请适用于数据处理技术领域,提供了一种数据存储方法、终端设备及计算机可读存储介质,包括:获取搜索关键词,从缓存中查找与搜索关键词的首字符对应的目标链表;检测目标链表中是否存在与搜索关键词相匹配的目标索引;若目标链表中不存在与搜索关键词相匹配的目标索引,则从磁盘中查找并获取与搜索关键词相匹配的目标索引;将目标索引添加至缓存中的目标链表中,并输出目标索引对应的后缀字符串;若目标链表中存在与搜索关键词相匹配的目标索引,则获取并输出目标索引对应的后缀字符串,从而提高了数据查询效率,缩短了数据查询时间。

A data storage method, terminal equipment and computer readable storage medium

【技术实现步骤摘要】
一种数据存储方法、终端设备及计算机可读存储介质
本申请属于数据处理
,尤其涉及一种数据存储方法、终端设备及计算机可读存储介质。
技术介绍
基于后缀索引的搜索引擎是以字符串的后缀字符串为索引的搜索引擎,现有的基于后缀索引的搜索引擎通常将索引存储在磁盘中,这样,终端设备每处理一次查询请求,都需要将所有索引从磁盘加载到内存中,再从加载到内存的索引中查找符合要求的索引。然而,由于磁盘中存储的大部分索引是很少被检索到的,因此,每次处理查询请求时都将所有索引加载到内存中会降低数据查询效率,延长数据查询时间。
技术实现思路
有鉴于此,本申请实施例提供了一种数据存储方法、终端设备及计算机可读存储介质,以解决现有的基于后缀索引的数据存储方法所导致的数据查询效率低,数据查询时间长的问题。本申请实施例的第一方面提供了一种数据存储方法,包括:获取搜索关键词,从缓存中查找与所述搜索关键词的首字符对应的目标链表;所述目标链表用于存储以所述搜索关键词的首字符为首字符的后缀字符串对应的索引的信息;检测所述目标链表中是否存在与所本文档来自技高网...

【技术保护点】
1.一种数据存储方法,其特征在于,包括:/n获取搜索关键词,从缓存中查找与所述搜索关键词的首字符对应的目标链表;所述目标链表用于存储以所述搜索关键词的首字符为首字符的后缀字符串对应的索引的信息;/n检测所述目标链表中是否存在与所述搜索关键词相匹配的目标索引;/n若所述目标链表中不存在与所述搜索关键词相匹配的目标索引,则从磁盘中查找并获取与所述搜索关键词相匹配的目标索引;/n将所述目标索引添加至所述缓存中的所述目标链表中,并输出所述目标索引对应的后缀字符串;/n若所述目标链表中存在与所述搜索关键词相匹配的目标索引,则获取并输出所述目标索引对应的后缀字符串。/n

【技术特征摘要】
1.一种数据存储方法,其特征在于,包括:
获取搜索关键词,从缓存中查找与所述搜索关键词的首字符对应的目标链表;所述目标链表用于存储以所述搜索关键词的首字符为首字符的后缀字符串对应的索引的信息;
检测所述目标链表中是否存在与所述搜索关键词相匹配的目标索引;
若所述目标链表中不存在与所述搜索关键词相匹配的目标索引,则从磁盘中查找并获取与所述搜索关键词相匹配的目标索引;
将所述目标索引添加至所述缓存中的所述目标链表中,并输出所述目标索引对应的后缀字符串;
若所述目标链表中存在与所述搜索关键词相匹配的目标索引,则获取并输出所述目标索引对应的后缀字符串。


2.根据权利要求1所述的数据存储方法,其特征在于,所述索引的信息包括最长公共前缀长度、源位置标识、非公共字符串、被检索次数及后继索引的地址;所述最长公共前缀长度用于描述所述索引对应的后缀字符串与其前继后缀字符串的最长公共前缀的长度,所述源位置标识用于描述所述索引对应的后缀字符串在源文件中的位置,所述非公共字符串用于描述所述索引对应的后缀字符串与其前继后缀字符串的预设长度的非公共字符串,所述被检索次数用于描述所述索引被检索到的次数,所述后继索引的地址用于描述所述索引的后继索引在所述目标链表中的地址;
所述检测检测所述目标链表中是否存在与所述搜索关键词相匹配的目标索引,包括:
检测所述目标链表中的第一个索引是否为空;
若所述目标链表中的第一个索引不为空,则获取所述第一个索引的非公共字符串,将预先定义的初始长度为0的字符串变量与所述第一个索引的非公共字符串进行组合得到所述第一个索引对应的后缀字符串,将所述第一个索引对应的后缀字符串与所述搜索关键词进行对比;
若所述第一个索引对应的后缀字符串与所述搜索关键词相等,则将所述第一个索引确定为与所述搜索关键词相匹配的目标索引;
获取所述第一个索引的各个后续索引的最长公共前缀长度;
若所述第一个索引的后续索引的最长公共前缀长度大于或等于所述搜索关键词的长度,则将所述第一个索引的后续索引确定为与所述搜索关键词相匹配的目标索引。


3.根据权利要求2所述的数据存储方法,其特征在于,所述将所述第一个索引对应的后缀字符串与所述搜索关键词进行对比之后,还包括:
若所述第一个索引对应的后缀字符串小于所述搜索关键词,则获取所述第一个索引的各个后续索引的最长公共前缀长度及非公共字符串,从各个所述后续索引的前继索引对应的后缀字符串中提取前n个字符,得到各个所述后续索引的待组合字符,将每一所述后续索引的所述待组合字符与该后续索引的非公共字符串进行组合,得到每一所述后继索引对应的后缀字符串;其中,n为所述后继索引的最长公共前缀长度;
依次将所述第一个索引的各个所述后继索引对应的后缀字符串与所述搜索关键词进行大小对比,基于对比结果确定所述第一个索引的后继索引是否为与所述搜索关键词相匹配的目标索引。


4.根据权利要求1所述的数据存储方法,其特征在于,所述若所述目标链表中不存在与所述搜索关键词相匹配的目标索引,则从磁盘中查找与所述搜索关键词相匹配的目标索引,包括:
若所述目标链表中不存在与...

【专利技术属性】
技术研发人员:彭炯瑜解静仪农革
申请(专利权)人:中山大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1