【技术实现步骤摘要】
一种缓存数据的匹配方法、匹配装置及终端设备
[0001]本专利技术属于自然语言处理的
,尤其涉及一种缓存数据的匹配方法、缓存数据的匹配装置及终端设备。
技术介绍
[0002]搜索引擎是指从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。为了提高搜索引擎的搜索效率和减少服务器负载,往往会采用缓存机制提高搜索效率。所谓缓存是指在高速内存硬件设备上为搜索引擎开辟一块存储区,来存储常见的查询语句及其结果,并采用一定的管理策略来维护缓存区内的数据。当搜索引擎再次接收到用户的查询语句时,首先在缓存系统中查找,如果能够在缓存中找到,则直接返回搜索结果;否则采取正常的搜索流程来返回搜索结果。
[0003]然而,由于传统的缓存系统中存储的查询语句存在大量的相似语句,严重影响缓存数据的命中率,这是一个亟需解决的技术问题。
技术实现思路
[0004]有鉴于此,本专利技术实施例提供了一种缓存数据的匹配方法、缓存数据的匹配装置及终端设备,以解决由于传统的缓存系统中存储的查询语句存在大量的相似语句,严重影响缓存 ...
【技术保护点】
【技术特征摘要】
1.一种缓存数据的匹配方法,其特征在于,所述缓存数据的匹配方法包括:获取当前查询语句对应的待匹配查询语句;所述待匹配查询语句是指预存在缓存系统中的查询语句;构建所述当前查询语句中多个目标词语各自对应的词语向量,并将所述词语向量组合为目标词语矩阵;所述目标词语矩阵用于表征所述当前查询语句的语句特征;获取所述待匹配查询语句对应的预存语句矩阵;所述预存语句矩阵用于表征所述待匹配查询语句的语句特征;计算所述目标词语矩阵与所述预存语句矩阵之间的相关系数;若所述相关系数大于阈值,则将所述待匹配查询语句对应的缓存结果作为所述当前查询语句的目标搜索结果。2.如权利要求1所述的缓存数据的匹配方法,其特征在于,所述获取当前查询语句对应的待匹配查询语句的步骤,包括:根据当前查询语句中的多个初始词语所属语句成分类型,获取多个所述初始词语各自对应的预设词库;基于所述预设词库在多个所述初始词语中,筛选多个目标词语;根据多个所述目标词语匹配所述待匹配查询语句。3.如权利要求2所述的缓存数据的匹配方法,其特征在于,所述基于所述预设词库在多个所述初始词语中,筛选多个所述目标词语步骤,包括:若所述初始词语在其对应的预设词库中匹配到相同词汇,则将所述初始词语作为第一目标词汇;若所述初始词语在其对应的预设词库中未匹配到相同词汇,则获取位于所述初始词语前一位字符;将所述前一位字符和所述初始词语的首位字符,组合为第一临时词语,将剩余字符作为第二临时词语;若所述第一临时词语和所述第二临时词语在所述预设词库中匹配到相同词汇,则将所述第一临时词语和所述第二临时词语作为第二目标词汇;其中,所述目标词汇包括所述第一目标词汇和所述第二目标词汇。4.如权利要求2所述的缓存数据的匹配方法,其特征在于,所述根据多个所述目标词语匹配所述待匹配查询语句的步骤,包括:获取多个所述目标词语对应的词语频率;所述词语频率是指词语在多个语句中出现的概率数值;获取最小频率目标词语对应的目标语句成分类型;所述最小频率目标词语是指多个所述目标词语中所述词语频率最小的目标词语;在缓存系统中的获取所述最小频率目标词语以及所述目标语句成分类型对应的缓存查询语句,将所述缓存查询语句作为所述待匹配查询语句。5.如权利要求1所述的缓存数据的匹配方法,其特征在于,所述构建所述当前查询语句中多个目标词语各自对应的词语向量,并...
【专利技术属性】
技术研发人员:朱建伟,
申请(专利权)人:长沙开发者科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。