词库的检索方法和相关装置制造方法及图纸

技术编号:39573940 阅读:9 留言:0更新日期:2023-12-03 19:25
本申请公开一种词库的检索方法和相关装置,获取待查输入串中的第一个字符,根据第一个字符从词库中确定检索范围并记录到缓存中

【技术实现步骤摘要】
词库的检索方法和相关装置


[0001]本申请涉及互联网
,特别是涉及一种词库的检索方法和相关装置


技术介绍

[0002]随着计算机技术的发展,诸如手机

平板电脑等电子设备越来越普及,给人们的生活

学习

工作带来了极大的便利

这些电子设备通常安装有输入法的应用程序,使得用户可使用该输入法进行信息输入

[0003]输入法中通常会提供词库,通过检索词库,向用户提供候选项

在检索词库时,一般是通过全拼串在词库中匹配到相同的全拼串,进而找到对应的词条作为候选项提供给用户

但是对于包括简拼的待查输入串,需要先基于包括简拼的待查输入串构建全拼串,然后通过上述方法检索词库,进而找到对应的词条作为候选项提供给用户

[0004]然而,对于包括简拼的待查输入串,需要检索其对应的所有全拼串,待查输入串越长,全拼串的组合情况越多,所以在待查输入串为长简拼串的场景下词库的检索性能非常差,以致于会影响整个输入法的响应性能,导致用户输入过程中卡顿,输入体验较差


技术实现思路

[0005]为了解决上述技术问题,本申请提供了一种词库的检索方法和相关装置,无需构建多种全拼串的组合,无需针对多种全拼串的组合分别进行检索,提高了词库的检索效率,并且由于实现了增量检索,进一步地提高了词库的检索性能,提高整个输入法的响应性能,降低用户输入过程中卡顿的可能性,提升用户的输入体验

[0006]本申请实施例公开了如下技术方案:
[0007]一方面,本申请实施例提供一种词库的检索方法,所述方法包括:
[0008]获取待查输入串中的第一个字符,所述待查输入串中包括简拼;
[0009]根据所述第一个字符,从词库中确定检索范围并记录到缓存中,所述检索范围包括以所述第一个字符为起始字符的全拼串所在的词条数据;
[0010]在所述检索范围中依次对所述待查输入串的其余字符进行检索,得到满足所述待查输入串的目标词条;
[0011]所述在所述检索范围中依次对所述待查输入串的其余字符进行检索,得到满足所述待查输入串的目标词条的过程中,当针对所述待查输入串中第
i
个字符进行检索时,从第
i
‑1个字符对应的缓存中检索得到第一词条数据,所述第一词条数据包括以前
i
个字符为前缀的全拼串所在的词条数据,并对所述第一词条数据进行缓存,直到完成针对所述待查输入串中末尾字符的检索,得到所述目标词条;所述第
i
‑1个字符对应的缓存中包括第二词条数据,所述第二词条数据包括以前
i
‑1个字符为前缀的全拼串所在的词条数据,
i
的取值为
2、3、
……
N

N
为待查输入串的字符数量

[0012]一方面,本申请实施例提供一种词库的检索装置,所述装置包括获取单元

确定单元

缓存单元和检索单元:
[0013]所述获取单元,用于获取待查输入串中的第一个字符,所述待查输入串中包括简拼;
[0014]所述确定单元,用于根据所述第一个字符,从词库中确定检索范围;
[0015]所述缓存单元,用于将所述检索范围记录到缓存中,所述检索范围包括以所述第一个字符为起始字符的全拼串所在的词条数据;
[0016]所述检索单元,用于在所述检索范围中依次对所述待查输入串的其余字符进行检索,得到满足所述待查输入串的目标词条;
[0017]所述在所述检索范围中依次对所述待查输入串的其余字符进行检索,得到满足所述待查输入串的目标词条的过程中,所述检索单元,具体用于当针对所述待查输入串中第
i
个字符进行检索时,从第
i
‑1个字符对应的缓存中检索得到第一词条数据,所述第一词条数据包括以前
i
个字符为前缀的全拼串所在的词条数据,并且所述缓存单元具体用于对所述第一词条数据进行缓存,直到完成针对所述待查输入串中末尾字符的检索,得到所述目标词条;所述第
i
‑1个字符对应的缓存中包括第二词条数据,所述第二词条数据包括以前
i
‑1个字符为前缀的全拼串所在的词条数据,
i
的取值为
2、3、
……
N

N
为待查输入串的字符数量

[0018]一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器以及存储器:
[0019]所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0020]所述处理器用于根据所述程序代码中的指令执行前述任一方面所述的方法

[0021]一方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码当被处理器执行时使所述处理器执行前述任一方面所述的方法

[0022]一方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现前述任一方面所述的方法

[0023]由上述技术方案可以看出,本申请可以针对包括简拼的待查输入串中的每个字符进行增量检索

具体的,可以获取待查输入串中的第一个字符,进而根据第一个字符从词库中确定检索范围并记录到缓存中,从而使得后续字符的检索仅在该检索范围中进行遍历,从而提高检索效率,检索范围包括以第一个字符为起始字符的全拼串所在的词条数据

然后,在检索范围中依次对待查输入串的其余字符进行检索,得到满足待查输入串的目标词条,具体的,当针对待查输入串中第
i
个字符进行检索时,从第
i
‑1个字符对应的缓存中检索得到第一词条数据,第一词条数据包括以前
i
个字符为前缀的全拼串所在的词条数据,并对第一词条数据进行缓存,直到完成针对待查输入串中末尾字符的检索,得到目标词条

其中,第
i
‑1个字符对应的缓存中包括第二词条数据,第二词条数据包括以前
i
‑1个字符为前缀的全拼串所在的词条数据,
i
的取值为
2、3、
……
N

N
为待查输入串的字符数量,从而使得每一次检索都是在前一次检索得到的缓存中进行检索即可,在检索范围的基础上逐渐缩小每一次检索的范围,实现增量检索,提高了词库的检索性能

可见,本申请即使在长简拼输入情况下,无需构建多种全拼串的组合,无需针对多种全拼串的组合分别进行检索,提高了词库的检索效率,并且由于实现了增量检索,进一步地提高了词库的检索性能,提高整个输入法的响应性能,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种词库的检索方法,其特征在于,所述方法包括:获取待查输入串中的第一个字符,所述待查输入串中包括简拼;根据所述第一个字符,从词库中确定检索范围并记录到缓存中,所述检索范围包括以所述第一个字符为起始字符的全拼串所在的词条数据;在所述检索范围中依次对所述待查输入串的其余字符进行检索,得到满足所述待查输入串的目标词条;所述在所述检索范围中依次对所述待查输入串的其余字符进行检索,得到满足所述待查输入串的目标词条的过程中,当针对所述待查输入串中第
i
个字符进行检索时,从第
i
‑1个字符对应的缓存中检索得到第一词条数据,所述第一词条数据包括以前
i
个字符为前缀的全拼串所在的词条数据,并对所述第一词条数据进行缓存,直到完成针对所述待查输入串中末尾字符的检索,得到所述目标词条;所述第
i
‑1个字符对应的缓存中包括第二词条数据,所述第二词条数据包括以前
i
‑1个字符为前缀的全拼串所在的词条数据,
i
的取值为
2、3、
……
N

N
为待查输入串的字符数量
。2.
根据权利要求1所述的方法,其特征在于,所述对所述第一词条数据进行缓存,包括:使用位图记录所述第一词条数据
。3.
根据权利要求2所述的方法,其特征在于,所述使用位图记录所述第一词条数据,包括:根据所述第一词条数据在所述词库中的位置,将所述位图中所述第一词条数据对应的位设置为满足查询条件的标识;将所述位图中其余词条数据对应的位设置为不满足查询条件的标识
。4.
根据权利要求1所述的方法,其特征在于,所述获取待查输入串中的第一个字符,包括:在完成所述待查输入串的输入后,获取所述待查输入串;对所述待查输入串进行字符划分,得到划分结果;基于所述划分结果获取所述第一个字符
。5.
根据权利要求1所述的方法,其特征在于,所述获取待查输入串中的第一个字符,包括:响应于针对所述第一个字符的输入操作,获取所述第一个字符;针对所述待查输入串中第
i
个字符进行检索,包括:响应于针对所述第
i
个字符的输入操作,获取所述第
i
个字符并对所述第
i
个字符进行检索
。6.
根据权利要求5所述的方法,其特征在于,所述末尾字符的判断条件包括:在获取到目标字符后,若超出预设时长未检测到字符输入操作,将所述目标字符作为所述待查输入串的末尾字符
。7.
根据权利要求5所述的方法,其特征在于,所述从第
i
‑1个字符对应的缓存中检索得到第一词条数据,包括:从所述第
i
‑1个字符对应的缓存中进行检索,得到所述第一词条数据以及与前
i
个字符匹配的目标全拼串;所述方法还包括:
将所述目标全拼串所...

【专利技术属性】
技术研发人员:费腾
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1