数据查询方法、装置、设备和存储介质制造方法及图纸

技术编号:38556581 阅读:18 留言:0更新日期:2023-08-22 21:00
本发明专利技术公开了一种数据查询方法、装置、设备和存储介质,其中方法包括:在预设字典树中查找查询词的尾字符对应的第二目标节点以及与查询词的首字符相同的字符所对应的第一目标节点;获取预设字典树中根节点到第一目标节点之间各节点对应的第一字符,以及第二目标节点到对应叶子节点之间各节点对应的第二字符;根据第一字符组合得到前缀字符,根据第二字符组合得到后缀字符,根据前缀字符以及后缀字符,输出查询结果;在通过预设字典树中查找查询词的后缀字符的基础上,在预设字典树中查找首字符相同的字符所对应的前缀字符,对查询词进行扩充,增加查询词的信息量;并通过前缀字符和后缀字符输出查询结果,可以提升匹配结果的准确率。的准确率。的准确率。

【技术实现步骤摘要】
数据查询方法、装置、设备和存储介质


[0001]本专利技术涉及检索
,具体涉及一种数据查询方法、装置、设备和存储介质。

技术介绍

[0002]现在很多应用都具有搜索联想功能,可以根据用户的输入内容和结构,智能联想出用户可能想要得到的信息。针对物流行业,当用户在进行寄件信息输入的时候,希望用户能够更快速准确的得到自己想要的寄托物内容。对于数据量庞大的寄托物词典库,建立的索引模型必须能够迅速给出联想结果,而且结果必须符合语义相关性,即联想的寄托物内容要包含用户输入的关键词。目前,查询方法的查询效率以及联想的准确性还有待提高。

技术实现思路

[0003]本专利技术实施例提供一种数据查询方法、装置、设备和存储介质,以解决现有索引方法中索引效率低和索引结果准确率受限的问题。
[0004]一方面,本专利技术实施例提供一种数据查询方法,所述方法包括:
[0005]获取待查询的查询词,并确定所述查询词的首字符以及尾字符;
[0006]在预设字典树中查找所述尾字符对应的第二目标节点以及与所述首字符相同的字符所对应的第一目标节点;
[0007]获取所述预设字典树中根节点到所述第一目标节点之间各节点对应的第一字符,以及所述第二目标节点到对应叶子节点之间各节点对应的第二字符;
[0008]根据所述第一字符组合得到前缀字符,根据所述第二字符组合得到后缀字符,根据所述前缀字符以及后缀字符,输出查询结果。
[0009]在本专利技术一些实施例中,所述根据所述前缀字符以及后缀字符,输出查询结果包括:
[0010]将所述前缀字符与所述查询词进行组合,得到目标查询词;
[0011]在所述预设字典树中,从所述根节点开始,依次对所述目标查询词的各个字符进行匹配,得到所述目标查询词的尾字符对应的第三目标节点;
[0012]获取所述第三目标节点到对应叶子节点之间各节点对应的第三字符,根据第三字符组合得到目标字符;
[0013]将所述目标字符与所述目标查询词进行组合,得到第一字符组合,将所述后缀字符与所述查询词组合,得到第二字符组合;
[0014]根据所述第一字符组合以及所述第二字符组合,输出查询结果。
[0015]在本专利技术一些实施例中,所述根据所述第一字符组合以及所述第二字符组合,输出查询结果包括:
[0016]获取所述第一字符组合对应的热度以及所述第二字符组合对应的热度;
[0017]根据所述第一字符组合对应的热度,计算所述第一字符组合对应的权重,以及根据所述第二字符组合对应的热度,计算所述第二字符组合对应的权重;
[0018]根据所述第一字符组合对应的权重,以及所述第二字符组合对应的权重,输出查询结果。
[0019]在本专利技术一些实施例中,所述在预设字典树中查找所述尾字符对应的第二目标节点以及与所述首字符相同的字符所对应的第一目标节点步骤之前,所述方法包括:
[0020]获取预设词典数据库中各样本字符组合以及各所述样本字符组合对应的初始热度;
[0021]构建初始字典树,并根据各所述样本字符组合中各字符的顺序,确定所述初始字典树中的字符分支以及字符分支中的各节点;
[0022]针对每个所述字符分支对应的样本字符组合,将该样本字符组合的初始热度存储至该字符分支上该样本字符组合的尾字符对应的节点,以得到预设字典树。
[0023]在本专利技术一些实施例中,所述获取预设词典数据库中各所述样本字符组合对应的初始热度的包括:
[0024]统计预设词典数据库中各样本字符组合的出现次数;
[0025]根据字符组合的出现次数,得到所述字符组合的统计特征,将所述统计特征设置为所述字符组合对应的初始热度;所述统计特征包括均值、方差、期望中的一种。
[0026]在本专利技术一些实施例中,所述将该样本字符组合的初始热度存储至该字符分支上该样本字符组合的尾字符对应的节点,以得到预设字典树之后,所述方法包括:
[0027]按照预设周期,统计所述预设词典数据库中各所述样本字符组合对应的出现次数
[0028]根据各所述样本字符组合对应的出现次数得到各所述样本字符组合对应新的统计特征;
[0029]若所述新的统计特征大于或等于预设统计特征阈值,则根据所述新的统计特征更新所述预设字典树中所述样本字符组合对应的初始热度;
[0030]若所述新的统计特征小于预设统计特征阈值,则将所述预设字典树中所述新的统计特征对应的所述样本字符组合对应的字符分支移除。
[0031]在本专利技术一些实施例中,所述将该样本字符组合的初始热度存储至该字符分支上该样本字符组合的尾字符对应的节点,以得到预设字典树之后,所述方法包括:
[0032]按照预设周期,统计所述预设词典数据库中新增字符组合;
[0033]根据所述新增字符组合中各字符的顺序,从所述预设字典树中根节点开始,依次对所述新增字符组合的各个字符进行匹配,检测所述预设字典树中是否存在与所述新增字符组合中字符匹配的匹配样本字符组合;
[0034]若存在所述匹配样本字符组合,则从所述匹配样本字符组合中确定出字符数匹配最多的目标样本字符组合,根据所述目标样本字符组合与所述新增字符组合的差异字符,在所述目标样本字符组合与所述新增字符组合的最后一个匹配字符对应的节点下,增加与所述差异字符对应的目标节点,形成新增字符分支;
[0035]若不存在所述匹配样本字符组合,则根据所述新增字符组合中各字符的顺序,确定所述预设字典树中所述新增字符组合对应的新增字符分支以及所述新增字符分支中的各节点。
[0036]在本专利技术一些实施例中,所述在预设字典树中查找所述尾字符对应的第二目标节点以及与所述首字符相同的字符所对应的第一目标节点包括:
[0037]将所述首字符与预设字典树中各节点的字符进行匹配,得到所述预设字典树中与所述首字符相同的字符,将与所述首字符相同的字符对应的节点设置为第一目标节点;
[0038]在所述预设字典树中,从所述根节点开始,依次对所述查询词的各个字符进行匹配,得到所述查询词的尾字符对应的第二目标节点。
[0039]另一方面,本专利技术实施提供一种数据查询装置,所述数据查询装置包括:
[0040]查询词获取模块,用于获取待查询的查询词,并确定所述查询词的首字符以及尾字符;
[0041]节点确定模块,用于在预设字典树中查找所述尾字符对应的第二目标节点以及与所述首字符相同的字符所对应的第一目标节点;
[0042]字符记录模块,用于读取所述预设字典树中根节点到所述第一目标节点之间各节点对应的第一字符,以及所述第二目标节点到对应叶子节点之间各节点对应的第二字符;
[0043]输出模块,用于根据所述第一字符组合得到前缀字符,根据所述第二字符组合得到后缀字符,根据所述前缀字符以及后缀字符,输出查询结果。
[0044]另一方面,本专利技术实施例提供一种数据查询设备,包括存储器和处理器;所述存储器存储有应用程序,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据查询方法,其特征在于,所述方法包括:获取待查询的查询词,并确定所述查询词的首字符以及尾字符;在预设字典树中查找所述尾字符对应的第二目标节点以及与所述首字符相同的字符所对应的第一目标节点;获取所述预设字典树中根节点到所述第一目标节点之间各节点对应的第一字符,以及所述第二目标节点到对应叶子节点之间各节点对应的第二字符;根据所述第一字符组合得到前缀字符,根据所述第二字符组合得到后缀字符,根据所述前缀字符以及后缀字符,输出查询结果。2.如权利要求1所述的数据查询方法,其特征在于,所述根据所述前缀字符以及后缀字符,输出查询结果包括:将所述前缀字符与所述查询词进行组合,得到目标查询词;在所述预设字典树中,从所述根节点开始,依次对所述目标查询词的各个字符进行匹配,得到所述目标查询词的尾字符对应的第三目标节点;获取所述第三目标节点到对应叶子节点之间各节点对应的第三字符,根据第三字符组合得到目标字符;将所述目标字符与所述目标查询词进行组合,得到第一字符组合,将所述后缀字符与所述查询词组合,得到第二字符组合;根据所述第一字符组合以及所述第二字符组合,输出查询结果。3.如权利要求2所述的数据查询方法,其特征在于,所述根据所述第一字符组合以及所述第二字符组合,输出查询结果包括:获取所述第一字符组合对应的热度以及所述第二字符组合对应的热度;根据所述第一字符组合对应的热度,计算所述第一字符组合对应的权重,以及根据所述第二字符组合对应的热度,计算所述第二字符组合对应的权重;根据所述第一字符组合对应的权重,以及所述第二字符组合对应的权重,输出查询结果。4.如权利要求1至3任一项所述的数据查询方法,其特征在于,所述在预设字典树中查找所述尾字符对应的第二目标节点以及与所述首字符相同的字符所对应的第一目标节点步骤之前,所述方法包括:获取预设词典数据库中各样本字符组合以及各所述样本字符组合对应的初始热度;构建初始字典树,并根据各所述样本字符组合中各字符的顺序,确定所述初始字典树中的字符分支以及字符分支中的各节点;每个所述字符分支中的节点构成一个样本字符组合;针对每个所述字符分支对应的样本字符组合,将该样本字符组合的初始热度存储至该字符分支上该样本字符组合的尾字符对应的节点,以得到预设字典树。5.如权利要求4所述的数据查询方法,其特征在于,所述获取预设词典数据库中各所述样本字符组合对应的初始热度的包括:统计预设词典数据库中各样本字符组合的出现次数;根据字符组合的出现次数,得到所述字符组合的统计特征,将所述统计特征设置为所述字符组合对应的初始热度;所述统计特征包括均值、方差、期望中的至少一种。
6.如权利要求4所述的数据查询方法,其特征在于,所述将该样本字符组合的初始热度存储至该字符分支上该样本字符组合的尾字符对应的节点,以得到预设字典树之后,所述方法包括:按照预设周期,统计所述预设词典数据库中各所述样本字符组...

【专利技术属性】
技术研发人员:李博涵曾庆维陈桓
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1