联想词确定方法、装置、存储介质和电子设备制造方法及图纸

技术编号:26730160 阅读:36 留言:0更新日期:2020-12-15 14:30
本申请的联想词确定方法、装置、存储介质和电子设备,首先获取用户输入的搜索词,从目标数据库中查询包含搜索词的组合信息,其中目标数据库中存储有每条检索数据对应的组合信息,每条检索数据的组合信息由该检索数据中至少两个分词词语任意组合得到;从包含搜索词的组合信息中选择目标组合信息,将目标组合信息作为搜索词的联想词进行输出。由于将检索数据中的分词词语进行任意组合,可以得到多种组合信息,使目标数据库中存储的数据包括各个分词词语的任意组合顺序,当用户输入搜索词时,不限制用户输入的搜索词在其想要搜索的文本中的位置,当输入文本中间位置的搜索词时,也能通过前缀匹配获得到用户想要搜索的文本,提高用户的搜索体验。

【技术实现步骤摘要】
联想词确定方法、装置、存储介质和电子设备
本申请涉及计算机
,更具体地说,涉及一种联想词确定方法、装置、存储介质和电子设备。
技术介绍
如今,随着信息技术的发展,更多的人选择通过网络搜索自己关注的内容。现有的大多数搜索系统中,在用户输入搜索词时,会给出智能提示,例如提示与搜索词相关的联想词。目前,搜索系统在查询搜索词的联想词时,通常采用前缀查询,即查询以搜索词为前缀的联想词。当用户输入某个搜索词后,搜索系统查询到的以该搜索词为前缀的联想词中可能不包括用户所关注的内容,导致不能匹配到用户想要搜索的内容。
技术实现思路
为解决现有的前缀查询存在的不能匹配到用户想要搜索的内容的技术问题,本申请实施例提供一种联想词确定方法、装置、存储介质和电子设备,有利于匹配到用户想要搜索的文本。为达到上述目的,本申请实施例的技术方案是这样实现的:第一方面,本申请实施例提供一种联想词确定方法,包括:获取用户输入的搜索词;从目标数据库中查询包含所述搜索词的组合信息;其中,所述目标数据库用于存储每条检索数据本文档来自技高网...

【技术保护点】
1.一种联想词确定方法,其特征在于,包括:/n获取用户输入的搜索词;/n从目标数据库中查询包含所述搜索词的组合信息;其中,所述目标数据库用于存储每条检索数据对应的组合信息,所述每条检索数据对应的组合信息通过将所述每条检索数据中至少两个分词词语进行任意组合得到;/n从包含所述搜索词的组合信息中选择目标组合信息,将所述目标组合信息作为所述搜索词的联想词进行输出。/n

【技术特征摘要】
1.一种联想词确定方法,其特征在于,包括:
获取用户输入的搜索词;
从目标数据库中查询包含所述搜索词的组合信息;其中,所述目标数据库用于存储每条检索数据对应的组合信息,所述每条检索数据对应的组合信息通过将所述每条检索数据中至少两个分词词语进行任意组合得到;
从包含所述搜索词的组合信息中选择目标组合信息,将所述目标组合信息作为所述搜索词的联想词进行输出。


2.根据权利要求1所述的方法,其特征在于,所述目标数据库的构建过程,包括:
针对设定的每条检索数据,对所述每条检索数据进行分词处理,并将得到的分词词语中至少两个分词词语进行任意组合,得到所述每条检索数据对应的组合信息;
将所述每条检索数据的组合信息进行保存,得到所述目标数据库。


3.根据权利要求2所述的方法,其特征在于,所述目标数据库中还存储有所述每条检索数据的上下文,所述每条检索数据的上下文包括所述每条检索数据中的每个文字;获取用户输入的搜索词之后,所述方法还包括:
从所述目标数据库中查询包含所述搜索词中的设定位置的文字的目标上下文;
确定所述目标上下文对应的候选检索数据;
所述从目标数据库中查询包含所述搜索词的组合信息,包括:
在所述候选检索数据对应的组合信息中查询包含所述搜索词的组合信息。


4.根据权利要求3所述的方法,其特征在于,所述目标数据库的构建过程,还包括:
针对所述目标数据库中设定的每条检索数据,采用标准分词器对所述每条检索数据进行分词处理,得到所述每条检索数据的每个文字;
根据所述每条检索数据的每个文字生成所述每条检索数据的上下文,将所述每条检索数据与所述每条检索数据的上下文对应保存在所述目标数据库中。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述搜索词的长度小于预设值时,在词语推荐库中查找所述搜索词;其中,所述词语推荐库由第一设定分词器对所述每条检索数据进行分词处理后,通过倒排索引的方式将...

【专利技术属性】
技术研发人员:朱红全刘坤叶林林程滇倪
申请(专利权)人:珠海格力电器股份有限公司珠海联云科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1