联想词确定方法、装置、存储介质和电子设备制造方法及图纸

技术编号:26730160 阅读:22 留言:0更新日期:2020-12-15 14:30
本申请的联想词确定方法、装置、存储介质和电子设备,首先获取用户输入的搜索词,从目标数据库中查询包含搜索词的组合信息,其中目标数据库中存储有每条检索数据对应的组合信息,每条检索数据的组合信息由该检索数据中至少两个分词词语任意组合得到;从包含搜索词的组合信息中选择目标组合信息,将目标组合信息作为搜索词的联想词进行输出。由于将检索数据中的分词词语进行任意组合,可以得到多种组合信息,使目标数据库中存储的数据包括各个分词词语的任意组合顺序,当用户输入搜索词时,不限制用户输入的搜索词在其想要搜索的文本中的位置,当输入文本中间位置的搜索词时,也能通过前缀匹配获得到用户想要搜索的文本,提高用户的搜索体验。

【技术实现步骤摘要】
联想词确定方法、装置、存储介质和电子设备
本申请涉及计算机
,更具体地说,涉及一种联想词确定方法、装置、存储介质和电子设备。
技术介绍
如今,随着信息技术的发展,更多的人选择通过网络搜索自己关注的内容。现有的大多数搜索系统中,在用户输入搜索词时,会给出智能提示,例如提示与搜索词相关的联想词。目前,搜索系统在查询搜索词的联想词时,通常采用前缀查询,即查询以搜索词为前缀的联想词。当用户输入某个搜索词后,搜索系统查询到的以该搜索词为前缀的联想词中可能不包括用户所关注的内容,导致不能匹配到用户想要搜索的内容。
技术实现思路
为解决现有的前缀查询存在的不能匹配到用户想要搜索的内容的技术问题,本申请实施例提供一种联想词确定方法、装置、存储介质和电子设备,有利于匹配到用户想要搜索的文本。为达到上述目的,本申请实施例的技术方案是这样实现的:第一方面,本申请实施例提供一种联想词确定方法,包括:获取用户输入的搜索词;从目标数据库中查询包含所述搜索词的组合信息;其中,所述目标数据库用于存储每条检索数据对应的组合信息,所述每条检索数据对应的组合信息通过将所述每条检索数据中至少两个相邻的分词进行任意组合得到;从包含所述搜索词的组合信息中选择目标组合信息,将所述目标组合信息作为所述搜索词的联想词进行输出。在一种可选的实施例中,所述目标数据库的构建过程,包括:针对设定的每条检索数据,对所述每条检索数据进行分词处理,并将得到的分词词语中至少两个分词词语进行任意组合,得到所述每条检索数据对应的组合信息;将所述每条检索数据的组合信息进行保存,得到所述目标数据库。在一种可选的实施例中,所述目标数据库中还存储有所述每条检索数据的上下文,所述每条检索数据的上下文包括所述每条检索数据中的每个文字;获取用户输入的搜索词之后,所述方法还包括:从所述目标数据库中查询包含所述搜索词中的设定位置的文字的目标上下文;确定所述目标上下文对应的候选检索数据;所述从目标数据库中查询包含所述搜索词的组合信息,包括:在所述候选检索数据对应的组合信息中查询包含所述搜索词的组合信息。在一种可选的实施例中,所述目标数据库的构建过程,还包括:针对所述目标数据库中设定的每条检索数据,采用标准分词器对所述每条检索数据进行分词处理,得到所述每条检索数据的每个文字;根据所述每条检索数据的每个文字生成所述每条检索数据的上下文,将所述每条检索数据与所述每条检索数据的上下文对应保存在所述目标数据库中。在一种可选的实施例中,所述方法还包括:当所述搜索词的长度小于预设值时,在词语推荐库中查找所述搜索词;其中,所述词语推荐库由第一设定分词器对所述每条检索数据进行分词处理后,通过倒排索引的方式将得到的多个分词词语进行存储得到;若在所述词语推荐库中未查找到所述搜索词,确定所述词语推荐库中保存的每个分词词语与所述搜索词的相似度,根据所述每个分词词语与所述搜索词的相似度,确定并输出所述搜索词对应的推荐词语。在一种可选的实施例中,所述方法还包括:当所述搜索词的长度不小于所述预设值时,在短语推荐库中查找所述搜索词;其中,所述短语推荐库由第二设定分词器对所述每条检索数据进行分词处理后,通过倒排索引的方式将得到的多个分词词语进行存储得到;若在所述短语推荐库中未查找到所述搜索词,确定所述短语推荐库中保存的每个分词词语与所述搜索词的相似度,根据所述每个分词词语与所述搜索词的相似度,确定并输出所述搜索词对应的推荐词语。在一种可选的实施例中,从包含所述搜索词的组合信息中选择目标组合信息,包括:根据包含所述搜索词的组合信息中各个组合信息的词频或者权重,从包含所述搜索词的组合信息中选择所述目标组合信息。第二方面,本申请实施例提供一种联想词确定装置,包括:获取单元,用于获取用户输入的搜索词;组合信息查询单元,用于从目标数据库中查询包含所述搜索词的组合信息;其中,所述目标数据库用于存储每条检索数据对应的组合信息,所述每条检索数据对应的组合信息通过将所述每条检索数据中至少两个分词词语进行任意组合得到;输出单元,用于从包含所述搜索词的组合信息中选择目标组合信息,将所述目标组合信息作为所述搜索词的联想词进行输出。第三方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现第一方面的联想词确定方法。第四方面,本申请实施例还提供一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器实现第一方面的联想词确定方法。本申请实施例的联想词确定方法、装置、存储介质和电子设备,首先获取用户输入的搜索词,从目标数据库中查询包含搜索词的组合信息,然后从包含搜索词的标组合信息中选择目标组合信息,将目标组合信息作为搜索词的联想词进行输出。其中的目标数据库中存储有每条检索数据对应的组合信息,每条检索数据的组合信息由该条检索数据中至少两个分词词语任意组合得到。由于将每条检索数据中的分词词语进行任意组合,可以得到多种组合信息,使目标数据库中存储的数据包括各个分词词语的任意组合顺序,当用户输入搜索词时,不限制用户输入的搜索词在其想要搜索的文本中的位置,当输入文本中间位置的搜索词时,也可以通过前缀匹配获得用户想要搜索的文本。因此,本申请实施例有利于匹配到用户想要搜索的文本,提高用户的搜索体验。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种联想词确定方法的流程图;图2为本申请实施例提供的另一种联想词确定方法的流程图;图3为本申请实施例提供的一种联想词确定装置的结构示意图;图4为本申请实施例提供的另一种联想词确定装置的结构示意图;图5为本申请实施例提供的一种电子设备的结构示意图。具体实施方式为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。文中的术语“第一”、“第二”仅用于描述目的,而不能理解为明示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。为了解决现有技术中不能匹配到用户想要搜索的文本,导致用户的本文档来自技高网...

【技术保护点】
1.一种联想词确定方法,其特征在于,包括:/n获取用户输入的搜索词;/n从目标数据库中查询包含所述搜索词的组合信息;其中,所述目标数据库用于存储每条检索数据对应的组合信息,所述每条检索数据对应的组合信息通过将所述每条检索数据中至少两个分词词语进行任意组合得到;/n从包含所述搜索词的组合信息中选择目标组合信息,将所述目标组合信息作为所述搜索词的联想词进行输出。/n

【技术特征摘要】
1.一种联想词确定方法,其特征在于,包括:
获取用户输入的搜索词;
从目标数据库中查询包含所述搜索词的组合信息;其中,所述目标数据库用于存储每条检索数据对应的组合信息,所述每条检索数据对应的组合信息通过将所述每条检索数据中至少两个分词词语进行任意组合得到;
从包含所述搜索词的组合信息中选择目标组合信息,将所述目标组合信息作为所述搜索词的联想词进行输出。


2.根据权利要求1所述的方法,其特征在于,所述目标数据库的构建过程,包括:
针对设定的每条检索数据,对所述每条检索数据进行分词处理,并将得到的分词词语中至少两个分词词语进行任意组合,得到所述每条检索数据对应的组合信息;
将所述每条检索数据的组合信息进行保存,得到所述目标数据库。


3.根据权利要求2所述的方法,其特征在于,所述目标数据库中还存储有所述每条检索数据的上下文,所述每条检索数据的上下文包括所述每条检索数据中的每个文字;获取用户输入的搜索词之后,所述方法还包括:
从所述目标数据库中查询包含所述搜索词中的设定位置的文字的目标上下文;
确定所述目标上下文对应的候选检索数据;
所述从目标数据库中查询包含所述搜索词的组合信息,包括:
在所述候选检索数据对应的组合信息中查询包含所述搜索词的组合信息。


4.根据权利要求3所述的方法,其特征在于,所述目标数据库的构建过程,还包括:
针对所述目标数据库中设定的每条检索数据,采用标准分词器对所述每条检索数据进行分词处理,得到所述每条检索数据的每个文字;
根据所述每条检索数据的每个文字生成所述每条检索数据的上下文,将所述每条检索数据与所述每条检索数据的上下文对应保存在所述目标数据库中。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述搜索词的长度小于预设值时,在词语推荐库中查找所述搜索词;其中,所述词语推荐库由第一设定分词器对所述每条检索数据进行分词处理后,通过倒排索引的方式将...

【专利技术属性】
技术研发人员:朱红全刘坤叶林林程滇倪
申请(专利权)人:珠海格力电器股份有限公司珠海联云科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1