提供搜索联想词的方法、装置、存储介质及电子设备制造方法及图纸

技术编号:21628902 阅读:31 留言:0更新日期:2019-07-17 11:04
本公开涉及一种提供搜索联想词的方法、提供搜索联想词的装置、计算机可读存储介质及电子设备。本公开实施例中的提供搜索联想词的方法包括:从搜索词数据库中获取搜索词,并获取用于联想所述搜索词的至少一个搜索字符串;建立所述搜索词与所述搜索字符串之间的关联索引,并计算所述关联索引的排序分数Sp;从所述搜索词数据库中获取与一目标搜索字符串存在关联索引关系的至少一个备选搜索词;将所述备选搜索词按照所述排序分数Sp进行排序,并将有序排列的所述备选搜索词作为所述目标搜索字符串的搜索联想词。该方法不仅提高了搜索词联想功能的开发效率,降低了搜索词联想功能的开发成本,而且具有普遍适用性强、通用性好等有益效果。

Provide methods, devices, storage media and electronic devices for searching associative words

【技术实现步骤摘要】
提供搜索联想词的方法、装置、存储介质及电子设备
本公开涉及计算机
,具体涉及一种提供搜索联想词的方法、提供搜索联想词的装置、计算机可读存储介质及电子设备。
技术介绍
搜索引擎可以根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户。当用户使用搜索引擎提供的检索服务时,搜索引擎可以根据用户在搜索输入框内输入的内容给出联想词补全或提示,联想词通常可以在搜索输入框的下方以下拉框列表的方式显示。这种提供联想词的方式既能辅助用户搜索,提高搜索效率,另外也能起到一定的流量分发作用。联想词提供功能也已成为各种专业搜索引擎(例如google、百度等)以及大型垂直搜索引擎(例如淘宝搜索、**搜索等)的标配产品。现有的搜索引擎通常是由专门的搜索团队基于已有业务数据或者搜索数据进行排期开发,或者通过技术外包排期开发。这种开发方式普遍存在开发周期长、开发效率低的问题,而且针对同类数据容易出现重复开发、资源浪费的情况。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种提供搜索联想词的方法、提供搜索联想词的装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的搜索联想词提供功能开发周期长、开发效率低等技术问题。根据本公开的一个方面,提供一种提供搜索联想词的方法,其特殊之处在于,包括:从搜索词数据库中获取搜索词,并获取用于联想所述搜索词的至少一个搜索字符串;建立所述搜索词与所述搜索字符串之间的关联索引,并计算所述关联索引的排序分数Sp;从所述搜索词数据库中获取与一目标搜索字符串存在关联索引关系的至少一个备选搜索词;将所述备选搜索词按照所述排序分数Sp进行排序,并将有序排列的所述备选搜索词作为所述目标搜索字符串的搜索联想词。在本公开的一种示例性实施方式中,所述计算所述关联索引的排序分数Sp,包括:根据所述搜索词与所述搜索字符串的关联程度,计算所述关联索引的相关度分数Sx;根据所述相关度分数Sx计算所述关联索引的排序分数Sp。在本公开的一种示例性实施方式中,所述计算所述关联索引的相关度分数Sx,包括:分别获取所述搜索词的词向量以及所述搜索字符串的词向量;计算所述搜索词的词向量与所述搜索字符串的词向量之间的向量距离,并将所述向量距离作为所述关联索引的相关度分数Sx。在本公开的一种示例性实施方式中,分别获取所述搜索词的词向量以及所述搜索字符串的词向量,包括:获取所述搜索词以及所述搜索字符串在训练语料库中的上下文词语;以所述上下文词语作为输入数据,利用神经网络算法分别训练得到所述搜索词的词向量以及所述搜索字符串的词向量。在本公开的一种示例性实施方式中,所述根据所述相关度分数Sx计算所述关联索引的排序分数Sp,包括:利用预设搜索接口获取所述搜索词的搜索结果数;根据所述搜索结果数计算所述搜索词的质量分数Sz;根据所述质量分数Sz和所述相关度分数Sx计算所述关联索引的排序分数Sp。在本公开的一种示例性实施方式中,在根据所述质量分数Sz和所述相关度分数Sx计算所述关联索引的排序分数Sp之前,所述根据所述相关度分数Sx计算所述关联索引的排序分数Sp还包括:对所述质量分数Sz做归一化处理。在本公开的一种示例性实施方式中,所述根据所述质量分数Sz和所述相关度分数Sx计算所述关联索引的排序分数Sp,包括:根据公式Sp=Sz*a+Sx*b计算所述排序分数Sp;其中,Sz为所述质量分数,Sx为所述相关度分数,a为第一预设系数,b为第二预设系数。在本公开的一种示例性实施方式中,所述第一预设系数为0.6,所述第二预设系数为0.4。在本公开的一种示例性实施方式中,所述从搜索词数据库中获取搜索词,包括:获取与搜索对象的基本信息相关的基本信息数据库,以所述基本信息数据库作为所述搜索词数据库;从所述基本信息数据库中获取所述搜索词。在本公开的一种示例性实施方式中,所述从所述基本信息数据库中获取所述搜索词,包括:从所述基本信息数据库中读取数据,并对所述数据进行分词处理;对分词处理后的所述数据进行归一化清洗,得到所述搜索词。在本公开的一种示例性实施方式中,所述根据所述搜索结果数计算所述搜索词的质量分数Sz,包括:统计所述搜索词在所述基本信息数据库中的词频;根据所述词频和所述搜索结果数计算所述搜索词的质量分数Sz。在本公开的一种示例性实施方式中,所述从搜索词数据库中获取搜索词,包括:获取与搜索对象的历史搜索信息相关的历史搜索数据库,以所述历史搜索数据库作为所述搜索词数据库;从所述历史搜索数据库中获取所述搜索词。在本公开的一种示例性实施方式中,所述从所述历史搜索数据库中获取所述搜索词,包括:从所述历史搜索数据库中读取数据;对所述数据进行归一化清洗,得到所述搜索词。在本公开的一种示例性实施方式中,所述获取与搜索对象的历史搜索信息相关的历史搜索数据库,包括:获取所述搜索对象的平均搜索量;根据所述平均搜索量计算所述搜索对象的数据提取周期;获取所述搜索对象在所述数据提取周期内的历史搜索信息,以形成所述历史搜索数据库。在本公开的一种示例性实施方式中,所述根据所述搜索结果数计算所述搜索词的质量分数Sz,包括:统计所述搜索词在所述历史搜索数据库中的搜索量;根据所述搜索量和所述搜索结果数计算所述搜索词的质量分数Sz。根据本公开的一个方面,提供一种提供搜索联想词的装置,其特殊之处在于,包括:第一获取模块,被配置为从搜索词数据库中获取搜索词,并获取用于联想所述搜索词的至少一个搜索字符串;索引模块,被配置为建立所述搜索词与所述搜索字符串之间的关联索引,并计算所述关联索引的排序分数Sp;第二获取模块,被配置为从所述搜索词数据库中获取与一目标搜索字符串存在关联索引关系的至少一个备选搜索词;排序模块,被配置为将所述备选搜索词按照所述排序分数Sp进行排序,并将有序排列的所述备选搜索词作为所述目标搜索字符串的搜索联想词。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特殊之处在于,所述计算机程序被处理器执行时实现以上任一所述的提供搜索联想词的方法。根据本公开的一个方面,提供一种电子设备,其特殊之处在于,包括处理器和存储器;其中,存储器用于存储所述处理器的可执行指令,所述处理器被配置为经由执行所述可执行指令来执行以上任一所述的提供搜索联想词的方法。在本公开实施例中,基于搜索词数据库可以建立搜索词与搜索字符串之间的关联索引,并可以计算各个关联索引的排序分数以对其进行排序,从而为用户提供按照关联程度进行排列的联想词。这种提供联想词的方法可以快捷便利地从复杂多样的业务数据或者搜索词数据中提取出搜索词的联想关系,不仅提高了搜索词联想功能的开发效率,降低了搜索词联想功能的开发成本,而且具有普遍适用性强、通用性好等有益效果。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附本文档来自技高网...

【技术保护点】
1.一种提供搜索联想词的方法,其特征在于,包括:从搜索词数据库中获取搜索词,并获取用于联想所述搜索词的至少一个搜索字符串;建立所述搜索词与所述搜索字符串之间的关联索引,并计算所述关联索引的排序分数Sp;从所述搜索词数据库中获取与一目标搜索字符串存在关联索引关系的至少一个备选搜索词;将所述备选搜索词按照所述排序分数Sp进行排序,并将有序排列的所述备选搜索词作为所述目标搜索字符串的搜索联想词。

【技术特征摘要】
1.一种提供搜索联想词的方法,其特征在于,包括:从搜索词数据库中获取搜索词,并获取用于联想所述搜索词的至少一个搜索字符串;建立所述搜索词与所述搜索字符串之间的关联索引,并计算所述关联索引的排序分数Sp;从所述搜索词数据库中获取与一目标搜索字符串存在关联索引关系的至少一个备选搜索词;将所述备选搜索词按照所述排序分数Sp进行排序,并将有序排列的所述备选搜索词作为所述目标搜索字符串的搜索联想词。2.根据权利要求1所述的提供搜索联想词的方法,其特征在于,所述计算所述关联索引的排序分数Sp,包括:根据所述搜索词与所述搜索字符串的关联程度,计算所述关联索引的相关度分数Sx;根据所述相关度分数Sx计算所述关联索引的排序分数Sp。3.根据权利要求2所述的提供搜索联想词的方法,其特征在于,所述计算所述关联索引的相关度分数Sx,包括:分别获取所述搜索词的词向量以及所述搜索字符串的词向量;计算所述搜索词的词向量与所述搜索字符串的词向量之间的向量距离,并将所述向量距离作为所述关联索引的相关度分数Sx。4.根据权利要求3所述的提供搜索联想词的方法,其特征在于,分别获取所述搜索词的词向量以及所述搜索字符串的词向量,包括:获取所述搜索词以及所述搜索字符串在训练语料库中的上下文词语;以所述上下文词语作为输入数据,利用神经网络算法分别训练得到所述搜索词的词向量以及所述搜索字符串的词向量。5.根据权利要求2所述的提供搜索联想词的方法,其特征在于,所述根据所述相关度分数Sx计算所述关联索引的排序分数Sp,包括:利用预设搜索接口获取所述搜索词的搜索结果数;根据所述搜索结果数计算所述搜索词的质量分数Sz;根据所述质量分数Sz和所述相关度分数Sx计算所述关联索引的排序分数Sp。6.根据权利要求5所述的提供搜索联想词的方法,其特征在于,在根据所述质量分数Sz和所述相关度分数Sx计算所述关联索引的排序分数Sp之前,所述根据所述相关度分数Sx计算所述关联索引的排序分数Sp还包括:对所述质量分数Sz做归一化处理。7.根据权利要求5所述的提供搜索联想词的方法,其特征在于,所述根据所述质量分数Sz和所述相关度分数Sx计算所述关联索引的排序分数Sp,包括:根据公式Sp=Sz*a+Sx*b计算所述排序分数Sp;其中,Sz为所述质量分数,Sx为所述相关度分数,a为第一预设系数,b为第二预设系数。8.根据权利要求7所述的提供搜索联想词的方法,其特征在于,所述第一预设系数为0.6,所述第二预设系数为0.4。9.根据权利要求5所述的提供搜索联想词的方法,其特征在于,所述从搜索词数据库中获取搜索词,包括:获取与搜索对象的基本信息相关的基本信息数据库,以所述基本信息数...

【专利技术属性】
技术研发人员:郑海贵邵荣防郝晖欧阳硕
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1