一种搜索词的处理方法、装置及计算机可读存储介质制造方法及图纸

技术编号:21629081 阅读:23 留言:0更新日期:2019-07-17 11:08
本发明专利技术公开了一种搜索词的处理方法、装置及计算机可读存储介质。其中,方法包括:获取输入的搜索串;所述搜索串包含至少两个关键词;确定所述搜索串中每个关键词的词性;利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词;获取所述焦点关键词的扩展关键词;并确定所述焦点关键词及扩展关键词的权重;所述焦点关键词的权重高于所述搜索串中的其它关键词的权重,且高于所述扩展关键词的权重;利用确定的各关键词的权重、所述搜索串的各关键词以及扩展关键词,生成检索串;所述检索串用于对数据库进行检索,获取在数据库进行检索后的检索结果。

A Method, Device and Computer Readable Storage Media for Searching Words

【技术实现步骤摘要】
一种搜索词的处理方法、装置及计算机可读存储介质
本专利技术涉及智能问答搜索
,尤其涉及搜索词的处理方法、装置及计算机可读存储介质。
技术介绍
目前大部分搜索引擎的搜索方式是用户向搜索引擎提交查询串,搜索引擎返回一系列与用户提交的查询相关的结果,用户在结果中寻找符合自身需求的信息。因此,搜索引擎需要通过用户提交的查询串去理解用户的真实需求。为了更好地理解用户意图,让搜索结果更加准确,对搜索查询串进行优化处理是信息检索领域中的一个基本问题。目前,搜索查询串进行优化处理的解决方案主要包括:对搜索查询串进行关键词扩展;对搜索查询串中关键词进行权重调整;对搜索查询串中关键词扩展结合权重调整。然而,这些方案中有些方案的检索精度较差,有些方案的检索结果不能够真正代表用户的查询意图。
技术实现思路
为解决现有存在的技术问题,本专利技术实施例提供一种搜索词的处理方法、装置及计算机可读存储介质。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供了一种搜索词的处理方法,包括:获取输入的搜索串;所述搜索串包含至少两个关键词;确定所述搜索串中每个关键词的词性;利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词;获取所述焦点关键词的扩展关键词;并确定所述焦点关键词及扩展关键词的权重;所述焦点关键词的权重高于所述搜索串中的其它关键词的权重,且高于所述扩展关键词的权重;利用确定的各关键词的权重、所述搜索串的各关键词以及扩展关键词,生成检索串;所述检索串用于对数据库进行检索,获取在数据库进行检索后的检索结果。上述方案中,确定所述搜索串中每个关键词的词性,包括:确定所述搜索串中每个关键词的词性为动词、或为名词、或为数量词。上述方案中,所述利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词,包括:利用确定的每个关键词的词性,确定所述搜索串所形成的短语结构类型;利用确定的短语结构类型,从所述至少两个关键词中确定焦点关键词。上述方案中,所述利用确定的短语结构类型,从所述至少两个关键词中确定焦点关键词,包括:当短语结构类型为名词结构、或为主谓结构时,从词性为名词的各关键词中确定所述焦点关键词;或者,当短语结构类型为主谓结构,且词性包含数量词时,从词性为名词和数量词的各关键词中确定所述焦点关键词。上述方案中,所述当短语结构类型为主谓结构时,从词性为名词的各关键词中确定所述焦点关键词,包括:将词性为名词,且与词性为动词的关键词形成主谓关系的关键词作为所述焦点关键词。上述方案中,所述当短语结构类型为名词结构时,从词性为名词的各关键词中确定所述焦点关键词,包括:将词性为名词,且在所述搜索串所形成的短语结构中表征主题的关键词作为所述焦点关键词。上述方案中,所述获取所述焦点关键词的扩展关键词,包括:针对每个焦点关键词,依据扩展词的扩展策略,确定对应焦点关键词的一个扩展关键词。上述方案中,所述方法还包括:利用所述检索串和搜索串对所述数据库进行检索;将检索后的检索结果进行打分并按分数高低进行排序;从检索结果中选择分数最高的检索结果作为查询结果。本专利技术实施例还提供了一种搜索词的处理装置,包括:接收单元,用于获取输入的搜索串;所述搜索串包含至少两个关键词;焦点确定单元,用于确定所述搜索串中每个关键词的词性;利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词;扩展及权重确定单元,用于获取所述焦点关键词的扩展关键词;并确定所述焦点关键词及扩展关键词的权重;所述焦点关键词的权重高于所述搜索串中的其它关键词的权重,且高于所述扩展关键词的权重;生成单元,用于利用确定的各关键词的权重、所述搜索串的各关键词以及扩展关键词,生成检索串;所述检索串用于对数据库进行检索,获取在数据库进行检索后的答案。本专利技术实施例又提供了一种搜索词的处理装置,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行:获取输入的搜索串;所述搜索串包含至少两个关键词;确定所述搜索串中每个关键词的词性;利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词;获取所述焦点关键词的扩展关键词;并确定所述焦点关键词及扩展关键词的权重;所述焦点关键词的权重高于所述搜索串中的其它关键词的权重,且高于所述扩展关键词的权重;利用确定的各关键词的权重、所述搜索串的各关键词以及扩展关键词,生成检索串;所述检索串用于对数据库进行检索,获取在数据库进行检索后的答案。上述方案中,所述处理器用于运行所述计算机程序时,执行:确定所述搜索串中每个关键词的词性为动词、或为名词、或为数量词。上述方案中,所述处理器用于运行所述计算机程序时,执行:利用确定的每个关键词的词性,确定所述搜索串所形成的短语结构类型;利用确定的短语结构类型,从所述至少两个关键词中确定焦点关键词。上述方案中,所述处理器用于运行所述计算机程序时,执行:针对每个焦点关键词,依据扩展词的扩展策略,确定对应焦点关键词的一个扩展关键词。上述方案中,所述处理器还用于运行所述计算机程序时,执行:利用所述检索串和搜索串对所述数据库进行检索;将检索后的检索结果进行打分并按分数高低进行排序;从检索结果中选择分数最高的检索结果作为查询结果。本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法的步骤。本专利技术实施例提供的搜索词的处理方法、装置及计算机可读存储介质,获取输入的搜索串;所述搜索串包含至少两个关键词;确定所述搜索串中每个关键词的词性;利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词;获取所述焦点关键词的扩展关键词;并确定所述焦点关键词及扩展关键词的权重;所述焦点关键词的权重高于所述搜索串中的其它关键词的权重,且高于所述扩展关键词的权重;利用确定的各关键词的权重、所述搜索串的各关键词以及扩展关键词,生成检索串;所述检索串用于对数据库进行检索,获取在数据库进行检索后的检索结果。通过确定搜索串中每个关键词的词性,进而确定搜索串中的焦点信息,如此,能够有效识别查询意图;同时,在焦点信息的基础上,通过同义词扩展、词权重调整完成查询语句的改写,采用改写后的查询语句去进行检索,能够明显提升检索精度。附图说明在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相似的部件。附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。图1为本专利技术实施例搜索词的处理方法流程示意图;图2为本专利技术应用实施例搜索查询优化方法流程示意图;图3为本专利技术应用实施例搜索查询优化装置结构示意图;图4为本专利技术实施例搜索词的处理装置结构示意图;图5为本专利技术实施例搜索词的处理装置硬件结构示意图。具体实施方式下面结合附图及实施例对本专利技术再作进一步详细的描述。目前,相关技术中,对搜索查询串进行优化处理的方案主要包括:1、对搜索查询串进行关键词扩展具体地,实际应用中,用户提交的查询请求中的搜索查询串通常都只包含很少的几个关键词,并不能准确、完整地表达用户真正的信息需求,这就会导致搜索引擎经常会返回大量的不相关文档。比如,用户在google输入查询请求“北京旅游”,可以认为用户关心的是旅游景点、旅游线路以及车船住宿等信息;如果按照查询本文档来自技高网...

【技术保护点】
1.一种搜索词的处理方法,其特征在于,所述方法包括:获取输入的搜索串;所述搜索串包含至少两个关键词;确定所述搜索串中每个关键词的词性;利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词;获取所述焦点关键词的扩展关键词;并确定所述焦点关键词及扩展关键词的权重;所述焦点关键词的权重高于所述搜索串中的其它关键词的权重,且高于所述扩展关键词的权重;利用确定的各关键词的权重、所述搜索串的各关键词以及扩展关键词,生成检索串;所述检索串用于对数据库进行检索,获取在数据库进行检索后的检索结果。

【技术特征摘要】
1.一种搜索词的处理方法,其特征在于,所述方法包括:获取输入的搜索串;所述搜索串包含至少两个关键词;确定所述搜索串中每个关键词的词性;利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词;获取所述焦点关键词的扩展关键词;并确定所述焦点关键词及扩展关键词的权重;所述焦点关键词的权重高于所述搜索串中的其它关键词的权重,且高于所述扩展关键词的权重;利用确定的各关键词的权重、所述搜索串的各关键词以及扩展关键词,生成检索串;所述检索串用于对数据库进行检索,获取在数据库进行检索后的检索结果。2.根据权利要求1所述的方法,其特征在于,确定所述搜索串中每个关键词的词性,包括:确定所述搜索串中每个关键词的词性为动词、或为名词、或为数量词。3.根据权利要求1所述的方法,其特征在于,所述利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词,包括:利用确定的每个关键词的词性,确定所述搜索串所形成的短语结构类型;利用确定的短语结构类型,从所述至少两个关键词中确定焦点关键词。4.根据权利要求3所述的方法,其特征在于,所述利用确定的短语结构类型,从所述至少两个关键词中确定焦点关键词,包括:当短语结构类型为名词结构、或为主谓结构时,从词性为名词的各关键词中确定所述焦点关键词;或者,当短语结构类型为主谓结构,且词性包含数量词时,从词性为名词和数量词的各关键词中确定所述焦点关键词。5.根据权利要求4所述的方法,其特征在于,所述当短语结构类型为主谓结构时,从词性为名词的各关键词中确定所述焦点关键词,包括:将词性为名词,且与词性为动词的关键词形成主谓关系的关键词作为所述焦点关键词。6.根据权利要求4所述的方法,其特征在于,所述当短语结构类型为名词结构时,从词性为名词的各关键词中确定所述焦点关键词,包括:将词性为名词,且在所述搜索串所形成的短语结构中表征主题的关键词作为所述焦点关键词。7.根据权利要求1所述的方法,其特征在于,所述获取所述焦点关键词的扩展关键词,包括:针对每个焦点关键词,依据扩展词的扩展策略,确定对应焦点关键词的一个扩展关键词。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用所述检索串和搜索串对所述数据库进行检索;将检索后的检索结果进行打分并按分数高低进行排序;从检索结果中选择分数最高的检索结果作为查询结果。9.一种搜索词的处理装置,其特征在于,所述装...

【专利技术属性】
技术研发人员:段福高冯俊兰胡珉王燕蒙邓路
申请(专利权)人:中国移动通信有限公司研究院中国移动通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1