更准确的搜索词权重确定方法及电子设备技术

技术编号:41912075 阅读:24 留言:0更新日期:2024-07-05 14:14
本申请涉及信息搜索技术的领域,尤其涉及一种更准确的搜索词权重确定方法及电子设备,该方法通过对用户输入搜索引擎的搜索语句进行分词处理得到各搜索词,然后一方面建立相对应的特征识别模型,识别出各搜索词中的重要度识别特征,另一方面建立了重要度模型,根据重要度识别特征以及重要度模型,能够把快速获得各搜索词的权重,根据权重匹配相对应的搜索结果,展示搜索结果,因此,在搜索引擎进行搜索时,能够省时省力,提高搜索效率,快速满足用户意图。

【技术实现步骤摘要】

本申请涉及信息搜索技术的领域,尤其是涉及一种更准确的搜索词权重确定方法及电子设备


技术介绍

1、随着随着互联网技术的发展,网络信息非常巨大。用户需要在海量信息里查找大自己所需的信息是非常困难的,需要采用搜索引擎等技术对用户输入的搜索请求进行匹配。

2、搜索引擎通常会对户输入的搜索语句进行分词,得到若干个搜索词,根据搜索词的权重以及搜索结果与搜索语句的匹配度等信息对得到的搜索结果进行排序,并提供给用户。由于不同用户基于同一查询意图输入的搜索语句存在很大的差异,因此如何精准识别用户提交的搜索语句中的核心词变得尤为重要,其准确性将直接决定最终呈现的搜索结果排序效果。

3、相关技术中,搜索引擎没有对分词结果进行词权重打分,导致分词结果以相同的重要性进入召回、排序流程,增加了非重要词的干扰,不能体现用户输入的真正意图,并且在相关性排序阶段,所有词都以相同的重要性参与计算,与重要词相关性更大的命中结果无法排序在前。

4、因此,针对上述中的相关技术,使用搜索应用进行搜索时,存在搜索结果无法满足用户意图,导致搜索效率较低的缺陷。


技术实现思路

1、为了提高搜索效率从而搜索结果满足用户意图,本申请提供一种更准确的搜索词权重确定方法及电子设备。

2、第一方面,本申请提供的一种更准确的搜索词权重确定方法采用如下的技术方案:

3、一种更准确的搜索词权重确定方法,包括以下步骤:

4、接收搜索语句;

5、对所述搜索语句进行分词处理,得到各搜索词;

6、基于预设规则构建特征识别模型,将各所述搜索词输入所述特征识别

7、模型,得到各搜索词的重要度识别特征;

8、基于预设规则构建重要度模型,将各所述搜索词的重要度识别特征输入所述重要度模型,确定各所述搜索词的权重;

9、根据各所述搜索词的权重,展示搜索结果。

10、通过采用上述技术方案,针对用户输入搜索引擎的搜索语句,先进行分词处理得到各搜索词,然后一方面建立相对应的特征识别模型,识别出各搜索词中的重要度识别特征,另一方面建立了重要度模型,根据重要度识别特征以及重要度模型,能够把快速获得各搜索词的权重,根据权重匹配相对应的搜索结果,展示搜索结果,因此,在搜索引擎进行搜索时,能够省时省力,提高搜索效率,快速满足用户意图。

11、优选的,在将各所述搜索词的重要度识别特征输入所述重要度模型,

12、确定各所述搜索词的权重的具体方法中,包括:

13、基于用户历史搜索记录构建相似搜索词组合数据集,所述相似搜索词组合数据集中的相似搜索词组合为所述用户历史搜索记录中显示同一搜索结果的搜索词组合;

14、提取相似搜索词组合数据集中不同的相似搜索词组合,基于不同的相似搜索词组合,构建相似搜索词组合识别模型;

15、将各所述搜索词输入所述相似搜索词组合识别模型,训练得到搜索词组合数据集;

16、所述搜索词的重要度识别特征包括tf-idf特征,所述tf-idf特征基于所述搜索词组合数据集确定。

17、通过采用上述技术方案,搜索词组合数据集基于用户历史搜索记录构建,并且基于搜索词组合数据集确定tf-idf特征,能够有效确定分词在用户历史搜索记录记录中出现的频次,即搜索词的词频,从而能够有效提高该搜索词对应的搜索结果的搜索效率,省时省力。

18、优选的,在提取相似搜索词组合数据集中不同的相似搜索词组合的具

19、体方法中,包括:

20、根据所述相似搜索词组合数据集中两个不同的相似搜索词组合共同显

21、示同一搜索结果数,确定两个不同的相似搜索词组合的相关度。

22、通过采用上述技术方案,在提取相似搜索词组合数据集中的相似搜索词组合时,通过相似搜索词足额数据集中不同的相似搜索词组合共同显示的同一搜索结果数,能够快速确定两个不同的相似搜索词组合的相关度,从而根据相关度训练相似搜索词组合识别模型,便于快速得到搜索词组合数据集,进一步提高了对搜索词权重判断的准确性,提高搜索的效率,满足用户的意图。

23、优选的,所述重要度识别特征还包括点击特征,所述方法还包括:获取所述搜索词的点击特征。

24、通过采用上述技术方案,在重要度识别特征识别中加入点击特征的识别,能够使重要度识别特征所具有的信息更丰富,从而可进一步提高了对搜索词权重判断的准确性,提高搜索的效率,满足用户的意图。

25、优选的,所述重要度识别特征还包括语言特征,所述方法还包括:获取所述搜索词的语言特征。

26、通过采用上述技术方案,在重要度识别特征识别中加入语言特征的识别,能够使重要度识别特征所具有的信息更丰富,从而可进一步提高了对搜索词权重判断的准确性,提高搜索的效率,满足用户的意图。

27、优选的,所述搜索词的语言特征包括一下任意一项或多项:所述搜索词的词性、所述搜索词的词类信息、所述搜索词的词长度。

28、通过采用上述技术方案,语言特征是搜索词本身的属性,主要包括搜索词的词性、搜索词的词类信息、搜索词的词长度,这些特征类别多而且针对搜索词来说是唯一的,跟上下文有很强的关联性,因此,具有搜索词的词性、搜索词的词类信息、搜索词的词长度中的一项或者多项的搜索词能够进一步提高了对搜索词权重判断的准确性,提高搜索的效率,满足用户的意图。

29、第二方面,本申请提供一种更准确的搜索词权重确定系统,采用如下的技术方案。

30、接收模块,用于接收搜索语句;

31、分词模块,用于对所述搜索语句进行分词处理,得到各搜索词;

32、特征识别模块,用于确定各搜索词的重要度识别特征;所述特征识别模块包括:tf-idf特征单元、点击特征单元和/或语言特征单元;所述tf-idf特征单元用于利用搜索词组合数据集确定所述tf-idf特征;所述点击特征单元用于利用用户历史搜索记录获取所述搜索词的点击特征;所述语言特征单元用于确定所述搜索词的语言特征;

33、权重确定模块,用于确定各所述搜索词的权重。

34、第三方面,本申请提供一种电子设备,采用如下的技术方案。

35、本申请还公开一种电子设备,所述电子设备包括:处理器和存储器;所述存储器与所述处理器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述处理器调用所述计算机指令以使得所述电子设备执行如上述方案中记载的更准确的搜索词权重确定方法。

36、第四方面,本申请提供一种计算机存储介质,采用如下的技术方案。

37、一种计算机存储介质,存储有指令,当所述指令在电子设备上运行时,使得所述电子设备执行如上述方案中记载的更准确的搜索词权重确定方法。

38、综上所述,本申请包括以下至少一种有益技术效果:

39、1.针对用户输入搜索引擎的搜索语句,先本文档来自技高网...

【技术保护点】

1.一种更准确的搜索词权重确定方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的更准确的搜索词权重确定方法,其特征在于:在将各所述搜索词的重要度识别特征输入所述重要度模型,确定各所述搜索词的权重的具体方法中,包括:

3.根据权利要求2所述的更准确的搜索词权重确定方法,其特征在于:在提取相似搜索词组合数据集中不同的相似搜索词组合的具体方法中,包括:

4.根据权利要求2或3任一项所述的更准确的搜索词权重确定方法,其特征在于:所述重要度识别特征还包括点击特征,所述方法还包括:获取所述搜索词的点击特征。

5.根据权利要求2-3任一项所述的更准确的搜索词权重确定方法,其特征在于:所述重要度识别特征还包括语言特征,所述方法还包括:获取所述搜索词的语言特征。

6.根据权利要求5所述的更准确的搜索词权重确定方法,其特征在于:所述搜索词的语言特征包括一下任意一项或多项:所述搜索词的词性、所述搜索词的词类信息、所述搜索词的词长度。

7.一种更准确的搜索词权重确定系统,其特征在于,包括:

8.一种电子设备,其特征在于,所述电子设备包括:处理器(20)和存储器(10);所述存储器(10)与所述处理器(20)耦合,所述存储器(10)用于存储计算机程序代码,所述计算机程序代码包括计算机指令,所述处理器(20)调用所述计算机指令以使得所述电子设备执行如权利要求1-6中任意一项所述的更准确的搜索词权重确定方法。

9.一种计算机存储介质,其特征在于,存储有指令,当所述指令在电子设备上运行时,使得所述电子设备执行如权利要求1-7中任一项所述的更准确的搜索词权重确定方法。

...

【技术特征摘要】

1.一种更准确的搜索词权重确定方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的更准确的搜索词权重确定方法,其特征在于:在将各所述搜索词的重要度识别特征输入所述重要度模型,确定各所述搜索词的权重的具体方法中,包括:

3.根据权利要求2所述的更准确的搜索词权重确定方法,其特征在于:在提取相似搜索词组合数据集中不同的相似搜索词组合的具体方法中,包括:

4.根据权利要求2或3任一项所述的更准确的搜索词权重确定方法,其特征在于:所述重要度识别特征还包括点击特征,所述方法还包括:获取所述搜索词的点击特征。

5.根据权利要求2-3任一项所述的更准确的搜索词权重确定方法,其特征在于:所述重要度识别特征还包括语言特征,所述方法还包括:获取所述搜索词的语言特征。

6.根据...

【专利技术属性】
技术研发人员:宁旭章贾现永蔡子哲
申请(专利权)人:企知道科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1