System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种搜索引擎的搜索质量评估方法、装置、计算机设备制造方法及图纸_技高网

一种搜索引擎的搜索质量评估方法、装置、计算机设备制造方法及图纸

技术编号:40764607 阅读:4 留言:0更新日期:2024-03-25 20:15
本申请涉及一种搜索引擎的搜索质量评估方法、装置、计算机设备。所述方法包括:获取待评估日志数据;基于所述待评估日志数据进行解析,所述解析包括:基于所述访问频次、访问信息,确定访问行为数据中的异常访问行为数据,获取所述异常访问行为数据对应的异常用户身份信息,将异常用户身份信息对应的访问行为数据从待评估日志数据中删除,得到解析后的日志数据;基于所述解析后的日志数据中的关键词、点击率、匹配度,根据预设的第一评分规则,确定搜索指标评分;基于响应时间超过时间阈值的日志数据,根据预设的第二评分规则,确定性能指标评分;基于搜索指标评分、性能指标评分以及不同指标对应的权重,得到搜索质量评分。

【技术实现步骤摘要】

本申请涉及互联网,特别是涉及一种搜索引擎的搜索质量评估方法、装置、计算机设备


技术介绍

1、信息检索过程中,用户更多是关注搜索引擎带给他更多的价值信息,以及更短的搜索路径,快速的获取价值信息。

2、目前,主要根据线上用户实际反馈来侧面说明,例如搜索结果页点击率、搜索结果页翻页率、搜索结果页导购率、搜索结果页转化率、搜索结果页停留时长等。这种情况下只有事后才能提供评估结果,也即只有用户搜索完成后才能针对用户已完成的搜索操作进行评估。


技术实现思路

1、基于此,有必要针对上述技术问题,提供了一种搜索引擎的搜索质量评估方法、装置、计算机设备。

2、第一方面,本申请提供了一种搜索引擎的搜索质量评估方法。所述方法包括:

3、获取待评估日志数据,所述待评估日志数据包括所述用户的访问行为数据,所述访问行为数据至少包括所述用户身份信息、访问信息、访问频次;

4、基于所述待评估日志数据进行解析,所述解析包括:基于所述访问频次、访问信息,确定所述访问行为数据中的异常访问行为数据,获取所述异常访问行为数据对应的异常用户身份信息,将所述异常用户身份信息对应的访问行为数据从待评估日志数据中删除,得到解析后的日志数据;

5、基于所述解析后的日志数据中的关键词、点击率、匹配度,根据预设的第一评分规则,确定搜索指标评分;

6、基于响应时间超过时间阈值的日志数据,根据预设的第二评分规则,确定性能指标评分;

7、基于所述搜索指标评分、所述性能指标评分以及不同指标对应的权重,得到搜索质量评分。

8、在其中一个实施例中,所述基于所述访问频次、访问信息,确定所述访问行为数据中的异常访问行为数据包括:

9、基于所述访问信息确定搜索词;

10、在预设频次阈值内,若对同一搜索词的访问频次超过预设搜索阈值,确定所述访问行为数据中的异常访问行为数据。

11、在其中一个实施例中,所述搜索指标评分的确定包括:

12、获取搜索引擎的日志信息,并基于所述搜索引擎的日志信息确定搜索词与对应的搜索结果所构成的点击序列;

13、根据不同点击序列中的不同搜索结果,确定点击率、匹配度;

14、基于所述点击率、所述匹配度确定搜索指标评分。

15、在其中一个实施例中,所述性能指标评分的确定包括:

16、对所述搜索词进行命名实体识别,得到所述搜索词的实体类信息;

17、对所述实体类信息进行聚类分析,得到聚类数量符合数量阈值的聚类实体类信息;

18、基于所述聚类实体类信息、所述点击率,确定所述性能指标评分。

19、在其中一个实施例中,所述方法还包括:

20、基于所述聚类实体类信息,实时热点信息,对搜索结果的排序进行修改。

21、第二方面,本申请还提供了一种搜索引擎的搜索质量评估装置,所述装置包括:

22、获取模块,用于获取待评估日志数据,所述待评估日志数据包括所述用户的访问行为数据,所述访问行为数据至少包括所述用户身份信息、访问信息、访问频次;

23、删除模块,用于基于所述待评估日志数据进行解析,所述解析包括:基于所述访问频次、访问信息,确定所述访问行为数据中的异常访问行为数据,获取所述异常访问行为数据对应的异常用户身份信息,将所述异常用户身份信息对应的访问行为数据从待评估日志数据中删除,得到解析后的日志数据;

24、第一评分模块,用于基于所述解析后的日志数据中的关键词、点击率、匹配度,根据预设的第一评分规则,确定搜索指标评分;

25、第二评分模块,用于基于响应时间超过时间阈值的日志数据,根据预设的第二评分规则,确定性能指标评分;

26、计算模块,用于基于所述搜索指标评分、所述性能指标评分以及不同指标对应的权重,得到搜索质量评分。

27、在其中一个实施例中,所述基于所述访问频次、访问信息,确定所述访问行为数据中的异常访问行为数据包括:

28、基于所述访问信息确定搜索词;

29、在预设频次阈值内,若对同一搜索词的访问频次超过预设搜索阈值,确定所述访问行为数据中的异常访问行为数据。

30、第三方面,本公开还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现搜索引擎的搜索质量评估方法的步骤。

31、第四方面,本公开还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现搜索引擎的搜索质量评估方法的步骤。

32、第五方面,本公开还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现搜索引擎的搜索质量评估方法的步骤。

33、上述搜索引擎的搜索质量评估方法,至少包括以下有益效果:

34、本公开提供的实施例方案,可以通过前端埋点用户请求日志,结合在线分析程序,计算实时热搜,以及离线分析程序,计算各项指标,生成每日搜索效果运营报表,便于运营人员,追踪搜索引擎的效果。

35、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

本文档来自技高网...

【技术保护点】

1.一种搜索引擎的搜索质量评估方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述访问频次、访问信息,确定所述访问行为数据中的异常访问行为数据包括:

3.根据权利要求1所述的方法,其特征在于,所述搜索指标评分的确定包括:

4.根据权利要求3所述的方法,其特征在于,所述性能指标评分的确定包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.一种搜索引擎的搜索质量评估装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述基于所述访问频次、访问信息,确定所述访问行为数据中的异常访问行为数据包括:

8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种搜索引擎的搜索质量评估方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述访问频次、访问信息,确定所述访问行为数据中的异常访问行为数据包括:

3.根据权利要求1所述的方法,其特征在于,所述搜索指标评分的确定包括:

4.根据权利要求3所述的方法,其特征在于,所述性能指标评分的确定包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.一种搜索引擎的搜索质量评估装置,其特征在于,所述装置包括:

7.根据权利要求6所述的...

【专利技术属性】
技术研发人员:刘斌范兆明
申请(专利权)人:企查查科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1