用户搜索行为的识别方法及装置制造方法及图纸

技术编号:22308375 阅读:14 留言:0更新日期:2019-10-16 08:28
本发明专利技术提出一种用户搜索行为的识别方法及装置,其中方法包括:通过根据用户行为日志生成多个用户行为链;根据预设规则确定每个用户行为链的类别;对多个用户行为链的类别进行统计分析,确定分析结果;根据所述分析结果对当前接收到的搜索词或对待输出的搜索结果进行更新。由此,以构建行为链的方式来灵活准确地划分用户的连续搜索行为区间,不受时间窗口的限制,有利于准确高效地用户搜索行为进行挖掘分析,实现准确地更新输入的搜索词和搜索结果,提升搜索体验。

Identification method and device of user search behavior

【技术实现步骤摘要】
用户搜索行为的识别方法及装置
本专利技术涉及互联网
,尤其涉及一种用户搜索行为的识别方法及装置。
技术介绍
对用户的搜索行为日志进行挖掘和分析是优化搜索效果,提升用户体验的重要环节。目前,较为常见的搜索行为挖掘和分析方法为对用户在一小段时间窗口内连续的搜索次数、查询点击率、点击位置、内容修改等进行挖掘分析。然而,这种方法无法准确高效地用户搜索行为进行挖掘分析方面,进行无法提供良好的搜索体验。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种用户搜索行为的识别方法。本专利技术的第二个目的在于提出一种用户搜索行为的识别装置。本专利技术的第三个目的在于提出另一种用户搜索行为的识别装置。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为达上述目的,本专利技术第一方面实施例提出了一种用户搜索行为的识别方法,包括:根据用户行为日志生成多个用户行为链;根据预设规则确定每个用户行为链的类别;对多个用户行为链的类别进行统计分析,确定分析结果;根据所述分析结果对当前接收到的搜索词或对待输出的搜索结果进行更新。在一种可能的实现方式中,所述分析结果包括用户行为模式;在所述用户行为模式包括常见纠错模式或频繁行为模式;所述根据所述分析结果对当前接收到的搜索词或对待输出的搜索结果进行更新包括:根据常见纠错模式对当前接收到的搜索词进行纠错;或者,根据频繁行为模式调整待输出的搜索结果的排序。在一种可能的实现方式中,所述根据用户行为日志生成多个用户行为链包括:按时间先后顺序对所述用户行为日志中的各个用户搜索行为进行排序;按照预设分割方法对排序后的用户行为日志进行分割,生成多个用户行为链。在一种可能的实现方式中,所述按照预设分割方法对排序后的用户行为日志进行分割,生成多个用户行为链,包括:依次遍历所述排序后的用户行为日志中各个用户搜索行为;针对每个用户行为链,将当前遍历到的在上一个用户行为链的终止行为之后首次出现的查询行为定义为当前用户行为链的起始行为,将当前遍历到的查询行为对应的最后一次点击行为或跳出行为定义为当前用户行为链的终止行为。在一种可能的实现方式中,所述每个用户行为链包括多个搜索词,所述根据预设规则确定每个用户行为链的类别包括:对每个搜索词的各个词语进行域标注,并按照域对每个搜索词进行分割处理,得到每个搜索词的各个词语;对每两个相邻的搜索词中相同域的词语进行比较,根据比较结果确定一个域变化信息;根据每个用户行为链的一个或多个域变化信息,确定每个用户行为链的搜索行为类别。在一种可能的实现方式中,所述每个用户行为链包括多个搜索结果,所述根据预设规则确定每个用户行为链的类别包括:对每个搜索结果的各个词语进行域标注,并按照域对每个搜索结果进行分割处理,得到每个搜索结果的各个词语;对每两个相邻的搜索结果中相同域的词语进行比较,根据比较结果确定一个域变化信息;根据每个用户行为链的一个或多个域变化信息,确定每个用户行为链的搜索行为类别。在一种可能的实现方式中,所述域为行政区域名称、字号、行业、组织形式中任一种。本专利技术实施例提供的用户搜索行为的识别方法,通过根据用户行为日志生成多个用户行为链;根据预设规则确定每个用户行为链的类别;对多个用户行为链的类别进行统计分析,确定分析结果;根据所述分析结果对当前接收到的搜索词或对待输出的搜索结果进行更新。由此,以构建行为链的方式来灵活准确地划分用户的连续搜索行为区间,不受时间窗口的限制,有利于准确高效地用户搜索行为进行挖掘分析,实现准确地更新输入的搜索词和搜索结果,提升搜索体验。为达上述目的,本专利技术第二方面实施例提出了一种用户搜索行为的识别装置,包括:生成模块,用于根据用户行为日志生成多个用户行为链;确定模块,用于根据预设规则确定每个用户行为链的类别;分析模块,用于对多个用户行为链的类别进行统计分析,确定分析结果;更新模块,用于根据所述分析结果对当前接收到的搜索词或对待输出的搜索结果进行更新。在一种可能的实现方式中,所述分析结果包括用户行为模式;在所述用户行为模式包括常见纠错模式或频繁行为模式;所述更新模块具体用于:根据常见纠错模式对当前接收到的搜索词进行纠错;或者,根据频繁行为模式调整待输出的搜索结果的排序。在一种可能的实现方式中,所述生成模块包括:排序单元,用于按时间先后顺序对所述用户行为日志中的各个用户搜索行为进行排序;生成单元,用于按照预设分割方法对排序后的用户行为日志进行分割,生成多个用户行为链。在一种可能的实现方式中,所述生成单元具体用于:依次遍历所述排序后的用户行为日志中各个用户搜索行为;针对每个用户行为链,将当前遍历到的在上一个用户行为链的终止行为之后首次出现的查询行为定义为当前用户行为链的起始行为,将当前遍历到的查询行为对应的最后一次点击行为或跳出行为定义为当前用户行为链的终止行为。在一种可能的实现方式中,所述每个用户行为链包括多个搜索词,所述确定模块具体用于:对每个搜索词的各个词语进行域标注,并按照域对每个搜索词进行分割处理,得到每个搜索词的各个词语;对每两个相邻的搜索词中相同域的词语进行比较,根据比较结果确定一个域变化信息;根据每个用户行为链的一个或多个域变化信息,确定每个用户行为链的搜索行为类别。在一种可能的实现方式中,所述每个用户行为链包括多个搜索结果,所述确定模块具体用于:对每个搜索结果的各个词语进行域标注,并按照域对每个搜索结果进行分割处理,得到每个搜索结果的各个词语;对每两个相邻的搜索结果中相同域的词语进行比较,根据比较结果确定一个域变化信息;根据每个用户行为链的一个或多个域变化信息,确定每个用户行为链的搜索行为类别。在一种可能的实现方式中,所述域为行政区域名称、字号、行业、组织形式中任一种。本专利技术实施例提供的用户搜索行为的识别装置,通过根据用户行为日志生成多个用户行为链;根据预设规则确定每个用户行为链的类别;对多个用户行为链的类别进行统计分析,确定分析结果;根据所述分析结果对当前接收到的搜索词或对待输出的搜索结果进行更新。由此,以构建行为链的方式来灵活准确地划分用户的连续搜索行为区间,不受时间窗口的限制,有利于准确高效地用户搜索行为进行挖掘分析,实现准确地更新输入的搜索词和搜索结果,提升搜索体验。为达上述目的,本专利技术第三方面实施例提出了另一种用户搜索行为的识别装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上所述的用户搜索行为的识别方法。为了实现上述目的,本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的用户搜索行为的识别方法。为了实现上述目的,本专利技术第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如上所述的用户搜索行为的识别方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术实施例提供的一种用户搜索行为的识别方法的流程示意本文档来自技高网...

【技术保护点】
1.一种用户搜索行为的识别方法,其特征在于,包括:根据用户行为日志生成多个用户行为链;根据预设规则确定每个用户行为链的类别;对多个用户行为链的类别进行统计分析,确定分析结果;根据所述分析结果对当前接收到的搜索词或对待输出的搜索结果进行更新。

【技术特征摘要】
1.一种用户搜索行为的识别方法,其特征在于,包括:根据用户行为日志生成多个用户行为链;根据预设规则确定每个用户行为链的类别;对多个用户行为链的类别进行统计分析,确定分析结果;根据所述分析结果对当前接收到的搜索词或对待输出的搜索结果进行更新。2.根据权利要求1所述的方法,其特征在于,所述分析结果包括用户行为模式;在所述用户行为模式包括常见纠错模式或频繁行为模式;所述根据所述分析结果对当前接收到的搜索词或对待输出的搜索结果进行更新包括:根据常见纠错模式对当前接收到的搜索词进行纠错;或者,根据频繁行为模式调整待输出的搜索结果的排序。3.根据权利要求1所述的方法,其特征在于,所述根据用户行为日志生成多个用户行为链包括:按时间先后顺序对所述用户行为日志中的各个用户搜索行为进行排序;按照预设分割方法对排序后的用户行为日志进行分割,生成多个用户行为链。4.根据权利要求3所述的方法,其特征在于,所述按照预设分割方法对排序后的用户行为日志进行分割,生成多个用户行为链,包括:依次遍历所述排序后的用户行为日志中各个用户搜索行为;针对每个用户行为链,将当前遍历到的在上一个用户行为链的终止行为之后首次出现的查询行为定义为当前用户行为链的起始行为,将当前遍历到的查询行为对应的最后一次点击行为或跳出行为定义为当前用户行为链的终止行为。5.根据权利要求1所述的方法,其特征在于,所述每个用户行为链包括多个搜索词,所述根据预设规则确定每个用户行为链的类别包括:对每个搜索词的各个词语进行域标注,并按照域对每个搜索词进行分割处理,得到每个搜索词的各个词语;对每两个相邻的搜索词中相同域的词语进行比...

【专利技术属性】
技术研发人员:范成周晗高山柳超
申请(专利权)人:北京天眼查科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1