基于用户行为深度分析的网页搜索数据信息智能分类管理方法、系统及计算机存储介质技术方案

技术编号:29757527 阅读:18 留言:0更新日期:2021-08-20 21:10
本发明专利技术公开基于用户行为深度分析的网页搜索数据信息智能分类管理方法、系统及计算机存储介质,通过获取用户历史网页搜索记录中各新闻搜索词,分析用户历史网页搜索记录中各新闻搜索词对应的网页新闻类型,同时统计用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻,获取用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻时长,计算用户历史网页搜索记录中各类型网页新闻的综合搜索频率系数,对比筛选用户历史网页搜索记录中各类型网页新闻对应的搜索频率等级,并按照综合搜索频率系数大小顺序进行排列管理,从而提高网页新闻搜索记录分类管理的功能性和智能化水平。

【技术实现步骤摘要】
基于用户行为深度分析的网页搜索数据信息智能分类管理方法、系统及计算机存储介质
本专利技术涉及搜索数据分类管理领域,涉及到基于用户行为深度分析的网页搜索数据信息智能分类管理方法、系统及计算机存储介质。
技术介绍
随着互联网技术的发展和普及,网页新闻搜索几乎已经成为现代人闲余生活中获取有效信息的必备途经。随着网页新闻搜索在人们生活中使用频率的提高,对网页新闻搜索记录分类管理研究也更加重要。目前,现有的网页新闻搜索记录分类管理基本根据搜索时间进行分类,这样方法虽然简洁、方便,但是分类管理功能较低,从而降低网页新闻搜索记录分类管理的智能化水平,无法满足用户的实际应用需求,同时现有的网页新闻搜索记录分类管理无法实现网页新闻类型的分类管理,导致不能分析用户对各类型网页信息的搜索频率,使得用户无法从中获取有效的参考数据,从而降低网页新闻搜索记录分类效率,减少用户的网页新闻搜索体验感和满意感,为了解决以上问题,现设计基于用户行为深度分析的网页搜索数据信息智能分类管理方法、系统及计算机存储介质。
技术实现思路
本专利技术的目的在于提供基于用户行为深度分析的网页搜索数据信息智能分类管理方法、系统及计算机存储介质,本专利技术通过获取用户历史网页搜索记录中各新闻搜索词,统计用户历史网页搜索记录中各新闻搜索词的词义,分析用户历史网页搜索记录中各新闻搜索词对应的网页新闻类型,同时统计用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻,获取用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻时长,计算用户历史网页搜索记录中各类型网页新闻的综合搜索频率系数,对比筛选用户历史网页搜索记录中各类型网页新闻对应的搜索频率等级,并按照综合搜索频率系数大小顺序进行排列管理,解决了
技术介绍
中存在的问题。本专利技术的目的可以通过以下技术方案实现:第一方面,本专利技术提供基于用户行为深度分析的网页搜索数据信息智能分类管理方法,包括如下步骤:S1、新闻搜索词获取:通过新闻搜索词获取模块对用户历史网页搜索记录中各新闻搜索词进行获取,统计用户历史网页搜索记录中各新闻搜索词,构成用户历史网页搜索记录中各新闻搜索词集合A(a1,a2,...,ai,...,an),ai表示为用户历史网页搜索记录中各新闻搜索词;S2、新闻搜索词词义统计:通过搜索词词义统计模块分别查询获取用户历史网页搜索记录中各新闻搜索词的词义,并统计用户历史网页搜索记录中各新闻搜索词的词义;S3、新闻搜索词词义分析:通过搜索词词义分析模块提取存储数据库中存储的各类型网页新闻对应的各相关词词义,对比得到用户历史网页搜索记录中各新闻搜索词对应的网页新闻类型,统计用户历史网页搜索记录中各类型网页新闻内各新闻搜索词,构成用户历史网页搜索记录中各类型网页新闻内各新闻搜索词集合WfA(wfa1,wfa2,...,wfaj,...,wfam),m≤n,wfaj表示为用户历史网页搜索记录中第f个类型网页新闻内第j个新闻搜索词,f=1,2,...,k;S4、浏览新闻统计:通过浏览新闻统计模块对用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻进行统计,分别统计用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻;S5、浏览新闻时长获取:通过浏览新闻时长获取模块对用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻时长进行获取,统计用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻时长,并计算用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的总浏览新闻时长;S6、搜索频率系数分析:通过分析服务器提取存储数据库中存储的搜索频率系数的补偿系数、浏览新闻条数和浏览新闻时长对应的搜索频率影响权重系数,计算用户历史网页搜索记录中各类型网页新闻的综合搜索频率系数,统计用户历史网页搜索记录中各类型网页新闻的综合搜索频率系数;S7、搜索频率系数对比:通过网页新闻管理中心提取设定的各搜索频率等级对应的搜索频率系数范围,将用户历史网页搜索记录中各类型网页新闻的综合搜索频率系数与各搜索频率等级对应的搜索频率系数范围进行对比,若用户历史网页搜索记录中某类型网页新闻的综合搜索频率系数处于某搜索频率等级对应的搜索频率系数范围之内,表明该类型网页新闻的综合搜索频率系数对应该搜索频率等级,统计用户历史网页搜索记录中各类型网页新闻对应的搜索频率等级;S8、搜索频率等级分类排列:通过搜索频率等级分类模块将用户历史网页搜索记录中各类型网页新闻对应的搜索频率等级进行分类,统计用户历史网页搜索记录中各搜索频率等级内各类型网页新闻,并按照综合搜索频率系数大小顺序对用户历史网页搜索记录中各搜索频率等级内各类型网页新闻进行排列管理。在第一方面的一种可能的设计中,所述步骤S2中包括构成用户历史网页搜索记录中各新闻搜索词的词义集合YA(Ya1,Ya2,...,Yai,...,Yan),Yai表示为用户历史网页搜索记录中第i个新闻搜索词的词义。在第一方面的一种可能的设计中,所述步骤S3中包括将用户历史网页搜索记录中各新闻搜索词的词义与各类型网页新闻对应的各相关词词义进行对比,统计用户历史网页搜索记录中各新闻搜索词的词义与各类型网页新闻对应的各相关词词义的近似度,筛选用户历史网页搜索记录中各新闻搜索词的词义对应相关词词义近似度最大的类型网页新闻。在第一方面的一种可能的设计中,所述步骤S4中包括构成用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻集合表示为用户历史网页搜索记录中第f个类型网页新闻内第j个新闻搜索词对应的第r条浏览新闻,f=1,2,...,k。在第一方面的一种可能的设计中,所述步骤S5中包括构成用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻时长集合表示为用户历史网页搜索记录中第f个类型网页新闻内第j个新闻搜索词对应的第r条浏览新闻时长,f=1,2,...,k。在第一方面的一种可能的设计中,所述用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的总浏览新闻时长计算公式为Tfaj表示为用户历史网页搜索记录中第f个类型网页新闻内第j个新闻搜索词对应的总浏览新闻时长,表示为用户历史网页搜索记录中第f个类型网页新闻内第j个新闻搜索词对应的第r条浏览新闻时长。在第一方面的一种可能的设计中,所述用户历史网页搜索记录中各类型网页新闻的综合搜索频率系数计算公式为ξi表示为用户历史网页搜索记录中第f个类型网页新闻的综合搜索频率系数,μ表示为搜索频率系数的补偿系数,m表示为用户历史网页搜索记录中第f个类型网页新闻内新闻搜索词的数量,n表示为用户历史网页搜索记录中新闻搜索词的总数量,e表示为自然数,等于2.718,α,β分别表示为浏览新闻条数、浏览新闻时长对应的搜索频率影响权重系数,v表示为用户历史网页搜索记录中第f个类型网页新闻内第j个新闻搜索词对应的浏览新闻条数,Tfaj表示为用户历史网页搜索记录中第f个类型网页新闻内第j个新闻搜本文档来自技高网
...

【技术保护点】
1.基于用户行为深度分析的网页搜索数据信息智能分类管理方法,其特征在于:包括如下步骤:/nS1、新闻搜索词获取:通过新闻搜索词获取模块对用户历史网页搜索记录中各新闻搜索词进行获取,统计用户历史网页搜索记录中各新闻搜索词,构成用户历史网页搜索记录中各新闻搜索词集合A(a

【技术特征摘要】
1.基于用户行为深度分析的网页搜索数据信息智能分类管理方法,其特征在于:包括如下步骤:
S1、新闻搜索词获取:通过新闻搜索词获取模块对用户历史网页搜索记录中各新闻搜索词进行获取,统计用户历史网页搜索记录中各新闻搜索词,构成用户历史网页搜索记录中各新闻搜索词集合A(a1,a2,...,ai,...,an),ai表示为用户历史网页搜索记录中各新闻搜索词;
S2、新闻搜索词词义统计:通过搜索词词义统计模块分别查询获取用户历史网页搜索记录中各新闻搜索词的词义,并统计用户历史网页搜索记录中各新闻搜索词的词义;
S3、新闻搜索词词义分析:通过搜索词词义分析模块提取存储数据库中存储的各类型网页新闻对应的各相关词词义,对比得到用户历史网页搜索记录中各新闻搜索词对应的网页新闻类型,统计用户历史网页搜索记录中各类型网页新闻内各新闻搜索词,构成用户历史网页搜索记录中各类型网页新闻内各新闻搜索词集合WfA(wfa1,wfa2,...,wfaj,...,wfam),m≤n,wfaj表示为用户历史网页搜索记录中第f个类型网页新闻内第j个新闻搜索词,f=1,2,...,k;
S4、浏览新闻统计:通过浏览新闻统计模块对用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻进行统计,分别统计用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻;
S5、浏览新闻时长获取:通过浏览新闻时长获取模块对用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻时长进行获取,统计用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的各条浏览新闻时长,并计算用户历史网页搜索记录中各类型网页新闻内各新闻搜索词对应的总浏览新闻时长;
S6、搜索频率系数分析:通过分析服务器提取存储数据库中存储的搜索频率系数的补偿系数、浏览新闻条数和浏览新闻时长对应的搜索频率影响权重系数,计算用户历史网页搜索记录中各类型网页新闻的综合搜索频率系数,统计用户历史网页搜索记录中各类型网页新闻的综合搜索频率系数;
S7、搜索频率系数对比:通过网页新闻管理中心提取设定的各搜索频率等级对应的搜索频率系数范围,将用户历史网页搜索记录中各类型网页新闻的综合搜索频率系数与各搜索频率等级对应的搜索频率系数范围进行对比,若用户历史网页搜索记录中某类型网页新闻的综合搜索频率系数处于某搜索频率等级对应的搜索频率系数范围之内,表明该类型网页新闻的综合搜索频率系数对应该搜索频率等级,统计用户历史网页搜索记录中各类型网页新闻对应的搜索频率等级;
S8、搜索频率等级分类排列:通过搜索频率等级分类模块将用户历史网页搜索记录中各类型网页新闻对应的搜索频率等级进行分类,统计用户历史网页搜索记录中各搜索频率等级内各类型网页新闻,并按照综合搜索频率系数大小顺序对用户历史网页搜索记录中各搜索频率等级内各类型网页新闻进行排列管理。


2.根据权利要求1所述的基于用户行为深度分析的网页搜索数据信息智能分类管理方法,其特征在于:所述步骤S2中包括构成用户历史网页搜索记录中各新闻搜索词的词义集合YA(Ya1,Ya2,...,Yai,...,Yan),Yai表示为用户历史网页搜索记录中第i个新闻搜索词的词义。


3.根据权利要求1所述的基于用户行为深度分析的网页搜索数据信息智能分类管理方法,其特征在于:所述步骤S3中包括将用户历史网页搜索记录中各新闻搜索词的词义与各类型网页新闻对应的各相关词词义进行对比...

【专利技术属性】
技术研发人员:刘伟
申请(专利权)人:武汉瑞通慧行电子商务有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1