【技术实现步骤摘要】
一种基于搜索引擎的用户行为分析方法及装置
[0001]本专利技术涉及数据分析
,具体是涉及一种基于搜索引擎的用户行为分析方法及装置。
技术介绍
[0002]运营商为获取更加有利的数据,需要对每个用户行为进行分析,以保证用户在之后的产品交互中更加舒适、推荐更加精准,以此来提高用户的用户体验。
[0003]用户输入搜索需求描述信息,例如关键字或图像,搜索引擎根据搜索需求描述信息向用户返回搜索结果,然而现有的技术中,用户的行为分析较为单一,仅通过用户的历史搜索结果筛选出该用户喜好的关键词,并没有关注到可能存在信息安全风险的垃圾信息、诈骗信息等,不仅不能对用户进行更好的信息推荐,还可能造成信息安全性问题。
技术实现思路
[0004]基于此,有必要针对现有技术问题,提供一种基于搜索引擎的用户行为分析方法及装置,以解决现有的用户行为分析方式能对用户进行更好的信息推荐,还可能造成信息安全性问题的缺陷。
[0005]为解决现有技术问题,本专利技术采用的技术方案为:
[0006]本专利技术提供一种 ...
【技术保护点】
【技术特征摘要】
1.一种基于搜索引擎的用户行为分析方法,其特征在于,该方法包括:确定预设时间段内的用户在目标搜索引擎的搜索输入信息;将所述搜索输入信息输入至训练好的用户偏好模型中,得到所述用户偏好模型预测的用户热点信息和用户冷信息;将所述用户热点信息和所述用户冷信息输入至训练好的用户行为分析模型中,得到所述用户行为分析模型预测的搜索显示信息、搜索关联词条和所述搜索关联词条关联的关联显示信息;所述用户热点信息的热度超过预设值,所述用户冷信息的热度不超过预设值,所述热度用于表征信息的推荐程度;基于所述搜索显示信息、所述搜索关联词条和所述关联显示信息向用户展示推荐信息。2.根据权利要求1所述的一种基于搜索引擎的用户行为分析方法,其特征在于,所述用户偏好模型通过以下步骤训练得到:确定用户在目标搜索引擎的样本访问信息列表;所述样本访问信息列表包含样本时间段内的用户访问信息;确定所述样本访问信息列表中的样本回访信息列表;所述样本回访信息列表包含样本时间段内的网站的停留时间、回访信息、回访信息的回访次数和回访相隔时间;确定用户的样本搜索输入信息和所述目标搜索引擎的引擎信息;将所述样本访问信息列表、所述样本回访信息列表、所述样本搜索输入信息和所述目标搜索引擎的引擎信息作为训练使用的输入数据,采用聚类的方式,得到用于预测用户热点信息和用户冷信息的所述用户偏好模型。3.根据权利要求2所述的基于搜索引擎的用户行为分析方法,其特征在于,所述用户行为分析模型通过以下步骤训练得到:将所述样本热点信息和所述样本冷信息输入至目标特征提取模型,提取所述热点信息和所述冷信息中的特征信息;基于所述特征信息与历史数据库的匹配情况确定所述样本热点信息和所述样本冷信息中的样本危险信息;所述历史数据库中存储有若干目标搜索引擎的举报信息;基于所述特征信息与历史关联库的匹配情况确定所述样本热点信息和所述样本冷信息中的样本关联信息;所述历史关联库中存储有用户基于样本搜索输入信息的跳转词条;将所述样本热点信息、所述样本冷信息、所述样本危险信息和所述样本关联信息作为训练使用的输入数据,采用聚类的方式,得到用于预测所述搜索显示信息、所述搜索关联词条和所述关联显示信息的所述用户行为分析模型。4.根据权利要求3所述的基于搜索引擎的用户行为分析方法,其特征在于,所述基于所述特征信息与历史数据库的匹配情况确定所述样本热点信息和所...
【专利技术属性】
技术研发人员:宋涛,李亚雄,陈鑫,
申请(专利权)人:乐虾深圳科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。