【技术实现步骤摘要】
基于聚类算法的用户行为分析方法、装置、设备及介质
[0001]本申请涉及数据分析
,尤其涉及一种基于聚类算法的用户行为分析方法、装置、设备及介质。
技术介绍
[0002]对于网页来说,每天都有大量的用户进行访问,点击页面的每个部分,这些点击行为正是代表用户的真实操作行为,隐含着用户的兴趣、习惯、爱好等信息。如果能正确获取用户在页面的行为路径,那就能捕捉到用户的行为习惯,这无论对一个互联网产品的提升以及用户操作的便捷性都是非常用帮助的。
[0003]现有技术中一般是基于预设时间范围内所有的用户行为数据,采用机器学习算法或者通过人工配置漏斗的方式,计算得到用户的行为路径;而得到的可以指示用户行为路径的网状图,无法直观清楚地展示用户真正的路径,以及受冗余数据的影响得到的数据的准确性不够精准,从而导致得出的用户行为路径不够精准。
技术实现思路
[0004]本申请实施例的目的在于提出一种基于聚类算法的用户行为分析方法、装置、设备及介质,以提高对用户行为数据的分析准确度。
[0005]为了解决上述技 ...
【技术保护点】
【技术特征摘要】
1.一种基于聚类算法的用户行为分析方法,其特征在于,包括:通过埋点数据,按照时间戳收集用户行为路径数据;基于K均值聚类算法,对所述用户行为路径数据进行聚类分析,得到节点路径数据;将所述节点路径数据中最小长度的节点路径作为前缀,并构造所述前缀对应的投影,得到初始投影路径;基于预设支持度阈值,将高于所述预设支持度阈值的初始投影路径进行递归处理,得到候选路径;统计每个所述候选路径从起点到终点的转化率,得到基础转化率;选取转化率最高的基础转化率作为目标转化率,并将所述目标转化率对应的候选路径作为目标路径。2.根据权利要求1所述的基于聚类算法的用户行为分析方法,其特征在于,所述基于K均值聚类算法,对所述用户行为路径数据进行聚类分析,得到节点路径数据,包括:选取预设节点作为聚类中心;基于所述K均值聚类算法,对所述聚类中心进行聚类分析,得到聚类数据;获取每个所述聚类数据对应的用户行为路径数据,得到所述节点路径数据。3.根据权利要求1所述的基于聚类算法的用户行为分析方法,其特征在于,所述将所述节点路径数据中最小长度的节点路径作为前缀,并构造所述前缀对应的投影,得到初始投影路径,包括:识别出所述节点路径数据中最小长度的节点路径数据,作为初始节点路径;将每个所述初始节点路径均作为前缀,构造每个所述前缀对应的投影;将每个所述前缀对应的投影作为一组序列数据,得到所述初始投影路径。4.根据权利要求1所述的基于聚类算法的用户行为分析方法,其特征在于,所述基于预设支持度阈值,将高于所述预设支持度阈值的初始投影路径进行递归处理,得到候选路径,包括:获取高于所述预设支持度阈值且长度为1的初始投影序列,得到基础投影序列;基于所述基础投影序列,构造新的前缀,并构造所述新的前缀对应的投影,得到进阶投影序列;将高于所述预设支持度阈值的所述进阶投影序列进行递归处理,直至所有所述节点路径数据都低于所述预设支持度阈值,得到所述候选路径。5.根据权利要求4所述的基于聚类算法的用户行为分析方法,其特征在于,所述将高于所述预设支持度阈值的所述进阶投影序列进行递归处理,直至所有所述节点路径数据都低于所述预设支持度阈值,得到所述候选路径,包括:将低于所述预设支持度阈值的进阶投影序列删除,得到目标投影序列;判断所述目标投影序列中是否存在比所述目标投影序列...
【专利技术属性】
技术研发人员:谌永材,周汉民,
申请(专利权)人:未鲲上海科技服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。