数据分析方法、装置、设备和计算机存储介质制造方法及图纸

技术编号:23446970 阅读:33 留言:0更新日期:2020-02-28 20:51
本申请公开了一种数据分析方法、装置、设备和计算机存储介质,涉及大数据领域。具体实现方案为:从目标应用的用户行为数据中,获取流失用户的行为数据;从所述流失用户的行为数据中提取用户行为特征,构成各流失用户的特征向量;基于特征向量之间的距离对所述流失用户进行聚类,得到一个以上的用户簇;分别针对各用户簇分析主成分特征,以确定各用户簇的主要流失原因。本申请能够实现低成本、高准确性地分析用户流失原因。

Data analysis methods, devices, equipment and computer storage media

【技术实现步骤摘要】
数据分析方法、装置、设备和计算机存储介质
本申请涉及计算机应用
,特别涉及一种基于大数据的数据挖掘技术。
技术介绍
随着各种各样的计算机应用类产品的不断出现,各产品的服务提供商在吸引新用户的同时,都希望能够尽量减少用户的流失。用户流失的原因多种多样,目前在分析用户流失原因时,采用的大多是通过电话回访、用户反馈邀请(例如通过邮件、社交平台、应用市场等发送反馈邀请)等方式。然而,大多数流失用户不会进行主动反馈,现有的分析方式需要耗费大量的人力物力成本,并且,各个反馈渠道用户的分布和产品真实用户的分布是存在差异的,在分析结果的准确性上存在偏差。
技术实现思路
有鉴于此,本申请提供了一种数据分析方法、装置、设备和计算机存储介质,以实现低成本、高准确性地分析用户流失原因。一方面,本申请提供了一种数据分析方法,该方法包括:从目标应用的用户行为数据中,获取流失用户的行为数据;从所述流失用户的行为数据中提取用户行为特征,构成各流失用户的特征向量;基于特征向量之间的距离对所述流失用户进行聚类,得到一个以上本文档来自技高网...

【技术保护点】
1.一种数据分析方法,其特征在于,该方法包括:/n从目标应用的用户行为数据中,获取流失用户的行为数据;/n从所述流失用户的行为数据中提取用户行为特征,构成各流失用户的特征向量;/n基于特征向量之间的距离对所述流失用户进行聚类,得到一个以上的用户簇;/n分别针对各用户簇分析主成分特征,以确定各用户簇的主要流失原因。/n

【技术特征摘要】
1.一种数据分析方法,其特征在于,该方法包括:
从目标应用的用户行为数据中,获取流失用户的行为数据;
从所述流失用户的行为数据中提取用户行为特征,构成各流失用户的特征向量;
基于特征向量之间的距离对所述流失用户进行聚类,得到一个以上的用户簇;
分别针对各用户簇分析主成分特征,以确定各用户簇的主要流失原因。


2.根据权利要求1所述的方法,其特征在于,所述从目标应用的用户行为数据中,获取流失用户的行为数据包括:
从目标应用的用户行为数据中,确定在预设的连续时长内没有用户行为数据的用户为流失用户。


3.根据权利要求2所述的方法,其特征在于,从所述流失用户的行为数据中提取用户行为特征包括:
从所述预设连续时长之前所述流失用户最后N次使用目标应用的行为数据中提取用户行为特征,所述N为预设的正整数。


4.根据权利要求1所述的方法,其特征在于,所述分别针对各用户簇分析主成分特征包括:
确定各用户行为特征在各用户簇下的信息增益;
将用户簇下满足预设要求的信息增益对应的用户行为特征作为主成分特征。


5.根据权利要求1或4所述的方法,其特征在于,确定各用户簇的主要流失原因包括:
将用户簇主成分特征所反映的原因,确定为该用户簇的主要流失原因。


6.根据权利要求5所述的方法,其特征在于,所述确定各用户行为特征在各用户簇下的信息增益包括:
利用用户行为特征在所有流失用户的信息熵与该用户行为特征在用户簇的信息熵的差值,确定该用户行为特征在该用户簇下的信息增益。


7.根据权利要求1所述的方法,其特征在于,该方法还包括:
对各用户簇的主要流失原因进行汇总,得到所述目标应用的流失原因分布。


8.根据权利要求1~7任一项所述的方法,其特征在于,所述目标应用为地图类应用;
所述用户行为数据包括用户轨迹数据;
所述用户行为特征包括以下至少一种:
用户最后一次导航的估时误差比、途中偏航次数、终点附近偏航次数、用户实际轨迹和规划轨迹的重合比例。


9.根据权利要求8所述的方法,其特征在于,在从所述流失用户的行为数据中提取用户行为特征之前,还包括:
对所述流失用户的轨迹数据进行以下数据清洗中的至少一种:
过滤掉行进速度低于预设速度阈值的轨迹数据;
过滤掉轨迹点缺失比例超过预设比例阈值的轨迹数据;
将流失用户的轨迹数据匹配到道路单元上,过滤掉匹配失败的轨迹数据;
将流失用户的轨迹数据匹配到道路单元上,过滤掉匹配数据的稀疏状况高于预设标准的道路单元相关的轨迹数据。


10.一种数据分析装置,其特征在于,该装置包括:
用户确定单元,用于从目标应用的用户行为数据中,获取流失用户的行为数据;
特征提...

【专利技术属性】
技术研发人员:黄际洲马文韬雷锦艺许浩
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1