【技术实现步骤摘要】
数据分析方法、装置、存储介质及处理器
本专利技术涉及数据处理领域,具体而言,涉及一种数据分析方法、装置、存储介质及处理器。
技术介绍
随着信息技术的发展和云服务的普及,云服务供应商所提供的服务日益多样化,涵盖存储、计算、管理、优化、人工智能等各个方面。用户对于大量且多样化服务的使用蕴含一定的潜在行为模式或规律。这些规律或反映用户群体的共同消费习惯,或揭示服务产品间的内在关联性。发掘并利用这些规律能够帮助产品供应者更好地进行产品定位,发现潜在用户群体,建立用户流失预警,同时更好地满足现有用户的需求。例如,假设用户群体中存在如下行为模式:<{添加服务A,添加服务B},{添加服务C},{取消服务B}>。那么我们可以猜测服务C对于服务A和B可能存在一定的依赖关系,并且用户对服务B的需求较服务A更具弹性。因此,我们可以对具有<{添加服务A,添加服务B}>行为模式的用户推荐服务C,另一方面,对具有<{添加服务A,添加服务B},{添加服务C}>行为模式的用户建立服务B的流失预警。经典的频 ...
【技术保护点】
1.一种数据分析方法,其特征在于,包括:/n获取用户服务的序列数据集,其中,所述序列数据集中的每一条序列对应一名用户所使用服务的使用数据,每一条所述序列包括至少一个元素,每个元素包括至少一个事件,所述事件用于表示用户服务的添加或流失;/n在所述序列数据集的至少一个事件中确定目标事件,并确定包括所述目标事件的序列为目标序列;/n对所述目标序列进行序列模式挖掘,确定所述目标事件的相关序列,以及所述相关序列与所述目标事件的关联度,其中,所述相关序列表示在包括所述目标事件的序列中与所述目标事件相关联的至少一个事件。/n
【技术特征摘要】
1.一种数据分析方法,其特征在于,包括:
获取用户服务的序列数据集,其中,所述序列数据集中的每一条序列对应一名用户所使用服务的使用数据,每一条所述序列包括至少一个元素,每个元素包括至少一个事件,所述事件用于表示用户服务的添加或流失;
在所述序列数据集的至少一个事件中确定目标事件,并确定包括所述目标事件的序列为目标序列;
对所述目标序列进行序列模式挖掘,确定所述目标事件的相关序列,以及所述相关序列与所述目标事件的关联度,其中,所述相关序列表示在包括所述目标事件的序列中与所述目标事件相关联的至少一个事件。
2.根据权利要求1所述的方法,其特征在于,获取用户服务的序列数据集包括:
从数据库采集用户服务的使用数据,其中,所述使用数据包括用户编号,时间,所使用服务的事件和使用量;
基于所述使用数据生成所述用户服务的起始时间表和流失时间表,其中,所述起始时间表用于表示每个用户开始使用所述用户服务的时间和所述流失时间表用于表示每个用户借宿使用所述用户服务的时间;
根据所述起始时间表和所述流失时间表生成所述序列数据集。
3.根据权利要求1所述的方法,其特征在于,对所述目标序列进行序列模式挖掘,确定所述目标事件的相关序列包括:
确定所述序列数据集的事件发生频数表,其中,所述事件发生频数表用于表示所述序列数据集中全部事件的频数;
基于所述事件发生频数表设定所述目标事件的支持度阈值;
基于所述支持度阈值对所述目标序列进行序列模式挖掘,确定所述目标事件的相关序列。
4.根据权利要求1所述的方法,其特征在于,对所述目标序列进行序列模式挖掘,确定所述目标事件的相关序列包括:
在序列数据集中确定所述目标序列的频繁序列,其中,所述频繁序列中包括所述目标事件的频繁邻接事件;
确定所述频繁序列的序列数量;
在所述频繁序列的序列数量高于预设序列数量的情况下,剔除所述频繁序列中的无效序列,得到有效频繁序列;
计算所述有效频繁序列的支持度,并确定所述支持度高于支持度阈值的有效频繁序列为所述相关序列。
5.根据权利要求1所述的方法,其特征在于,在所述序列数据集的至少一个事件中确定目标事件之后,所述方法还包括:
确定所述目标事件的邻接频繁事件集,...
【专利技术属性】
技术研发人员:文诗奇,谭国苹,李刚毅,
申请(专利权)人:博彦科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。