The invention discloses a mobile customer super-subdivision method based on in-depth learning, which includes steps: S1, pre-processing the basic data and consumption behavior data of mobile users; S2, statistic the average value of t-month data of each user in the first user set (such mobile users have consumption behavior data greater than or equal to t-month) according to consumption behavior characteristics, etc. For the statistical characteristics of this feature, S3, the two types of features after processing are joined together as feature vectors; S4, an automatic encoder is constructed to obtain the low-dimensional vector representation of feature vectors; S5, a hierarchical clustering model is constructed to carry out hierarchical clustering; S6, for the second user set (such mobile users have consumption behavior data less than t months), the distance between the cluster centers after clustering is calculated and clustered. Get the corresponding subdivision category. The invention can quickly subdivide large-scale mobile customer data, and can provide personalized services such as set meal recommendation according to the results of customer subdivision.
【技术实现步骤摘要】
一种基于深度学习的移动客户超细分方法
本专利技术涉及数据处理的
,尤其是指一种基于深度学习的移动客户超细分方法。
技术介绍
随着人民生活水平提高,移动互联网普及,移动客户的规模也在不断增大。随着移动客户群的多样化,不同客户群所需要的服务需求也不尽相同。为了能更加个性化地为用户提供服务,推送套餐等优惠信息,需要对庞大的客户群进行客户细分,分析不同客户群的消费行为特征。移动客户发送短信、通话、使用移动流量等消费行为产生了大量消费行为数据。用户的消费行为,一定程度上体现了用户的消费习惯、消费类型偏好等,通过细分出不同的消费类型群体,可以对用户的消费行为进行挖掘。然而,传统的机器学习方法难以适应海量的高维数据。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提出了一种基于深度学习的移动客户超细分方法,可以对大规模移动客户数据实现快速细分,并且根据客户细分结果,可以针对性地进行套餐推荐等个性化服务。为实现上述目的,本专利技术所提供的技术方案为:一种基于深度学习的移动客户超细分方法,包括以下步骤:S1、收集移动用户的基础数据和消费行为数据,对数据进行预处理,其中基础数据包括性别和年龄区间;S2、针对消费行为特征,包括“短信条数”、“通话时长”,统计第一用户集中每个用户的该特征的t个月数据的平均值、标准差、最大值、最小值和极差作为该特征的统计特征;所述第一用户集为拥有大于或等于t个月的消费行为数据的移动用户;S3、将处理后的基础特征和消费行为的统计特征拼接,作为特征向量;S4、构建自动编码器,将特征向量输入自动编码器,获得数据的低维向量表示;S5、构建层 ...
【技术保护点】
1.一种基于深度学习的移动客户超细分方法,其特征在于,包括以下步骤:S1、收集移动用户的基础数据和消费行为数据,对数据进行预处理,其中基础数据包括性别和年龄区间;S2、针对消费行为特征,包括“短信条数”、“通话时长”,统计第一用户集中每个用户的该特征的t个月数据的平均值、标准差、最大值、最小值和极差作为该特征的统计特征;所述第一用户集为拥有大于或等于t个月的消费行为数据的移动用户;S3、将处理后的基础特征和消费行为的统计特征拼接,作为特征向量;S4、构建自动编码器,将特征向量输入自动编码器,获得数据的低维向量表示;S5、构建层次聚类模型,输入低维向量表示,进行层次聚类,以实现对客户细分;当聚类效果不好时,重新训练自动编码器,获得新的向量表示,再输入层次聚类模型进行聚类;S6、计算聚类后每个簇的簇心,获得簇心的基础特征向量和消费行为特征向量,拼接后得到拼接特征向量,输入第二用户集的基础特征向量和消费行为特征向量拼接后得到的拼接特征向量,计算该拼接特征向量与每个簇心的拼接特征向量的欧式距离,距离最近的簇心所在簇的类别即为该用户的细分类别;所述第二用户集为拥有小于t个月的消费行为数据的移动用 ...
【技术特征摘要】
1.一种基于深度学习的移动客户超细分方法,其特征在于,包括以下步骤:S1、收集移动用户的基础数据和消费行为数据,对数据进行预处理,其中基础数据包括性别和年龄区间;S2、针对消费行为特征,包括“短信条数”、“通话时长”,统计第一用户集中每个用户的该特征的t个月数据的平均值、标准差、最大值、最小值和极差作为该特征的统计特征;所述第一用户集为拥有大于或等于t个月的消费行为数据的移动用户;S3、将处理后的基础特征和消费行为的统计特征拼接,作为特征向量;S4、构建自动编码器,将特征向量输入自动编码器,获得数据的低维向量表示;S5、构建层次聚类模型,输入低维向量表示,进行层次聚类,以实现对客户细分;当聚类效果不好时,重新训练自动编码器,获得新的向量表示,再输入层次聚类模型进行聚类;S6、计算聚类后每个簇的簇心,获得簇心的基础特征向量和消费行为特征向量,拼接后得到拼接特征向量,输入第二用户集的基础特征向量和消费行为特征向量拼接后得到的拼接特征向量,计算该拼接特征向量与每个簇心的拼接特征向量的欧式距离,距离最近的簇心所在簇的类别即为该用户的细分类别;所述第二用户集为拥有小于t个月的消费行为数据的移动用户。2.根据权利要求1所述的一种基于深度学习的移动客户超细分方法,其特征在于:在步骤S1中,对数据进行预处理包括去除异常字段、填补缺失值和特征离散化。3.根据权利要求2所述的一种基于深度学习的移动客户超细分方法,其特征在于:所述异常字段包括取值全为0、逻辑有误的字段;用特征数据的平均值填补缺失值;将连续性特征划分区间,离散化为0,1,2。4.根据权利要求1所述的一种基于深度学习的移动客户超细分方法,其特征在于:在步骤S4中,所述自动编码器由编码器和解码器构成;所述编码器将输入数据压缩成低维特征向量,所述解码器负责将压缩的输入特征重构得到原始输入数据;所述编码器与解码器的神经网络层呈对称关系;所述自动编码器的构建过程如下:S41、构建编码器和解码器编码器由4层神经网络层组成,第一层输入层,神经元数量为输入向量的维度,第二层全连接层,神经元数量为512,激活函数为‘tanh’,第三层全连...
【专利技术属性】
技术研发人员:胡金龙,曹丽洁,杨疆,黄敏杰,雷蕾,王睿,苏良良,刘南海,冯静芳,董守斌,
申请(专利权)人:华南理工大学,中国移动通信集团广西有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。