一种基于多模型融合的潜在换机用户发现方法技术

技术编号：15640669 阅读：215 留言：0更新日期：2017-06-16 07:23

本发明专利技术提出一种基于多模型融合的潜在换机用户发现方法，该方法主要包括用户的消费数据和换机轨迹数据采集和预处理、特征构建、模型构建及模型融合、预测等步骤。本发明专利技术旨在利用机器学习算法的多样性和差异性，将多个模型组合起来，以获得更好的效果，使集成的模型具有更强的泛化能力。通过用户历史数据进行训练，最后在数据集上进行预测，从而得到即将换机的高价值用户，并精确的为用户推送手机信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模型融合的潜在换机用户发现方法
本专利技术涉及数据清洗方法、异常数据处理方法、用户换机打标方法、特征工程构建方法，以及采用多模型融合进行换机用户预测的技术。
技术介绍
运营商几乎每分每秒都在产生着海量业务数据，如何将这些数据利用起来并产生价值，这就成了运营商的一个迫切需求。然而随机投放的推送对多数用户造成无意义的干扰。对商家而言，滥发的推送可能降低品牌声誉，同时难以估算营销成本。基于数据挖掘技术和手段，通过运营商提供的精确的用户消费行为和历史换机轨迹刻画用户画像、了解用户需求，充分利用数据挖掘和机器学习技术为运营商的业务开展提供有力支撑。利用数据挖掘、机器学习等技术对用户行为进行分析，发现潜在的换机用户。当前通用的方法为利用有监督的分类器对用户历史换机数据、用户app使用情况等信息来建立模型，对用户是否换机，换机类型等做出预测。随着大数据时代的到来，如何有效的进行数据挖掘，从而产生商业价值已经成为了一种企业必然趋势。
技术实现思路
本专利技术提出了一种基于多模型融合的分类算法对用户换机行为进行预测，同时本专利技术还涉及到了用户历史行为分析、样本标注意、特征工程构建、特征选择和特征变换等领域的技术。为了实现上述目的，本专利技术采用的技术方案是：一种基于多模型融合的潜在换机用户发现方法，包括以下步骤：(1)数据采集和预处理，收集用户的基本信息和用户历史换机轨迹信息，删除异常信息，处理缺失信息，对数值型信息进行归一化处理；利用时间窗口划分训练集和测试集。用户的基本信息和用户历史换机轨迹信息从运营商的用户最近1年消费信息中获取。(2)特征构建，根据步骤(1)...
一种基于多模型融合的潜在换机用户发现方法

【技术保护点】
一种基于多模型融合的潜在换机用户发现方法，其特征在于，包括以下步骤：(1)数据采集和预处理，收集用户的基本信息和用户历史换机轨迹信息，删除异常信息，处理缺失信息，对数值型信息进行归一化处理；利用时间窗口划分训练集、验证集和测试集；(2)特征构建，根据步骤(1)训练集和测试集中的数据提取出基本信息，以及对基本信息进行扩展得到原始特征；对原始特征分别进行排序得到排序特征；用皮尔逊相关系数衡量原始特征和目标之间变量的相关性，构建多项式特征；将训练集和测试集中的无关联属性特征作为离散特征；(3)模型构建及模型融合，分别构建树型模型、超平面模型和惰性模型中的典型的分类器Xgboost、LIBSVM和KNN，用训练集中的数据分别对Xgboost，LIBSVM和KNN进行训练，再用训练后的Xgboost、LIBSVM和KNN分别训练测试集；(4)用步骤(3)所述Xgboost、LIBSVM和KNN分类器分别对未知样本进行预测，得到的多个预测结果进行加权投票为最终的预测结果。

【技术特征摘要】
1.一种基于多模型融合的潜在换机用户发现方法，其特征在于，包括以下步骤：(1)数据采集和预处理，收集用户的基本信息和用户历史换机轨迹信息，删除异常信息，处理缺失信息，对数值型信息进行归一化处理；利用时间窗口划分训练集、验证集和测试集；(2)特征构建，根据步骤(1)训练集和测试集中的数据提取出基本信息，以及对基本信息进行扩展得到原始特征；对原始特征分别进行排序得到排序特征；用皮尔逊相关系数衡量原始特征和目标之间变量的相关性，构建多项式特征；将训练集和测试集中的无关联属性特征作为离散特征；(3)模型构建及模型融合，分别构建树型模型、超平面模型和惰性模型中的典型的分类器Xgboost、LIBSVM和KNN，用训练集中的数据分别对Xgboost，LIBSVM和KNN进行训练，再用训练后的Xgboost、LIBSVM和KNN分别训练测试集；(4)用步骤(3)所述Xgboost、LIBSVM和KNN分类器分别对未知样本进行预测，得到的多个预测结果进行加权投票为最终的预测结果。2.根据权利要求1所述一种基于多模型融合的潜在换机用户发现方法，其特征在于：所述用户的基本信息和用户历史换机轨迹信息从运营商的用户最近1年消费信息中获取。3.根据权利要求1或2所述一种基于多模型融合的潜在换机用户发现方法，其特征在于：所述步骤(1)中还包括根据用户历史换机轨迹信息对用户打标签，具体为：过滤换机时间小于...

【专利技术属性】
技术研发人员：王进，夏翠萍，杨阳，王鸿，李智星，邓欣，陈乔松，胡峰，雷大江，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人