【技术实现步骤摘要】
一种基于用户信息的数据分析方法
本专利技术属于大数据分析与数据挖掘领域,尤其涉及一种基于用户信息的数据分析方法及系统。
技术介绍
随着移动通信技术的发展,移动通信业务种类越来越多,对通讯资源的需求也迅速增长,然而当前可用的无线通讯资源有限,在多用户多业务的条件下如何合理调配资源,提高无线资源的利用效率,是目前移动通信领域研究的热点和难点,而在无线资源调度过程中的一个关键问题就是确定用户优先级。用户优先级别的确定是一个多目标求解的问题,需要同时综合考虑用户使用资源的公平性、无线资源使用效率、系统吞吐量、服务质量等多个目标的约束。目前对用户优先级的判别方法,或只考虑技术上的需求,或只考虑业务上的需求,没有全面考虑用户自身的影响因素,导致用户在资源的使用分配上的确定具有片面性。回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照自变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和 ...
【技术保护点】
1.一种基于用户信息的数据分析方法,包括以下步骤:/n接收用户信息;/n将所述用户信息转换汇总为用户大数据集合;/n将所述用户大数据集合随机划分为两个集合,所述两个集合包括第一集合和第二集合,所述第一集合存储到第一数据库中,所述第二集合存储到第二数据库中;/n对所述第一数据库中的所述第一集合进行分箱相关处理,得到第三集合,将所述第三集合存储到第三数据库中;/n提取所述第三数据库中的第三集合,并基于所述第三集合采用因子分析法构建第一模型;/n提取所述第二数据库中的第二集合,基于所述第二集合对所述第一模型进行验证;/n其中,所述基于所述第三集合采用因子分析法构建所述第一模型,具 ...
【技术特征摘要】
1.一种基于用户信息的数据分析方法,包括以下步骤:
接收用户信息;
将所述用户信息转换汇总为用户大数据集合;
将所述用户大数据集合随机划分为两个集合,所述两个集合包括第一集合和第二集合,所述第一集合存储到第一数据库中,所述第二集合存储到第二数据库中;
对所述第一数据库中的所述第一集合进行分箱相关处理,得到第三集合,将所述第三集合存储到第三数据库中;
提取所述第三数据库中的第三集合,并基于所述第三集合采用因子分析法构建第一模型;
提取所述第二数据库中的第二集合,基于所述第二集合对所述第一模型进行验证;
其中,所述基于所述第三集合采用因子分析法构建所述第一模型,具体包括:
使用因子分析法进行变量聚类;
对每个类中的变量进行第一次变量筛选使得剩余变量数不大于第一阈值;
对第一次筛选后剩下的变量采用多次向后剔除法迭代进行第二次变量筛选,直至满足预设条件。
2.如权利要求1所述的方法,其中将所述用户大数据集合随机划分为两个集合,具体包括:
将用户所有信息组合成宽表;
将所述宽表随机按照一定比例划分成两个集合。
3.如权利要求2所述的方法,其中所述第一集合为训练集,其用于建模和模型参数估计,所述第二集合为测试集,其用于模型评估。
4.如权利要求1所述的方法,其中所述第一模型为逻辑回归模型。
5.如权利要求4所述的方法,其中所述对所述第一数据库中的所述第一集合进行分箱相关处理,得到第三集合具体包括:
对所述第一集合数据,进行分箱;
对每箱进行WOE变换,获取...
【专利技术属性】
技术研发人员:邵俊,蔺静茹,张磊,曹新建,支磊,
申请(专利权)人:索信达北京数据技术有限公司,深圳索信达数据技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。