当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于迭代决策树的电信用户分类方法技术

技术编号:19009802 阅读:18 留言:0更新日期:2018-09-22 09:35
本发明专利技术涉及一种基于迭代决策树的电信用户分类方法,包括:S1:根据用户的基本信息、通话、短信记录构建用户社交关系网络G(V,E);S2:从G(V,E)中抽取特征,或根据已分类的用户更新其他用户的特征;S3:用迭代决策树对G(V,E)中未分类的用户分类,即判断是否满足|sFriend‑nFriend|≥L;若满足则分类,将分类的用户数记为κ;K若κ>K,回到步骤S2,否则进入步骤S4;S4:令L=L‑1;若L≥0,返回步骤S2,否则进入步骤S5;S5:输出分类结果。本发明专利技术在训练集较少的情况下能达到很低的错误率,可以克服训练集占比高导致的过拟合影响,实现用户的精准定位。

A method of Telecom user classification based on iterative decision tree

The present invention relates to an iterative decision tree based telecommunication user classification method, which includes: S1: constructing a user's social network G (V, E) according to the user's basic information, call and short message records; S2: extracting features from G (V, E), or updating features of other users according to the classified users; S3: using an iterative decision tree for G (V, E) Uncategorized user classification, that is, to determine whether to satisfy | sFriend_nFriend | | L; if satisfied, the number of categorized users will be classified as kappa; K if kappa > K, back to S2, otherwise entered into C4; S4: let L = L_1; if L > 0, return to S2, otherwise entered S15; S5: output classification results. The invention can achieve a very low error rate when the training set is small, overcome the over-fitting effect caused by the high proportion of the training set, and realize the accurate positioning of the user.

【技术实现步骤摘要】
一种基于迭代决策树的电信用户分类方法
本专利技术属于人工智能、数据挖掘领域,具体涉及一种基于迭代决策树的电信用户分类方法。
技术介绍
1.移动营销技术移动营销近年来受到广泛研究,一方面,有人从理论上研究了为什么消费者能接受手机作为宣传信息的方式。通过实证研究,他们发现利用手机客户端进行移动营销时,其能否被用户接受的关键在于所提供的信息对于客户来说所具备的娱乐性以及价值高低。另一方面,有人根据消费者/用户的生活方式、使用动机和产品/服务属性等要素,通过要素分析和聚类分析方法,以实证研究的方式研究了意大利手机用户的行为。还有人则调查了消费者对智能手机时代移动营销的态度,发现虽然手机功能和用户使用频率在不断提高,但消费者持续抱有对移动营销传播的负面态度。现有一种大数据移动营销分析和广告推荐框架,该框架支持离线和在线广告业务,其分析技术是根据移动用户的个人资料、网站访问行为、移动情况等大数据来进行广告推荐。还有一种新的混合多属性决策模型,提出了一个移动电子商务的评估模型,该模型能够提升用户在模糊环境中对不确定移动电子商务信息的接受程度。2.电信用户分类技术电信用户分类是移动营销中的重要一环,现有一种基于遗传算法的方法来增强案例推理的案例匹配过程,然后在此基础上又开发了一个原型GA-CBR系统来预测电信客户购买保险的行为,并找出最有可能与最不可能购买保险的顾客。现有技术公开了一种基于案例推理系统的数据降维技术,使用遗传算法从垂直和水平方向对数据进行降维处理。现有技术还包括一个客户分类模型,利用现有客户的数据来挖掘出他们的购买模式。该模型首先独立使用几种分类技术,然后用遗传算法来综合不同的分类结果。有学者研究了电信客户分类问题,他们提出了一种使用支持向量机和人工神经网络技术对电信客户数据进行分类并确定最适合客户群的增值服务的方法。从分类的客户群中,他们推导出具有模糊属性的分类规则。还有学者则通过考虑数据分布的不平衡性来研究客户分类问题。他们将集成学习与成本敏感学习相结合,并提出了一种用于不平衡数据的动态分类器集成方法,可以为每个客户自适应地选择动态集成方法。还包括一种用于移动用户分类的改进决策树算法,该算法引入遗传算法来优化决策树算法的结果。在他此模型中,由于分类属性提高了预测的准确性,此模型可以将移动用户分为四类:普通用户,商务用户,高级商务用户和金牌用户。3.决策树技术决策树是一种计算智能技术,得益于其简单性和高效性,已被广泛应用于机器学习和数据挖掘领域。它是一个决策支持工具,使用树状图或决策模型来进行表示,其决策结果包括机会事件结果,资源成本和效用等。现有一种新的顾客生命周期模型,其中包括五个决策模型,即当前价值、历史价值、长期价值预测、信用和忠诚度。此模型使用决策树方法来提取与长期价值、信用和忠诚度有关的重要参数,然后建立客户价值评估体系。还包括一种用于移动用户分类的改进决策树算法,并引入遗传算法来优化决策树算法的结果。通过在真实数据集上的测试,显示了该算法与C4.5决策树和SVM算法相比在分类准确性方面的优越性。一种新的并行化决策树算法,以改善海量数据挖掘应用中的数据处理延迟问题。模型中使用CPU进行流量控制,并使用GPU进行计算。结果表明,与传统的基于CPU的方法相比,该方法可以显着提高时间效率。还有一种通过考虑时间和成本约束来研究决策树,将重点放在如何在有限时间内完成分类任务,从而构建出决策树。从而开发了一种构建时间受限的最小代价树算法,当时间充裕时,该算法会选择能带来最大收益的决策属性,当时间受限时,该算法会选择时间效率最高的决策属性。电信用户分类是移动营销中的重要一环,只有对用户进行精准定位,才能在移动营销中针对性地向用户推销产品和服务。然而目前电信运营商在对用户进行分类时,主要是基于用户的个人资料信息,如姓名、性别、所在地等,没有充分利用运营商自身丰富的用户通话和短信记录等数据,导致传统分类方法准确性较低。
技术实现思路
为克服传统分类方法中存在的上述缺陷,本专利技术利用电信运营商的校园基站数据中丰富的用户短信和通话记录,构建用户的社交关系网络,并对用户的关系网络进行全面统计分析,提取用户特征,在此基础上,提出一种基于迭代决策树的分类算法来识别学生用户和非学生用户。为达到上述目的,本专利技术提供了一种基于迭代决策树的电信用户分类方法,包括以下步骤:S1:根据用户的基本信息、通话、短信记录构建用户社交关系网络G(V,E);S2:从用户社交关系网络G(V,E)中抽取特征,或者根据已分类的用户更新其他用户的特征;S3:应用迭代决策树算法对G(V,E)中所有未分类的用户进行分类,即判断用户的学生好友与非学生好友的数量差是否超过了阈值参数L,即是否满足|sFriend-nFriend|≥L;若满足,则对用户进行分类,并将成功分类的用户数记为κ;K若κ>K,回到步骤S2,否则进入步骤S4;其中,参数sFriend表示社交关系网络G(V,E)中某用户的学生好友数,参数nFriend表示社交关系网络G(V,E)中某用户的非学生好友数,参数L为可动态调整的阈值参数,K为预设的用于判断是否继续迭代的迭代参数;S4:令L=L-1;若L≥0,返回步骤S2,否则进入步骤S5;S5:输出分类结果。进一步,在步骤S1中,社交关系网络G(V,E)的建立方法为:对于每个用户,创建一个节点u∈V来表示;如果有两个用户u和v之间有电话或短信记录,则在他们之间创建边e(u,v)∈E。进一步,在步骤S2中,抽取的特征包括用户的好友数、用户的学生好友数、用户的非学生好友数和用户在同一学校的学生好友数。进一步,在步骤S3中,若nFriend-sFriend≥L,则将该用户分类为非学生用户;若则将该用户分类为学生用户;若sFriend-nFriend≥L,且则将该用户分类为非学生用户;其中,参数cFriend表示社交关系网络G(V,E)中该用户在同一学校的学生好友数,参数Friend表示社交关系网络G(V,E)中该用户的好友总数,参数C为预设的比例参数。本专利技术的有益效果在于:与传统的决策树相比,本专利技术所述的迭代决策树具有一些显著的区别。传统决策树的每个叶节点都应该对应某个确定的分类结果,但本专利技术所述的迭代决策树可以不对用户进行分类,即不满足|sFriend-nFriend|≥L条件的用户不进行分类,再通过迭代的方式,根据统计得到的特征,结合用户的好友圈,先将辨识度较高的用户,即满足条件|sFriend-nFriend|≥L的用户进行分类。然后,经过一轮分类,用户关系网络中被成功分类的那些用户的标签会发生改变,新分类的用户会改变其他尚未分类用户的好友圈分布情况。而这些未分类用户因为好友圈的分布发生了改变,又可以利用上述决策树在下一轮对他们进行分类。即用户虽然在上一轮没能成功分类,但是利用上一轮新分出的结果,可能会在这一轮成功分类。一直进行这样的迭代过程,直到所有用户都成功分类。为了保证最后所有用户都能成功分类,阈值L不设为固定数值,而是一个动态参数,它会在迭代过程中不断调整,当L等于0时,分类条件|sFriend-nFriend|≥L一定可以满足,因此能够保证所有客户都分类成功。本专利技术为电信客户分类和基于决策树的算法的应用提供了一个新的视角,尤本文档来自技高网
...
一种基于迭代决策树的电信用户分类方法

【技术保护点】
1.一种基于迭代决策树的电信用户分类方法,其特征在于:包括:S1:根据用户的基本信息、通话、短信记录构建用户社交关系网络G(V,E);S2:从用户社交关系网络G(V,E)中抽取特征,或者根据已分类的用户更新其他用户的特征;S3:应用迭代决策树算法对G(V,E)中所有未分类的用户进行分类,即判断用户的学生好友与非学生好友的数量差是否超过了阈值参数L,即是否满足|sFriend‑nFriend|≥L;若满足,则对用户进行分类,并将成功分类的用户数记为κ;若κ>K,回到步骤S2,否则进入步骤S4;其中,参数sFriend表示社交关系网络G(V,E)中某用户的学生好友数,参数nFriend表示社交关系网络G(V,E)中某用户的非学生好友数,参数L为可动态调整的阈值参数,K为预设的用于判断是否继续迭代的迭代参数;S4:令L=L‑1;若L≥0,返回步骤S2,否则进入步骤S5;S5:输出分类结果。

【技术特征摘要】
1.一种基于迭代决策树的电信用户分类方法,其特征在于:包括:S1:根据用户的基本信息、通话、短信记录构建用户社交关系网络G(V,E);S2:从用户社交关系网络G(V,E)中抽取特征,或者根据已分类的用户更新其他用户的特征;S3:应用迭代决策树算法对G(V,E)中所有未分类的用户进行分类,即判断用户的学生好友与非学生好友的数量差是否超过了阈值参数L,即是否满足|sFriend-nFriend|≥L;若满足,则对用户进行分类,并将成功分类的用户数记为κ;若κ>K,回到步骤S2,否则进入步骤S4;其中,参数sFriend表示社交关系网络G(V,E)中某用户的学生好友数,参数nFriend表示社交关系网络G(V,E)中某用户的非学生好友数,参数L为可动态调整的阈值参数,K为预设的用于判断是否继续迭代的迭代参数;S4:令L=L-1;若L≥0,返回步骤S2,否则进入步骤S5;S5:输出分类结果。2.根据权利要求1所述的基于迭代决策树的...

【专利技术属性】
技术研发人员:尚家兴朱倩雯武红春周尚波冯永钟将
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1