识别存在家庭关系客户的方法、装置、设备及介质制造方法及图纸

技术编号:20875048 阅读:20 留言:0更新日期:2019-04-17 11:15
本发明专利技术提供了一种识别存在家庭关系客户的方法、装置、设备及介质。该方法包括:获取目标位置的真实家庭用户;筛选目标位置处预设时间段中闲时通话天数所占比例大于第一预设比例的交往圈用户;将真实家庭用户和交往圈用户进行混合,得到基础用户;从基础用户中选取第二预设比例的用户作为训练样本集用户;基于已知家庭关系样本集用户的多个输入变量,剔除与用于识别家庭关系无关的输入变量,获取多个重要输入变量;对训练样本集用户的多个重要输入变量进行建模,获得模型输出规则,用于识别存在家庭关系的客户。根据本发明专利技术提供的技术方案,利用真实家庭用户和交往圈用户数据训练模型,并附加多个与识别家庭关系有关的变量,大幅提升预测准确度。

【技术实现步骤摘要】
识别存在家庭关系客户的方法、装置、设备及介质
本专利技术涉及通信
,尤其涉及一种识别存在家庭关系客户的方法、装置、设备及介质。
技术介绍
现有的判断客户家庭关系的方法主要包括以下几种:1、通过用户在CRM(客户关系管理)系统中订购家庭网产品的记录及订购的家庭成员关系进行判断家庭关系。2、通过家庭微蜂窝型基站(FEMTO,Femtocell)进行家庭成员信息收集,定位服务管理模块,管理物理家庭信息及家庭成员,处理家庭基站信令数据和家庭区域内的用户定位分析。3、通过用户在特定时间内的通话时间段数据进行检测和关联,将满足关联阈值的用户设为家庭成员。综上所述,现有方法分别存在以下缺陷:1、现有技术1中的设定条件中用户必须办理家庭网或类似产品,未办理用户及无法进行判断;且用户在办理过程中存在非家庭成员办理情况,对后续营销存在影响。2、现有技术2中家庭基站FEMTO作为基本淘汰的产品已经基本没有业务办理量,存量用户保有量低,适用场景少。对整体用户分析无法提供有效支撑。3、现有技术3中仅考虑用户的语音通话行为,未考虑位置、交往圈、特殊组合等关键影响因子,准确度有限。
技术实现思路
本专利技术实施例提供了一种识别存在家庭关系客户的方法、装置、设备及介质,利用真实家庭用户和交往圈用户数据训练模型,并附加多个与识别家庭关系有关的变量,大幅提升预测准确度。第一方面,本专利技术实施例提供了一种识别存在家庭关系客户的方法,方法包括:获取目标位置的真实家庭用户;筛选所述目标位置处预设时间段中闲时通话天数所占比例大于第一预设比例的交往圈用户;将所述真实家庭用户和所述交往圈用户进行混合,得到基础用户;从所述基础用户中选取第二预设比例的用户作为训练样本集用户;基于已知家庭关系样本集用户的多个输入变量,从所述多个输入变量中剔除与用于识别家庭关系无关的输入变量,获取多个重要输入变量;对所述训练样本集用户的多个重要输入变量进行建模,获得存在家庭关系客户的模型输出规则;根据所述模型输出规则,识别存在家庭关系的客户。根据本专利技术所述的识别存在家庭关系客户的方法,所述基于已知家庭关系样本集用户的多个输入变量,从所述多个输入变量中剔除与用于识别家庭关系无关的输入变量,获取多个重要输入变量,包括:获取所述基于已知家庭关系样本集用户的多个输入变量;基于所述多个输入变量,通过数据审核和/或特征选择,从所述多个输入变量中获取多个重要输入变量。根据本专利技术所述的识别存在家庭关系客户的方法,所述多个输入变量包括如下项中的至少一种年龄差、夜间常驻小区是否重合、身份证是否相同、互相通话次数、交往圈重合数、是否同姓、是否属于同一集团网、互相通话天数、互相通话时长、忙时小区重合数、闲时小区重合数、使用相同国际移动设备识别码IMEI次数。根据本专利技术所述的识别存在家庭关系客户的方法,所述多个重要输入变量包括如下项中的至少一种年龄差、夜间常驻小区是否重合、身份证是否相同、互相通话次数、交往圈重合数、以及是否同姓。根据本专利技术所述的识别存在家庭关系客户的方法,所述对所述训练样本集用户的多个重要输入变量进行建模,包括:利用决策树算法C5.0,对所述训练样本集用户的多个重要输入变量进行建模,得到决策树模型。根据本专利技术所述的识别存在家庭关系客户的方法,所述对所述训练样本集用户的多个重要输入变量进行建模,得到决策树模型,包括:基于所述训练样本集用户的多个重要输入变量,得到所述多个重要输入变量中每一个变量的信息增益率;根据所述多个重要输入变量中每一个变量的信息增益率,确定所述决策树模型的最佳分组变量和分割点;根据所述最佳分组变量和分割点,得到决策树模型。根据本专利技术所述的识别存在家庭关系客户的方法,所述方法还包括:对所述决策树模型进行建模分析,得到所述多个重要输入变量中每一个变量所占的权重。根据本专利技术所述的识别存在家庭关系客户的方法,所述方法还包括:根据所述多个重要输入变量中每一个变量所占的权重,获得存在家庭关系客户的模型输出规则。根据本专利技术所述的识别存在家庭关系客户的方法,所述方法还包括:将所述基础用户中除所述训练样本集用户之外的用户作为验证样本集用户;利用所述验证样本集用户,对所述模型输出规则进行评估。根据本专利技术所述的识别存在家庭关系客户的方法,所述将所述真实家庭用户和所述交往圈用户进行混合,包括:基于所述真实家庭用户,以家庭为单位,将属于同一家庭的用户进行两两组合,形成家庭关系对;将所述家庭关系对和所述交往圈用户混合,得到基础用户。第二方面,本专利技术实施例提供了一种识别存在家庭关系客户的装置,装置包括:第一获取模块,用于获取目标位置的真实家庭用户;筛选模块,用于筛选所述目标位置处预设时间段中闲时通话天数所占比例大于第一预设比例的交往圈用户;混合模块,用于将所述真实家庭用户和所述交往圈用户进行混合,得到基础用户;选取模块,用于从所述基础用户中选取第二预设比例的用户作为训练样本集用户;剔除模块,用于基于已知家庭关系样本集用户的多个输入变量,从所述多个输入变量中剔除与用于识别家庭关系无关的输入变量,获取多个重要输入变量;建模模块,用于对所述训练样本集用户的多个重要输入变量进行建模,获得存在家庭关系客户的模型输出规则;识别模块,用于根据所述模型输出规则,识别存在家庭关系的客户。根据本专利技术所述的识别存在家庭关系客户的装置,剔除模块具体用于:获取所述基于已知家庭关系样本集用户的多个输入变量;基于所述多个输入变量,通过数据审核和/或特征选择,从所述多个输入变量中获取多个重要输入变量。根据本专利技术所述的识别存在家庭关系客户的装置,所述多个输入变量包括如下项中的至少一种年龄差、夜间常驻小区是否重合、身份证是否相同、互相通话次数、交往圈重合数、是否同姓、是否属于同一集团网、互相通话天数、互相通话时长、忙时小区重合数、闲时小区重合数、使用相同国际移动设备识别码IMEI次数。根据本专利技术所述的识别存在家庭关系客户的装置,所述多个重要输入变量包括如下项中的至少一种年龄差、夜间常驻小区是否重合、身份证是否相同、互相通话次数、交往圈重合数、以及是否同姓。根据本专利技术所述的识别存在家庭关系客户的装置,建模模块具体用于:利用决策树算法C5.0,对所述训练样本集用户的多个重要输入变量进行建模,得到决策树模型。根据本专利技术所述的识别存在家庭关系客户的装置,建模模块具体用于:基于所述训练样本集用户的多个重要输入变量,得到所述多个重要输入变量中每一个变量的信息增益率;根据所述多个重要输入变量中每一个变量的信息增益率,确定所述决策树模型的最佳分组变量和分割点;根据所述最佳分组变量和分割点,得到决策树模型。根据本专利技术所述的识别存在家庭关系客户的装置,装置还包括:建模分析模块,用于对所述决策树模型进行建模分析,得到所述多个重要输入变量中每一个变量所占的权重。根据本专利技术所述的识别存在家庭关系客户的装置,装置还包括:模型输出规则获取模块,用于根据所述多个重要输入变量中每一个变量所占的权重,获得存在家庭关系客户的模型输出规则。根据本专利技术所述的识别存在家庭关系客户的装置,装置还包括:评估模块,用于将所述基础用户中除所述训练样本集用户之外的用户作为验证样本集用户;利用所述验证样本集用户,对所述模型输出规则进行评估。根据本专利技术所述的识别存在家庭关系客户本文档来自技高网...

【技术保护点】
1.一种识别存在家庭关系客户的方法,包括:获取目标位置的真实家庭用户;筛选所述目标位置处预设时间段中闲时通话天数所占比例大于第一预设比例的交往圈用户;将所述真实家庭用户和所述交往圈用户进行混合,得到基础用户;从所述基础用户中选取第二预设比例的用户作为训练样本集用户;基于已知家庭关系样本集用户的多个输入变量,从所述多个输入变量中剔除与用于识别家庭关系无关的输入变量,获取多个重要输入变量;对所述训练样本集用户的多个重要输入变量进行建模,获得存在家庭关系客户的模型输出规则;根据所述模型输出规则,识别存在家庭关系的客户。

【技术特征摘要】
1.一种识别存在家庭关系客户的方法,包括:获取目标位置的真实家庭用户;筛选所述目标位置处预设时间段中闲时通话天数所占比例大于第一预设比例的交往圈用户;将所述真实家庭用户和所述交往圈用户进行混合,得到基础用户;从所述基础用户中选取第二预设比例的用户作为训练样本集用户;基于已知家庭关系样本集用户的多个输入变量,从所述多个输入变量中剔除与用于识别家庭关系无关的输入变量,获取多个重要输入变量;对所述训练样本集用户的多个重要输入变量进行建模,获得存在家庭关系客户的模型输出规则;根据所述模型输出规则,识别存在家庭关系的客户。2.根据权利要求1所述的方法,其特征在于,所述基于已知家庭关系样本集用户的多个输入变量,从所述多个输入变量中剔除与用于识别家庭关系无关的输入变量,获取多个重要输入变量,包括:获取所述基于已知家庭关系样本集用户的多个输入变量;基于所述多个输入变量,通过数据审核和/或特征选择,从所述多个输入变量中获取多个重要输入变量。3.根据权利要求1所述的方法,其特征在于,所述多个输入变量包括如下项中的至少一种年龄差、夜间常驻小区是否重合、身份证是否相同、互相通话次数、交往圈重合数、是否同姓、是否属于同一集团网、互相通话天数、互相通话时长、忙时小区重合数、闲时小区重合数、使用相同国际移动设备识别码IMEI次数。4.根据权利要求1所述的方法,其特征在于,所述多个重要输入变量包括如下项中的至少一种年龄差、夜间常驻小区是否重合、身份证是否相同、互相通话次数、交往圈重合数、以及是否同姓。5.根据权利要求1所述的方法,其特征在于,所述对所述训练样本集用户的多个重要输入变量进行建模,包括:利用决策树算法C5.0,对所述训练样本集用户的多个重要输入变量进行建模,得到决策树模型。6.根据权利要求5所述的方法,其特征在于,所述对所述训练样本集用户的多个重要输入变量进行建模,得到决策树模型,包括:基于所述训练样本集用户的多个重要输入变量,得到所述多个重要输入变量中每一个变量的信息增益率;根据所述多个重要输入变量中每一个变量的信息增益率,确定所述决策树模...

【专利技术属性】
技术研发人员:张晟刘亮顾强
申请(专利权)人:中国移动通信集团江苏有限公司中国移动通信集团有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1