客户流失预测的深度学习方法及装置制造方法及图纸

技术编号:20869027 阅读:26 留言:0更新日期:2019-04-17 09:51
本发明专利技术公开了一种客户流失预测的深度学习方法及装置。根据设定的规则对采集的存量数据标注流失和续费标签,并把已经做完流失续费标签的客户按照比例分为训练样本和测试样本,利用预测模型对训练样本中的流失和续费两种不同类型的客户学习所选取的客户的特征得到训练模型,把训练模型代入到测试样本中,根据训练模型预测结果与测试样本中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率较高的模型作为实际应用中的模型。使用本发明专利技术的方法能够准确判断客户流失的概率,提高流失判断精度,降低人工盲目回访成本。

【技术实现步骤摘要】
客户流失预测的深度学习方法及装置
本专利技术属于人工智能领域,具体地说,是一种客户流失预测的深度学习方法及装置。
技术介绍
随着技术的发展,人们在享受电视节目等视频服务(产品)方面,无论从节目内容还是从接收途径上,都得到了极大的丰富,已经不仅仅局限于通过电视收看视频节目,广电系统垄断视频节目制作、传输的时代已一去不复返。近年来,电信企业等纷纷将触角伸向了这块领域,对于广电的下一代核心产品--数字电视而言将面临着来自各方面的激烈竞争,广电有线电视面临着客户流失、竞争力下降和资源未充分利用等经营危机,客户流失也成为广电管理最棘手的问题,影响广电发展及企业效益,如何进行流失预警并有针对性的对客户挽回是目前广电宽带亟需解决的问题。并伴随着信息时代的来临,企业营销焦点从以产品为中心转变为以客户为中心,客户关系管理成为企业的核心问题。客户关系管理的关键问题是客户是否流失,通过对客户的流失与否的预测,对企业流失的客户制定优化的个性化服务方案,采取不同的营销手段,实现企业利润最大化目标。根据相关调查数据显示,“客户保有率”增加5%将有可能为运营商带来85%的收入增长;挽留成功一位老客户的成本只占发展一位新客户成本的1/5;向老客户推荐新产品的成功率为向客户的3倍。由此可见,建立合理的客户流失预警模型,对客户进行分群,制定相应的营销策略,对不同的客户群提供个性化的客户服务是必须和有效的。现有对流失和续费客户的判断标准主要根据人工经验,根据客户到期是否续费来主观判断客户的流失与否进行电话回访与关注,不但需要消耗较多的人力,还会存在判断失误,有的客户还没到期就已经流失到别的运营商了,等人工发现到期未续费时客户已经在别的运营商缴费,挽留回来的困难大幅度增加。
技术实现思路
本专利技术的目的在于提供一种客户流失预测的深度学习方法及装置,根据客户的基本信息和使用行为信息等数据,判断客户流失的概率,提高流失判断精度,降低人工盲目回访成本。实现本专利技术的技术解决方案为:一种客户流失预测的深度学习方法,根据设定的规则对采集的存量数据标注流失和续费标签,并把已经做完流失续费标签的客户按照比例分为训练样本和测试样本,利用预测模型对训练样本中的流失和续费两种不同类型的客户学习所选取的客户的特征得到训练模型,把测试样本代入到训练模型中,根据训练模型预测结果与测试样本中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率较高的模型作为实际应用中的模型。其中,所选取客户的历史信息和学习客户的特征包括客户基本特征、客户行为特征、设备信息特征和消费购买特征。客户基本特征包括客户地理位置、客户账龄、客户级别、客户年龄、客户类型、客户下的用户数和客户下的互动用户数;客户行为特征包括最近1个月的直播观看次数、最近1个月的直播观看天数、最近1个月的直播观看时长、最近1个月回看观看次数、最近1个月回看观看天数、最近1个月的开机天数、最近1个月的开机次数、最近3个月的开机天数、最近3个月的开机次数、距离最近一次观看的天数,其中选取最近1个月和3个月的时间段是综合计算广电流失客户观看行为统计分析和指标的时效性考虑所得;设备信息特征主要为设备的使用年限和设备的更换频率;消费购买特征主要为客户近一个月的订购的产品个数、客户近三个月的订购产品个数、客户近一个月的出账金额,客户近三个月出账金额;其中,在训练模型建立的过程中使用的预测模型涉及的算法包括决策树、神经网络、随机森林。本专利技术还为客户的流失续费预测提供一种装置,该装置包括标签模块,用于对已知流失续费的历史客户标注流失续费的标签;分组模块,用于把存量数据按照7:3的比例分为训练集和测试集,且保持训练集和测试集里面的流失和续费客户占比相差较小;训练建模模块,用于使用不同的预测模型对训练集建立多个预测模型;测试模块,对不同的预测模型进行准确率评估;筛选模块,用于选取准确率较高的预测模型;识别模块,用于利用选择好的模型对未知的客户进行流失续费预测。其中,所选取客户的历史信息和学习客户的特征包括客户基本特征、客户行为特征、设备信息特征和消费购买特征。其中,所选取客户的历史信息和学习客户的特征包括客户基本特征、客户行为特征、设备信息特征和消费购买特征。客户基本特征包括客户地理位置、客户账龄、客户级别、客户年龄、客户类型、客户下的用户数和客户下的互动用户数;客户行为特征包括最近1个月的直播观看次数、最近1个月的直播观看天数、最近1个月的直播观看时长、最近1个月回看观看次数、最近1个月回看观看天数、最近1个月的开机天数、最近1个月的开机次数、最近3个月的开机天数、最近3个月的开机次数、距离最近一次观看的天数,其中选取最近1个月和3个月的时间段是综合计算广电流失客户观看行为统计分析和指标的时效性考虑所得;设备信息特征主要为设备的使用年限和设备的更换频率;消费购买特征主要为客户近一个月的订购的产品个数、客户近三个月的订购产品个数、客户近一个月的出账金额,客户近三个月出账金额;其中,在训练模型建立的过程中使用的预测模型涉及的算法包括决策树、神经网络、随机森林。本专利技术与现有技术相比,其显著优点为:本专利技术通过计算机来完成历史客户的流失续费标记、对客户流失续费特征的学习和对未知客户流失续费的预测,使用本专利技术能够准确判断客户流失的概率,提高流失判断精度,降低人工盲目回访成本。附图说明图1是本专利技术客户流失预测方法的数据处理实施方式流程图。图2是本专利技术的数据清洗规则流程图。图3是本专利技术客户流失预测方法的一种实施方式流程图。图4是本专利技术客户流失预测方法的详细实施方式和应用的流程图。图5是本专利技术客户流失预测装置的一种实施方式流程图。图6是本专利技术客户流失预测装置的详细实施方式和应用流程图。具体实施方式下面结合实施例和附图对本专利技术作进一步说明。图1是本专利技术客户流失预测方法的一种数据处理实施方式流程图,主要反映数据的采集、存储及清洗过程。数据的采集、存储及清洗过程是数据建模的基础,本专利技术主要清洗数据表:客户信息表、用户日全量表、设备信息表、设备编码表、设备历史订购表、产品订购历史表、出账信息表、点播记录表、开机信息表。其中客户信息表包含字段为客户标识、客户证号、老客户编号、老客户证号、客户名称、客户名简拼、客户密码、客户类型、客户级别、客户状态、状态变化日期、客户证件类型、客户证件号、客户证件地址、证件生效日期、证件失效日期、客户职业、单位名称、单位地址、境内外标识、地市代码、归属组织、营销组织、归属分公司、建档工号、建档组织、建档日期、生效日期、失效日期、受理日期、受理编号、受理操作员、受理组织、备注、县区代码、客户属性、客户订单id、片区id、片区名称、片区经理id、片区经理名称、片区经理电话、数据来源系统编码、ETL处理周期;用户日全量表包含字段为产品规格实例id、基本套餐实例id、基本策划编号、基本套餐品牌、产品规格id、客户编号、账户编号、付费方式、用户类别id、计费号、次计费号、主用户id、计费开始时间、用户名、用户属性、收视属性、VIP标识、VIP属性、境内外标识、低保标识、低保属性、用户身份、首次使用时间、用户状态、用户状态时间、操作状态、停开机状态、住宅地址id、安装地址id、安装地址名称、联系人标识、邮寄方式、邮寄地址、接入方式、宽本文档来自技高网
...

【技术保护点】
1.一种客户流失预测的深度学习方法,其特征在于,包括如下步骤:采集客户的存量数据进行存储,并对存量数据进行指标筛选,对筛选后的存量数据进行检查清洗,对清洗后的数据进行关联,得到有效数据;根据设定的规则对经过预处理的客户存量数据标注流失和续费标签;将已标注过流失和续费标签的客户按照比例划分为训练样本集和测试样本集;对训练样本集建立多个预测模型,利用预测模型对训练样本集中的流失客户和续费客户进行学习,得到训练模型;将测试样本集代入到训练模型中,训练模型预测结果与测试样本集中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率高的模型作为实际应用中的模型;使用该模型预测未来的未知客户流失续费情况。

【技术特征摘要】
1.一种客户流失预测的深度学习方法,其特征在于,包括如下步骤:采集客户的存量数据进行存储,并对存量数据进行指标筛选,对筛选后的存量数据进行检查清洗,对清洗后的数据进行关联,得到有效数据;根据设定的规则对经过预处理的客户存量数据标注流失和续费标签;将已标注过流失和续费标签的客户按照比例划分为训练样本集和测试样本集;对训练样本集建立多个预测模型,利用预测模型对训练样本集中的流失客户和续费客户进行学习,得到训练模型;将测试样本集代入到训练模型中,训练模型预测结果与测试样本集中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率高的模型作为实际应用中的模型;使用该模型预测未来的未知客户流失续费情况。2.根据权利要求1所述的深度学习方法,其特征在于,所述客户的存量数据包括:客户信息表,包含字段为客户标识、客户证号、老客户编号、老客户证号、客户名称、客户名简拼、客户密码、客户类型、客户级别、客户状态、状态变化日期、客户证件类型、客户证件号、客户证件地址、证件生效日期、证件失效日期、客户职业、单位名称、单位地址、境内外标识、地市代码、归属组织、营销组织、归属分公司、建档工号、建档组织、建档日期、生效日期、失效日期、受理日期、受理编号、受理操作员、受理组织、备注、县区代码、客户属性、客户订单id、片区id、片区名称、片区经理id、片区经理名称、片区经理电话、数据来源系统编码、ETL处理周期;用户日全量表,包含字段为产品规格实例id、基本套餐实例id、基本策划编号、基本套餐品牌、产品规格id、客户编号、账户编号、付费方式、用户类别id、计费号、次计费号、主用户id、计费开始时间、用户名、用户属性、收视属性、VIP标识、VIP属性、境内外标识、低保标识、低保属性、用户身份、首次使用时间、用户状态、用户状态时间、操作状态、停开机状态、住宅地址id、安装地址id、安装地址名称、联系人标识、邮寄方式、邮寄地址、接入方式、宽带登录名、电视号、地市代购、营销人员、营销组织、担保客户、生效日期、失效日期、创建日期、创建人编码、创建组织、受理日期、受理编号、受理操作员、受理组织、受理分公司、标准归属分公司、标准归属地区、模拟基本业务标识、数字基本业务标识、付费节目业务标识、互动基本业务标识、互动点播业务标识、宽带接入业务标识、语音业务标识、AMSP业务标识、扩展业务1标识、扩展业务2标识、云媒体标识、云媒体类型、用户类型、高清业务标识、在线标识、模拟基本业务在线标识、数字基本业务在线标识、付费节目业务在线标识、互动基本业务在线标识、互动点播业务在线标识、宽带接入业务在线标识、语音业务在线标识、AMSP业务在线标识、扩展业务1在线标识、扩展业务2在线标识、高清业务在线标识、主机标识、副机标识、自管网用户标识、直管网用户标识、整转标识、有效用户标识、有效用户标识(数字基本业务(1002)欠费停机在1年内)、有效用户标识(数字基本业务(1002)账单最早欠费月份2年内)、是否有10内到期产品、暂停用户标识、互动活跃客户标识、欠费停机用户标识、免费用户标识、缴费用户标识、新增用户标识、在线新增用户标识、流失用户标识、在线流失用户标识、电视支付状态、是否资料、是否置换、分区标识、数据来源系统编码、是否存量数据、ETL处理周期;设备信息表,包含字段为资源ID、资源型号、资源状态、生效时间、失效时间、入库日期、设备序列号、MAC地址、CMMAC、PIN、保修周期、保修周期单位、保换周期、保换周期单位、扩展字段、扩展字段2、扩展字段3、绑定设备、批次号、所在仓库、受理编号、受理日期、受理操作员、受理组织、地市代码、区县代码、扩展字段4、扩展字段5、锁定时间、资源等级、使用次数、备注、绑定状态、成本价格、入库单号、数据来源系统编码、是否存量数据、ETL处理周期;设备编码表,包含字段为资源型号、资源大类、资源小类、资源名称、资源设备号、受理资源、受理编号、受理日期、资源状态、项目资源信号、受理组织、受理操作员、备注、ETL处理周期;设备历史订购表,包含字段为历史ID、产品资源实例编号、策划实例ID、产品规格实例id、资源大类、资源小类、资源设备号、资源设备号2、资源设备号3、资源状态、资源来源、资源用途、地市代码、受理编号、创建日期、受理日期、生效日期、失效日期、受理操作员、受理组织、客户编号、客户订单信息ID;产品订购历史表,包含字段为历史ID、产品资源实例编号、策划实例ID、产品规格实例编号、资源大类、资源小类、资源设备号、资源设备号2、资源设备号3、资源状态、资源来源、资源用途、地市代码、受理编号、创建日期、受理日期、生效日期、失效日期、受理操作员、受理组织、客户编号、客户订单信息ID;出账信息表,包含字段为帐目标识、帐目来源规则标识、用户标识、帐户、销帐流水号、账单编号、帐务周期标识、费用周期、帐目类型、原始金额、优惠金额、减免金额、调帐金额、已销账金额、已打印金额、未打印金额、欠费金额、数据生成日期、状态、状态时间、滞纳金、滞纳金减免、默认帐务、计费优惠、帐目状态、帐目状态时间、处理坏帐时间、优惠ID、补足ID、通话次数、关联流水、总使用次数、标准消费类型编号、数据来源系统编码、是否历数据、ETL处理周期;点播记录表,包含字段为品牌、话单类型、服务标识、话单帐期月、批价使用产品、计费产品代码、主产品代码、促销产品集合、套餐计划、客户编号、账户编号、用户编号、条件代码、计费用户号码、一级归属局、二级归属局、三级归属局、开始时间、结束时间、计费资源量、批价标志、科目代码1、费用1、费用1优惠、科目代码2、费用2、费用2优惠、科目代码3、费用3、费用3优惠、科目代码4、费用4、费用4优惠、免费资源量、累计资源量值、话单序列号、记录类型、第三方号码、CP代码、内容ID、服务代码、PPV价格标签、用户计费类别、原始基本费、其他费用、标准资费批价结果基本费、标准资费批价结果其他费、批价处理日期时间、源文件、分公司组织ID、漫游类型、用户类型、备份日期、重处理标志、保留字段1、保留字段2、保留字段3、保留字段4、节目名称、计费用户属性、监控用户标示、批价重处理话单标识、账务科目代码1、账务科目代码2、账务科目代码3、账务科目代码4、迟到标志、入库时间、记录序号、标准归属分公司、数据来源系统编码、是否存量数据、ETL处理周期;开机信息表,包含字段为项目编号、区域id、系统类型、业务类型、记录时间、机顶盒id、CA卡号、用户唯一识别码、MAC地址、内网ip地址、外网ip地址。3.根据权利要求1-2任一所述的深度学习方法,其特征在于:采集客户的存量数据进行存储,并对存量数据进行指标筛选,对筛选后的存量数据的数据缺失、数据格式、数据合理...

【专利技术属性】
技术研发人员:宋晶科王华林峰孔令浚王玉婷宦琦曾钧鹏许萍朱亦丹
申请(专利权)人:南京中数媒介研究有限公司
类型:发明
国别省市:江苏,32

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1