【技术实现步骤摘要】
客户流失预测的深度学习方法及装置
本专利技术属于人工智能领域,具体地说,是一种客户流失预测的深度学习方法及装置。
技术介绍
随着技术的发展,人们在享受电视节目等视频服务(产品)方面,无论从节目内容还是从接收途径上,都得到了极大的丰富,已经不仅仅局限于通过电视收看视频节目,广电系统垄断视频节目制作、传输的时代已一去不复返。近年来,电信企业等纷纷将触角伸向了这块领域,对于广电的下一代核心产品--数字电视而言将面临着来自各方面的激烈竞争,广电有线电视面临着客户流失、竞争力下降和资源未充分利用等经营危机,客户流失也成为广电管理最棘手的问题,影响广电发展及企业效益,如何进行流失预警并有针对性的对客户挽回是目前广电宽带亟需解决的问题。并伴随着信息时代的来临,企业营销焦点从以产品为中心转变为以客户为中心,客户关系管理成为企业的核心问题。客户关系管理的关键问题是客户是否流失,通过对客户的流失与否的预测,对企业流失的客户制定优化的个性化服务方案,采取不同的营销手段,实现企业利润最大化目标。根据相关调查数据显示,“客户保有率”增加5%将有可能为运营商带来85%的收入增长;挽留成功一位老客户的成本只占发展一位新客户成本的1/5;向老客户推荐新产品的成功率为向客户的3倍。由此可见,建立合理的客户流失预警模型,对客户进行分群,制定相应的营销策略,对不同的客户群提供个性化的客户服务是必须和有效的。现有对流失和续费客户的判断标准主要根据人工经验,根据客户到期是否续费来主观判断客户的流失与否进行电话回访与关注,不但需要消耗较多的人力,还会存在判断失误,有的客户还没到期就已经流失到别的运营 ...
【技术保护点】
1.一种客户流失预测的深度学习方法,其特征在于,包括如下步骤:采集客户的存量数据进行存储,并对存量数据进行指标筛选,对筛选后的存量数据进行检查清洗,对清洗后的数据进行关联,得到有效数据;根据设定的规则对经过预处理的客户存量数据标注流失和续费标签;将已标注过流失和续费标签的客户按照比例划分为训练样本集和测试样本集;对训练样本集建立多个预测模型,利用预测模型对训练样本集中的流失客户和续费客户进行学习,得到训练模型;将测试样本集代入到训练模型中,训练模型预测结果与测试样本集中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率高的模型作为实际应用中的模型;使用该模型预测未来的未知客户流失续费情况。
【技术特征摘要】
1.一种客户流失预测的深度学习方法,其特征在于,包括如下步骤:采集客户的存量数据进行存储,并对存量数据进行指标筛选,对筛选后的存量数据进行检查清洗,对清洗后的数据进行关联,得到有效数据;根据设定的规则对经过预处理的客户存量数据标注流失和续费标签;将已标注过流失和续费标签的客户按照比例划分为训练样本集和测试样本集;对训练样本集建立多个预测模型,利用预测模型对训练样本集中的流失客户和续费客户进行学习,得到训练模型;将测试样本集代入到训练模型中,训练模型预测结果与测试样本集中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率高的模型作为实际应用中的模型;使用该模型预测未来的未知客户流失续费情况。2.根据权利要求1所述的深度学习方法,其特征在于,所述客户的存量数据包括:客户信息表,包含字段为客户标识、客户证号、老客户编号、老客户证号、客户名称、客户名简拼、客户密码、客户类型、客户级别、客户状态、状态变化日期、客户证件类型、客户证件号、客户证件地址、证件生效日期、证件失效日期、客户职业、单位名称、单位地址、境内外标识、地市代码、归属组织、营销组织、归属分公司、建档工号、建档组织、建档日期、生效日期、失效日期、受理日期、受理编号、受理操作员、受理组织、备注、县区代码、客户属性、客户订单id、片区id、片区名称、片区经理id、片区经理名称、片区经理电话、数据来源系统编码、ETL处理周期;用户日全量表,包含字段为产品规格实例id、基本套餐实例id、基本策划编号、基本套餐品牌、产品规格id、客户编号、账户编号、付费方式、用户类别id、计费号、次计费号、主用户id、计费开始时间、用户名、用户属性、收视属性、VIP标识、VIP属性、境内外标识、低保标识、低保属性、用户身份、首次使用时间、用户状态、用户状态时间、操作状态、停开机状态、住宅地址id、安装地址id、安装地址名称、联系人标识、邮寄方式、邮寄地址、接入方式、宽带登录名、电视号、地市代购、营销人员、营销组织、担保客户、生效日期、失效日期、创建日期、创建人编码、创建组织、受理日期、受理编号、受理操作员、受理组织、受理分公司、标准归属分公司、标准归属地区、模拟基本业务标识、数字基本业务标识、付费节目业务标识、互动基本业务标识、互动点播业务标识、宽带接入业务标识、语音业务标识、AMSP业务标识、扩展业务1标识、扩展业务2标识、云媒体标识、云媒体类型、用户类型、高清业务标识、在线标识、模拟基本业务在线标识、数字基本业务在线标识、付费节目业务在线标识、互动基本业务在线标识、互动点播业务在线标识、宽带接入业务在线标识、语音业务在线标识、AMSP业务在线标识、扩展业务1在线标识、扩展业务2在线标识、高清业务在线标识、主机标识、副机标识、自管网用户标识、直管网用户标识、整转标识、有效用户标识、有效用户标识(数字基本业务(1002)欠费停机在1年内)、有效用户标识(数字基本业务(1002)账单最早欠费月份2年内)、是否有10内到期产品、暂停用户标识、互动活跃客户标识、欠费停机用户标识、免费用户标识、缴费用户标识、新增用户标识、在线新增用户标识、流失用户标识、在线流失用户标识、电视支付状态、是否资料、是否置换、分区标识、数据来源系统编码、是否存量数据、ETL处理周期;设备信息表,包含字段为资源ID、资源型号、资源状态、生效时间、失效时间、入库日期、设备序列号、MAC地址、CMMAC、PIN、保修周期、保修周期单位、保换周期、保换周期单位、扩展字段、扩展字段2、扩展字段3、绑定设备、批次号、所在仓库、受理编号、受理日期、受理操作员、受理组织、地市代码、区县代码、扩展字段4、扩展字段5、锁定时间、资源等级、使用次数、备注、绑定状态、成本价格、入库单号、数据来源系统编码、是否存量数据、ETL处理周期;设备编码表,包含字段为资源型号、资源大类、资源小类、资源名称、资源设备号、受理资源、受理编号、受理日期、资源状态、项目资源信号、受理组织、受理操作员、备注、ETL处理周期;设备历史订购表,包含字段为历史ID、产品资源实例编号、策划实例ID、产品规格实例id、资源大类、资源小类、资源设备号、资源设备号2、资源设备号3、资源状态、资源来源、资源用途、地市代码、受理编号、创建日期、受理日期、生效日期、失效日期、受理操作员、受理组织、客户编号、客户订单信息ID;产品订购历史表,包含字段为历史ID、产品资源实例编号、策划实例ID、产品规格实例编号、资源大类、资源小类、资源设备号、资源设备号2、资源设备号3、资源状态、资源来源、资源用途、地市代码、受理编号、创建日期、受理日期、生效日期、失效日期、受理操作员、受理组织、客户编号、客户订单信息ID;出账信息表,包含字段为帐目标识、帐目来源规则标识、用户标识、帐户、销帐流水号、账单编号、帐务周期标识、费用周期、帐目类型、原始金额、优惠金额、减免金额、调帐金额、已销账金额、已打印金额、未打印金额、欠费金额、数据生成日期、状态、状态时间、滞纳金、滞纳金减免、默认帐务、计费优惠、帐目状态、帐目状态时间、处理坏帐时间、优惠ID、补足ID、通话次数、关联流水、总使用次数、标准消费类型编号、数据来源系统编码、是否历数据、ETL处理周期;点播记录表,包含字段为品牌、话单类型、服务标识、话单帐期月、批价使用产品、计费产品代码、主产品代码、促销产品集合、套餐计划、客户编号、账户编号、用户编号、条件代码、计费用户号码、一级归属局、二级归属局、三级归属局、开始时间、结束时间、计费资源量、批价标志、科目代码1、费用1、费用1优惠、科目代码2、费用2、费用2优惠、科目代码3、费用3、费用3优惠、科目代码4、费用4、费用4优惠、免费资源量、累计资源量值、话单序列号、记录类型、第三方号码、CP代码、内容ID、服务代码、PPV价格标签、用户计费类别、原始基本费、其他费用、标准资费批价结果基本费、标准资费批价结果其他费、批价处理日期时间、源文件、分公司组织ID、漫游类型、用户类型、备份日期、重处理标志、保留字段1、保留字段2、保留字段3、保留字段4、节目名称、计费用户属性、监控用户标示、批价重处理话单标识、账务科目代码1、账务科目代码2、账务科目代码3、账务科目代码4、迟到标志、入库时间、记录序号、标准归属分公司、数据来源系统编码、是否存量数据、ETL处理周期;开机信息表,包含字段为项目编号、区域id、系统类型、业务类型、记录时间、机顶盒id、CA卡号、用户唯一识别码、MAC地址、内网ip地址、外网ip地址。3.根据权利要求1-2任一所述的深度学习方法,其特征在于:采集客户的存量数据进行存储,并对存量数据进行指标筛选,对筛选后的存量数据的数据缺失、数据格式、数据合理...
【专利技术属性】
技术研发人员:宋晶科,王华,林峰,孔令浚,王玉婷,宦琦,曾钧鹏,许萍,朱亦丹,
申请(专利权)人:南京中数媒介研究有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。