基于随机森林和决策树的优质客户优化识别方法及装置制造方法及图纸

技术编号:18658848 阅读:25 留言:0更新日期:2018-08-11 14:47
本发明专利技术公开了一种基于随机森林和决策树的优质客户优化识别方法及装置,所述方法包括以下步骤:获取样本客户价值特征,并进行样本客户的优质性判别;采用样本客户数据,基于随机森林和决策树算法进行训练,构建优质客户识别模型;基于专家监督法对优质客户识别模型的判断结果进行有效性分析,并基于分析结果训练优质客户优化识别模型;将待识别客户的价值特征作为输入,基于所述优质客户优化识别模型,判断所述客户是否为优质客户。本发明专利技术基于大数据实现了优质客户的精准定位。

Quality customer optimization identification method and device based on random forest and decision tree

The invention discloses a method and device for optimizing customer identification based on random forest and decision tree. The method comprises the following steps: acquiring customer value characteristics of samples and discriminating the quality of sample customers; adopting sample customer data and training based on random forest and decision tree algorithm, constructing high quality products. Customer identification model; validity analysis of the judgment results of the high-quality customer identification model based on expert supervision method, and training the high-quality customer optimization identification model based on the analysis results; taking the value characteristics of the customer to be identified as input, judging whether the customer is a high-quality customer based on the high-quality customer optimization identification model Household. The invention realizes accurate positioning of high quality customers based on big data.

【技术实现步骤摘要】
基于随机森林和决策树的优质客户优化识别方法及装置
本专利技术属于机器学习的
,尤其涉及一种基于随机森林和决策树的优质客户优化识别方法及装置。
技术介绍
随着电力改革深化、售电侧市场的全面放开,国家电网公司各级供电公司均面临着市场竞争压力,为提升电网企业盈利能力和竞争力,增加优质客户的忠诚度、满意度和客户黏性,企业在做好全社会普遍服务的基础上,为优质客户提供优质服务将是各售电主体竞争优质客户的主要手段和策略。为了实现上述目的,保持电网企业的长期可持续发展,必须精准定位优质客户,并为优质客户提供差异化优质服务,增强客户对电网企业的忠诚度和依赖粘性,抢占优质客户资源市场,制定有针对性的竞争服务策略,将有限的服务资源投入到优质客户的身上,与其建立稳定的供用电关系。随着公司营销信息化、自动化建设的大力推进,以及4亿用户智能电能表全面实现信息自动采集,公司拥有的海量客户数据,4.3亿客户的档案、业扩、计量、电费等数据年增长量约50TB,4.0亿只智能电能表电量、电能质量采集带来数据年增长量约500TB,每日约20万次95598电话带来数据年增长量约10TB,每日约15万张业务工单带来数据年增长量约2TB,节能服务、电动汽车充换电网络运营等也积累了海量数据;同时,随着互联网经济的快速发展,95598智能互动网站、“掌上电力”手机APP、“电e宝”、“e充电”等网络用户的应用呈爆炸式增长。然而,随着数据量的爆发式增长和业务要求的不断提高,传统的业务系统架构已经越来越难满足系统运行的要求。大数据技术作为重要的战略资源已经在全球范围内达成共识,数据这一基础性战略资源为分析客户需求和提供针对性服务,提供了数据支撑。综上所述,如何基于大数据实现优质客户的精准识别定位,是目前需要迫切解决的技术问题。
技术实现思路
为克服上述现有技术的不足,解决现有技术中针对如何基于大数据实现优质客户的精准识别定位的问题,本专利技术提供了一种售电侧基于随机森林和决策树的优质客户优化识别方法及装置,所述方法以电网公司客户的用电属性、用电行为、用电特征等海量数据为基础,建立多维度的客户评价指标体系,通过以数据分析方式构建的客户评价模型,并进一步优化模型,对客户进行综合评分,从而实现对优质客户的精准定位。本专利技术的第一目的是提供一种基于随机森林和决策树的优质客户优化识别方法。为了实现上述目的,本专利技术采用如下一种技术方案:一种基于随机森林和决策树的优质客户优化识别方法,包括以下步骤:获取样本客户价值特征,并进行样本客户的优质性判别;采用样本客户数据,基于随机森林和决策树算法进行训练,构建优质客户识别模型;基于专家监督法对优质客户识别模型的判断结果进行有效性分析,并基于分析结果训练优质客户优化识别模型;将待识别客户的价值特征作为输入,基于所述优质客户优化识别模型,判断所述客户是否为优质客户。作为进一步的优选方案,所述获取样本客户价值特征并进行样本客户的优质性判别的具体步骤包括:选择样本客户,获取样本客户的用户各项用电信息,并对其影响客户综合价值进行分析,构建多维度的客户价值评价特征指标体系;根据所述指标体系统计样本客户的价值特征,并进行样本客户优质性判别。作为进一步的优选方案,所述获取样本客户价值特征中价值特征包括用户对应的基本属性、经济价值、负荷价值、发展价值、信用价值、行业价值数据。作为进一步的优选方案,所述采用样本客户数据,基于随机森林和决策树算法进行训练,构建优质客户识别模型的具体步骤包括:对样本客户数据进行预处理;基于随机森林法构建优质客户判断模型;基于决策树算法构建优质客户业务规则释义模型;采用预处理后的样本客户数据对优质客户判断模型和优质客户业务规则释义模型进行模型训练,构建优质客户识别模型。作为进一步的优选方案,所述对样本客户数据进行预处理的具体步骤包括:数据清洗、特征因素量化、特征拓展、特征选择和异常值处理。作为进一步的优选方案,所述数据清洗为通过数据超限值检验、特征有效性检验和数据空值检验,对数据进行清洗;所述数据超限值检验为检查样本客户数据中用电量和电费电价均为0的记录并予以删除;所述特征有效性检验为检查样本客户数据中用户重要性特征信息过于单一的记录;所述数据空值检验为检查暂停天数字段全空和电费回款逾期天数缺失严重的记录。作为进一步的优选方案,所述采用预处理后的样本客户数据对优质客户判断模型和优质客户业务规则释义模型进行模型训练的具体步骤包括:依次进行全特征训练、重要特征训练、全特征交叉训练和重要特征交叉训练;所述全特征训练:样本选取全部样本客户数据,模型入参为全部业务指标;所述重要特征训练:样本选取全部样本客户数据,模型入参为重要性高的前40%指标;所述全特征交叉训练:将样本客户数据平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次,模型入参为全部业务指标;所述重要特征交叉训练:将样本客户数据平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次,模型入参为重要性高的前40%指标。作为进一步的优选方案,在模型训练前,所述方法还包括:采用MDA法和MDG法相结合的方式选取重要性指标,通过模型训练,得到指标重要性分析结果。作为进一步的优选方案,所述方法还包括:建立所述优质客户识别模型升级优化的长效机制,基于专家监督法对优质客户识别模型的判断结果不定期地进行有效性分析,并基于分析结果,重新训练优质客户优化识别模型。作为进一步的优选方案,所述方法还包括:对训练好的所述优质客户优化识别模型进行集成,通过数据接口收集用户特征数据,定期进行优质客户的识别,将待识别客户的价值特征作为输入,基于所述优质客户优化识别模型,判断所述客户是否为优质客户。本专利技术的第二目的是提供一种基于随机森林和决策树的优质客户优化识别装置。为了实现上述目的,本专利技术采用如下一种技术方案:一种基于随机森林和决策树的优质客户优化识别装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种基于随机森林和决策树的优质客户优化识别方法。本专利技术的第三目的是提供一种计算机可读存储介质。为了实现上述目的,本专利技术采用如下一种技术方案:一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行所述的一种基于随机森林和决策树的优质客户优化识别方法。本专利技术的有益效果1、本专利技术以电网公司客户的用电属性、用电行为、用电特征等海量数据为基础,采用机器学习的技术手段,实现了优质客户的识别,为针对优质客户提供优质服务提供了保障,有助于提升电网企业竞争力。2、本专利技术采用随机森林和决策树相结合的方式进行客户识别模型的训练,所述识别模型能够在识别客户是否优质的基础上,判断优质客户的业务规则释义,进一步实现了优质客户的精准定位。3、本专利技术建立所述优质客户识别模型升级优化的长效机制,基于专家监督法对优质客户识别模型的判断结果不定期地进行有效性分析,并基于分析结果,重新训练优质客户优化识别模型,通过重新训练模型达到模型版本升级及优化的目的。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为本本文档来自技高网
...

【技术保护点】
1.一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,包括以下步骤:获取样本客户价值特征,并进行样本客户的优质性判别;采用样本客户数据,基于随机森林和决策树算法进行训练,构建优质客户识别模型;基于专家监督法对优质客户识别模型的判断结果进行有效性分析,并基于分析结果训练优质客户优化识别模型;将待识别客户的价值特征作为输入,基于所述优质客户优化识别模型,判断所述客户是否为优质客户。

【技术特征摘要】
1.一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,包括以下步骤:获取样本客户价值特征,并进行样本客户的优质性判别;采用样本客户数据,基于随机森林和决策树算法进行训练,构建优质客户识别模型;基于专家监督法对优质客户识别模型的判断结果进行有效性分析,并基于分析结果训练优质客户优化识别模型;将待识别客户的价值特征作为输入,基于所述优质客户优化识别模型,判断所述客户是否为优质客户。2.如权利要求1所述的一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,所述获取样本客户价值特征并进行样本客户的优质性判别的具体步骤包括:选择样本客户,获取样本客户的用户各项用电信息,并对其影响客户综合价值进行分析,构建多维度的客户价值评价特征指标体系;根据所述指标体系统计样本客户的价值特征,并进行样本客户优质性判别。3.如权利要求1或2所述的一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,所述获取样本客户价值特征中价值特征包括用户对应的基本属性、经济价值、负荷价值、发展价值、信用价值、行业价值数据。4.如权利要求1所述的一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,所述采用样本客户数据,基于随机森林和决策树算法进行训练,构建优质客户识别模型的具体步骤包括:对样本客户数据进行预处理;基于随机森林法构建优质客户判断模型;基于决策树算法构建优质客户业务规则释义模型;采用预处理后的样本客户数据对优质客户判断模型和优质客户业务规则释义模型进行模型训练,构建优质客户识别模型。5.如权利要求4所述的一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,所述对样本客户数据进行预处理的具体步骤包括:数据清洗、特征因素量化、特征拓展、特征选择和异常值处理。6.如权利要求5所述的一种基于随机森林和决策树的优质客户优化识别方法,其特...

【专利技术属性】
技术研发人员:李云亭张洪利荣以平朱伟义刘霄慧尹明立粱波姜云王伟刘昳娟王鑫
申请(专利权)人:国网山东省电力公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1