The invention discloses a method and device for optimizing customer identification based on random forest and decision tree. The method comprises the following steps: acquiring customer value characteristics of samples and discriminating the quality of sample customers; adopting sample customer data and training based on random forest and decision tree algorithm, constructing high quality products. Customer identification model; validity analysis of the judgment results of the high-quality customer identification model based on expert supervision method, and training the high-quality customer optimization identification model based on the analysis results; taking the value characteristics of the customer to be identified as input, judging whether the customer is a high-quality customer based on the high-quality customer optimization identification model Household. The invention realizes accurate positioning of high quality customers based on big data.
【技术实现步骤摘要】
基于随机森林和决策树的优质客户优化识别方法及装置
本专利技术属于机器学习的
,尤其涉及一种基于随机森林和决策树的优质客户优化识别方法及装置。
技术介绍
随着电力改革深化、售电侧市场的全面放开,国家电网公司各级供电公司均面临着市场竞争压力,为提升电网企业盈利能力和竞争力,增加优质客户的忠诚度、满意度和客户黏性,企业在做好全社会普遍服务的基础上,为优质客户提供优质服务将是各售电主体竞争优质客户的主要手段和策略。为了实现上述目的,保持电网企业的长期可持续发展,必须精准定位优质客户,并为优质客户提供差异化优质服务,增强客户对电网企业的忠诚度和依赖粘性,抢占优质客户资源市场,制定有针对性的竞争服务策略,将有限的服务资源投入到优质客户的身上,与其建立稳定的供用电关系。随着公司营销信息化、自动化建设的大力推进,以及4亿用户智能电能表全面实现信息自动采集,公司拥有的海量客户数据,4.3亿客户的档案、业扩、计量、电费等数据年增长量约50TB,4.0亿只智能电能表电量、电能质量采集带来数据年增长量约500TB,每日约20万次95598电话带来数据年增长量约10TB,每日约15万张业务工单带来数据年增长量约2TB,节能服务、电动汽车充换电网络运营等也积累了海量数据;同时,随着互联网经济的快速发展,95598智能互动网站、“掌上电力”手机APP、“电e宝”、“e充电”等网络用户的应用呈爆炸式增长。然而,随着数据量的爆发式增长和业务要求的不断提高,传统的业务系统架构已经越来越难满足系统运行的要求。大数据技术作为重要的战略资源已经在全球范围内达成共识,数据这一基础性战略资源为分 ...
【技术保护点】
1.一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,包括以下步骤:获取样本客户价值特征,并进行样本客户的优质性判别;采用样本客户数据,基于随机森林和决策树算法进行训练,构建优质客户识别模型;基于专家监督法对优质客户识别模型的判断结果进行有效性分析,并基于分析结果训练优质客户优化识别模型;将待识别客户的价值特征作为输入,基于所述优质客户优化识别模型,判断所述客户是否为优质客户。
【技术特征摘要】
1.一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,包括以下步骤:获取样本客户价值特征,并进行样本客户的优质性判别;采用样本客户数据,基于随机森林和决策树算法进行训练,构建优质客户识别模型;基于专家监督法对优质客户识别模型的判断结果进行有效性分析,并基于分析结果训练优质客户优化识别模型;将待识别客户的价值特征作为输入,基于所述优质客户优化识别模型,判断所述客户是否为优质客户。2.如权利要求1所述的一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,所述获取样本客户价值特征并进行样本客户的优质性判别的具体步骤包括:选择样本客户,获取样本客户的用户各项用电信息,并对其影响客户综合价值进行分析,构建多维度的客户价值评价特征指标体系;根据所述指标体系统计样本客户的价值特征,并进行样本客户优质性判别。3.如权利要求1或2所述的一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,所述获取样本客户价值特征中价值特征包括用户对应的基本属性、经济价值、负荷价值、发展价值、信用价值、行业价值数据。4.如权利要求1所述的一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,所述采用样本客户数据,基于随机森林和决策树算法进行训练,构建优质客户识别模型的具体步骤包括:对样本客户数据进行预处理;基于随机森林法构建优质客户判断模型;基于决策树算法构建优质客户业务规则释义模型;采用预处理后的样本客户数据对优质客户判断模型和优质客户业务规则释义模型进行模型训练,构建优质客户识别模型。5.如权利要求4所述的一种基于随机森林和决策树的优质客户优化识别方法,其特征在于,所述对样本客户数据进行预处理的具体步骤包括:数据清洗、特征因素量化、特征拓展、特征选择和异常值处理。6.如权利要求5所述的一种基于随机森林和决策树的优质客户优化识别方法,其特...
【专利技术属性】
技术研发人员:李云亭,张洪利,荣以平,朱伟义,刘霄慧,尹明立,粱波,姜云,王伟,刘昳娟,王鑫,
申请(专利权)人:国网山东省电力公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。