基于随机森林和逻辑回归的优质客户识别方法及装置制造方法及图纸

技术编号:18659040 阅读:23 留言:0更新日期:2018-08-11 14:52
本发明专利技术公开了一种基于随机森林和逻辑回归的优质客户识别方法及装置,所述方法包括以下步骤:获取样本客户价值特征,并进行优质性判别;采用样本客户数据,基于随机森林和逻辑回归算法构建优质客户识别模型;将待识别客户的价值特征作为输入,基于所述优质客户识别模型,判断所述客户是否为优质客户。本发明专利技术基于大数据实现了优质客户的精准定位。

Quality customer identification method and device based on random forest and logistic regression

The invention discloses a high quality customer identification method and device based on random forest and logic regression. The method comprises the following steps: acquiring sample customer value characteristics and discriminating high quality; constructing a high quality customer identification model based on random forest and logic regression algorithm with sample customer data; and waiting to be known. Taking the value characteristics of other customers as input, the customer is judged to be a good customer based on the high quality customer identification model. The invention realizes accurate positioning of high quality customers based on big data.

【技术实现步骤摘要】
基于随机森林和逻辑回归的优质客户识别方法及装置
本专利技术属于机器学习领域,尤其涉及一种基于随机森林和逻辑回归的优质客户识别方法及装置。
技术介绍
随着电力改革深化、售电侧市场的全面放开,国家电网公司各级供电公司均面临着市场竞争压力,为提升电网企业盈利能力和竞争力,增加优质客户的忠诚度、满意度和客户黏性,企业在做好全社会普遍服务的基础上,为优质客户提供优质服务将是各售电主体竞争优质客户的主要手段和策略,必须制定有针对性的竞争服务策略,将有限的服务资源投入到优质客户的身上,与其建立稳定的供用电关系,是电网企业保持长期可持续发展的必然选择。随着数据量的爆发式增长和业务要求的不断提高,传统的业务系统架构已经越来越难满足系统运行的要求。大数据技术作为重要的战略资源已经在全球范围内达成共识,数据这一基础性战略资源为分析客户需求和提供针对性服务,提供了数据支撑。因此,如何基于大数据实现优质客户的精准定位,是目前需要迫切解决的技术问题。
技术实现思路
为克服上述现有技术的不足,本专利技术提供了一种售电侧基于随机森林和逻辑回归的优质客户识别方法及装置,所述方法以电网公司客户的用电属性、用电行为、用电特征等海量数据为基础,建立多维度的客户评价指标体系,通过以数据分析方式构建的客户评价模型,对客户进行综合评分,从而实现对优质客户的精准定位。为实现上述目的,本专利技术采用如下技术方案:一种基于随机森林和逻辑回归的优质客户识别方法,包括以下步骤:步骤1:获取样本客户价值特征,并进行优质性判别;步骤2:采用样本客户数据,基于随机森林和逻辑回归算法构建优质客户识别模型;步骤3:将待识别客户的价值特征作为输入,基于所述优质客户识别模型,判断所述客户是否为优质客户。进一步地,所述步骤1包括:步骤1.1:根据获取的用户各项用电信息构建客户价值评价特征指标体系;步骤1.2:根据所述指标体系统计样本用户的价值特征,并进行样本用户优质性判别。进一步地,所述步骤1中价值特征包括用户对应的基本属性、经济价值、负荷价值、发展价值、信用价值、行业价值数据。进一步地,所述步骤2包括:步骤2.1:对样本用户数据进行预处理;步骤2.2:基于随机森林法训练优质客户判断模型;步骤2.3:采用逻辑回归算法构建优质客户等级判断模型;步骤2.4:结合优质客户判断模型和优质客户等级判断模型获取优质客户识别模型。进一步地,所述步骤2.1包括:数据清洗、特征因素量化、特征拓展、特征选择和异常值处理。进一步地,所述步骤2.2包括:全特征训练:样本选取全部样本用户数据,模型入参为全部业务指标;重要特征训练:样本选取全部样本用户数据,模型入参为重要性高的前40%指标;全特征交叉训练:将样本用户数据平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次,模型入参为全部业务指标;重要特征交叉训练:将样本用户数据平均拆分成10份,每次选择其中9份作为训练样本,剩余1份作为预测样本,循环迭代10次,模型入参为重要性高的前40%指标。进一步地,所述步骤2.3包括:将优质客户判断模型获取的优质客户通过逻辑回归模型进行综合评分;设置多个综合评分区间,得到优质客户等级判断模型。进一步地,所述方法还包括:对训练好的模型进行集成,通过数据接口收集用户特征数据,定期开展客户优质等级的判定。根据本专利技术的第二目的,本专利技术还提供了一种基于随机森林和逻辑回归的优质客户识别装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的方法。根据本专利技术的第三目的,本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行所述的一种基于随机森林和逻辑回归的优质客户识别方法。本专利技术的有益效果1、本专利技术以电网公司客户的用电属性、用电行为、用电特征等海量数据为基础,采用机器学习的技术手段,实现了优质客户的识别,为针对优质客户提供优质服务提供了保障,有助于提升电网企业竞争力。2、本专利技术采用随机森林和逻辑回归相结合的方式进行客户识别模型的训练,所述识别模型能够在识别客户是否优质的基础上,判断客户的优质等级,进一步实现了优质客户的精准定位。3、本专利技术建立所述优质客户识别模型升级优化的长效机制,基于专家监督法对优质客户识别模型的判断结果不定期地进行有效性分析,并基于分析结果,重新训练优质客户优化识别模型,通过重新训练模型达到模型版本升级及优化的目的。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为本专利技术基于随机森林和逻辑回归的优质客户识别方法流程图;图2为本专利技术优质客户识别模型构建流程图;图3为本专利技术基于逻辑回归法形成的客户评分趋势示意图。具体实施方式应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。实施例一本实施例公开了一种基于随机森林和逻辑回归的优质客户识别方法,如图1所示,包括以下步骤:(一)数据准备阶段1、建立客户价值评价特征指标体系:通过收集用户档案信息、经济价值类信息、负荷价值类信息、发展价值类信息、信用价值类信息、行业价值类信息,综合分析各种影响客户综合价值的因素,建立客户价值评价特征指标体系。通过客户集中研讨及客户调研,实现各地市样本用户优质性判别,为模型训练提供数据基础。依据优质客户为电网公司带来的各种价值特征为基础,梳理客户的各项用电指标,依据客户价值角度对指标进行归类,构建客户评价指标体系,对指标标准化处理,并进行多维度汇总,为判断客户优质特性提供数据基础。2、确定模型训练样本:通过与地市专家讨论确定的优质客户指标体系,基于营销业务应用系统、用电信息采集系统,分别统计出样本用户对应的基本属性、经济价值、负荷价值、发展价值、信用价值、行业价值数据,以此作为模型训练样本。本实施例中对47.4万样本客户用电行为特征数据进行了专家评判,标注了是否优质。用户属性:户号、户名、行业分类、是否高耗能和用电类别。经济价值:客户用电给供电企业所带来的盈利情况,如售电均价较高、用电量较大、电费较多的客户。包括:当期售电均价、当期电费、当期电量、累计售电均价、累计电费、累计电量、合同容量和运行容量。负荷价值:客户在用电过程中表现出来的电力负荷价值,如功率因素较大、平均负荷率高、低谷用电率较好的客户。包括:平均日负荷率、高峰用电率、低谷用电率和力调系数。发展价值:客户自身用电发展较好的,未来贡献较大的客户,能给公司带来持续的利润贡献。包括:当期电量增长率、近3个月电量增长率、近6个月电量增长率、近一年电量增长率、增容次数和减容次数。信用价值:信用是供用电双方完成交易的本文档来自技高网
...

【技术保护点】
1.一种基于随机森林和逻辑回归的优质客户识别方法,其特征在于,包括以下步骤:步骤1:获取样本客户价值特征,并进行优质性判别;步骤2:采用样本客户数据,基于随机森林和逻辑回归算法构建优质客户识别模型;步骤3:将待识别客户的价值特征作为输入,基于所述优质客户识别模型,判断所述客户是否为优质客户。

【技术特征摘要】
1.一种基于随机森林和逻辑回归的优质客户识别方法,其特征在于,包括以下步骤:步骤1:获取样本客户价值特征,并进行优质性判别;步骤2:采用样本客户数据,基于随机森林和逻辑回归算法构建优质客户识别模型;步骤3:将待识别客户的价值特征作为输入,基于所述优质客户识别模型,判断所述客户是否为优质客户。2.如权利要求1所述的一种基于随机森林和逻辑回归的优质客户识别方法,其特征在于,所述步骤1包括:步骤1.1:根据获取的用户各项用电信息构建客户价值评价特征指标体系;步骤1.2:根据所述指标体系统计样本用户的价值特征,并进行样本用户优质性判别。3.如权利要求1或2所述的一种基于随机森林和逻辑回归的优质客户识别方法,其特征在于,所述步骤1中价值特征包括用户对应的基本属性、经济价值、负荷价值、发展价值、信用价值、行业价值数据。4.如权利要求1所述的一种基于随机森林和逻辑回归的优质客户识别方法,其特征在于,所述步骤2包括:步骤2.1:对样本用户数据进行预处理;步骤2.2:基于随机森林法训练优质客户判断模型;步骤2.3:采用逻辑回归算法构建优质客户等级判断模型;步骤2.4:结合优质客户判断模型和优质客户等级判断模型获取优质客户识别模型。5.如权利要求4所述的一种基于随机森林和逻辑回归的优质客户识别方法,其特征在于,所述步骤2.1包括:数据清洗、特征因素量化、特征拓展、特征选择和异常值处理。6.如权利要求4所述的一种基于随机森林和逻...

【专利技术属性】
技术研发人员:李云亭张洪利荣以平朱伟义刘霄慧尹明立粱波王伟姜云刘昳娟王鑫
申请(专利权)人:国网山东省电力公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1