一种电费回收风险预测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24687168 阅读:21 留言:0更新日期:2020-06-27 08:59
本申请涉及一种电费回收风险预测方法、装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取待预测用户在预设时间段内的连续缴费记录数据;基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据;基于所述多条原始数据,获得不同维度下的多种特征参数数据;基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险。本申请实施例中采用抗噪神经网络模型来预测待预测用户的电费回收风险,使其对噪声数据具备更好的抗干扰性,可以不再受电力数据标注过程中的误差干扰,从而提高了预测的准确率。

A risk prediction method, device, electronic equipment and storage medium for electric charge recovery

【技术实现步骤摘要】
一种电费回收风险预测方法、装置、电子设备及存储介质
本申请属于人工智能
,具体涉及一种电费回收风险预测方法、装置、电子设备及存储介质。
技术介绍
电费回收一直是供电企业的老大难问题,因为目前采取的运营手段是先输电送电,再缴费,所以往往存在收费周期耗时耗力以及回收不了等各种隐患。电费回收的结果与供电企业经营成果息息相关,一直以来,电费回收都是电力营销的重点内容。供电企业拥有十分庞大的客户数量,但是每个用户的资信程度存在着很大的差别,用户的资信程度严重影响着其电费的缴纳状况。目前供电企业针对以上问题也提出了各种行政管理方法和技术手段,也有相应的回收策略。目前的催收手段主要是人工催收,采取电话提醒、上门贴单、当面收费等人工策略。同时,随着信息技术的快速发展,国内供电企业也开始尝试使用通过对用电用户的海量数据进行挖掘分析,剥离出其中的相关特征,对用户建立起用户画像以及分级系统,试图做到风险预警,以此来判断该用户是否存在拖欠电费的可能性。如,运用逻辑回归模型,基于高压用户用电关键因素对电费回收的影响程度进行建模;利用决策树算法建立客户欠费的风险识别模型;基于理论分析改进LR-Bagging算法来预测用户用电欠费风险。采用人工上前催收的手段不仅浪费了大量的时间和金钱,还因为人为等不可控因素,存在安全隐患,管理者也难以做到监控管理,催收回报率较低,不能做到提前预防、风险预警。现存的预测模型也存在弊端,因为决策树、逻辑回归等模型属于有监督模型,需要对训练数据进行打标签,标签的质量影响着预测准确率,一旦数据打标签过程存在误差,整个模型效果也会大大降低,损害模型性能;同时因为电力数据形成较为复杂,电力用户有不同的种类、电价执行标准以及缴费方式,因此导致数据维度较大且非线性,常用的机器学习算法较难拟合这种非线性关系。
技术实现思路
鉴于此,本申请实施例在于提供一种电费回收风险预测方法、装置、电子设备及存储介质,以改善现有预测模型受标签影响大,导致抗噪声能力弱的问题。本申请的实施例是这样实现的:第一方面,本申请实施例提供了一种电费回收风险预测方法,包括:获取待预测用户在预设时间段内的连续缴费记录数据;基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据;基于所述多条原始数据,获得不同维度下的多种特征参数数据;基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险,其中,所述抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵DMI。本申请实施例中,采用基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵DMI作为抗噪神经网络模型的损失函数,并以此来预测待预测用户的电费回收风险,由于DMI是两个取值范围相同的随机离散变量的联合分布矩阵行列式(det)的绝对值。因此DMI具有以下性质:DMI是非负的,对称并且满足信息单调性,同时满足相对不变性,使其对噪声数据具备更好的抗干扰性,可以不再受电力数据标注过程中的误差干扰,从而提高了预测的准确率。结合第一方面实施例的一种可能的实施方式,所述损失函数为:LDMI(Qh(X),Y′)=-log(DMI(h(x),Y′))=-log(|det(Qh(X),Y′)|),其中,Qh(X),Y′是离散型随机变量h(X)和离散型随机变量Y′的联合分布,Qh(X),Y′是c×c的矩阵形式,h(X)的随机性来自于h和随机变量X。结合第一方面实施例的一种可能的实施方式,在获得不同维度下的多种特征参数数据之后,所述方法还包括:对所述多种特征参数数据中的每种特征参数数据各自做特征归一化处理;相应地,基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险,包括:基于事先训练好的抗噪神经网络模型和归一化处理后的多种特征参数数据,确定所述待预测用户的电费回收风险。本申请实施例中,通过对多种特征参数数据中的每种特征参数数据各自做特征归一化处理,然后再基于归一化处理后的多种特征参数数据来预测待预测用户的电费回收风险,以减少该多种特征参数数据中不同维度下的特征参数数据因为数值大小不一而带来的预测误差。结合第一方面实施例的一种可能的实施方式,获取待预测用户在预设时间段内的连续缴费记录数据,包括:获取所述待预测用户在两年内的连续缴费记录数据;相应地,基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,包括:基于所述连续缴费记录数据,以两个月为间隔,得到在时间上连续的十二条原始数据,每条原始数据包括:用户编号,开户日期,应收违约金,应收电费,用电电量,缴费日期,缴费方式;相应地,基于所述多条原始数据,获得不同维度下的多种特征参数数据,包括:基于所述多条原始数据,获得用户编号,开户年限,缴费行为综合评分,预计缴费时间段,用电电量波动情况,最近一次电量环比,缴费方式更改次数,欠费次数,5日之前付款次数,20日之前付款次数,25日之前付款次数,周期内缴纳总电费,周期内总电量,周期内总违约金,周期内平均电费,周期内平均电量,缴费总记录次数。本申请实施例中,通过获取待预测用户在两年内的连续缴费记录数据,并以两个月为间隔,得到在时间上连续的包括用户编号,开户日期,应收违约金,应收电费,用电电量,缴费日期,缴费方式在内的十二条原始数据,并以此获得不同维度下的多种特征参数数据,使其涵盖多种不同维度的特征参数数据,以保证预测结果的准确性和可靠性。结合第一方面实施例的一种可能的实施方式,在基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险之前,所述方法还包括:获取带有标注的训练样本数据,所述训练样本数据包括多个用电用户各自的特征参数数据;利用所述样本数据对初始抗噪神经网络模型进行训练,得到训练好的抗噪神经网络模型,其中,所述初始抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵DMI。本申请实施例中,通过事先对用于预测用户电费回收风险的模型进行训练,使其后续可以很方便用于预测用户电费回收风险,同时,在训练时,采用基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵DMI作为抗噪神经网络模型的损失函数,并以此来预测待预测用户的电费回收风险,由于DMI是两个取值范围相同的随机离散变量的联合分布矩阵行列式(det)的绝对值。因此DMI具有以下性质:DMI是非负的,对称并且满足信息单调性,同时满足相对不变性,使其对噪声数据具备更好的抗干扰性,可以不再受电力数据标注过程中的误差干扰,从而提高了预测的准确率。结合第一方面实施例的一种可能的实施方式,通过以下步骤获取用电用户的特征参数数据:获取该用电用户在预设时间段内的连续缴费记录数据;基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据;基于所述多条原始数据,获得该用电用户在不同维度下的多种特征参数数据和用于表征该用电用户是否为欠费用户的标签。本申请实施例中,在获取用电用户的特征本文档来自技高网
...

【技术保护点】
1.一种电费回收风险预测方法,其特征在于,包括:/n获取待预测用户在预设时间段内的连续缴费记录数据;/n基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据;/n基于所述多条原始数据,获得不同维度下的多种特征参数数据;/n基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险,其中,所述抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵DMI。/n

【技术特征摘要】
1.一种电费回收风险预测方法,其特征在于,包括:
获取待预测用户在预设时间段内的连续缴费记录数据;
基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,每条原始数据包括多种不同维度下的与缴费相关的数据;
基于所述多条原始数据,获得不同维度下的多种特征参数数据;
基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险,其中,所述抗噪神经网络模型的损失函数为基于两个离散型随机变量的联合分布矩阵的行列式的互信息熵DMI。


2.根据权利要求1所述的方法,其特征在于,所述损失函数为:LDMI(Qh(X),Y′)=-log(DMI(h(x),Y′))=-log(|det(Qh(X),Y′)|),其中,Qh(X),Y′是离散型随机变量h(X)和离散型随机变量Y′的联合分布,Qh(X),Y′是c×c的矩阵形式,h(X)的随机性来自于h和随机变量X。


3.根据权利要求1所述的方法,其特征在于,在获得不同维度下的多种特征参数数据之后,所述方法还包括:
对所述多种特征参数数据中的每种特征参数数据各自做特征归一化处理;
相应地,基于事先训练好的抗噪神经网络模型和所述多种特征参数数据,确定所述待预测用户的电费回收风险,包括:
基于事先训练好的抗噪神经网络模型和归一化处理后的多种特征参数数据,确定所述待预测用户的电费回收风险。


4.根据权利要求1所述的方法,其特征在于,获取待预测用户在预设时间段内的连续缴费记录数据,包括:
获取所述待预测用户在两年内的连续缴费记录数据;
相应地,基于所述连续缴费记录数据,得到在时间上连续的多条原始数据,包括:
基于所述连续缴费记录数据,以两个月为间隔,得到在时间上连续的十二条原始数据,每条原始数据包括:用户编号,开户日期,应收违约金,应收电费,用电电量,缴费日期,缴费方式;
相应地,基于所述多条原始数据,获得不同维度下的多种特征参数数据,包括:
基于所述多条原始数据,获得用户编号,开户年限,缴费行为综合评分,预计缴费时间段,用电电量波动情况,最近一次电量环比,缴费方式更改次数,欠费次数,5日之前付款次数,20日之前付款次数,25日之前付款次数,周期内缴纳总电费,周期内总电量,周期内总违约金,周期内平均电费,周期内平均电量,缴费总记录次数。


5.根据权利要求1-4任一项所述...

【专利技术属性】
技术研发人员:张发恩刘雨微
申请(专利权)人:创新奇智上海科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1