一种群租风险指数的预测方法及计算机设备技术

技术编号:27409936 阅读:39 留言:0更新日期:2021-02-21 14:24
本发明专利技术公开了一种群租风险指数的预测方法及计算机设备,所述方法包括:获取群租房住户在群租期间的电量数据;将群租房住户在群租期间的电量数据输入至随机森林回归算法模型中进行训练,以构建群租风险指数预测模型,其中,所述群租风险指数预测模型在接收到未检查住户的电量数据后,输出预测的群租风险指数,根据所述预测的群租风险指数可筛选出群租风险指数高的月份、租户。群租风险指数的核心思路为基于电力大数据分析群租居民和正常居民用电行为上的差异,从用户的每日和每月用电情况出发,提取用户用电行为特征,基于已查处的群租用户用电行为特点,运用随机森林回归算法,构建机器学习模型,智能输出用户群租风险指数。指数。指数。

【技术实现步骤摘要】
一种群租风险指数的预测方法及计算机设备


[0001]本专利技术涉及群租管治领域,具体涉及一种群租风险指数的预测方法及计算机设备。

技术介绍

[0002]房屋管理相关行政处罚事项集中划转至城管执法部门统一行驶,而浦东新区面积大,外来人口多,群租房整治难点很大。群租房住户人口密度大,用电习惯也与普通住户有所不同。浦东供电公司主动对接城管执法局需求,利用电力大数据分析及人工智能算法,构建数学模型和机器学习模型,对住户用电量进行精准分析,快速定位,开发了群租风险指数这一数字产品。辅助城管等执法部门治理群租房难题,可快速输出高可疑的群租房居民,方便执法人员准确上门抽样排查,有效打击群租现象。

技术实现思路

[0003]本专利技术的目的在于提供一种群租风险指数的预测方法,群租风险指数的核心思路为基于电力大数据分析群租居民和正常居民用电行为上的差异,从用户的每日和每月用电情况出发,提取用户用电行为特征,基于已查处的群租用户用电行为特点,运用随机森林回归算法,构建机器学习模型,智能输出用户群租风险指数。
[0004]为了达到上述目的,本专利技术采用的技术方案如下:
[0005]一种群租风险指数的预测方法,包括:
[0006]获取群租房住户在群租期间的电量数据;
[0007]将群租房住户在群租期间的电量数据输入至随机森林回归算法模型中进行训练,以构建群租风险指数预测模型,其中,所述群租风险指数预测模型在接收到未检查住户的电量数据后,输出预测的群租风险指数,根据所述预测的群租风险指数可筛选出群租风险指数高的月份、租户。
[0008]进一步地,所述群租房住户及未检查住户位于同一区域内,位于该区域内的住房的面积相同。
[0009]进一步地,所述电量数据包括群租房住户在群租期间的各月月均用电量和/或各月在单位面积的月均用电量。
[0010]进一步地,所述各月在单位面积的月均用电量通过以下步骤获得:
[0011]获取住户的住房的面积;
[0012]获取与所述住房对应的各月用电量;
[0013]根据所述住房的面积以及与所述住房对应的各月用电量计算得到所述住户各月在单位面积的月均用电量。
[0014]进一步地,所述构建群租房风险指数预测模型具体包括:
[0015]运用随机森林回归算法对各月月均用电量和/或各月在单位面积的月均用电量的曲线进行拟合,其中,拟合后的群租房住户用电量曲线的标签设为1,拟合后的非群租房住
户用电量曲线的标签设为0,所述群租风险指数预测模型输出的预测的群租风险指数为一个0至1的值。
[0016]进一步地,还包括:
[0017]获取未检查住户的电量数据,其中,所述未检查住户的电量数据包括各月月均用电量和/或各月在单位面积的月均用电量;
[0018]将所述未检查住户的电量数据输入至所述群租风险指数预测模型中,其中,所述群租风险指数预测模型在接收到未检查住户的电量数据后,输出预测的群租风险指数。
[0019]进一步地,还包括:
[0020]判断所述预测的群租风险指数是否超出预设值,若是,将该预测的群租风险指数以及与该预测的群租风险指数的住户信息发送至城管执法局。
[0021]进一步地,还包括:
[0022]在城管执法局上门查验后,将查验的结果发送至建群租风险指数预测模型中,以达到循环迭代进一步提升预测的准确率。
[0023]另一方面,本专利技术还提供了一种计算机设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现上述的方法步骤。
[0024]与现有技术相比,本专利技术至少具有以下优点之一:
[0025]群租风险指数的核心思路为基于电力大数据分析群租居民和正常居民用电行为上的差异,从用户的每日和每月用电情况出发,提取用户用电行为特征,基于已查处的群租用户用电行为特点,运用随机森林回归算法,构建机器学习模型,智能输出用户群租风险指数。
附图说明
[0026]图1为本专利技术一实施例中群租风险指数的预测方法的流程图;
[0027]图2为本专利技术一实施例中群租风险指数的预测方法的框图。
具体实施方式
[0028]以下结合附图1、2和具体实施方式对本专利技术作进一步详细说明。根据下面说明,本专利技术的优点和特征将更清楚。需要说明的是,附图采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本专利技术实施方式的目的。为了使本专利技术的目的、特征和优点能够更加明显易懂,请参阅附图。须知,本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本专利技术实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本专利技术所能产生的功效及所能达成的目的下,均应仍落在本专利技术所揭示的
技术实现思路
能涵盖的范围内。
[0029]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、群租风险指数的预测方法、物品或者现
场设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、群租风险指数的预测方法、物品或者现场设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、群租风险指数的预测方法、物品或者现场设备中还存在另外的相同要素。
[0030]请参阅图1、2所示,本实施例提供的一种群租风险指数的预测方法,包括:
[0031]获取群租房住户在群租期间的电量数据;
[0032]将群租房住户在群租期间的电量数据输入至随机森林回归算法模型中进行训练,以构建群租风险指数预测模型,其中,所述群租风险指数预测模型在接收到未检查住户的电量数据后,输出预测的群租风险指数,根据所述预测的群租风险指数可筛选(包括人工筛选或机器筛选)出群租风险指数高(大于预设值,可为0.8)的月份、租户,对预测的群租风险指数进行离群点检测,离群点检测是数据挖掘中重要的一部分,它的任务是发现与大部分其他对象显著不同的对象,发现明显偏高的月份和住户,也能找到部分群租住户,将筛选出来的月份、住户信息发送至城管执法局。
[0033]本实施例中,所述群租房住户及未检查住户位于同一区域内,位于该区域内的住房的面积相同。
[0034]本实施例中,所述电量数据包括群租房住户在群租期间的各月月均用电量(本实施例中的用电量包括峰时用电量以及谷时用电量)和/或各月在单位面积的月均用电量。
[0035]将城管执法局曾经查处的群租房住户群租期间的月用电量作为训练集输入随机森林回归算法进行训练,运用随机森林回本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种群租风险指数的预测方法,其特征在于,包括:获取群租房住户在群租期间的电量数据;将群租房住户在群租期间的电量数据输入至随机森林回归算法模型中进行训练,以构建群租风险指数预测模型,其中,所述群租风险指数预测模型在接收到未检查住户的电量数据后,输出预测的群租风险指数,根据所述预测的群租风险指数可筛选出群租风险指数高的月份、租户。2.如权利要求1所述的群租风险指数的预测方法,其特征在于,所述群租房住户及未检查住户位于同一区域内,位于该区域内的住房的面积相同。3.如权利要求1所述的群租风险指数的预测方法,其特征在于,所述电量数据包括群租房住户在群租期间的各月月均用电量和/或各月在单位面积的月均用电量。4.如权利要求1所述的群租风险指数的预测方法,其特征在于,所述各月在单位面积的月均用电量通过以下步骤获得:获取住户的住房的面积;获取与所述住房对应的各月用电量;根据所述住房的面积以及与所述住房对应的各月用电量计算得到所述住户各月在单位面积的月均用电量。5.如权利要求3所述的群租风险指数的预测方法,其特征在于,所述构建群租房风险指数预测模型具体包括:运用随机森林回归算法对各月月均用电量和/或各月在单位面积的月均用电量的曲线进行拟合,其中,...

【专利技术属性】
技术研发人员:傅超然潘博何维国沈浩陈赟潘智俊赵文恺董建军廖静吴志炜王佳裕洪祎祺叶傲霜
申请(专利权)人:国网上海市电力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1