基于用水规律的用户画像方法与系统技术方案

技术编号:25802804 阅读:23 留言:0更新日期:2020-09-29 18:36
本发明专利技术公开了一种基于用水规律的用户画像方法与系统,其包括以下步骤:(1)收集用户的用水数据及用户类别标签;(2)将采集到的用水数据中提取出若干个时间段的平均用水量作为特征向量,结合用户的类别标签构建出训练样本集,基于自动机器学习技术构建出深度分层模糊系统,利用训练样本集训练此系统,从而构建出分类模型;(3)将采集到的用户用水数据输入到已构建出的分类模型中,从而完成用户画像。本发明专利技术通过进行用户画像,可以总结单个用户及用户群的特性,从而可对单个用户提供更加精准的服务,以及实现区域之间的资源的合理分配。

【技术实现步骤摘要】
基于用水规律的用户画像方法与系统
本专利技术涉及进行用户画像,是一种通过对用户用水规律的分析来进行用户画像的方法及系统,属于数据分析领域。
技术介绍
用户用水行为受到多方面因素的影响,其中包括内在因素,如用户自身的社会经济信息;以及外在因素,如环境温度。其中用户自身的社会经济信息包括用户的年龄、薪资水平、居住房屋大小、用户肖像等。进行用户画像,可以对用户提供个性化的推荐及服务,以及提升用户管理水平和引导用户用水行为,用途广泛。此外,还可以通过构建一定区域内单个用户的用户肖像,总结出此区域内群体用户的特性,从而实现更加合理的分配能源以及提供其他公共性服务。用户用水规律的分析还具有其他诸多意义,如提供个性化的用水服务,或使第三方机构提供精准的推销,以及引起隐私保护的反思等。
技术实现思路
基于上述现有技术,本专利技术提出一种基于用水规律的用户画像方法及系统。为实现上述目的,本专利技术采用下述技术方案:本专利技术提供了一种基于用水规律的用户画像方法,包括以下步骤:(1)收集用户的用水数据及用户类别标签;(2)将采集到的用水数据中提取出若干个时间段的平均用水量作为特征向量,结合用户的类别标签构建出训练样本集,基于自动机器学习技术构建出深度分层模糊系统,利用训练样本集训练此系统,从而构建出分类模型;(3)将采集到的用户用水数据输入到已构建出的分类模型中,从而完成用户画像。优选的,所述步骤(1)步骤中收集用户m的有关信息构成用户m的类别标签向量。用户画像类别标签分类包括以下标签一种或多种:年龄、是否退休、是否有小孩、房屋面积和人口数。类别标签ym=(y1,y2,y3,y4,y5),每个标签取值-1,0,1;每个用户的用水数据和对应的类别标签向量,构建出训练样本数据库P。优选的,所述步骤(2)步骤如下:步骤1:提取特征向量:将每天的时间划分成12个时间段,分别为t1-t12;将训练样本数据库中的数据按照24时制划分成对应1~7天的七段数据,然后将7天的数据分别按照12个时间段进行划分,求出用户在每天各时间段用水量式中,d为第d天。将每个时间段的结尾时间节点的用水量值减去起始时间节点的用水量值即可得到每个时间段的用水量;分别求出12个时间段在7天内的用水量的平均值:利用用户m的12个时间段的用水量的平均值构建出特征向量步骤2:搭建深度分层模糊系统对深度分层模糊系统的总体参数进行设置,手动确定层数L(设为6)、移动步长s(设为2)和卷积窗的长度w(设为3)。将训练样本数据库P中的特征向量作为系统的输入向量,类别标签ym作为每一个模糊子系统的正确输出向量。进而可以得到训练集P1在第一层第i个模糊子系统的输入-输出数据对。根据该数据对,结合已有的模糊集合计算公式,输入向量可进一步划分为R个模糊集合A1,A2,...,AR,进而构建出此模糊子系统的完备模糊规则库。优选的,所述步骤(2)中基于强化学习的搜索方式构建该模糊子系统,步骤如下:步骤1:确定搜索空间S;步骤2:设计子系统。优选的,所述步骤(2)中将训练样本数据库P中的数据分为两部分:训练集P1和测试集P2,将测试集P2中的数据输入到分类模型中,通过将分类结果与类别标签进行比较,测试出分类模型的精确度是否能够满足需求。如果精确度不能够满足要求,则需要利用更多的样本数据重新对分类模型进行训练,直至分类模型的精确度达到要求。优选的,所述步骤(3)中,将采集到的某用户的用水数据直接输入至分类模型中,分类模型对数据进行特征向量提取的操作,然后将特征向量输入到深度分层模糊系统中进行分析,得到最终的分类结果,确定出每个类别标签,完成用户画像,最后利用显示器设备输出结果。本专利技术还提供了一种基于用水规律的用户画像系统,用于在执行时实现上述基于用水规律的用户画像方法的步骤,包括:数据采集模块,该模块用于执行步骤(1)的方法;构建分类模型模块,该模块用于执行步骤(2)的方法;用户画像模块,该模块用于执行步骤(3)的方法。本专利技术的技术方案具有以下有益效果:(1)通过进行用户画像,可以总结单个用户及用户群的特性,从而可对单个用户提供更加精准的服务,以及实现区域之间的资源的合理分配。(2)深度分层模糊系统具有更好的精度、计算速度,并且解决了维数灾难规则爆炸问题。(3)基于自动机器学习技术构建深度分层模糊系统避免了人工干预,更加高效,并且能够提升系统的整体性能。(4)采用分布式系统架构,方便了数据的采集和集中处理分析,并且较常规方式更加节约资源。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术分布式系统架构示意图;图2是本专利技术子系统设计流程图;图3是本专利技术方法流程图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。本专利技术提出了一种基于用水规律的用户画像方法及系统。采用了分布式的系统架构以及基于自动机器学习的深度分层模糊系统方法。将用户的有关信息(包括人口数、房屋面积、是否有小孩等)作为类别标签,利用智能电表采集到用户7天内的用水数据,将所有采集到的数据信息上传至数据平台;在数据平台中,计算出7天内12个不同时间段的用水量的平均值,将其作为特征向量,基于自动机器学习技术构建出性能更佳的深度分层模糊系统,利用此系统对用户的用水数据进行评估、分类,完成用户画像。本专利技术主要包括三个模块:数据采集模块、构建分类模型模块和用户画像模块。数据采集模块负责收集、整理用户的用水数据及用户基本信息(类别标签),并上传至数据平台;构建分类模型模块负责从采集到的用水数据中提取出12个时间段的7天的平均用水量作为特征向量,结合用户的类别标签构建出训练样本集,基于自动机器学习技术构建出深度分层模糊系统,利用训练样本集训练此系统,从而构建出分类模型;用户画像模块负责将采集到的用户用水数据输入到已构建出的分类模型中,从而完成用户画像。以下是对三个模块的详细介绍:模块一:数据采集本模块采用了分布式的系统架构(示意图如图1),采集用户数据,利用通信网络将数据传输至数据平台。通过智能水表(边缘设备)间隔15分钟的采样,采集用户m的7天的原始用水数据Qm(m=1,2,...,n),将数据利用通信网络传输到数据平台。利用用户m的有关信息构成用户m的类别标签向量。用户画像类别标签分类如表1所示。类别标签ym=(y1,y2,y3,y4,y5),每个标签可取值-1,0,1。在数据平台中,利用以上所述的两种数据信息:每个用户的用水数据和对应的类别标签向量,构建出训练样本数据库P。此数据本文档来自技高网...

【技术保护点】
1.一种基于用水规律的用户画像方法,其特征在于,包括以下步骤:/n(1)收集用户的用水数据及用户类别标签;/n(2)将采集到的用水数据中提取出若干个时间段的平均用水量作为特征向量,结合用户的类别标签构建出训练样本集,基于自动机器学习技术构建出深度分层模糊系统,利用训练样本集训练此系统,从而构建出分类模型;/n(3)将采集到的用户用水数据输入到已构建出的分类模型中,从而完成用户画像。/n

【技术特征摘要】
1.一种基于用水规律的用户画像方法,其特征在于,包括以下步骤:
(1)收集用户的用水数据及用户类别标签;
(2)将采集到的用水数据中提取出若干个时间段的平均用水量作为特征向量,结合用户的类别标签构建出训练样本集,基于自动机器学习技术构建出深度分层模糊系统,利用训练样本集训练此系统,从而构建出分类模型;
(3)将采集到的用户用水数据输入到已构建出的分类模型中,从而完成用户画像。


2.根据权利要求1所述的基于用水规律的用户画像方法,其特征在于,所述步骤(1)步骤中收集用户m的有关信息构成用户m的类别标签向量;用户画像类别标签分类包括以下标签一种或多种:年龄、是否退休、是否有小孩、房屋面积和人口数;类别标签ym=(y1,y2,y3,y4,y5),每个标签取值-1,0,1;每个用户的用水数据和对应的类别标签向量,构建出训练样本数据库P。


3.根据权利要求1所述的基于用水规律的用户画像方法,其特征在于,所述步骤(2)步骤如下:
步骤1:提取特征向量:
将每天的时间划分成12个时间段,分别为t1-t12;
将训练样本数据库中的数据按照24时制划分成对应1~7天的七段数据,然后将7天的数据分别按照12个时间段进行划分,求出用户在每天各时间段用水量式中,d为第d天;将每个时间段的结尾时间节点的用水量值减去起始时间节点的用水量值即可得到每个时间段的用水量;
分别求出12个时间段在7天内的用水量的平均值:(T=t1,t2,...,t12);利用用户m的12个时间段的用水量的平均值构建出特征向量
步骤2:搭建深度分层模糊系统
对深度分层模糊系统的总体参数进行设置,手动确定层数L(设为6)、移动步长s(设为2)和卷积窗的长度w(设为3);

【专利技术属性】
技术研发人员:李成栋申存骁邓晓平李银萍李文峰张桂青
申请(专利权)人:山东建筑大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1