一种考虑地理和线路从属关系的用户特征标签设定方法技术

技术编号:18668929 阅读:22 留言:0更新日期:2018-08-14 20:49
本发明专利技术公开了一种考虑地理和线路从属关系的用户特征标签设定方法,对电网内外部获取的数据进行处理,利用数据清洗、归约和转化,建立可供后续分析的数据集;确定典型的用户特征标签,根据数据的更新频次,进行标签分类,将特征标签分为静态标签及动态标签;利用动态聚类算法,为不同的特征标签确定属性值范围,从而建立典型的用户特征标签库;通过关键字对比完成用户标签设定。本发明专利技术可以获得更具科学性和准确性的用户典型特征标签属性情况,有利于为不同特征标签的用户提供相适应的增值服务,提高用户的认可度。

User feature label setting method considering geographic and line affiliation

The invention discloses a user characteristic label setting method which considers the relationship between geography and route subordination, processes the data acquired inside and outside the power grid, establishes a data set for subsequent analysis by data cleaning, reduction and transformation, determines a typical user characteristic label, and labels according to the update frequency of the data. Classification, the feature tags are divided into static tags and dynamic tags; dynamic clustering algorithm is used to determine the range of attribute values for different feature tags, thus establishing a typical user feature tag library; through keyword comparison to complete user tag settings. The invention can obtain more scientific and accurate attributes of user's typical feature labels, and is beneficial to providing corresponding value-added services for users with different feature labels, and improving user's recognition.

【技术实现步骤摘要】
一种考虑地理和线路从属关系的用户特征标签设定方法
本专利技术属于用户用电行为分析中的用户特征标签设定的范畴,涉及一种考虑地理和线路从属关系的用户特征标签设定方法。
技术介绍
随着信息化建设的深入推进和智能电网的飞速发展,电网企业积累了丰富的数据资源,挖掘现有数据的内在价值并充分利用数据分析结果辅助决策,进而研究客户服务质量提升方式,成为驱动电网企业创新发展的重要途径之一。因此,开展考虑地理和线路从属关系的电力用户特征标签设定的研究,为不同类型的用户设定特征标签,从而制定差异化的营销策略并精准推送服务,可大大提高产品和服务的竞争力,满足电力客户日益多样化的用电服务需求,扩大电能在社会能源消费中的占有率。当前的电力行业用户行为细分缺乏深入研究,传统上根据所属供电分区、用电规模、客户性质等用户自身的单一属性来进行分析,已经不能适应当前电力市场营销的需要,亟待更加科学的用户特征标签设定方法,以对用户进行更为准确的细分。数据挖掘是从存放的数据库、数据仓库或其他信息库的大量数据中挖掘潜在的有用的价值的过程。它是信息技术发展到一定阶段的必然结果,是拥有大规模数据库、高效的计算能力和有效的计算方法后的产物。正则表达式也是一用数据处理及高效检索的方法,其可以对字符串和特殊字符进行逻辑操作,在事先定义好一些字符组合后形成一个“规则字符串”,实现对其他文本数据的逻辑过滤。利用正则表达式可以为用户特征标签的属性值计算提供巨大的便利。动态聚类算法属于大样本聚类法,具有计算量小,占用计算机存贮单元少、方法简单等优点,适用于大样本数据的聚类分析。动态聚类算法先通过粗略的预分类加快分类速度,然后再逐步调整,直到将类分得较为合理为止。
技术实现思路
针对海量的电网运营管理数据,本专利技术的目的是提供一种考虑地理和线路从属关系的用户特征标签设定方法。使用本专利技术可以获得更具科学性和准确性的用户典型特征标签属性情况,从而有利于为不同特征标签的用户提供相适应的增值服务,从节能增效、安全用电、用户关怀等多方面提供个性化服务,提高用户的认可度。本专利技术的目的是通过以下技术方案实现:一种考虑地理和线路从属关系的用户特征标签设定方法,其特征在于具体步骤如下:(1)对电网内外部获取的客户基本信息、用电量、缴费途径、缴费时间、规定缴费时间范围、所属台区线路、地理信息及供电区域划分范围数据进行处理,利用数据清洗、归约和转化,建立可供后续分析的数据集;(2)确定典型的用户特征标签为用户年龄、地理特征、所属线路、信誉状况、用电偏好和缴费偏好,根据影响这些用户特征标签属性值的数据的更新频次,将特征标签分为静态标签及动态标签;(3)结合供电区域的划分信息,并根据用户所处的地理信息和线路配变从属关系,计算用户的地理特征标签;(4)对样本数据进行正则表达式判断,筛选出符合条件的文本字段,并进行赋值;(5)利用动态聚类算法,为不同的特征标签确定属性值范围,从而建立典型的用户特征标签库;(6)最后通过用户数据的关键字段匹配,设定各用户的特征标签。进一步地,步骤(1)中,电网公司通过数据采集、传输技术,存储了大量的客户基本信息、用电量、缴费途径、缴费时间、客户所属台区线路及地理信息数据等,这些数据有的为结构化数据,有的为文本类型的半结构化数据,并不能直接用于后续的特征标签分析,需要对其进行处理。利用数据清洗、归约和转化技术对不同来源不同结构的多样化数据进行操作,生成可供特征标签属性值分析的数据样本集。由于导出的客户基本信息及缴费信息中包含着许多对特征标签设定无意义的字段,故先进行归约,提取出关键字段,并转化为新数据段。而用户用电量、各时段用电分布等结构化数据则采用归一化处理,如下式所示:其中,ai为结构化数据的初始值,Amax,Amin分别为该结构化类型的数据的最大值及最小值。步骤(2)中,考虑到不同用户的特征属性存在着交叉,为了更统一地为用户设定标签,故选用典型的用户特征标签:用户年龄、地理特征、所属线路、信誉状况、用电偏好和缴费偏好进行分析。根据影响这些用户特征标签属性值的数据的更新频次,将特征标签分为静态标签及动态标签。其中用户年龄、地理特征、所属线路高度关联用户属性为静态标签,可较长时间更新一次;而用户信誉状况、用电偏好和缴费偏好为动态标签,受实时数据的影响,更新频率要高一些。而步骤(3)中,结合供电区域的划分信息,将供电区域等价为一个多边形,并按下式计算其中心(Xc,Yc):其中,(xi,yi)为供电区域多边形的顶点坐标表示,A为供电区域等价多边形的面积,当供电区域含有曲线段时,将其细分为小线段进行处理。同时考虑线路及配变的从属关系,当所属线路配变的地理坐标为(Xt,Yt),用户的地理坐标为(xuse,yuse),按下式计算用户的地理特征标签(X,Y):进一步地,步骤(4)中,对样本数据中的字段进行正则表达式判断,筛选出符合所写的正则表达式的文本字段,并为其赋值,从而方便文本字段在后续特征标签分析中的应用。再进一步地步骤(5)中,利用动态聚类算法,为地理特征标签等不同的特征标签确定属性值范围,从而建立典型的用户特征标签。以地理特征标签的属性值划分为例,设地理特征标签样本为Z=(Z1,Z2,…,Zn),随机取一个样本作为聚类中心mi,计算所有样本Z与m1的广义欧式距离dg(Xi,m1):然后进行样本分类,给定阈值d0,若dg(Zi,mj)<d0,则Zi属于Γj簇类。计算第k个聚类中心:mk=max(dg(Xi,m1)+dg(Xi,m2)+…+dg(Xi,mk-1))重复计算并生成新的聚类,直到所有样本都划入到各自的聚类中,得到最终的聚类数w。最后以所属聚类类别作为各特征标签的最终属性值,表征该用户的偏好程度或需求指数。最后步骤(6)中,根据当前用户的数据信息,进行关键字段的匹配和比较,确定用户的特征标签的属性区间,为各用户设定相应的特征标签。本专利技术在用户特征标签设定过程中引入正则表达式分析和动态聚类算法特征属性值划分可以为用户设置更为合理、更清晰明了的标签,从属性值中发现用户的行为偏好及缴费偏好等。为后期的用户用电行为分析奠定了一定的基础,也有助于提高用户感知度和认可度,提高服务营销的精准度。本专利技术的有益效果:使用本专利技术的考虑地理和线路从属关系的用户特征标签设定方法,可以获得更具科学性和准确性的用户典型特征标签属性情况,发现各用户的用电行为偏好、缴费方式偏好、信誉水平等,从而有利于为不同特征标签的用户提供相适应的增值服务,从节能增效、安全用电、用户关怀等多方面提供个性化服务,提高用户的认可度。附图说明图1是本专利技术的流程图。具体实施方式下面结合附图对本专利技术进行详细的描述。一种考虑地理和线路从属关系的用户特征标签设定方法,包括:通过数据来源获取数据、对数据进行分类得到数据类型、根据数据类型进行数据处理、根据数据更新频次进行标签分类、建立特征标签库、通过关键字对比完成用户标签设定。从电表、监测表计、智能终端、95598客服系统、营销业务系统等获取客户基本信息、用电量、缴费方式、缴费时间、所属配电台区及线路以及供电区域的地理信息等数据,利用正则判断和动态聚类算法分别对处理后的数据进行分析,建立典型的用户特征标签库,从而通过关键字段比对,为用户设定特征标签。首先本文档来自技高网
...

【技术保护点】
1.一种考虑地理和线路从属关系的用户特征标签设定方法,其特征在于具体步骤如下:(1)对电网内外部获取的客户基本信息、用电量、缴费途径、缴费时间、规定缴费时间范围、所属台区线路、地理信息及供电区域划分范围数据进行处理,利用数据清洗、归约和转化,建立可供后续分析的数据集;(2)确定典型的用户特征标签为用户年龄、地理特征、所属线路、信誉状况、用电偏好和缴费偏好,根据影响这些用户特征标签属性值的数据的更新频次,将特征标签分为静态标签及动态标签;(3)结合供电区域的划分信息,并根据用户所处的地理信息和线路配变从属关系,计算用户的地理特征标签;(4)对样本数据进行正则表达式判断,筛选出符合条件的文本字段,并进行赋值;(5)利用动态聚类算法,为不同的特征标签确定属性值范围,从而建立典型的用户特征标签库;(6)最后通过用户数据的关键字段匹配,设定各用户的特征标签。

【技术特征摘要】
1.一种考虑地理和线路从属关系的用户特征标签设定方法,其特征在于具体步骤如下:(1)对电网内外部获取的客户基本信息、用电量、缴费途径、缴费时间、规定缴费时间范围、所属台区线路、地理信息及供电区域划分范围数据进行处理,利用数据清洗、归约和转化,建立可供后续分析的数据集;(2)确定典型的用户特征标签为用户年龄、地理特征、所属线路、信誉状况、用电偏好和缴费偏好,根据影响这些用户特征标签属性值的数据的更新频次,将特征标签分为静态标签及动态标签;(3)结合供电区域的划分信息,并根据用户所处的地理信息和线路配变从属关系,计算用户的地理特征标签;(4)对样本数据进行正则表达式判断,筛选出符合条件的文本字段,并进行赋值;(5)利用动态聚类算法,为不同的特征标签确定属性值范围,从而建立典型的用户特征标签库;(6)最后通过用户数据的关键字段匹配,设定各用户的特征标签。2.根据权利要求1所述的考虑地理和线路从属关系的用户特征标签设定方法,其特征在于:所述步骤(1)中,电网公司通过数据采集、传输技术,存储了大量的客户基本信息、用电量、缴费途径、缴费时间、客户所属台区线路及地理信息数据,这些数据包括结构化数据和文本类型的半结构化数据,并不能直接用于后续的特征标签分析;利用数据清洗、归约和转化技术对不同来源不同结构的多样化数据进行操作,生成可供特征标签属性值分析的数据样本集;由于导出的客户基本信息及缴费信息中包含着对特征标签设定无意义的字段,故先进行归约,提取出关键字段,并转化为新数据段;而用户用电量、各时段用电分布结构化数据则采用归一化处理,如下式所示:其中,ai为结构化数据的初始值,Amax,Amin分别为该结构化类型的数据的最大值及最小值。3.根据权利要求1所述的考虑地理和线路从属关系的用户特征标签设定方法,其特征在于:所述步骤(2)中,不同用户的特征属性存在着交叉,为了更统一地为用户设定标签,选用典型的用户特征标签:用户年龄、地理特征、所属线路、信誉状况、用电偏好和缴费偏好进行分析;根据影响这些典型的用户特征标签属性值的数据的更新频次...

【专利技术属性】
技术研发人员:周红林胡扬波潘留兴郝翠萍
申请(专利权)人:江苏电力信息技术有限公司国网江苏省电力公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1