The invention discloses a user characteristic label setting method which considers the relationship between geography and route subordination, processes the data acquired inside and outside the power grid, establishes a data set for subsequent analysis by data cleaning, reduction and transformation, determines a typical user characteristic label, and labels according to the update frequency of the data. Classification, the feature tags are divided into static tags and dynamic tags; dynamic clustering algorithm is used to determine the range of attribute values for different feature tags, thus establishing a typical user feature tag library; through keyword comparison to complete user tag settings. The invention can obtain more scientific and accurate attributes of user's typical feature labels, and is beneficial to providing corresponding value-added services for users with different feature labels, and improving user's recognition.
【技术实现步骤摘要】
一种考虑地理和线路从属关系的用户特征标签设定方法
本专利技术属于用户用电行为分析中的用户特征标签设定的范畴,涉及一种考虑地理和线路从属关系的用户特征标签设定方法。
技术介绍
随着信息化建设的深入推进和智能电网的飞速发展,电网企业积累了丰富的数据资源,挖掘现有数据的内在价值并充分利用数据分析结果辅助决策,进而研究客户服务质量提升方式,成为驱动电网企业创新发展的重要途径之一。因此,开展考虑地理和线路从属关系的电力用户特征标签设定的研究,为不同类型的用户设定特征标签,从而制定差异化的营销策略并精准推送服务,可大大提高产品和服务的竞争力,满足电力客户日益多样化的用电服务需求,扩大电能在社会能源消费中的占有率。当前的电力行业用户行为细分缺乏深入研究,传统上根据所属供电分区、用电规模、客户性质等用户自身的单一属性来进行分析,已经不能适应当前电力市场营销的需要,亟待更加科学的用户特征标签设定方法,以对用户进行更为准确的细分。数据挖掘是从存放的数据库、数据仓库或其他信息库的大量数据中挖掘潜在的有用的价值的过程。它是信息技术发展到一定阶段的必然结果,是拥有大规模数据库、高效的计算能力和有效的计算方法后的产物。正则表达式也是一用数据处理及高效检索的方法,其可以对字符串和特殊字符进行逻辑操作,在事先定义好一些字符组合后形成一个“规则字符串”,实现对其他文本数据的逻辑过滤。利用正则表达式可以为用户特征标签的属性值计算提供巨大的便利。动态聚类算法属于大样本聚类法,具有计算量小,占用计算机存贮单元少、方法简单等优点,适用于大样本数据的聚类分析。动态聚类算法先通过粗略的预分类加快分类速 ...
【技术保护点】
1.一种考虑地理和线路从属关系的用户特征标签设定方法,其特征在于具体步骤如下:(1)对电网内外部获取的客户基本信息、用电量、缴费途径、缴费时间、规定缴费时间范围、所属台区线路、地理信息及供电区域划分范围数据进行处理,利用数据清洗、归约和转化,建立可供后续分析的数据集;(2)确定典型的用户特征标签为用户年龄、地理特征、所属线路、信誉状况、用电偏好和缴费偏好,根据影响这些用户特征标签属性值的数据的更新频次,将特征标签分为静态标签及动态标签;(3)结合供电区域的划分信息,并根据用户所处的地理信息和线路配变从属关系,计算用户的地理特征标签;(4)对样本数据进行正则表达式判断,筛选出符合条件的文本字段,并进行赋值;(5)利用动态聚类算法,为不同的特征标签确定属性值范围,从而建立典型的用户特征标签库;(6)最后通过用户数据的关键字段匹配,设定各用户的特征标签。
【技术特征摘要】
1.一种考虑地理和线路从属关系的用户特征标签设定方法,其特征在于具体步骤如下:(1)对电网内外部获取的客户基本信息、用电量、缴费途径、缴费时间、规定缴费时间范围、所属台区线路、地理信息及供电区域划分范围数据进行处理,利用数据清洗、归约和转化,建立可供后续分析的数据集;(2)确定典型的用户特征标签为用户年龄、地理特征、所属线路、信誉状况、用电偏好和缴费偏好,根据影响这些用户特征标签属性值的数据的更新频次,将特征标签分为静态标签及动态标签;(3)结合供电区域的划分信息,并根据用户所处的地理信息和线路配变从属关系,计算用户的地理特征标签;(4)对样本数据进行正则表达式判断,筛选出符合条件的文本字段,并进行赋值;(5)利用动态聚类算法,为不同的特征标签确定属性值范围,从而建立典型的用户特征标签库;(6)最后通过用户数据的关键字段匹配,设定各用户的特征标签。2.根据权利要求1所述的考虑地理和线路从属关系的用户特征标签设定方法,其特征在于:所述步骤(1)中,电网公司通过数据采集、传输技术,存储了大量的客户基本信息、用电量、缴费途径、缴费时间、客户所属台区线路及地理信息数据,这些数据包括结构化数据和文本类型的半结构化数据,并不能直接用于后续的特征标签分析;利用数据清洗、归约和转化技术对不同来源不同结构的多样化数据进行操作,生成可供特征标签属性值分析的数据样本集;由于导出的客户基本信息及缴费信息中包含着对特征标签设定无意义的字段,故先进行归约,提取出关键字段,并转化为新数据段;而用户用电量、各时段用电分布结构化数据则采用归一化处理,如下式所示:其中,ai为结构化数据的初始值,Amax,Amin分别为该结构化类型的数据的最大值及最小值。3.根据权利要求1所述的考虑地理和线路从属关系的用户特征标签设定方法,其特征在于:所述步骤(2)中,不同用户的特征属性存在着交叉,为了更统一地为用户设定标签,选用典型的用户特征标签:用户年龄、地理特征、所属线路、信誉状况、用电偏好和缴费偏好进行分析;根据影响这些典型的用户特征标签属性值的数据的更新频次...
【专利技术属性】
技术研发人员:周红林,胡扬波,潘留兴,郝翠萍,
申请(专利权)人:江苏电力信息技术有限公司,国网江苏省电力公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。