System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术数据数据压缩,具体涉及一种基于三维邻接矩阵的电力用户行为数据存储方法及系统。
技术介绍
1、随着电力用户数据的不断累积,随着电力行业的发展,越来越多的电力用户行为数据需要被有效地存储和管理,以便构建准确的用户画像、进行数据挖掘和知识发现,这些数据对于电力行业的发展和用户服务至关重要。
2、传统的电力用户数据通常是采用数据统计的方式对用电行为、能耗情况汇总分析,缺乏对用户在电力服务客户端(app)的行为数据的进一步数据挖掘。公开号为cn105373607a的专利技术专利公开了一种电力业务系统sql访问日志压缩方法,其对sql语句进行分解,创建sql模式语句,可以将多条结构相似的sql语句抽象为一条sql语句,并通过构建sql模式匹配引擎,对于匹配成功的sql语句仅将得到模式库的序号写入sql日志数据库表中,达到sql访问日志压缩的目的。但是这种方式仅针对sql访问语句,用户使用电力app端的其他行为数据,比如页面停留时间、交互过程等数据,往往缺乏合适的数据结构进行存储,不便于数据的准确索引、统计与量化分析。更进一步的,用户行为时序数据的存储还存在以下2类问题:
3、1)用户重复访问相同页面的行为往往反复存储、计算,存储效率不高,且过多的无效重复数据难以对用户的消费行为准确判断;
4、2)没有统一有效的数据模型,对用户访问特定页面的历史访问行为、当前访问行为,在时序上统一存储,不利于后续数据的高效索引与数据挖掘。
技术实现思路
1、有鉴于此
2、本专利技术第一方面,公开一种基于三维邻接矩阵的电力用户行为数据存储方法,所述方法包括:
3、根据登录时间和退出时间记录用户在电力服务客户端的不同使用周期;
4、获取用户在不同使用周期内的有效行为数据;
5、分析用户在电力服务客户端的各个功能页面的有效行为数据的特征,构建多叉树数据结构,存储用户在各个功能页面之间的有效行为数据;
6、在各功能页面内部,构建有向带权图数据结构,存储用户在各个功能页面内部的有效行为数据;
7、提取有向带权图数据结构对应的二维邻接矩阵,将同一用户在不同使用周期的二维邻接矩阵叠加,得到存储用户在页面内部的历史有效行为数据的三维邻接矩阵。
8、在以上技术方案的基础上,优选的,所述使用周期登录时间和退出时间采用相对时间;
9、电力服务客户端的页面使用期间,若电力服务客户端熄屏或转后台,都标记为当前使用周期结束;
10、重新登录或重新激活电力服务客户端,记为新的使用周期。
11、在以上技术方案的基础上,优选的,所述获取用户在不同使用周期内的有效行为数据具体包括:
12、采集用户在不同使用周期内的时序行为数据,包括用户登录时间、每个页面停留时间、交互操作、行为顺序、访问次数和用户退出时间;
13、若用户登录时间的年、月、日与服务器时间不符,当前使用周期的数据不予记录;
14、若页面停留时间大于第一预设时长,则回溯检测所述第一预设时长内用户是否进行交互操作,若否,则当前页面停留时间不予记录;若是,继续进行第一预设时长的页面停留监测,重复以上过程,直到当前使用周期结束,得到有效行为数据。
15、在以上技术方案的基础上,优选的,所述构建多叉树数据结构,存储用户在各个功能页面之间的有效行为数据具体包括:
16、以各个功能页面的唯一id为页面标识,记为pid;所述功能页面包括首页面和一级子页面;
17、以首页面为根节点,以一级子页面为子节点,构建多叉树数据结构,用于存储用户在首页面、一级子页面中的访问数据;
18、以链式结构存储多叉树,并在根节点与子节点中均加入2字节存储空间,用于记录对应页面的停留时间,记为ptime。
19、在以上技术方案的基础上,优选的,所述构建有向带权图数据结构,存储用户在各个功能页面内部的有效行为数据具体包括:
20、将每个一级子页面分成多个存在相互调用、相互跳转关系的功能模块;将每个功能模块作为二级子页面;
21、基于各个功能模块之间的关系,为每个一级子页面构建一个有向带权图数据结构;
22、通过有向带权图数据结构存储用户在各个二级子页面中的有效行为数据。
23、在以上技术方案的基础上,优选的,所述基于各个功能模块之间的关系,为每个一级子页面构建一个有向带权图数据结构具体包括:
24、梳理出每个一级子页面的所有层级中的所有功能模块;
25、记录每个功能模块的pid,即二级子页面的pid;
26、记录功能模块之间的跳转关系;
27、构建有向带权图数据结构,其中,节点代表每个功能模块,有向边表示两个节点对应的功能模块之间的跳转关系,有向边的权值代表对应的页面停留时间。
28、在以上技术方案的基础上,优选的,所述提取有向带权图数据结构对应的二维邻接矩阵,将同一用户在不同使用周期的二维邻接矩阵叠加具体包括:
29、根据用户的每个使用周期内的有向带权图数据结构,提取功能模块的访问顺序及页面停留时间,构建与其对应的二维邻接矩阵进行数据存储,二维邻接矩阵的元素代表对应的页面停留时间;
30、用户重复访问时,取页面停留时间的最大值进行记录;
31、将同一用户在不同使用周期的二维邻接矩阵按照时间顺序叠加,得到三维邻接矩阵;
32、若用户的三维邻接矩阵为稀疏矩阵,对稀疏矩阵进行压缩优化存储。
33、本专利技术第二方面,公开了一种基于三维邻接矩阵的电力用户行为数据存储系统,所述系统包括:
34、数据采集模块:用于根据登录时间和退出时间记录用户在电力服务客户端的不同使用周期;获取用户在不同使用周期内的有效行为数据;
35、第一存储模块:用于分析用户在电力服务客户端的各个功能页面的有效行为数据的特征,构建多叉树数据结构,存储用户在各个功能页面之间的有效行为数据;
36、第二存储模块:用于在各功能页面内部,构建有向带权图数据结构,存储用户在各个功能页面内部的有效行为数据;提取有向带权图数据结构对应的二维邻接矩阵,将同一用户在不同使用周期的二维邻接矩阵叠加,得到存储用户在页面内部的历史有效行为数据的三维邻接矩阵。
37、本专利技术第三方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
38、其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
39、所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现如本专利技术第一方面所述的方法。
40、本专利技术第四方面,公开一种计算机可读存储介质,所述计算机可读存储本文档来自技高网...
【技术保护点】
1.一种基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述使用周期登录时间和退出时间采用相对时间;
3.根据权利要求2所述的基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述获取用户在不同使用周期内的有效行为数据具体包括:
4.根据权利要求3所述的基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述构建多叉树数据结构,存储用户在各个功能页面之间的有效行为数据具体包括:
5.根据权利要求3所述的基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述构建有向带权图数据结构,存储用户在各个功能页面内部的有效行为数据具体包括:
6.根据权利要求5所述的基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述基于各个功能模块之间的关系,为每个一级子页面构建一个有向带权图数据结构具体包括:
7.根据权利要求5所述的基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述提取有向带权图数
8.一种基于三维邻接矩阵的电力用户行为数据存储系统,其特征在于,所述系统包括:
9.一种电子设备,其特征在于,包括:至少一个处理器、至少一个存储器、通信接口和总线;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使计算机实现如权利要求1~7任一项所述的方法。
...【技术特征摘要】
1.一种基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述使用周期登录时间和退出时间采用相对时间;
3.根据权利要求2所述的基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述获取用户在不同使用周期内的有效行为数据具体包括:
4.根据权利要求3所述的基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述构建多叉树数据结构,存储用户在各个功能页面之间的有效行为数据具体包括:
5.根据权利要求3所述的基于三维邻接矩阵的电力用户行为数据存储方法,其特征在于,所述构建有向带权图数据结构,存储用户在各个功能页面内部的有效行为数据具体包括:
【专利技术属性】
技术研发人员:杨庭,靖海,严俊,高俊,刘彦,王博,
申请(专利权)人:湖北华中电力科技开发有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。