【技术实现步骤摘要】
一种高压电缆运行大数据关联分析方法、装置及介质
[0001]本专利技术涉及高压电缆数据处理
,并且更具体地,涉及一种高压电缆运行大数据关联分析方法、装置及介质。
技术介绍
[0002]高压电缆运行维护过程中会产生大量的台账数据及状态数据,这些数据中蕴含着大量的有用信息,对高压电缆的运维和管控水平提升有着重要意义。然而,随着高压电缆运检数据量呈指数级增长,状态数据离散化、孤岛化严重,海量数据的利用和分析严重不足,尤其缺乏对数据之间的关联性分析。
技术实现思路
[0003]针对现有技术的不足,本专利技术提供一种高压电缆运行大数据关联分析方法、装置及介质。
[0004]根据本专利技术的一个方面,提供了一种高压电缆运行大数据关联分析方法,包括:
[0005]根据高压电缆运行数据,生成事务项集;
[0006]根据Apriori算法分别计算事务项集中每个事务项的支持度,并与预先设置的最小支持度阈值进行比较,确定事务项集中的频繁项集;
[0007]分别计算频繁项集中每个频繁项的置信度, ...
【技术保护点】
【技术特征摘要】
1.一种高压电缆运行大数据关联分析方法,其特征在于,包括:根据高压电缆运行数据,生成事务项集;根据Apriori算法分别计算所述事务项集中每个事务项的支持度,并与预先设置的最小支持度阈值进行比较,确定所述事务项集中的频繁项集;分别计算所述频繁项集中每个频繁项的置信度,并与预先设置的最小置信度阈值进行比较,确定强关联规则集。2.根据权利要求1所述的方法,其特征在于,根据高压电缆运行数据,生成事务项集的操作,包括:根据高压电缆运行产生的报表数据,生成报表事务项集;根据所述高压电缆运行中产生的时序数据,生成时序事务项集。3.根据权利要求2所述的方法,其特征在于,根据所述报表事务数据,生成报表事务项集的操作,包括:对所述报表数据进行归一化处理;对所述报表数据进行关键词提取,确定关键词集;去除所述关键词集中的无用项和重复项,确定有效关键词集;根据所述有效关键词集,生成所述报表事务项集。4.根据权利要求2所述的方法,其特征在于,根据所述高压电缆运行中产生的时序数据,生成时序事务项集的操作,包括:根据预先设置的数据频度对所述时序数据进行筛选,确定有效时序数据;根据预先设置的区间长度对所述有效时序数据进行离散化,确定离散化数据;根据所述时序数据进行离散化特征提取,确定离散化特征数据;根据所述时序数据,确定事件事务数据;根据所述离散化数据、所述离散化特征数据以及所述事件事务数据,生成所述时序事务项集。5.根据权利要求1所述的方法,其特征在于,根据Apriori算法分别计算所述事务项集中每个事务项的支持度,并与预先设置的最小支持度阈值进行比较,确定所述事务项集中的频繁项集的操作,包括:在所述事务项集中的事务...
【专利技术属性】
技术研发人员:王格,王昱力,欧阳本红,夏荣,李文杰,郭卫,赵鹏,任志刚,陈健宁,潘泽华,周远翔,刘宗喜,刘松华,邓显波,
申请(专利权)人:国网北京市电力公司清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。