【技术实现步骤摘要】
基于自编码技术的ACT
‑
Apriori算法
[0001]本专利技术属于大数据挖掘算法
,具体涉及一种基于自编码技术的ACT
‑
Apriori算法。
技术介绍
[0002]智能电网是利用现代网络信息技术等实现电网设备间的数据信息交换,从而实现电网实时自动化控制、智能调节、在线决策分析等功能的新型电网。智能电网的建设积累了海量数据资源,目前电力公司基于数据管理企业,基于信息驱动业务的需求日益迫切。而智能电网大数据具有“4V”特征,即:数量大(Volume)、种类多(Variety)、速度快(Velocity)、价值密度低(Value)。近年来,电力信息化日臻完善,电力设备状态监测、生产管理、运行调度、环境气象等数据逐步实现集成共享,大数据技术为电力设备状态评估和故障诊断提供了全新的解决思路和技术手段。但是随着智能电网的发展和电网规模的迅速增长,及时、准确地掌握电力设备运行状态面临巨大的问题和挑战,传统的数据处理方法已经难以满足需求,因此学者们提出了一系列大数据挖掘算法。
[00 ...
【技术保护点】
【技术特征摘要】
1.基于自编码技术的ACT
‑
Apriori算法,其特征在于:首先,对事务数据库D进行预处理,将事务数据库D中各项目的高频参数NS忽略并用自编码位向量SNT代替,形成简化数据库RBD;将数据记录简化后全部读到内存,在频繁项集连接、剪枝生成候选项集的过程中,对生成候选项集的过程进行改进,直接生成候选项集,得到候选项集后扫描数据库计算支持度,由于候选项集与简化数据库RBD均已排序,在每条记录中分别搜索候选项集时,一旦搜索到大于候选项的值时,即可停止该事务的搜索。2.基于自编码技术的ACT
‑
Apriori算法,其特征在于包括以下步骤:步骤一、数据预处理阶段:首先,计算事务数据库D中各项目的支持度计数并以降序排列;其次,设定项目的高频参数NS,在事务数据库D中通过选定的高频参数NS忽略部分频繁项集L,并将其用自编码位向量SNT表示,同时建立频繁项列表TF和频繁项目集列表TI,最终形成简化数据库RBD;步骤二、频繁项集生成阶段:S2.1:使用简化数据库RBD替换原始事务数据库D;S2.2:在Tree数据结构中的每个节点添加新的大小为2
NS
的计数器列表
‑
TFISup,用以跟踪TFIs,从而确定每个候选频繁项集的支持度计数c.TFISup[i];S2.3:设置最小支持度阈值MinSup并进行迭代,通过判断式c.TFISup[i]>MinSup在每一次迭代中进行剪枝操作,最终确定频繁项集。3.根据权利要求2所述基于自编码技术的ACT
‑
Apriori算法,其特征在于:所述步骤一中,1)事务数据库D:表示存储所有已发生事务的数据集合;2)频繁项集L:表示事务数据库D中的频繁项集,L(k)表示频繁项集L中的频繁k项集;3)高频参数NS:表示在数据预处理阶段必须从事务数据库D中选择的频繁项集的数量;4)频繁项列表TF:表示数据库中的项目按其出现频率排序和选定的高频参数NS的参数情况,选择所有高频参数NS项来创建出的列表;5)频繁项目集列表TI代表了TF中所有可能的排列组合;频繁项目集列表TI中每个项目集的长度介于0到高频参数NS之间;6)简化数据库RBD:表示在数据预处理阶段创建的数据库;在简化数据库RBD中,TFI被一个自编码位向量代替,该位向量表示它们在每个事务中所存在的位置;为了创建简化数据库RBD,从原始事务数据库D中的每个事务中移除频繁项集L,并将它们用自编码位向量存储到一个新的字段中;这个用来存储频繁项目自编码位向量的新的字段叫做交易位SNT。4...
【专利技术属性】
技术研发人员:程江洲,闫冉阳,张晓瑀,冯梦婷,冯馨以,
申请(专利权)人:三峡大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。