一种传感器数据周期高占有模式挖掘方法技术

技术编号:37982080 阅读:24 留言:0更新日期:2023-06-30 09:57
本发明专利技术公开了一种传感器数据周期高占有模式挖掘方法,属于数据挖掘领域,包括:对于数据库中的传感数据项集,根据预设剪枝条件按顺序对不满足要求的项进行剪枝,从至少一个模式中挖掘出至少一个满足预设条件的传感数据模式;并按照传感数据模式平均长度的顺序,以固定周期作为间隔计算传感数据项集的周期占有度,输出满足预设周期占有度阈值条件的周期高占有传感数据模式。本发明专利技术提出用周期占有度来综合评价模式的优劣,从而以新的兴趣度量或约束来指导挖掘过程,据此在挖掘过程中进行了对搜索空间的剪枝操作,不仅能够聚焦在用户真正感兴趣的模式上,而且能够压缩搜索空间,提高挖掘效率。挖掘效率。挖掘效率。

【技术实现步骤摘要】
一种传感器数据周期高占有模式挖掘方法


[0001]本专利技术涉及数据挖掘领域,具体涉及一种传感器数据周期高占有模式挖掘方法。

技术介绍

[0002]模式挖掘是数据挖掘研究中的一个主题。作为数据挖掘的核心工作之一,模式挖掘被广泛应用于关联规则挖掘、序列模式挖掘、文本分类、Web日志分析和协同过滤算法中。
[0003]传感数据是指由感知设备或者传感设备感受、测量以及传输的数据,一些常见的声、光、电、温度、位置等传感器以及封装了多种传感元件的传感设备所传输、存储的数据都可以归为传感数据。因为这类传感数据大部分都是结构化的数据,因此可以作为标准的传感数据序列存储在数据库中。
[0004]现有的模式挖掘方法大多聚焦于用支持度度量模式的频繁程度,由此发掘出具有应用价值的频繁模式。但是,用简单、单一的指标来评判模式的优劣经常会挖掘出冗余或者可用性低的数据。本专利技术提出的周期高占有模式挖掘方法,提出了一种新的评判指标和剪枝策略,能够满足一部分应用需求。

技术实现思路

[0005]针对现有技术中的上述不足,本专利技术提供了一种传本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种传感器数据周期高占有模式挖掘方法,其特征在于,包括如下步骤:S1、获取待分析的传感器数据序列,基于Apriori算法生成周期占有模式数据库树,所述数据库树包括至少一个用于指示模式的节点,每个用于指示模式的节点代表一个传感器数据项集;S2、遍历所述数据库树中的所有节点并计算传感器数据项集的周期,根据预设剪枝条件按顺序对数据库树中的传感器数据项集进行剪枝,从至少一个传感器模式中挖掘至少一个满足预设条件的传感器数据模式;S3、按照传感器数据模式平均长度的顺序,以固定周期作为间隔计算传感器数据项集的周期占有度,判断传感器数据序列在不同周期事务集中的占有度是否满足周期占有度阈值,若是则输出满足条件的周期高占有模式,若不是则删除。2.根据权利要求1所述的一种传感器数据周期高占有模式挖掘方法,其特征在于,所述S2中计算传感器数据项集的周期的具体方式为:S21、定义传感器数据项集I=i1,i2,...,i
n
;S22、将传感器数据项集I中的n项按出现先后顺序排列并对应时间戳后而成的项集S=<(i1,t1),(i2,t2),...,(i
n
,t
n
)>作为一个时间事务序列,其中i
i
∈I为传感器数据项集I中的第i项,t
i
为i
i
发生的时间且t
i
<t
i+1
,i=1,2,

,n

1;S23、根据S22对应的时间戳构建关于待分析传感器数据序列中连续的两个事务的周期间距集;S24、根据S23中的周期间距集得到时间事务序列的周期;S25、以所得到的时间事务序列周期为间隔将传感器数据项集中的事务划分为多个周期事务集,计算传感器数据项集在不同周期事务集中的平均长度,得到传感器数据模式的平均长度。3.根据权利要求2所述的一种传感器数据周期高占有模式挖掘方法,其特征在于,所述S23中周期间距集表示为:其中,p
S
为周期间距集,为连续两个事务之间的时间差且为连续两个事务之间的时间差且分别表示第j和第j+1两个连续事务...

【专利技术属性】
技术研发人员:尤涛李聃师珂瑞陈进朝白璐杜承烈
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1