本发明专利技术提供一种基于动态关联规则的设备故障信息挖掘方法,能够反应动态关联规则随着时间产生的变化,所述方法包括:获取设备故障维修信息数据集D;按照预约维修日期将获取的设备故障维修信息数据集D划分为n个子数据集D
A method of mining equipment fault information based on dynamic association rules
The present invention provides a method for mining equipment fault information based on association rules, can reflect the dynamic association rule changes over time, the method comprises: obtaining the equipment maintenance information data set D; according to the appointment date of service will get the equipment maintenance information data set D is divided into n sub data sets D
【技术实现步骤摘要】
一种基于动态关联规则的设备故障信息挖掘方法
本专利技术涉及数据挖掘
,特别是指一种基于动态关联规则的设备故障信息挖掘方法。
技术介绍
在数据挖掘技术发展繁荣的大背景下,关联规则技术得到了蓬勃发展,关联规则挖掘的目的是为了从大量数据中发现项/变量之间的关联和相关关系。传统关联规则挖掘方法挖掘的关联规则能反映变量间的相互依赖关系,但是不能反映规则本身的变化规律。以挖掘故障信息数据库为例,传统的关联规则挖掘方法挖掘的关联规则能够发现数据库中不同设备、故障原因以及维修信息之间的联系,从而有利于找出设备、故障原因以及维修信息之间的联系,并根据设备确定最常见的故障原因等,但是,传统的关联规则挖掘方法没有考虑关联规则随着时间产生的变化的情况,认为挖掘的关联规则在数据库中是永恒有效的,没有考虑关联规则的变化。
技术实现思路
本专利技术要解决的技术问题是提供一种基于动态关联规则的设备故障信息挖掘方法,以解决现有技术所存在的没有考虑关联规则随着时间产生变化的问题。为解决上述技术问题,本专利技术实施例提供一种基于动态关联规则的设备故障信息挖掘方法,包括:获取设备故障维修信息数据集D;按照预约维修日期将获取的设备故障维修信息数据集D划分为n个子数据集D1,D2,...,Dn,其中,D={D1,D2,...,Dn};定义动态关联规则算法,其中,动态关联规则表示为:其中,A、B分别表示项集,SV表示支持度向量,CV表示置信度向量,s表示项集的支持度,c表示关联规则的置信度,表示动态关联规则的推理符号;按照定义的动态关联规则算法,对n个子数据集D1,D2,...,Dn进行动态关联规则挖掘,得到设备故障原因与维修措施之间的关联关系。进一步地,所述获取设备故障维修信息数据集D包括:获取设备故障维修信息原始数据集;从获取的设备故障维修信息原始数据集中,获取目标属性数据;对获取的目标属性数据进行预处理,所述预处理包括:处理目标属性中的属性缺失值,属性格式不一致值和/或去掉冗余值。进一步地,在对获取的目标属性数据进行预处理之后,所述方法还包括:对预处理后的对目标属性数据进行字符离散化,得到设备故障维修信息数据集D。进一步地,所述动态关联规则的支持度向量SV表示为:SV=[s(A∪B)1,s(A∪B)2,...,s(A∪B)n]其中,表示项集A∪B在子数据集Di中的支持度度量,st.表示约束条件,表示项集A∪B在子数据集Di中出现的频数,|Di|为子数据集Di中的记录数。进一步地,所述动态关联规则的置信度向量CV表示为:其中,反映了项集A∪B在子数据集Di中的置信度度量,st.表示约束条件,为项集A∪B的SV中的第i个元素,为项集A的SV中的第i个元素。进一步地,所述动态关联规则的支持度s表示为:其中,M是数据集D中的记录数,表示项集A∪B在子数据集Di中出现的频数。进一步地,所述动态关联规则的置信度c表示为:其中,s(A∪B)为项集A∪B的支持度,sX为项集A的支持度。进一步地,所述按照定义的动态关联规则算法,对n个子数据集D1,D2,...,Dn进行动态关联规则挖掘,得到设备故障原因与维修措施之间的关联关系包括:对每个时间段上的子数据集利用频繁项集产生算法产生动态关联规则左项和右项;确定所述动态关联规则左项的支持度,所述动态关联规则左项的支持度表示为:其中,表示动态关联规则左项的支持度,表示动态关联规则左项在时间段ti上的支持度向量,Mi表示与时间段ti上的子数据集Di中的记录数Mi,M表示数据集D中总的记录数;若所述动态关联规则左项的支持度大于预设的支持度阈值,则确定所述动态关联规则左右全项的支持度,所述动态关联规则左右全项的支持度表示为:其中,sR表示动态关联规则左右全项的支持度,sRi表示动态关联规则左右全项在时间段ti上的支持度向量;通过公式确定动态关联规则的置信度,其中,c表示动态关联规则的置信度;判断所述动态关联规则的置信度是否大于预设的置信度阈值,若大于预设的置信度阈值,则根据挖掘得到的动态关联规则,分析设备故障原因与维修措施之间的关联关系。进一步地,所述方法还包括:建立时间序列回归模型,预测动态关联规则的发展趋势。进一步地,所述方法还包括:在交互式可视化界面上,根据用户点击的预约维修日期,链接到相应的项集和关联规则的挖掘结果界面;和/或,在交互式可视化界面上,根据用户输入的查询条件进行匹配查询,以列表的形式显示相应的查询结果,所述查询条件包括:项集或关联规则;和/或,在交互式可视化界面上,根据用户选择的关联规则,以柱状图的形式显示所述关联规则的置信度。本专利技术的上述技术方案的有益效果如下:上述方案中,获取设备故障维修信息数据集D;按照预约维修日期将获取的设备故障维修信息数据集D划分为n个子数据集D1,D2,...,Dn,其中,D={D1,D2,...,Dn};定义动态关联规则算法,其中,动态关联规则表示为:其中,A、B分别表示项集,SV表示支持度向量,CV表示置信度向量,s表示项集支持度,c表示动态关联规则的置信度;按照定义的动态关联规则算法,对n个子数据集D1,D2,...,Dn进行动态关联规则挖掘,得到设备故障原因与维修措施之间的关联关系,这样,挖掘得到的动态关联规则与获取到的设备故障维修信息数据集D中的预约维修日期动态相关,从而能够反映出挖掘得到的动态关联规则与预约维修日期之间的关系。附图说明图1为本专利技术实施例提供的基于动态关联规则的设备故障信息挖掘方法的流程示意图;图2为本专利技术实施例提供的设备所属品牌分布示意图;图3为本专利技术实施例提供的设备所属大类分布图;图4为本专利技术实施例提供的按照预约日期划分后,预约维修日期分布示意图;图5为本专利技术实施例提供的故障原因分布图;图6为本专利技术实施例提供的组成关联规则的置信度向量柱状示意图;图7为本专利技术实施例提供的组成关联规则的全项频繁项集的支持度向量柱状示意图;图8为本专利技术实施例提供的关联规则全项频繁项集支持度柱状示意图;图9为本专利技术实施例提供的支持度回归预测曲线;图10为本专利技术实施例提供的Django架构的工作原理图;图11为本专利技术实施例提供的详细结果页面;图12为本专利技术实施例提供的查询页面;图13为本专利技术实施例提供的某规则置信度趋势柱状图。具体实施方式为使本专利技术要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。本专利技术针对现有的没有考虑关联规则随着时间产生变化的问题,提供一种基于动态关联规则的设备故障信息挖掘方法参看图1所示,本专利技术实施例提供的基于动态关联规则的设备故障信息挖掘方法,包括:S101,获取设备故障维修信息数据集D;S102,按照预约维修日期将获取的设备故障维修信息数据集D划分为n个子数据集D1,D2,...,Dn,其中,D={D1,D2,...,Dn};S103,定义动态关联规则算法,其中,动态关联规则表示为:其中,A、B分别表示项集,SV表示支持度向量,CV表示置信度向量,s表示项集的支持度,c表示关联规则的置信度,表示动态关联规则的推理符号;S104,按照定义的动态关联规则算法,对n个子数据集D1,D2,...,Dn进行动态关联规则挖掘,得到设备故障原因与维修措施之间的关联关系。本专利技术实施例所述的基于动态关联规则的设备故障信息挖掘本文档来自技高网...

【技术保护点】
一种基于动态关联规则的设备故障信息挖掘方法,其特征在于,包括:获取设备故障维修信息数据集D;按照预约维修日期将获取的设备故障维修信息数据集D划分为n个子数据集D
【技术特征摘要】
1.一种基于动态关联规则的设备故障信息挖掘方法,其特征在于,包括:获取设备故障维修信息数据集D;按照预约维修日期将获取的设备故障维修信息数据集D划分为n个子数据集D1,D2,...,Dn,其中,D={D1,D2,...,Dn};定义动态关联规则算法,其中,动态关联规则表示为:其中,A、B分别表示项集,SV表示支持度向量,CV表示置信度向量,s表示项集的支持度,c表示关联规则的置信度,表示动态关联规则的推理符号;按照定义的动态关联规则算法,对n个子数据集D1,D2,...,Dn进行动态关联规则挖掘,得到设备故障原因与维修措施之间的关联关系。2.根据权利要求1所述的基于动态关联规则的设备故障信息挖掘方法,其特征在于,所述获取设备故障维修信息数据集D包括:获取设备故障维修信息原始数据集;从获取的设备故障维修信息原始数据集中,获取目标属性数据;对获取的目标属性数据进行预处理,所述预处理包括:处理目标属性中的属性缺失值,属性格式不一致值和/或去掉冗余值。3.根据权利要求2所述的基于动态关联规则的设备故障信息挖掘方法,其特征在于,在对获取的目标属性数据进行预处理之后,所述方法还包括:对预处理后的对目标属性数据进行字符离散化,得到设备故障维修信息数据集D。4.根据权利要求1所述的基于动态关联规则的设备故障信息挖掘方法,其特征在于,所述动态关联规则的支持度向量SV表示为:其中,表示项集A∪B在子数据集Di中的支持度度量,st.表示约束条件,表示项集A∪B在子数据集Di中出现的频数,|Di|为子数据集Di中的记录数。5.根据权利要求1所述的基于动态关联规则的设备故障信息挖掘方法,其特征在于,所述动态关联规则的置信度向量CV表示为:其中,反映了项集A∪B在子数据集Di中的置信度度量,st.表示约束条件,为项集A∪B的SV中的第i个元素,为项集A的SV中的第i个元素。6.根据权利要求1所述的基于动态关联规则的设...
【专利技术属性】
技术研发人员:王玲,彭开香,
申请(专利权)人:北京科技大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。