一种基于符号化与TF-IDF的机械设备故障特征提取方法技术

技术编号:19823586 阅读:72 留言:0更新日期:2018-12-19 15:21
一种基于符号化与TF‑IDF的机械设备故障特征提取方法,包括:将采集的待诊断振动信号转为时间序列,并对所述时间序列进行截取,得到所述振动时间序列的子序列;将所述振动时间子序列加载至正常振动子序列集合中,将加载后的振动子序列集合进行符号化;将符号化的上述振动子序列集合采用TF‑IDF方法进行差异化特征提取。本发明专利技术技术方案中将符号化与TF‑IDF方法相结合,进行机械设备故障特征提取,提高了机械设备故障诊断中振动信号特征提取的准确性和有效性,有很好的分类能力,能够更好更快的提取机械设备特征。

【技术实现步骤摘要】
一种基于符号化与TF-IDF的机械设备故障特征提取方法
本专利技术涉及机械设备故障提取
,尤其涉及一种基于符号化与TF-IDF的机械设备故障特征提取方法。
技术介绍
机械设备的复杂化、大型化使得系统一旦发生故障,将会造成巨大的经济损失乃至人员伤亡,故而机械设备的故障诊断和异常检测是保证设备安全、可靠和高效运行的有效手段。机械设备中重要的组件是否发生故障直接影响整台机器的健康状况,因此对机械设备的故障监测与检测能够及时发现设备中零件的损伤,避免零件失效和机器损坏。而设备中零件的故障检测可以通过振动信号特征的有效提取与分析加以实现,设备中零件的振动信号中常常混有很大的噪声,具有非平稳性特征,因此对零件故障特征信息准确而有效的提取是机械设备故障诊断中的重点和难点。中国专利公开号:CN105738722A公开了一种航空机电作动器故障诊断方法,其涉及一种基于符号动力学信息熵理论和改进Parks聚类算法的航空机电作动器故障诊断方法,通过对机电作动器逆变器侧母线电流的幅值时间序列进行符号化处理,将计算得到的信息熵值以及母线电流时间序列的最大幅值作为机电作动器故障诊断的两个特征量,然后建立基于训练样本的标准故障特征矩阵,采用改进Parks聚类算法通过计算待测样本与故障特征矩阵的距离来判断待测样本归属的故障类型。由此可见,所述诊断方法存在以下问题:第一,所述诊断方法需要对机电作动器的6种状态下分别采样,且在各运行状态下需要采集至少50组母线电流时间,对所述母线电流时间测量完成后还需要分别对其提取故障诊断特征量,采样工程量大,耗费时间多。第二,所述诊断方法使用母线电流时间序列的最大幅值以及符号动力学信息熵值座位故障诊断的特征量,计算量大,降低了所述诊断方法的数据提取效率。第三,所述诊断方法在采样时会改变所述机电作动器的本质特征,使其的各项参数发生改变,导致所采集的数据不属于同种状况,故障数据提取效率低。
技术实现思路
为此,本专利技术提供一种基于符号化与TF-IDF的机械设备故障特征提取方法,用以克服现有技术中零件故障特征提取效率低的问题。为实现上述目的,本专利技术提供一种基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,包括:将采集的待诊断振动信号转为振动时间序列,并对所述振动时间序列进行截取,截取后得到振动时间子序列;将所述振动时间子序列加载至正常振动时间子序列集合中,将加载后的振动时间子序列集合进行符号化;将符号化的上述振动时间子序列集合采用TF-IDF方法进行差异化特征提取。进一步地,在将待诊断振动信号转为振动时间序列时,先将所述待诊断振动信号中的振动位移,速度,加速度通过相应的传感器,并按照时间顺序进行采集得到振动时间序列S;采集完成后选择固定大小的滑动窗口对所述振动时间序列S进行截取,以此形成振动时间子序列进一步地,所述振动时间序列S为:在测量所述振动信号相应物理量时,按照时间先后顺序排列而成的数列,S=(s1,s2,…,sn)(1),其中n是所述振动时间序列S的长度,且n为正整数;所述振动时间序列子序列为:所述振动时间序列S中长度为k的子序列,其中1≤j≤n-k+1。进一步地,所述滑动窗口的长度为k,步长为m,其中k,m均为正整数。进一步地,在对所述振动时间序列进行符号化时,包括:将所述振动时间序列中的数据离散化,形成少量数值;离散化后,使用颗粒法对非线性非平稳系统进行描述,并在描述的同时使所述系统中的周期性、相关性等本质特征保持稳定;描述完成后,利用等区间法对所述振动时间序列进行符号化,并将每个符号称为一个单词。进一步地,在使用等区间法对所述振动时间序列进行符号化时,先计算出长度为n的振动时间序列S=(s1,s2,…,sn)中最小值Smin和最大值Smax,并计算出原始振动时间序列的值域[Smin,Smax];计算完成后,按照公式(3)将所述值域划分为k个大小相等的区间,其中Ci为所述振动时间序列的一个“单词”;经过公式(3)处理后,所述振动时间序列中的每个值都对应一个“单词”,从而将所述振动时间序列转换为符号时间序列。进一步地,所述TF-IDF是在咨讯检索中常用的加权技术;根据所述TF-IDF法的思想提出振动时间序列TF-IDF方法为:当所述振动时间子序列集合中的某些符号化数值在一个振动时间子序列中出现的频率高(TF值高),而在其它的振动时间子序列中很少出现(IDF值低),则认为此符号化数值是代表该序列的典型特征,并以此将各符号化振动时间序列进行分类。进一步地,所述振动时间序列的词频TF为一个上述给定的“单词”在符号化子序列中的次数,一个符号化子序列中某个单词Ci的重要性可以表示为:其中ni,j是单词Ci在子序列dj中的出现次数,而分母表示子序列dj中所有字词的出现次数之和;所述振动时间序列的逆向文件频率IDF为一个单词Ci普遍重要性的度量,某一特定单词的IDF,可以由符号化子序列总数除以包含该单词的子序列数目,再把结果取对数得到:其中|D|为时间序列中的子序列总数。进一步地,在采用TF-IDF方法进行差异化特征提取后,对提取的特征采用欧式距离进行序列特征相似性比较,若待诊断的故障子序列与正常振动时间子序列TF-IDF特征值的欧式距离数值具有分离性,则说明TF-IDF所提取的特征有效。进一步地,在采用TF-IDF方法进行差异化特征提取后,对提取的特征采用PCA主成分提取并使用KMeans方法进行聚类处理,若待诊断不同故障子序列中类内样本距离相对较小,类间样本距离较大,且正常振动数据相对于故障数据更加紧凑,则证明TF-IDF提取的特征有效。与现有技术相比,本专利技术的有益效果在于,本专利技术技术方案中将符号化与TF-IDF结合,进行机械设备故障特征提取,提高了机械设备故障诊断中振动信号特征提取的准确性和有效性,有很好的分类能力,能够更好更快的提取机械设备故障特征;且所述方法使用无监督学习方法解决了有监督学习方法中带有标签的故障数据难以获取的问题。进一步地,本专利技术利用相应传感器,对所述振动信号进行采集,并按照顺序得到时间序列S,将复杂的信号转化为数据,能够为后续的符号化做准备,提高了所述提取方法对零件故障特征的提取效率。进一步地,本专利技术在所述振动时间序列S中提取出多个振动时间子序列通过提取多个所述振动时间子序列,为后续的符号化以及故障特征的提取做准备,进一步提高了所述提取方法对零件故障特征的提取效率。进一步地,所述截取振动时间子序列的滑动窗口采用固定尺寸,这样,截取的振动时间子序列均为同样的长度及步长,在符号化后能够保证所述符号的统一性,在后续的单词提取中也能使所述数据更加直观的表现出来,进一步提高了所述提取方法对零件故障特征的提取效率。进一步地,在利用TF-IDF法对所述符号化时间子序列进行单词提取时,先对所述时间子序列中的数据离散化,在使用颗粒法对所述系统进行描述,在描述时所述系统中的周期性、相关性等本质特征不会发生改变,这样,在描述所述系统时不会因为进行操作而使所述系统中的本质特征发生改变,描述完成后的时间子序列也为同一特征下的数据,维持了所述系统和数据的稳定性,进一步提高了所述提取方法对零件故障特征的提取效率。进一步地,本专利技术通过计算振动时间序列的值域,并将其划分为多个大小相等的区间,以此本文档来自技高网
...

【技术保护点】
1.一种基于符号化与TF‑IDF的机械设备故障特征提取方法,其特征在于,包括:将采集的待诊断振动信号转为振动时间序列,并对所述振动时间序列进行截取,截取后得到振动时间子序列;将所述振动时间子序列加载至正常振动时间子序列集合中,将加载后的振动时间子序列集合进行符号化;将符号化的上述振动时间子序列集合采用TF‑IDF方法进行差异化特征提取。

【技术特征摘要】
1.一种基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,包括:将采集的待诊断振动信号转为振动时间序列,并对所述振动时间序列进行截取,截取后得到振动时间子序列;将所述振动时间子序列加载至正常振动时间子序列集合中,将加载后的振动时间子序列集合进行符号化;将符号化的上述振动时间子序列集合采用TF-IDF方法进行差异化特征提取。2.根据权利要求1所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,在将待诊断振动信号转为振动时间序列时,先将所述待诊断振动信号中的振动位移,速度,加速度通过相应的传感器,并按照时间顺序进行采集得到振动时间序列S;采集完成后选择固定大小的滑动窗口对所述振动时间序列S进行截取,以此形成振动时间子序列3.根据权利要求2所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,所述振动时间序列S为:在测量所述振动信号相应物理量时,按照时间先后顺序排列而成的数列,S=(s1,s2,…,sn)(1),其中n是所述振动时间序列S的长度,且n为正整数;所述振动时间序列子序列为:所述振动时间序列S中长度为k的子序列,其中1≤j≤n-k+1。4.根据权利要求2所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,所述滑动窗口的长度为k,步长为m,其中k,m均为正整数。5.根据权利要求1所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,在对所述振动时间序列进行符号化时,包括以下步骤:将所述振动时间序列中的数据离散化,形成少量数值;离散化后,使用颗粒法对非线性非平稳系统进行描述,并在描述的同时使所述系统中的周期性、相关性等本质特征保持稳定;描述完成后,利用等区间法对所述振动时间序列进行符号化,并将每个符号称为一个单词。6.根据权利要求5所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,在使用等区间法对所述振动时间序列进行符号化时,先计算出长度为n的振动时间序列S=(s1,s2,…,sn)中最小值Smin和最大值Smax,并计算出原始振动时间序列的值域[Smin...

【专利技术属性】
技术研发人员:丁承君冯玉伯朱雪宏王鑫
申请(专利权)人:河北工业大学泰华宏业天津机器人技术研究院有限责任公司
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1