一种基于蚁群算法改进的LDTW序列相似度量方法技术

技术编号:20486679 阅读:51 留言:0更新日期:2019-03-02 19:42
本发明专利技术属于机械故障诊断和分类领域;具体为一种基于蚁群算法改进的LDTW序列相似度量方法,所述方法包括将给定长度的两个序列转换为距离矩阵;将距离矩阵映射成栅格法的0‑1矩阵,在0‑1矩阵中按照禁忌表对蚂蚁在栅格中的搜索范围进行第一次限制;根据LDTW距离的步长对蚂蚁的搜索范围第二次限制;蚂蚁在第一次和第二次共同限制后的栅格区域移动,根据动态调整状态转移概率移动到下一访问点;从而搜索得到路径;根据蚂蚁搜索得到的栅格值之和,确定适应度函数;适应度函数最小时,为最佳的序列距离长度;根据序列距离长度,确定两个序列的相似度;本发明专利技术既保证了弯曲路径长度不超过LDTW限制的弯曲路径长度,又降低计算的时间成本。

An Improved LDTW Sequence Similarity Measurement Method Based on Ant Colony Algorithm

The invention belongs to the field of mechanical fault diagnosis and classification; in particular, it is an improved LDTW sequence similarity measurement method based on ant colony algorithm, which includes transforming two sequences of given length into distance matrix, mapping distance matrix into 0_1 matrix of grid method, and restricting the search range of ants in grid for the first time in 0_1 matrix according to tabu table according to LDTW. The step size of distance restricts the search range of ants for the second time; ants move in the grid area after the first and second joint restrictions, and move to the next access point according to the dynamic adjustment of the state transition probability; thus the path is searched; fitness function is determined according to the sum of the grid values obtained by ant search; fitness function is the best sequence distance root when the fitness function is minimum; According to the length of the sequence distance, the similarity of the two sequences is determined; the invention not only ensures that the length of the bending path does not exceed the length of the bending path limited by LDTW, but also reduces the time cost of calculation.

【技术实现步骤摘要】
一种基于蚁群算法改进的LDTW序列相似度量方法
本专利技术属于机械故障诊断和分类领域,其实质为一种基于蚁群算法改进的LDTW序列相似度量方法。
技术介绍
相似度量通常作为数据挖掘的前序步骤,与挖掘算法结合起来完成不同的挖掘任务。挖掘算法在训练过程中,通常都需要计算序列间的相似度,发现它们之间的相似规律或特征,许多研究表明,经过精心设计的相似性度量可以提升算法的性能。动态时间弯曲(DynamicTimeWarping,DTW)作为如今很常用的序列间的相似度量方法,可以在时间或空间发生扭曲变形的情况下进行相似度量。目前,DTW的应用已经从语音识别,发展到其他诸多领域中,如生物信息学,在线签名验证和手势识别等。如今,随着数据量的增多,DTW计算所花费的时间也随之增加;同时,DTW还存在病理对齐的问题,即一个序列上的一个点可能会映射到另一个序列的多个点上,形成多个奇异点,从而导致DTW的精度也有所下降。由于DTW在时间和空间上的复杂性受到了限制,众多学者对其性能和效率上进行了改进;其中包括很多经典的改进算法,大致将这些变体分为两大类:第一类是取代了对DTW特征的考虑,研究者觉得数据的趋势更为重要。例如,微分DTW(DDTW)通过考虑序列的一阶导数来获得形状的信息,从而减少奇异点的发生,但是该方法没有考虑算法的时间和空间的复杂性。定性DTW(QDTW)考虑了DTW时间复杂度高的问题,将时间序列转换为定性时间序列,从而来减少时间序列的长度,再计算定性时间序列之间的DTW,但是实验中发现预测精度略有下降。还有很多研究是针对其他数据特征的考虑,例如形状上下文和兴趣点等。本专利技术就不再赘述了。第二类基本上是对弯曲路径设置约束的。其中,分割DTW(SDTW)证明了用分段线性段支持时间弯曲查询的可能性,但是仍存在病理对齐问题。加权DTW(WDTW)对参考点与测试点之间相位差较高的点进行处罚,以防止异常值造成的最小距离失真,实验结果表明提高了分类和聚类精度,但是计算所花费的时间和空间是很大的。快速搜索DTW(FDTW)考虑了DTW计算时间复杂度高,采用有效地删除大量的搜索候选项,从而直接降低搜索成本。但是其中采用了近似的方法,用几个片段表示一个序列的粗略版本来估计时间弯曲距离,很可能错过了正确的对齐。量化DTW采用了码字的概念,在做语音识别的时候,不再存储同一个单词的多个模板,而是为每个单词存储一个参考模型,将未知语音与参考模型的中心体进行比较,提高了识别的速度,但是识别率不可避免的有所下降。柔性DTW(FDTW)给予额外的分数来奖励较长的一对一的片段,避免了一个序列中的相邻点与另一个序列中相隔较远的点对齐。由于额外的增加项导致了其计算时间的增加。有限弯曲长度下的动态时间弯曲距离(LDTW)是最近提出的改进DTW的方法,属于第二类对弯曲路径提出一种新的约束,但该方法无法在保证精确性的前提下有着较低的时间复杂度。这些方法要么取代了对DTW特征的考虑要么对弯曲路径设置约束,但都无法做到在保证精确性的前提下尽可能的降低时间复杂度。
技术实现思路
有鉴于此,本专利技术提出了一种基于蚁群算法(antcolonyoptimization,ACO)改进的LDTW的序列相似度量方法,即ACO_LDTW;本专利技术不仅能有效地抑制病理对齐,同时允许更多的灵活性。如图1所示,其具体包括以下步骤:S1、将给定长度的两个序列转换为距离矩阵;S2、根据LDTW距离的最大步长确定限制距离,将距离矩阵根据限制距离映射到栅格法的0-1矩阵中,根据限制距离确定的搜索范围,按照禁忌表对蚂蚁在栅格中的搜索范围进行限制;S3、蚂蚁限制后的栅格区域移动,根据动态调整状态转移概率移动到下一访问点;从而搜索得到路径;S4、根据蚂蚁搜索得到的栅格值之和,确定适应度函数;在适应度函数最小时,即为最佳的序列距离长度;S5、根据最佳的序列距离长度,确定两个序列的相似度;其中,LDTW距离表示为有限弯曲长度下的动态时间弯曲距离。进一步的,在给定长度分别为i、j的两序列X={x1,x2,…,xi}和Y={y1,y2,…,yj}中,称为序列X和Y的距离矩阵,其中元素dis(xi,yj)为序列X中第i个观测数据和序列Y中的第j个观测数据之间的距离,表示为dist(xi,yj)=(xi-yj)2。根据对齐矩阵,可将序列X与Y间的DTW距离做如下定义:进一步的,基于栅格地图的蚁群算法采用的0-1矩阵模拟环境(“0”代表无障碍物的栅格,“1”代表有障碍物的栅格),通过禁忌表限制蚂蚁已访问过的位置,在避开障碍物的情况下,搜索从起点到终点的最优路径。具体的,所述步骤S2包括根据限制距离,将距离矩阵中每个元素映射到栅格法的0-1矩阵中;即限制距离将蚂蚁在栅格中的搜索范围限制为六边形,所述六边形的两个对角为直角,直角边的距离均为限制距离L,非直角边上的栅格为“1”,即该栅格的矩阵元素值为“1”;其余栅格均为“0”;蚂蚁避开为“1”的栅格,且避开禁忌表上已访问过的栅格,搜索从起点到终点的最优路径;其中,限制距离表示为L=Ceil[(Nstep_max-Ndim)×ε],Nstep_max为LDTW距离的最大步长,Ndim是序列的维数,Ceil[]表示向正无穷方向取整,ε表示限制因子,ε∈[0.1,0.4];“0”代表无障碍物的栅格,“1”代表有障碍物的栅格。如图2所示,该图的可搜索范围被黑色障碍限制为六边形。同时,LDTW引入步长限制了弯曲路径范围,避免了病理性对齐问题。通过公式可以看出,LDTW是通过从点(i,j)出发进行递归计算到(1,1),且步数不能超过所限制的最大步长。本专利技术将对齐矩阵映射成栅格地图中的0-1矩阵,再利用本专利技术提出的算法搜索最优路径。当数据维数过大时,LDTW的计算效率会显著降低,本专利技术为提升计算效率,结合LDTW的步数范围,将蚂蚁在地图中的搜索范围进行限制。系数ε控制着搜索范围的范围,该系数的增减会导致搜索范围的增减。为了讨论该系数的取值范围,选用了本专利技术实施例1中第一组维数为60×60的SyntheticControl数据,其最大步数为72,分别将ε设为不同的值,用本专利技术算法进行搜索,在计算迭代100次后,得到的效果如图3-6所示。图2中,可搜索范围被黑色栅格限制在中间的狭窄区域内,图3中,曲线路线表示一个搜索结果。其中,ε分别取0.4,0.3,0.2,0.1。可以看出,当ε取值较大时,搜索范围过大,算法不能有效的收敛到最优解,且得到结果中,步长已经超过了最大步数;而ε取值过小时,搜索范围变小,导致遗漏了部分优质解。因此本专利技术将ε取值为0.2,既符合LDTW的步数限制,又通过缩小搜索范围提高了蚁群算法计算效率。进一步的,考虑到LDTW的三个约束规则,本专利技术将蚂蚁的每一次行走区域方向进行了限制。如图7所示,蚂蚁在选择下一个访问点时最多只能在三个栅格中选择,传统蚁群算法常采用如下的状态转移概率来选择下一个访问点;也即所述步骤S3包括蚂蚁在限制后的限制区域进行移动,通过生成一个均匀随机数rand()和对比参数p,如果rand()>p,蚂蚁在当前栅格用原始状态转移概率公式从可访问栅格中选择下一个访问栅格,否则,在可访问的栅格中选择较小的值为下一个访问栅格,其中,可访问的栅格为当前本文档来自技高网
...

【技术保护点】
1.一种基于蚁群算法改进的LDTW序列相似度量方法,其特征在于,所述方法包括:S1、将给定长度的两个序列转换为距离矩阵;S2、根据LDTW距离的最大步长确定限制距离,将距离矩阵根据限制距离映射到栅格法的0‑1矩阵中,根据限制距离确定的搜索范围,按照禁忌表对蚂蚁在栅格中的搜索范围进行限制;S3、蚂蚁限制后的栅格区域移动,根据动态调整状态转移概率移动到下一访问点;从而搜索得到路径;S4、根据蚂蚁搜索得到的栅格值之和,确定适应度函数;在适应度函数最小时,即为最佳的序列距离长度;S5、根据最佳的序列距离长度,确定两个序列的相似度;其中,LDTW距离表示为有限弯曲长度下的动态时间弯曲距离。

【技术特征摘要】
1.一种基于蚁群算法改进的LDTW序列相似度量方法,其特征在于,所述方法包括:S1、将给定长度的两个序列转换为距离矩阵;S2、根据LDTW距离的最大步长确定限制距离,将距离矩阵根据限制距离映射到栅格法的0-1矩阵中,根据限制距离确定的搜索范围,按照禁忌表对蚂蚁在栅格中的搜索范围进行限制;S3、蚂蚁限制后的栅格区域移动,根据动态调整状态转移概率移动到下一访问点;从而搜索得到路径;S4、根据蚂蚁搜索得到的栅格值之和,确定适应度函数;在适应度函数最小时,即为最佳的序列距离长度;S5、根据最佳的序列距离长度,确定两个序列的相似度;其中,LDTW距离表示为有限弯曲长度下的动态时间弯曲距离。2.根据权利要求1所述的一种基于蚁群算法改进的LDTW序列相似度量方法,其特征在于,所述步骤S1包括给定长度为i的序列X={x1,x2,…,xi}和长度为j的序列Y={y1,y2,…,yj},其距离矩阵为其中元素dis(xi,yj)为序列X中第i个观测数据和序列Y中的第j个观测数据之间的距离,dist(xi,yj)=(xi-yj)2。3.根据权利要求1所述的一种基于蚁群算法改进的LDTW序列相似度量方法,其特征在于,所述步骤S2包括根据限制距离,将距离矩阵中每个元素映射到栅格法的0-1矩阵中;即限制距离将蚂蚁在栅格中的搜索范围限制为六边形,所述六边形的两个对角为直角,直角边的距离均为限制距离L,非直角边上的栅格为“1”,即该栅格的矩阵元素值为“1”;其余栅格均为“0”;蚂蚁避开为“1”的栅格,且避开禁忌表上已访问过的栅格,搜索从起点到终点的最优路径;其中,限制距离表示为L=Ceil[(Nstep_max-Ndim)×ε],Nstep_max为LDTW距离的最大步长,Ndim是序列的维数,Ceil[]表示向正无穷方向取整,ε表示限制因子,ε∈[0.1,0.4];“0”代表无障碍物的栅格,“1”代表有障碍物的栅格。4.根据权利要求1所述的一种基于蚁群算法改进的LDTW序列相似度量方法,其特征在于,所述步骤S3包括蚂蚁在限制后的限制区域进行移动,通过生成一个均匀随机数rand()和对比参数p,如果rand()>p,蚂蚁在当前栅格用原始状态转移概率公式从可访问栅格中选择下一个访问栅格,否则,在可访问的栅格中选择较小的值为下一个访问栅格,其中,可访问的栅格为当前栅格相邻的三个栅格,分别为其右上方栅格、右方栅格以及上方栅格。5.根据权利要求4所述的一种基于蚁群算法改进的LDTW序列相似度量方...

【专利技术属性】
技术研发人员:代劲何雨虹李家瑶
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1