【技术实现步骤摘要】
基于时序对齐预测的序列距离度量方法、存储介质及芯片
[0001]本专利技术涉及机器学习
,具体涉及基于时序对齐预测的序列距离度量方法、存储介质及芯片。
技术介绍
[0002]序列之间的距离在序列分类、检索、聚类等应用中起着至关重要的作用。相比于向量距离,度量序列之间的距离更加困难,因为不同的序列可能有不同的采样率、执行速度、局部扭曲、初始状态和弹性扭曲。为了解决这些时序差异,现有的序列距离或者将每个序列编码成一个时序不变的特征向量,或者使用对齐进行时序对应校准。典型的基于特征的方法使用循环神经网络(RNN)对序列进行编码并度量相应特征之间的欧几里德距离。与计算与任何其他序列的距离时,一个序列的特征总是固定的。虽然这些方法是可学习的,并且在推理时只需要进行前向计算,但它们需要大量序列来训练复杂的RNN,并且可解释性较弱,因为不清楚学习到的特征如何处理时序差异以及可以处理哪些类型的时序差异。
[0003]基于对齐的方法为不同的序列对确定不同的最优对齐。这更加直观和灵活,因为在比较不同序列时,时序差异可能不同。大多数对齐方法在预定义的可行约束下解决优化问题以推断最优对齐。例如,DTW可能是应用最广泛的序列距离,其各种变体或进行加速推理,或适应增加或修改的约束,或处理来自不同模态的序列,其中Soft
‑
DTW通过使用所有可行对齐的软最小成本作为目标来优化可微损失。但这些优化通常很耗时,不能充分利用GPU,并且不能很好地扩展到长序列。
[0004]此外,由于推断对齐本身就是一个优化问题并 ...
【技术保护点】
【技术特征摘要】
1.基于时序对齐预测的序列距离度量方法,其特征在于,包括以下步骤:S100,构建保序对齐预测(OAP)模型;具体地,输入序列:和和是两个长度分别为L
X
和L
Y
的序列,X的元素x
i
,i=1,2,
…
,L
X
和Y的元素y
j
,j=1,
…
,L
Y
位于d维特征空间R
d
中;超参数:变换后的维数d
′
、时序矩阵权重λ,在计算X和Y之间的距离时,将Y对齐到X;S200,对OAP模型进行自监督训练;具体地,采用神经网络f通过考虑时序信息直接预测最优对齐的概率T
*
=f(X,Y),则X和Y之间的OAP距离为:d(X,Y)=<T
*
,D>,其中是X和Y中元素之间的成对距离矩阵,e(x
i
,y
j
)是两个元素x
i
和y
j
之间的向量距离,表示x
i
和y
j
对齐的概率。2.根据权利要求1所述的基于时序对齐预测的序列距离度量方法,其特征在于,所述OAP模型的前向计算过程包括:S101,输入:和是两个长度分别为L
X
和L
Y
的序列,X的元素x
i
,i=1,2,
…
,L
X
和Y的元素y
j
,j=1,
…
,L
Y
位于d维特征空间R
d
中;超参数:变换后的维数d
′
、时序矩阵权重λ。在计算X和Y之间的距离时,将Y对齐到X;S102,使用线性投影W
q
∈R
d
′×
d
将X中所有元素x
i
变换为变换为产生另一个变换序列S104,使用每个作为查询,使用作为键,计算所有的和之间的欧几里得距离,从而得到矩阵S105,计算和的相对位置i/L
X
和j/L
Y
之间的所有成对欧几里德距离,存到矩阵中;S106,计算相似度矩阵S,其为D
s
和D
t
的组合:的组合:S107,通过沿相似矩阵S的第二维执行softmax,对所有查询的注意力形成一个注意力矩阵A:
S108,对注意力矩阵A执行全局L1归一化:归一化:表示x
i
和y
j
对齐的概率;S109,计算得到X和Y之间的OAP距离为:d(X
,
Y)=<T
*
,D>。3.根据权利要求2所述的基于时序对齐预测的序列距离度量方法,其特征在于,所述OAP模型的可行对齐集合OAP模型的可行对齐集合其中1
L
是一个L维元素全为1的向量,T是对齐矩阵。4.根据权利要求1或2所述的基于时序对齐预测的序列距离度量方法,其特征在于,所述OAP模型的自监督训练方法具体包括:S201,给定N个未标记的训练序列X
n
,n=1,
…
,N,目标是学...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。